数月前、私は Google アシスタントに簡単な質問をしましたが (相关内容は思い出せません)、関係のない答えが返されました。もう一名尋ねると、違う答えが返ってきました。質問を入力する一定がありました。
その時点で、私は音声認識ソフトウェアはアフリカ人向けに作られたものではないと結論付けました。
私の話す英語とアクセントは個人的な成長と显露のおかげで解决されましたが、多くの音声認識アプリやソフトウェアがアフリカ話者により適応しつつあることもわかります(アクセントの点で)。しかし、実際のところ、アフリカ人向けの音声認識の実現にはまだ長い時間がかかります。
ネイティブスピーカーが 1,000 万人以上いるアフリカの主要言語を使用できるアプリがなぜそれほど多くないのか、今でも不思議に思っています。そこで私は、アフリカの文脈と言語における人工知能と自然言語処理の現状について、現場の言語学者および学術研究者と話すことにしました。
Q: こんにちは、あなた自身について教えてください。言語学者および NLP AI 愛好家として、何に興味がありますか?
こんにちは、私はオランレワジュ・サミュエルです。
私は計算音韻論、データセット構築、アノテーションとキュレーション、自然而然言語処理、および現場言語学に興味があります。
私の主な指導者は。最近、私はタンパク質言語学、タンパク質のフォールディング、および数学言語学に大きな喜びを感じています。私が尊敬する学者の名前は次のとおりです。彼の作品は私の研究に影響を与え、私の専門知識をディープラーニング NLP とロボット工学に活用しました。私の現在の研究分野は、タンパク質のフォールディングと、量子物理学、量子化学、言語学の間の相互関係です。
私はまだ自分の分析目標を厳密に定めているわけではありませんが、今のところは専門知識を磨き、自分の很有概率を探ることに分散しています。資格そのもののためではなく、他啓発のためです。したがって、私はここでのプログラムを结束し、他のことに移りたいとしながら、自分自己本身を成長させようと努めています。
Q: この分野におけるあなたの著書にはどのようなものがありますか?
私はさまざまな偉大な人物と協力して、さまざまな出版物に参加してきました。私の最近の言語学の論文の 1 つは、「」主に、NLP に関する私の特集出版物のほとんどは、Masakhane NLP グループによるものです。
これも:
Q: ルワンダのキガリでの現在の仕事は何ですか?
私は「言語专家のための必然言語処理」というコースを教えています。常见的に、私はルワンダのキガリでアフリカの文脈における言語的必然言語プロセスを教えています。
私は、大規模言語モデル (LLM) の構築など、さまざまな NLP タスク用の多言語データセットの構築、アノテーション、キュレーション、剖析、公開のニュアンスを提高し、デモンストレーションする任務を負っています。大規模な言語モデルとは、複数の言語システムを単一のストリーム内で機能させることを表明します。私たちは、パターンまたはテンプレートを用到して AI システムをトレーニングするラテライゼーション (情况化) によってこれを達成しようとしています。このパターンは、他のアプリケーションの基礎となります。
会話型 AI を超えて、私たちは转为型 AI の分野で何か蓄意義なことを行うことを検討しています。これは依旧会として、データを並べ替えて確率などの数学题的計算によって結果を转为するモデルの機能の側面化の1部です。
Q: アフリカにおける AI/NLP の現状と応用についてお話しいただけますか?
NLP はアフリカ全土で多くの事例で使用されており、その中にはロボット工学や会話型 AI が含まれています。会話型 AI の典型的な例は、ラゴスのAlaye です。これは、自然観光客 (他州からのナイジェリア人) が大都市であり州であるラゴス内で道を見つけ、レストラン、クラブ、ショップなどの場所を特定するのを支援します。人気のナイジェリアのピジン (ナイジャ ピジン) を使用した交通状況も含まれます。
私たちは、タスクを実行するためにトレーニングできる AI モデルを開発しています。複雑なシステムやプロセスを単純なコマンド文案列 (モデリング) に絞り込みます。これが、現時点でのアフリカにおけるロボット工学における NLP の実用化です。
現在、言語学における AI の応用は主に自動化ですが、ロボットやチャットボットなど、さまざまな AI アプリケーションに組み込まれた言語モデルもあります。
本当に素晴らしいことをやっている人たちがいます。、 、 ()、 と 。
アフリカ言語における AI アプリケーションの課題は何ですか
AI 産業で世界的な関連性を見つける上でアフリカの状況に対する大きな課題は、言語リソース (データ) の制限です。アフリカは多言語なので、世界中で進行中のさまざまなAIプロジェクトに必要な膨大なデータを提供します。たとえば、アフリカにある最大の言語データセットは約 2000 時間ですが、これは、何十億時間もの音声データがある英語と比較すると、非常にばかげています。
AI に何かが起こるとすれば、それは高リソース言語にも起こるでしょう。たとえそれがアフリカの言語で起こったとしても、私たちはそれらに電力を供給するシステムを持っていません。したがって、対応するものが10分ではないため遅れており、この問題は文書化の严重不足がほぼ炫舞时尚にわたる問題となっています。
たとえば、ナイジェリアには 200 を超える部族がありますが、最も人気のある言語は 3 つだけです。ヨルバ、イボ、ハウサとは異なり、小規模な部族や言語にはデータがほとんどありません (リソース データが少ない)。それが私たちがやろうとしていることです 、低リソース言語からデータを収集し、それらを音声合成 (STT) や音声合成 (TTS) などのプログラム可能な音声認識に使用します。
AI や NLP の技術者は、AI を信じていないか、ROI を探求するのに着实なデータがないと考えているため、投資を行っていません。したがって、私たちは現在の地底下工事がブレークスルーとなることを期侍しています。
さらに、最も人気のある検索エンジンはアジアと西洋(特にアメリカ)であるため、アフリカは言語 AI と NLP の全世界市場で周縁化されています。また、ここでの私たちの作品集の中には、スポンサーシップの関係で、アフリカ人としての功績を認めることができないものもあります。
Q: アフリカの NLP の適用が最も進んでいるアフリカの国はどこですか?
最も大きな影響を与えたアフリカ諸国には、南アフリカ、ケニア、ルワンダが含まれます。彼らはクレイジーです!ナイジェリアも拼搏しているが、この世界を探索性すべき人々のほとんどは開発を求めているのではなく、学歴の満足を求めている。私たちは言語を大切にしていますが、その言語を应用してデータセットを構築しているわけではありません。言語を包存し保護するために文書化に投資すべきであるにもかかわらず、私たちはむしろ言語を遺産として話すか私有化したいと考えます。
Q: では、ビジネス面で、アフリカ言語の NLP の商業化において、アフリカはどのような立場にあるのでしょうか?
品德高尚に言うと、データセットを販売するビジネス之间にはあまり多くはありません。それでも、プロジェクトに資金をつぎ込む人たちは多額の寄付をしますが、現場のエージェントに届く金額は、这么多年投入量された金額と比較すると如此にわずかです。
Q:それでは倫理の問題に行き着きます。人々のデータを収集して販売することに倫理的価値はありますか?そして、これらのプロジェクトに多額の資金が提供され、これらの言語の一次ソースが非常に最小限の金額 (場合によってはゼロ) しか得られないのは公平でしょうか?これらのデータやソースに対する保護はありますか?
データ収集を禁止する法律はありません。最も重要なことは、データがネイティブ スピーカーから積極的に収集され、その時間に対して報酬が支払われることです。ただし、すべての活動はアフリカ連合の方針に沿ったものでなければなりません。 また、データ収集を伴う言語学の研究には、通常、母語話者または回答者の同意が必要です。
2 番目の質問ですが、これらの分野に携わる人々に最終的に届く金額については、誰にもどうすることもできません。最も比较重要なことは、全員が喜んでプロジェクトにコミットすることです。人々は記録されて報酬が与えられると言われており、金額さえよければ「不合理各部分合理」はない。
Q: 現状で NLP と語学トレーニングに参加したい人がいる場合、何を勧めますか?
広い分野です。多くはすでに基礎があり、構築段階にありますが、まだ基礎の段階にある方面もたくさんあります。私が皆さんにお勧めしたいのは、言語データの収集と讲解に列席することです。データと同じくらい、データセットのデータ讲解も有必要的です。
したがって、私は熱心なデータ駆動型グループに缴纳するかボランティア活動をすることをお勧めします。データの収集と数据分析、用語の学習などにボランティアとして缴纳します。
最終的な考え
音声認識ソフトウェアでは、さまざまな AI や NLP のコマンドやプロンプトを在使用して、アフリカが不適切に表現され続けています。アフリカ人がデータセットの構築に开始し、自分たちの言語を発信し、文書への投資を続けると、物語は変わってくるでしょう。それでも、AI および NLP アプリケーションに関してアフリカから生み出されたいくつかの创作には感銘を受けるでしょう。
私の調査と手がかりを追って、ロボットがアフリカの現地言語で促されているのを見てきました。アフリカのさまざまな状況(観光、探検)に合わせた現地のチャットボットが増えており、一部の言語は家電製品の IoT に使用されています。しかし、現在世界で起こっている大規模な AI と NLP 革命を考慮すると、私たちはもっと取り組むべきだと信じています。今のところ、他にもありますためにテキストの分類音声データの場合よりも優れています。それでも、音声データセットとテキスト データセットの両方がさらに必要です。データは新しい通貨です。私は正直に言って、外国人が間違った仕事をする前に、アフリカ人がこれを行うことを望みます(ああ、そうそう、以前出版された本で報告されている誤った歴史データを読んだことがあります。不適切な文書化が私たちに与える影響はそれです)。