Go to contents

9の言語を聞き分けて文字に自動変換、ETRI研究チームが「多言語音声認識技術」開発

9の言語を聞き分けて文字に自動変換、ETRI研究チームが「多言語音声認識技術」開発

Posted April. 19, 2017 08:26,   

Updated April. 19, 2017 08:27

한국어

韓国国内研究グループが9つの言語を聞き分け、自動的に文字に変換する「多言語音声認識技術」の開発に成功した。自動通訳、人工知能(AI)秘書、リアルタイムでの映画字幕、無人コールセンターなど、様々なサービス開発に活用できるオリジナル技術になるものとみられる。

韓国電子通信研究院(ETRI)は、キム・サンフン責任研究員などの研究チームが従来より性能を一層高めた新しい「9つの言語音声認識」を開発したと、18日明らかにした。

音声認識技術は、アップルの「シリ」と三星(サムスン)の「ビックスビ」などのスマートフォンの音声認識サービスに既に使われている。しかし、認識率が90%程度で使用するには不便が大きい。今回開発した技術は、認識率を95%に高め、誤差をさらに減らしたことに意味がある。さらに、英語、韓国語、日本語、中国語、フランス語、スペイン語、ドイツ語、ロシア語、アラビア語まで、9つの言語を支援する。日常会話の場合は、認識機が絶えず認識しながら、リアルタイムで文字に変えてくれる。研究チームは、「韓国語の場合、グーグルなどの世界的企業の音声認識技術より、性能がさらに優れており、他の言語は対等な水準だ」と説明した。

研究チームは、AI技術の一つである「ディープラーニング」手法を活用して、膨大な音声情報(ビッグデータ)を自動分析する方法で音声認識技術の完成度を高めた。インターネットに接続された状態で使う「クライアントサーバー型」と、スマートフォンなどの携帯端末に設置できる「搭載型」の2種類に分けて発売する計画だ。性能は、クライアントサーバ型のほうが優れている。搭載型は、インターネット接続が切れたところでも、手軽に利用できる利点がある。

ETRIはこの技術を、既存の自動通訳プログラム「ジニトーク」に適用して、試験サービスを開始した。今後、平昌(ピョンチャン)冬季五輪の自動通訳・翻訳サービス部門の公式スポンサーである「ハングルとコンピュータ」と一緒に、オリンピック通訳サービス用としても開発する予定だ。2020年の東京オリンピックの開催まで、対象言語を14言語に拡大し、最終的には20以上の言語を支援するという目標だ。



전승민 チョン・スンミン記者 enhanced@donga.com