Go to contents

THE DONG-A ILBO Logo

言葉で制御し、検索・注文まで…遠距離音声認識技術を巡る家電業界の競争が激化

言葉で制御し、検索・注文まで…遠距離音声認識技術を巡る家電業界の競争が激化

Posted June. 01, 2018 08:58,   

Updated June. 01, 2018 08:58

한국어

LG電子は、先月3日に披露したプレミアムスマートフォン「G7ThinQ(シンキュ)」に、スマートフォンの中では初めて、最大で5メートルも離れたところでも人の声を聞き取る遠距離音声認識機能を搭載した。この技術は、LG電子の空港ロボットやエアコン、冷蔵庫など、遠距離から音声で制御される製品にのみ搭載された。これをスマートフォンにも適用したことで、スマートフォンがAIスピーカーの役割を果たせる可能性を切り開いた。

G7シンキュにはすでに、さまざまなAI機能が搭載されている。LG電子のすべての家電が自動的にスマートフォンに連動されて音声で制御が可能な「Qリンク」機能が、G7シンキュから搭載された。スマートフォンが遠いところにあっても、家電を音声で制御できる。LG電子の関係者は、「LG電子独自の音声認識機能『Qボイス』に『スピーカーフォンで電話に出て』など、スマートフォンが離れているときに利用可能な音声コマンドも追加されている」と説明した。

G7シンキュに入った遠距離音声認識技術のコアはマイク、そして遠距離音声認識アルゴリズムである。マイクは、スマートフォンの上部と下部の2カ所に搭載されている。通常、電話するときは、口に近い下部のマイクは音声データを受け入れ、上部のマイクは、周囲の騒音を減らす補助的役割をする。G7シンキュは、上部と下部の両方のマイクを利用して、音データをより豊かに受け入れるようにアルゴリズムを設計した。

遠距離音声認識率を向上させるディープラーニングアルゴリズムも搭載した。このアルゴリズムは、2度にわたって周囲の雑音を除去し、話す人の声だけを強化する。遠くから収集された音のデータを確保するために、LG電子の洗濯機、エアコンなどが確保した遠距離音声データを活用した。このデータに、スマートフォンの環境で出てくる可能性のあるテレビの音、車の騒音など、さまざまなノイズを想定して入れて、音声と雑音を区別できるアルゴリズムを作ったのだ。

チャン・ソクボクLG電子人工知能研究所責任研究員は、「スマートフォンのユーザーから遠距離データを収集して学習するためには時間がかかる。他の家電製品から得たデータをもとに、最適な音声認識モデルを作って、スマートフォンに適用することができた」と語った。

三星(サムスン)電子は、家の中の家電制御や検索、注文コマンド実行のハブとして、冷蔵庫とエアコンに注目している。冷蔵庫、エアコンなどの生活家電に、遠距離音声認識が可能な高感度マイクと遠距離音声認識技術を搭載している。

AIスピーカーを主力商品として発売している企業にとっても、遠距離音声認識技術は、主要課題である。アマゾンは、遠距離音声認識率を高めるために、AIスピーカー「エコ」に7個のマイクを入れた。マイクが多く搭載されるほど、受け入れる音の情報量が多いからだ。声に最も近いマイクを探して、そのマイクの音を拡大し、残りのマイクから入ってくる音を殺す「ビームフォーミング」技術も適用した。「ギガジニ」を披露したKTは、「騒々しい環境の中の音声認識技術」を開発して披露する予定だ。


金哉希 jetti@donga.com