Credit : Lorrie Lejeune/MIT via MIT News

スマホに話しかけるのが恥ずかしい人向け?声を出さずに音声アシスタントが使える装置が誕生!

機械に話しかけるのは恥ずかしい?MITの学生が、声を出すことも、口を開くこともなく音声アシスタントなどに意思を伝える装置をMITの研究者らが開発した。

「オルター・エゴ」
別人格を意味する「オルター・エゴ」(AlterEgo)と名付けられたこの装置は、耳から顎にかけて装着するデバイスだ。これに取り付けられた4つの電極が、顎と顔の神経筋情報を読み取り、認識する。こうして声に全く出さずに口の中で「しゃべった」言葉が認識され、あとはSiriやGoogleアシスタントなどと同様に、音声アシスタントによる返答を受けるという仕組み。音声アシスタントからの声も空気を振動させる音ではなく、骨伝導でデバイス着用者にのみ聞こえるようになっている。

つまらない会議中で声を発することなく時間を確認したり、囲碁やチェスで次の一手を検索したり、デート中に初めて見た美術作品のことを調べて知ったかぶりして作品解説をしたり、なんてことが相手にバレずにできるというわけなのだ。

話しかけることで反応してくれる機能を持ったデバイスは、スマートフォンやスマートスピーカーの音声アシスタントなど昨今様々なものが登場しているが、それらのデバイスに話しかけた情報は周囲の人に聞き取られてしまう可能性もある。文字情報だって画面を覗き見られれば同じことだ。それに、機械に対して人へするのと同様に話しかけることに抵抗感を持つ人も少なくないだろう。オルター・エゴはそれらのことを解決してくれる可能性を秘めているし、何らかの理由で発話が困難な人にも文字入力以外のインプット方法を与える可能性も秘めているだろう。

読み取り正確性92%

オルター・エゴの研究では、口の中で単語を入力した際の単語と神経筋情報との相関性をニューラルネットワークで探ることにより、単語を識別できるようにしている。現在のところ10人の被験者に、それぞれ神経筋情報の設定に15分を費やした後で90分間実際に試させたところ、読み取りの正確性は92%だった。この精度はよりデータを集めることで高められるとのことだ。

なお、Facebook社のBuilding 8部門は脳の信号を文字情報に変換しようという試みを2017年に発表したが、同じく音声に頼らないインプット方法としてはオルター・エゴの方がそちらよりもずっと実用化の可能性が高そうだ。それと同時にオルター・エゴは、これが英語以外の他の言語にも上手く対応できるかも今後調査する必要があるだろう。

特殊部隊隊員などが密かに行わねばならない作戦時にも適しているともされるオルター・エゴ。そういう状況なら別として、日常的に人々が使用するデバイスとなるためにはより小型化、もしくは神経筋情報の読み取り一を変更する必要があるだろう。そうでもしなければ、一目見ただけでそれとわかる現在の見た目では「あ、この人きっと私と話してる時に関係ないこと調べてたりするんだろうな」とみんなに思われてしまうに違いない…。

何はともあれオルター・エゴは機械と人間のインタラクティブに新たな形をもたらすものと言えよう。

MIT is making a device that can ‘hear’ the words you say silently(Popular Science)

Computer system transcribes words users “speak silently”(MIT News)

AlterEgo: Interfacing with devices through silent speech(YouTube – MIT Media Lab)

RELATED POST