武見研究室訪問
「障碍」を「障碍」ではなくす社会へ
1 ムーンショット型研究開発事業 Internet of Brains
1.1 訪問先:武見充晃先生
武見充晃先生は,内閣府の政策である ムーンショット型研究開発制度 に採択されているプロジェクト Internet of Brains の課題推進者の一人である.
武見先生は中でも,課題4「共通基盤技術」として登録されている「身体的能力と知覚能力の拡張による身体の制約からの解放」をテーマに研究を遂行している.
本プロジェクトの PM でもある金井良太氏は株式会社アラヤの創業者・CEO も務めている.株式会社アラヤは Brain-Machine Interface に関する最先端の R&D を行っているのと同時に,AI 技術と組み合わせた「アラヤしかできない」多数のソリューションを提供している(HP も参照).
1.2 中目黒にある研究室
我々は,本研究グループがムーンショット事業で借りている,セレソ中目黒にある研究室に訪問させてもらった.
3/8/2024 の日経新聞「AI開発のアラヤ・金井良太CEO 好奇心の赴くまま究める」の記事に登場する背景は,この研究室のものである.
AI開発のアラヤ・金井良太CEO 好奇心の赴くまま究める NIKKEI The STYLE 「My Story」 - 日本経済新聞武見先生は現在,慶應義塾大学の特任講師を務めており,牛場潤一教授の指導のもと研究に取り組んでいる.上の写真の背景は九州大学提供の「無限」をテーマとした芸術作品であり,牛場教授の特注品だという.
2 Trusted BMI-CA
武見先生は本研究プロジェクトで,AI 支援型 Trusted BMI-CA (Cybernetic Avatar) の社会実装にも取り組んでいる(HPも参照).
2.1 BMI ブレインピック
BMI-CA とは,AI の支援により,脳波だけでなく目線や頭の動きなどの様々なデータを綜合して,バーチャルリアリティ(VR)内のアバターを自分の思い通りに動かすための技術である.
これにより,従来の身体的制約から解放された交流が可能になる様子が,例えば次の BMI Brain-pic でよく表現されている:
これは Epic Games が提供する世界的 TPS ゲーム Fortnite 内のキャラクターを3人で共同で動かし,徒競走の速さを競う e-sports 競技である.慶應義塾大学内の種々の背景を持った参加者が一堂に介して,公平に競い合うことが出来たという.
2.3 武見先生の研究
事象関連脱同期は,武見先生の専門の1つであると言えるだろう.
特に武見先生は,この ERD のメカニズムを解明する論文 (Takemi et al., 2013) を発表している.1
この論文では,感覚運動野上の事象関連脱同期が,一次運動野の興奮と相関する様子を電気生理学的に解明している.
この科学的発見が,BMI ブレインピックとサイバー・アバター (CA) の脳波による操作を支えているのである.
3 非侵襲性脳刺激の体験
続いて我々は地下2階に案内され,大変貴重なことに,非侵襲性脳刺激の体験をさせていただいた.
動画内で,自分は右手に種々のポーズを取らせ,その度に刺激の出方が変わることを見ている.基本的に一次運動野 (M1) への刺激は,既存の動きを促進する方向への筋運動に転換される.
武見先生はこの M1 への刺激の姿勢依存性を,マーモセット で詳細に研究している論文を最近発表している (Takemi et al., 2024).2
3.1 2つある非侵襲性脳刺激
非侵襲性能刺激には,磁気を用いるものと電気を用いるものの2つがある (眞野智生, 2022):
3.2 リハビリへの応用
rTMS は,磁気刺激の周波数を変えることによって,抑制的に働くか(1 Hz など),興奮性に働くか(5 Hz など)を変えることができる.
例えば,脳血管障害などにより脳に損傷を受けた患者は,半球間抑制のバランスが崩れるために,障害を受けていない方の脳が興奮しすぎてしまい,それが正常な回復を阻害してしまうことが起こる.
この状況を緩和するために,左右の脳で周波数を使い分けることで,非侵襲性脳刺激を用いたリハビリが可能である (眞野智生, 2022).
一方で,このような脳刺激は,非侵襲性と言えどもてんかんを誘発するリスクがある.そのため,てんかん患者に対する療法とはなり得ないという.
4 近年の研究
武見先生とその研究グループによる最新の研究を2つ紹介する.
4.1 選択的な抑制解除
前述の研究 (Takemi et al., 2013) と近年の研究 (Takemi et al., 2018) が合わさることで,
という機序が見えてきている.
脳卒中後の半球間抑制(第 3.2 節)と同様に,脳の作用は直感的には「興奮」を中心にしていると思われがちであるが,「抑制」も大変重要な役割を果たしている.
4.2 Brain-Machine Interface (BMI) (Sato et al., 2024)
武見先生に地下1階を案内してもらった際に,株式会社アラヤで行われているある研究の話を詳細に義紹介いただいた.
それが,(Sato et al., 2024) である.この研究はアラヤの X Communication Team で行われているようである:
この動画で描かれているように,言葉を介さずともタイピングと同じ速度で言語情報をやり取りすることを目指すプロジェクトである.
4.2.1 アラヤの研究の概要
動画のサムネイルにもなっている笹井俊太郎氏(アラヤ取締役)に文章を読んでもらい,その間の脳波データを集める作業を数ヶ月も続け,累計で 175 時間ものデータを収集した.
この脳波データと音声データとを CLIP (Radford et al., 2021) というアーキテクチャのニューラルネットワークで学習させた.
その結果,175 時間ものデータがあると,脳波だけからどの単語を話そうとしているかは極めて高い精度で予測できることがわかった(全 512 単語の中のどれかを5割の確率で当てられる).
4.2.2 BMI × AI はどこまで行けるか?
通常の研究では,脳波データは高々 10 時間程度しか収集せず,その場合は今回の (Sato et al., 2024) の方法でも 2.5% 程度の正答率しか出ないという.
すなわち,データの量を大きくすることで,現状の深層学習モデルを用いれば,高い精度で発話の予測が可能であることがわかった.
このように,データの量を増やすとある時点で驚異的に正答率が上がる現象は,深層学習においてよく観察されており,スケーリング則 と呼ばれている.
ただし,拡散模型 (Salimans and Ho, 2022) を用いて脳波だけから音声を直接生成しようとしても,意味のある音声は生成できなかったという.
4.2.3 BMI の歴史から見る,アラヤの研究の新規性
2017 年前後まで,300-based BMI (Donchin et al., 2000) が主流であった.
これは スペラー (speller) と呼ばれる種のインターフェースであり,画面上で点滅する文字を注視する際の脳波を通じてタイピングをする.
このスペラーの方法で自動で照明を点灯させる (神作憲司, 2009) などの応用も考えられていたが,やはり必ずモニターを用意してその点滅を注視しなければいけないことは使用者の大きなストレスになるため,広い応用は難しかっただろう.
脳波データのノイズ低減法が進歩したり,深層学習手法が進歩することで,175 時間もデータを集めずに済むようになったら,アラヤの研究を通じて,障害を持った人もそうでない人も隔たりなく,リアルタイムで会話ができるようになる日も近いかもしれない.
5 終わりに
犬やイルカと会話ができるようになる日も遠くないかもしれない.
References
Footnotes
武見先生の引用数最大の論文である,Google Scholar 参照.↩︎
ただし,(Takemi et al., 2024) はマーモセットに電極を埋め込んでおり,我々が経験した非侵襲性の状況とは全く異なる.↩︎
実はこの効果は拮抗筋では見られないという (Takemi et al., 2018).↩︎