位相的機械学習
――データはもはや「ただの数字」ではない――
これから AI で加速する産業分野はどこか?
A Blog Entry on Bayesian Computation by an Applied Mathematician
$$
$$
1 なぜ位相的機械学習が必要とされたか?
1.1 従来手法の反省点
どうして「位相」が機械学習におけるキーワードとして再注目されているかというと,「以前の我々は,座標の取り方に関して無関心だったから」だと言える.
これまでの深層学習のアーキテクチャは,モデリングの対象が言語・音声・動画のどれであるかに依らず,
という同一のステップを辿っていた.
しかし,深層学習の応用先が広がっていくごとに,次のような例が見つかってきた:
1.2 ベクトルを超えていく
根本的な問題は,従来のデータ解析では Euclid 空間 \(\mathbb{R}^d\) 以外の空間を考えてこなかったことにある.
それゆえ,どんなデータもまずは \(\mathbb{R}^d\) 内に埋め込むことが考えられ,モデリング法の多様性が失われていたのだと言える.
画像を文字列のような系列だと捉えたり,分子を文字列としてモデリングしたりする様子は,大変に奇怪である.
1.2.1 幾何学的深層学習
そこで 幾何学的深層学習 (GDL: Geometric Deep Learning) の標語の下で,従来の Euclid 空間 \(\mathbb{R}^d\) 以外にも,多様な空間上のデータをモデリングをする方法論が研究された.
これにより,「ベクトル」以外の言葉でデータを見ることが可能になったのである.
「ベクトル」以外の言葉として最初に探索されたものが「グラフ」であり,グラフニューラルネットワーク (GNN) が幾何学的深層学習の中心的な柱となっている.
1.2.2 グラフを超えていく
しかしすでに,グラフを超えていく動きの萌芽も見られる (Hajij et al., 2023).
そのためには,数学の言葉に注目することが肝要である.幾何学には,十数世紀以上の抽象化の蓄積があり,単体複体 (Schaub et al., 2022) や胞体複体 (Hajij et al., 2020) などの概念が,最初のとっかかりとなっている.
(Hansen and Ghrist, 2019) では,スペクトル層理論というスペクトルグラフ理論 (Chung, 1997) の拡張が展開されている.
1.3 位相的機械学習が目指すもの
以上,それぞれのデータに自然な表現を選ぶ ことが大事であることはわかっていただけただろう.
- 創薬において,有機分子が目標のタンパク質に結合するかの判定のために,有機分子を文字列で表してトランスフォーマーに学習させる.
- 画像において,ニューロンの区画をモデリングするために,画像をグラフで表してトランスフォーマーに学習させる.
という営みは,トランスフォーマーというアーキテクチャが言語(だけ)のために制作された当初の意図からすると,大変不本意である.3 (機械学習の黎明期において,必要な試行錯誤であることは間違いないが,)
深層学習が,化学,薬学,神経科学,社会学などの各分野で真にイノベーションを産むためには,その分野にあったアーキテクチャの特定が必要である.
「各分野の各データに最もあったアーキテクチャは何か?」という指標を,幾何学を指導原理として与えよう というのが位相的機械学習である.
これにより,次の2点を達成することが目標である:
2 位相的機械学習の「いま」
位相的機械学習 (TDL) の目指すところを,各分野での成功事例で見ていこう.
2.1 分子モデリング
2.2 SARS-CoV-2 変異株予測
コロナウィルスの変異株にはオミクロン株という名前がついている.
実はオミクロン株にもさらに分類があり,当初の系統は BA.1 である.
BA.2 系統 (Chen and Wei, 2022) と BA.4, BA.5 系統 (Chen et al., 2022) との登場可能性とその性質(感染力は?既存のワクチンが効くか?)を,2ヶ月以上前に「変異懸念株」として予測することに成功したのは,代数トポロジーの知見を取り入れた TDL 手法であった.
パーシステントホモロジーなどの代数トポロジーの手法は,分子間/分子内相互作用を記述するのに優れており,特に SARS-CoV-2 変異株の新たなスパイクタンパク質がどのようなリガンドに結合し得るかの予測に優れていた (Cang, 2018).
SARS-CoV-2 やその変異株の迅速なワクチン開発の背後で暗躍していたのは,TDL だったのである.
2.3 タンパク質の構造予測と生成
Google DeepMind の AlphaFold 2 は主にトランスフォーマーを用いた深層模型で,2020 年の タンパク質構造予測精密評価 (CASP14) で驚異的な成績で優勝した.
たんぱく質の構造生成において,(Hoogeboom et al., 2022) 以来は同変性を備えたグラフニューラルネットワークによる拡散模型の使用も進んでいる.なお,AlphaFold 3 (Abramson et al., 2024) でも拡散模型が取り入れられている.
Deep Learning で大規模分子の構造分布を予測するなんて数年前には考えられませんでしたが、拡散モデルによってすでに現実になりつつあります。4
2.4 電子顕微鏡
3 文献紹介
サーベイかつポジションペーパー (Papamarkou et al., 2024) を大いに参考にした.
(Nguyen et al., 2019) は,マルチスケール重みつき色つき部分グラフとパーシステント・ホモロジーを取り入れた深層学習手法により,D3R Grand Challenge 2 の stage 2 での絶対自由エネルギー予測 set 1 において1位を獲得し,続いて Challenge 3 では 26 のタスクのうち 10 タスクで1位を獲得したことを報告している.
パーシステントホモロジーについて,液体シリカとアモルファスシリカの分子動力学シミュレーション結果を例に取り,パーシステント図式などの方法でデータの位相的構造を取り出している様子が (大林一平, 2018) で詳細に解説されている.論文としては (Hiraoka et al., 2016), (Ichinomiya et al., 2017) に対応する.同著者によるより数学的なものは (大林一平, 2017).平岡裕章研究室の研究紹介スライドも参照.
(Hansen and Ghrist, 2019) では,スペクトル層理論という理論を展開している.これは,スペクトルグラフ理論 (Chung, 1997) を,一般の胞体層 (cellular sheaf) に拡張したものであるという.組み合わせ論的なグラフラプラシアンを,正則な胞体複体上の線型空間の胞体層上の Hodge ラプラシアンの特別な場合と見ることで,スペクトルデータを層のコホモロジーや胞体構造と関連づけることが出来るという.
グラフカーネルに関する良い日本語文献に (ガラムカリ和 et al., 2021) がある.
4 個人的な (Papamarkou et al., 2024) の見どころ
Computer Vision の分野に続いて,構造生成の分野でも Diffusion model が state of the art となったことが触れられている((Mengchun Zhang et al., 2023) も参照):
In addition to 2D and 3D computer vision, diffusion models have become the state-of-the-art in graphbased molecular generation. (Papamarkou et al., 2024)
これが (Bodnar et al., 2022) で Neural Sheaf Diffusion に発展しようとしている.これはグラフ上の層を考えることで,グラフ上に更なる幾何的構造を作り込み,データのより高次の構造を捉えることができるようにしようというものである(この枠組みでは,Graph Neural Network は自明な層を扱った場合,と相対化される).
個人的には,Gauss 過程が Banach 空間の研究に応用できたこと,拡散過程が多様体やグラフの局所構造を捉えることが,単に数学的な特徴付けであることを超えて,効率的な計算手法として,計算機科学として,計算数学として発展する具体的な試みが,TDL の名前の下に総覧できる点が大変に興味深い.
For example, a combination of applied category theory and TDA may lead to algorithms that automatically summarize how neural networks produce their output, making deep learning more understandable to humans. (Papamarkou et al., 2024)
ランダムウォークを用いて,単体複体の表現学習を行うという展開もある Simplex2Vec (Billings et al., 2019), (Schaub et al., 2020)
TDL / GDL は初めての幾何学を指導原理としたエンジニアリングになるかもしれない.多様体を超えた一般的な幾何学的な枠組みが,層の言葉で作られるかもしれない.
(Bronstein et al., 2021) も良い本である.
References
Footnotes
有機化合物は,分枝の構造を文字列で表した SMILES 文字列や,3次元座標で原子の位置を表した MOL ファイルなどで表される (船津公人 et al., 2024).↩︎
(Han et al., 2022) はグラフニューラルネットワークが,Vision Transformer に画像分類や物体認識など多くのタスクで優ったことを報告している.↩︎
例えば,トランスフォーマーは2体間相互作用のモデリングには優れているが,3体間相互作用のモデリングは大変不得意である (Sanford et al., 2023).↩︎