[archive] 機能的MRIと深層学習の融合(近添准教授)

人工知能と神経基盤の相互参照アプローチによる視覚-価値変換機構の解明

(新学術領域「人工知能と脳科学」公募研究)

要約

生物の行動は主観的価値によって規定されている。外界の情報は感覚器を介して捉えられ、脳内で抽象的価値情報に変換された後、価値に基づく意思決定を経て適切な行動が選択される。ヒトを対象とした機能的MRI研究により、前頭眼窩野や側坐核、線条体が価値処理に関わることが明らかにされているが、感覚情報からどのような過程を経て価値の情報が生じるかは明らかにされていない。視覚情報からカテゴリ情報への変換が階層的に行われることから、視覚情報から価値情報への変換も同様の階層的処理を受けている可能性がある。本研究計画においては、価値処理領域として既に同定されている領域間で価値の情報表現構造を比較するのみでなく、未知の価値処理領域をモデルの情報構造との対応から明らかにする。具体的には、深層学習により多層ニューラルネットワークに画像情報と価値の対応を学習させ、構築された階層構造から脳内の価値情報の階層構造を推測し、翻って、脳内の階層構造から多層ニューラルネットの設計を行う。この手順を反復的に行うことで、視覚情報から価値情報への変換に関わる未知の神経機構を明らかにすると同時に、視覚情報から価値情報を抽出する人工知能を開発する。人間の価値評価の神経基盤を模した人工知能を産業応用することで、直接的に社会に貢献するとともに、感覚情報から価値情報への変換過程を明らかにし、価値の「前駆体」に相当する脳内表象を発見することで、価値判断研究の新しい古典となるような研究を目指す。

 

背景と研究目的

複数の選択肢から最良のものを選び出すためには、個体は対象の価値を評価し比較する必要がある。申請者は、視覚刺激および味覚刺激提示中の脳活動の空間的パターンを解析することにより、前頭眼窩野において感覚情報と切り離された抽象的な「価値」が表現されることを明らかにした(Chikazoe et al., 2014)。また、視覚刺激が抽象度に応じて様々なレベルの情報を持つことに着目し、申請者が開発した手法である表象類似度分解を用いて、視覚刺激の物理的特徴、カテゴリ、主観的価値の情報が、それぞれ視覚野、下部側頭葉、前頭眼窩野で表現されることを明らかにした。これらの結果は、感覚器を介して捉えられた外界の情報が、脳内で価値情報に変換されることを示唆しているが、この変換処理のメカニズムに関しては、ほとんど何もわかっていない。一方、視覚情報からカテゴリ情報への変換は、腹側視覚路において階層的情報処理によってなされることが、機能的MRIや電気生理学的手法を用いた先行研究により明らかにされている(Kravitz et al., 2013)。近年、視覚情報からカテゴリ情報への変換を行うよう設計されたニューラルネットワークが、哺乳類の腹側視覚路と類似した構造をもつことが明らかにされているが(Güçlü et al., 2015)、このニューラルネットワークは、実際の視覚処理神経機構のごく一部(畳み込みやプーリング処理)を模倣しているに過ぎず、この構造は膨大なデータ(例:100万枚の画像とそれに対応する1000のカテゴリ)を利用した教師あり学習の結果、獲得されたものである。また先行研究により、モデルと実際の神経基盤の情報表現の類似の度合いと、モデルの対象識別における成績とは相関することが明らかにされている(Yamins et al., 2014; Khaligh-Razavi & Kriegeskorte, 2014)。深層学習を用いた外部データのモデリングが偶発的に神経基盤と類似した情報表現を獲得するメカニズムは明らかにされていないが、発達の過程で生じるシナプス刈り込みと深層学習における誤差逆伝播法などのユニット間の結合強度の学習過程が類似した効果をもたらしているのかもしれない。もしモデルと神経基盤の情報表現の類似がこのような回路の形成過程における類似に由来するのであれば、感覚情報処理にとどまらずより高次の脳機能においても、同様の類似構造が見出されるはずである。

 

目標

そこで本研究計画においては、そのメカニズムのモデルを作成すると同時に、モデル内の情報表現の構造を手掛かりにして、視覚-価値情報変換の神経基盤を解明することを目指す。具体的には研究期間内に以下の研究目標の実現を目指す。

A.美術品オークション情報から、視覚情報を価値情報に変換する人工知能の雛形を作成する。

B.個人の行動実験結果および脳活動と人工知能の間でフィッティングを行い、新規の刺激への個人の反応を予想する人工知能を作成するとともに、人工知能の各階層に対応する脳領域を個人のレベルで同定する。

C. 個人の嗜好を模倣した、視覚-価値変換を行う人工知能と、その各階層に対応する脳内情報mapを被験者間で統合する。被験者間で共通する視覚-価値変換の神経基盤を同定するとともに、仮想的な平均的個人の視覚-価値変換処理を模倣した人工知能を作成する。

 

方法

本研究計画においては、視覚情報を価値情報に変換する人工知能を作成するとともに、視覚情報から価値の抽出に関わる神経基盤を同定する。最初の段階では、ビッグデータを入出力に用いて視覚情報を価値情報に変換する人工知能を作成し、次の段階では、行動実験データと機能的MRIにより測定した脳活動に基き、人工知能の個人へのフィッティングを行う。最終段階では被験者間で脳内情報mapと人工知能の統合を行い、被験者間で共通する視覚-価値変換の神経基盤を同定する。

2017年度:

A. 視覚情報から価値情報を抽出する人工知能(多層ニューラルネットワーク)作成

美術品のオークションの参加者は、美術品の写真と記述の情報から入札額を決定する。これはつまり、理想的な人工知能を作成できれば、美術品の写真と記述から価格を予想可能であることを示している。モダリティの異なる入力(視覚と言語)を同時に扱う分類器の設計はより複雑であること(Ngiam et al., 2011)、および言語処理を行う分類器の設計自体も複雑であることを考慮し、本研究計画では、視覚的情報のみを用いて分類器を作成する。分類器の訓練には美術品オークションサイトで公開されている取引結果と画像情報(1250万件以上)を用いる(https://www.liveauctioneers.com)。視覚から価値への情報変換には、対象が何であるかを認識する対象認識の過程が必要となると思われるが、この過程は、カテゴリ分類を行う分類器と共通であると考えられる。そこで、視覚-価値変換器の設計には、ひな形として既存のニューラルネットワークを用いる。視覚情報からカテゴリ情報を抽出する分類器としてはHintonらのグループが2012年のCompetition (ILSVRC2012)で用いた分類器がよく用いられる。この分類器はオープンソースで提供されている(caffe.berkeleyvision.org)ので、これに階層を追加した多層ニューラルネットワークに対して、オークション商品の画像情報を入力し、取引価格を出力するように深層学習を用いて訓練する。このようにして構築された視覚-価値変換器は、情報処理内容の違いを反映して、従来のカテゴリ情報の分類器とは異なる構造をとることが予想される。例えば、Hintonらの分類器の最も低次の階層では、学習の結果、初期視覚野の神経細胞と類似したガボールフィルター様の受容野をもつユニットが観察されるようになるが、視覚-価値変換器においては、出力の違いを反映して、このようなユニットの割合が減少することを予想する。申請者の予備実験の結果からは、価値情報処理への初期視覚野の関与が示唆されており、このことから、視覚-価値変換器においても、低次の階層の段階で価値の前駆体に相当するシグナルがみられることを予想している。

 

2018年度:視覚-価値情報変換を行う神経基盤の同定(超高磁場MRIによる機能的MRI実験)

B. 個人の嗜好を模倣した視覚-価値変換を行う人工知能の作成

前述のように、哺乳類の脳内でどのような情報処理を受けて感覚情報が価値情報に変換されるかは解明されていない。そこで、本研究計画においては、仮想通貨を用いたオークション課題遂行中の脳活動を機能的MRI実験により測定し、購買行動における商品の価値の脳内表現を明らかにする。オークション課題においては、2017年度の人工知能作成に用いたものと同様の美術品画像のうち、モデルの作成に用いられなかったものを被験者に提示して「この絵を買うとしたら、いくらまでなら出せるか」を答えてもらう。この課題においては、美術品の正確な価格を予測することを目的とはせず、被験者個人の感じる主観的価値を知ることを目的としている。オークション課題は、MRIスキャナの内外で行い、スキャナ外で取得した視覚刺激に対する各被験者の主観的価値のデータは、各被験者にフィッティングした人工知能の予測性能の評価に用いる。次に、前年度において作成した視覚-価値変換を行う人工知能と各々の被験者の間で、フィッティングを行う。人工知能の出力する「美術品の価値」と各々の被験者が答える「美術品の主観的価値」の間には、個人の嗜好の違いを反映して大きな差が生じることが予想されるので、出力誤差を最小化するよう、誤差逆伝播法を用いて最上位の階層から順に下っていく形で、モデルのパラメータを調整する。

次に機能的MRI実験に用いた全ての視覚刺激の組み合わせにおいて、刺激間の情報表現の違いを、類似度行列の形でそれぞれの階層で計算し、これと脳活動の空間的パターンの類似度行列との対応を調べる。この手続きにより、視覚-価値変換器の各階層の情報表現が脳内のどの領域の情報表現に対応するかを同定する。さらに、実験的に計測した個人の脳活動のデータと視覚-価値変換器の間で情報表現が類似するように、視覚-価値変換器のパラメータを修正する(図1)。

このようにして作成された視覚-価値変換器は、個人の嗜好と脳活動を反映して、未知の刺激に対しても、その個人と類似した価値判断を行う機能を獲得することが予想される。以上の計画により、新規の刺激への反応(スキャナ外にて取得した美術品に対する主観的価値のデータ)をできるだけ正確に予想する、各被験者の嗜好と脳内情報表現を模した人工知能を作成する。

 

C. 視覚-価値変換を行う人工知能と、その各階層に対応する脳内情報mapの被験者間統合

最終段階では、個人にフィッティングした人工知能とその各階層に対応する脳内情報mapの被験者間での統合を行う。脳内情報mapの被験者間統合には、機能的MRI研究で通常行われる集団解析の手法を用いる。具体的には、各被験者の脳内情報mapを標準脳に投射後、脳内の各画素(voxel)において、各階層毎に計算した脳内情報量の値を集団解析にかけ、被験者間で共通する視覚-価値変換の神経基盤を同定する。人工知能の統合においては、個人毎に作成した人工知能からの出力を相加平均また相乗平均して出力とする、アンサンブル分類器を作成する。

 

研究経過

2017年度は、画像認識における代表的モデルであるVGG16をベースにして、これに美術品と価格の関係を学習させる転移学習を行うことで、画像と価格の関係を推定する一般的人工神経回路(general artificial neural network)を作成した。学習に用いるデータは、美術品オークションを行うwebsiteにおいて実際に取引の成立したものの中から5000ドル以下のものに限定した(test datasetと含め計40,000)。これにより、有名作家の作品はほぼ除外され、解析の対象となるデータの多くは、無名作家またはローカルな作家に限定された。さらに、30人の被験者を対象に機能的MRI実験を行い、美術品の画像の価値評価を行う際の脳活動のデータを取得し、この実験における行動データに基づいて、視覚ー価値変換回路の個人最適化を行った。これにより、半分の被験者で個人の嗜好を推定する人工神経回路の作成に成功した(r > 0.31, p < .05)。今後は、このパフォーマンスを、脳機能イメージングの情報を取り込むことによりどの程度改善できるかが重要なポイントとなる。脳機能イメージングデータの前処理は終了しているが、「主観的な価値基準に基づいて油絵を評価する」という課題自体が複雑なため、脳活動のパターンも複雑なものになっている。まずは標準的な解析手法(回帰分析)による脳活動推定を行い、その結果に基づいた解析を進めるが、これに加えて、脳活動推定においてより複雑なモデル(Singh et al., in preparation)を適用することも検討している。

 

深層学習と機能的MRIの融合による聴覚刺激の嗜好の個人差の解明(新学術領域「多元質感知」公募研究)

要約

本研究計画においては、未だ明らかにされていない、聴覚刺激の嗜好の個人差の神経機構の構造を探るために、ニューラルネットワークモデルを利用する。具体的には音楽情報のデータベースから取得した大量の音楽ファイルとそのサイト内での人気の情報を用いて、多層ニューラルネットワークに音楽と人気の関係を学習させ、聴覚-価値変換の数理モデルを作成する。次に、音楽刺激を聴いてそれに対する選好度を答える課題を用いた機能的MRI実験を行い、聴覚情報を価値情報に変換する際の脳活動を計測する。作成した多層ニューラルネットワークに機能的MRI実験で用いた聴覚刺激(音楽ファイル)を入力し、各階層においてこれらの刺激がどのように表現されるかを推定する。さらに、これらの視覚刺激間の類似度を各階層で計算し、これと脳活動の空間的パターンの類似度との対応を調べる。脳活動の類似度は、脳内の各領域で個別に求めることができるので、申請者が開発した手法である表象類似度分解(Chikazoe et al., 2014, Nature Neuroscience)を適用することにより、多層ニューラルネットワークの各階層が脳内のどの領域に対応するかを同定することができる。さらに、実験的に計測した脳活動のデータと、被験者の回答した楽曲の主観的価値の情報を用いて、聴覚-価値変換を行うニューラルネットワークの構造を修正し、被験者個人の神経機構の構造に近づける。純粋な工学的アプローチにより作成された聴覚-価値変換モデルが表現する「価値」の内容は、人間の感じる「価値」と異なるものとなる可能性があるが、本研究においては、フィッティングにより人工知能と人間の神経基盤の間での情報表現の乖離を最小化し、新規の刺激に関しても、個人の嗜好を模倣した反応(価値評価)を行う人工神経回路を作成する。さらに、被験者間で脳内情報mapの統合を行い、被験者間で共通する聴覚-価値変換の神経基盤を同定するとともに、音楽の嗜好の個人差の原因となる脳領域を同定する。

 

背景と研究目的

味覚刺激や聴覚刺激に対する個人の嗜好は多様であるが、これがどういった神経基盤の働きによるものかは明らかにされていない。価値評価は質的情報を量的情報に変換する過程であることから、嗜好の個人差はこの変換過程および質感知の神経基盤の個人間の違いに原因を求めることができる。申請者は、視覚刺激および味覚刺激提示中の脳活動の空間的パターンを解析することにより、前頭眼窩野において感覚情報と切り離された抽象的な「価値」が表現されることを明らかにした(Chikazoe et al., 2014)。また、視覚刺激が抽象度に応じて様々なレベルの情報を持つことに着目し、申請者が開発した手法である表象類似度分解を用いて、視覚刺激の物理的特徴、カテゴリ、主観的価値の情報が、それぞれ視覚野、下部側頭葉、前頭眼窩野で表現されることを明らかにした。これらの結果は、感覚器を介して捉えられた外界の情報が、脳内で共通情報に変換されることを示唆しているが、この変換処理のメカニズムに関しては、ほとんど何もわかっていない。一方、視覚情報からカテゴリ情報への変換は、腹側視覚路において階層的情報処理によってなされることが、機能的MRIや電気生理学的手法を用いた先行研究により明らかにされている(Kravitz et al., 2013)。近年、視覚情報からカテゴリ情報への変換を行うよう設計されたニューラルネットワークが、哺乳類の腹側視覚路と類似した構造をもつことが明らかにされているが(Güçlü et al., 2015)、このニューラルネットワークは、実際の視覚処理神経機構のごく一部(畳み込みやプーリング処理)を模倣しているに過ぎず、この構造は膨大なデータ(例:100万枚の画像とそれに対応する1000のカテゴリ)を利用した教師あり学習の結果、獲得されたものである。また先行研究により、モデルと実際の神経基盤の情報表現の類似の度合いと、モデルの対象識別における成績とは相関することが明らかにされている(Yamins et al., 2014; Khaligh-Razavi & Kriegeskorte, 2014)。深層学習を用いた外部データのモデリングが偶発的に神経基盤と類似した情報表現を獲得するメカニズムは明らかにされていないが、発達の過程で生じるシナプス刈り込みと深層学習における誤差逆伝播法などのユニット間の結合強度の学習過程が類似した効果をもたらしているのかもしれない。もしモデルと神経基盤の情報表現の類似がこのような回路の形成過程における類似に由来するのであれば、感覚情報処理にとどまらずより高次の脳機能においても、同様の類似構造が見出されるはずである。

 

目標

そこで本研究計画においては、そのメカニズムのモデルを作成すると同時に、モデル内の情報表現の構造を手掛かりにして、聴覚-価値情報変換の神経基盤を解明することを目指す。具体的には研究期間内に以下の研究目標の実現を目指す。

A. 10万件におよぶ楽曲情報から、聴覚情報を価値情報に変換する人工知能の雛形を作成する。

B. 個人の行動実験結果および脳活動と人工神経回路の間でフィッティングを行い、新規の刺激への個人の反応を予想する人工神経回路を作成するとともに、人工神経回路の各階層に対応する脳領域を個人のレベルで同定する。

C. 個人の嗜好を模倣した、聴覚-価値変換を行う人工神経回路と、その各階層に対応する脳内情報mapを被験者間で統合する。被験者間で共通する聴覚-価値変換の神経基盤を同定するとともに、嗜好の個人差の原因となる脳領域を同定する。

 

方法

本研究計画においては、聴覚情報から価値情報を抽出する人工神経回路を作成するとともに、聴覚刺激の嗜好の個人差に関わる神経基盤を同定する。最初の段階では、ビッグデータを入出力に用いて聴覚情報を価値情報に変換する人工神経回路を作成し、次の段階では、行動実験データと機能的MRIにより測定した脳活動に基き、人工神経回路の個人へのフィッティングを行う。最終段階では被験者間で脳内情報mapと人工神経回路の統合を行い、被験者間で共通する聴覚-価値変換の神経基盤を同定するとともに、価値評価の個人差に最も大きな寄与をもつ脳領域を同定する本研究計画においては、聴覚情報から価値情報を抽出する人工神経回路を作成するとともに、聴覚刺激の嗜好の個人差に関わる神経基盤を同定する。最初の段階では、ビッグデータを入出力に用いて聴覚情報を価値情報に変換する人工神経回路を作成し、次の段階では、行動実験データと機能的MRIにより測定した脳活動に基き、人工神経回路の個人へのフィッティングを行う。最終段階では被験者間で脳内情報mapと人工神経回路の統合を行い、被験者間で共通する聴覚-価値変換の神経基盤を同定するとともに、価値評価の個人差に最も大きな寄与をもつ脳領域を同定する。

2018年度:

A. 聴覚情報から価値情報を抽出する人工神経回路作成

音楽の嗜好の個人差は大きいため、この個人差をモデルに取り込む必要があるが、初年度は、まず個人差を考えないモデル(匿名データに適合した人工神経回路(図2))を作成する。人工神経回路の訓練には音楽共有サイト(Free Music Archive (FMA))で公開されている楽曲とそれに対応する視聴数および人気の情報(10万曲以上)を用いる(https://github.com/mdeff/fma)。聴覚から価値への情報変換には、音声ファイルから質感情報を含む特徴を抽出するプロセスが必要である。そこで、聴覚-価値変換器の設計には、ひな形として既存のニューラルネットワークを用いる。聴覚情報から特徴を抽出する人工神経回路としては畳み込みニューラルネットワークであるWavenetや再帰型ニューラルネットワークであるMagentaなどを用いる。これらの人工神経回路はオープンソースで提供されている(https://github.com/ibab/tensorflow-wavenet; https://github.com/tensorflow/magenta)ので、これに階層を追加した多層ニューラルネットワークに対して、FMAからダウンロードした楽曲情報を入力し、各楽曲の人気の度合いを出力するように深層学習を用いて訓練する。このようにして構築された聴覚-価値変換器は、情報処理内容の違いを反映して、発話内容を判定する人工神経回路とは異なる構造をとることが予想される。価値評価は質的情報を量的情報に変換するプロセスであり、入力情報に近い階層においては、聴覚情報の質的情報が表現されると考えられるが、申請者の予備実験の結果からは、価値情報処理への初期視覚野の関与が示唆されており、このことから、聴覚-価値変換器においても、低次の階層の段階で価値の前駆体に相当するシグナルがみられることを予想している。

 

2019年度:聴覚-価値情報変換を行う神経基盤の同定(超高磁場MRIによる機能的MRI実験)

B. 個人の嗜好を模倣した聴覚-価値変換を行う人工神経回路の作成

前述のように、哺乳類の脳内でどのような情報処理を受けて感覚情報が価値情報に変換されるかは解明されていない。そこで、本研究計画においては、被験者に音楽刺激に対する選好度をレーティングしてもらい、その時の脳活動を機能的MRI実験により測定し、音楽刺激の価値の脳内表現を明らかにする。レーティング課題においては、2018年度の人工知能作成に用いたものと同様の音楽刺激のうち、モデルの作成に用いられなかったものを被験者に提示して「この楽曲を買うとしたら、いくらまでなら出せるか」を答えてもらう。この課題においては、楽曲の商業的価値を予測することを目的とはせず、被験者個人の感じる主観的価値を知ることを目的としている。レーティング課題は、MRIスキャナの内外で行い、スキャナ外で取得した聴覚刺激に対する各被験者の主観的価値のデータは、各被験者にフィッティングした人工知能の予測性能の評価に用いる(図1)。次に、前年度において作成した聴覚-価値変換を行う人工知能と各々の被験者のデータの間で、フィッティングを行う。人工神経回路の出力する「楽曲の価値」と各々の被験者が答える「楽曲の主観的価値」の間には、個人の嗜好の違いを反映して大きな差が生じることが予想されるので、出力誤差を最小化するようモデルのパラメータを調整する。ここで、通常の人工神経回路の訓練では、誤差逆伝播法を用いて最上位の階層から順に下っていく形でモデルのパラメータを調整するが、本研究計画におけるフィッティングでは、必ずしも誤差逆伝播法を用いる必要はない。人工神経回路の各階層と対応する脳領域が同定できていれば、誤差は全階層で同時に計算可能であるからである。そこで、このプロセスにおいては、通常の誤差逆伝播法のみでなく、全層のパラメータのフィッティングを同時に行う方法もテストする。

C. 聴覚-価値変換を行う人工知能と、その各階層に対応する脳内情報mapの被験者間統合

最終段階では、個人にフィッティングした人工知能とその各階層に対応する脳内情報mapの被験者間での統合を行う。脳内情報mapの被験者間統合には、機能的MRI研究で通常行われる集団解析の手法を用いる。具体的には、各被験者の脳内情報mapを標準脳に投射後、脳内の各画素(voxel)において、各階層毎に計算した脳内情報量の値を集団解析にかけ、被験者間で共通する聴覚-価値変換の神経基盤を同定し、これらの脳領域内で嗜好の個人差を最もよく説明する脳領域を同定する。

 

研究経過

本研究においては、聴覚刺激を価値に変換する人工神経回路を作成する部分に困難が予想される。視覚刺激を用いた物体認識は、深層学習が最も成功している領域であって、VGG16やresnetなど、人間と同等以上の成績を示すものも作成されているが、聴覚刺激の処理に関しては、そのようなものは作成されていない。現在は、先行研究を参考にしながら、音楽刺激からvalenceおよびarousalを読み取るrecurrent neural networkを作成している。ある程度の予測精度を出せるものが作れた時点で、fMRI実験に移りたいと考えている。

本編に戻る