3/14/2009

ニューロン集団活動と復号化と情報理論~Quian QuirogaとPanzeriの総説

脳の情報処理を細胞レベルで知りたい場合、従来から行われている方法はこう:

1個のニューロンの電気活動(スパイク)を計測しては、その活動と刺激入力や行動出力との対応を調べる。そして、例えば1年以上かけて、100個分のニューロン活動のデータを集めたら、そのデータを統計解析しては、脳でこんな情報処理をしている、といったことを議論する。

この方法は大成功をおさめて、脳の理解は深まったし、今でも重要な情報を提供し続けている。

一方で、20年くらい前から、次のような方法論も普及してきた:
たくさんのニューロンたちの活動を「同時」に計測して、その集団の活動から脳の情報処理を議論する。(この場合、1日の実験のデータ解析に1年以上かかることもある。。。)

と違う方法論ではあるけれど、きっと多くの人は、
ニューロンは集団として情報を処理している
と考えているはずである。

とすると、研究現場では、集めたニューロンたちの活動データから何とかして情報を抽出しないといけない。(でないと論文が書けない)

そんな情報を抽出する時の方法論をわかりやすくまとめた総説Nature Review Neuroscienceに掲載されている。

(*と、今回も非常にテクニカルな話題です。。。すみません。。。)

---
著者のQuian QuirogaとPanzeriは、この総説の言葉を借りればneurostatistician(にゅーろすたてぃすてぃしゃん)。

神経統計学者。

非常に頭が良さそうな研究者の響きがする。

限られた量のニューロン活動データから情報を抽出する場合、従来の統計学+アルファの知識やノウハウが必要とされる。そのために新しい統計学の方法論を開発する必要も時にはあるから、そのような分野を「神経統計学」という耳慣れない言葉で表現するのだろう。

それはともかく、この総説では、ここ数年よく使われるようになってきた、ベイズ的な方法に代表される復号化(decoding)と、(シャノンの)情報理論について、神経統計学的な観点からまとめられている。

それぞれの基本的な発想とお互いの相補性、さらには実際に応用する時の注意点、限界なども説明されている。そして、著者の研究を主に紹介しながら、復号化と情報理論の応用例をまとめている。そして最後に、次元圧縮法や相関活動の扱いという技術的な問題を強調しながら、今後の課題・方向性を議論している。

---
僕は神経統計学者ではないけど、研究分野としては非常に近いし、個人的な感想を書いてみる。

この総説は、神経集団スパイクデータの解析法としての、復号化と情報理論に関する基礎知識と重要文献が非常によくまとめられていて、必読文献だと思う。クロスバリデーションや情報量計算時のバイアスの問題なども言及されていて、実用上気をつけるべき情報も提供されている。

ただ、マルチニューロン活動計測をするかしないかの一つの本質であるノイズ相関のことは比較的軽目に扱われていたのは残念。これに関する重要文献の一部は参考文献として挙げられている。

また、Bialekたちの貢献があまり評価されていなかったように感じたのは気のせいか。ちなみに、Panzeriは情報理論で有名ではあるけど、最近の方法はともかく、一昔前の、しかも多くの人が使ってしまった相互情報量の計算法は、一部のわかっている人には評判は悪い。それがなぜかは、Panzeri自身が書いた総説を見ればよくわかる。

それから、このような総説を読んでいつも思うのは、テクニカルな議論になればなるほど、「脳との乖離」を感じる。

この総説にあるように、
1.計測
2.スパイクソーティング
3.スパイク解析
という3つのステップが研究上のプロセスなわけだけども、3の方法論的なことを深く考え進めると、どうしても1の部分、特に生物学的な視点がおろそかになる気がする。この総説を読みながらもそう感じた。常に、生ものを扱っているという視点を失わないようにしながら研究していかないといけない。(理論ではなく、あくまでデータ解析なんだし)

回路のごくごく一部のエレメントからしかニューロン活動を計測していないわけだから、解析の方法論を開発するのも重要な一方、回路のどのあたりからデータを得ているか、そういうことを考慮にいれながら、データを解釈していく必要もあるように思う。

---
文献
Nat Rev Neurosci. 2009 Mar;10(3):173-85.
Extracting information from neuronal populations: information theory and decoding approaches.
Quian Quiroga R, Panzeri S.

4 comments:

阿頼王 said...

脳の情報処理については、大まかに2つの方法が有る訳ですね。

一つは『1個のニューロンの電気活動(スパイク)を計測しては、その活動と刺激入力や行動出力との対応を調べる』方法と、
『たくさんのニューロンたちの活動を「同時」に計測して、その集団の活動から脳の情報処理を議論する』方法。

でも、多数のニューロン活動による“情報処理”も結局は、1個のニューロンの電気活動が、多数のニューロンに波及して行われているのだから、多数のニューロン活動をエンコードすれば、今まで行われていた1個のニューロン活動についても深い理解が得られる……って理解でいいのでしょうか?(余り自信無し)

実際、多数のニューロン活動が同時に行われて居るわけで、後者の方が、“より現実の脳活動”に近いですよね。

たまたま、最近、別の目的で『統計解析』のお勉強をしているのですけど、『統計解析』の世界だけでも“奥が深い”です。で、その中の一冊の本の最初の辺りに、

「統計はウソをつく」

って書いてありました^^;

どういう事かと言うと、同じデーターでも、『階級の分け方によって全く違う印象の度数分布』になると言う事ですね。統計解析って、確かにマスターすれば“素晴らしいツール”になると思います(だから、今、少しずつお勉強しているのですけど)けど、あまり統計解析の世界に入り込んでしまうと、わたしの能力では『迷子』になっちゃいそうです。

>常に、生ものを扱っているという視点を失わないようにしながら研究していかないといけない。

って仰る、Shuzoさんの研究者としての感覚は、本当に大正解だと思います。

わたしが、大学レベルでH-H方程式を“いじりまわしていた”時も、論理の上に論理を乗せていくと、なんか「どんどん現実から遠ざかって、自分の都合の良い理論を作れそうな感じ」がつきまとっていました^^;

どんなに立派な“ツール”でも、その“ツール”を十分に理解して使わないと、事実を好きな形に加工してしまうような気がします。

それにしても『統計解析』って、わたしにとっては難しいです~

Shuzo said...

こんにちは阿瀬王さん。

> 脳の情報処理については、大まかに2つの方法が有る訳ですね。

正確にはこうですね:
ニューロンの活動(スパイク)を測って、脳の情報処理を知る方法は、大まかに二つある。

決して、脳の情報処理そのものが二つしかない訳ではないです。(多分、わかっていらっしゃるでしょうけど、他の方に誤解を招きそうでしたので)

> 「統計はウソをつく」

なるほど。
確かに
統計は人を欺く
は確信をついているようにも思います。
「有意差」のp値なんて、詐欺みたいなもんですしね(と言い切ると、統計学者の方に怒られるかもしれませんが)。

あと、HHモデルですが、HHモデルは理論ですので、今回議論した「データ解析」とは違うので、立場は分かれるところのような気もします。
理論は、多くの現実を予言できることもありますから、その意味では、少々生モノから距離を置くのは良い気もします。

例えば、ニュートン力学(ここの文脈で私が「理論」と言っているものの典型です)が、単にリンゴが落ちることしか説明できなくて、ミカンが落ちることは説明できなかったら何の意味もないですし。その意味では、いろんな現象を説明できるくらい抽象度が高い理論は、むしろ多くの神経科学者が欲しているものでもあります。


> それにしても『統計解析』って、わたしにとっては難しいです~

全く同感です。
私は絶対に実験向きだと痛感してます。。。

Anonymous said...

okahiraです。

ニューロン集団の同時性を解析するのは相当難しそうですね。ノイズの処理とか特に
データ解析に1年。。。すごい

生物を相手にしているということは、計測と解析を両立しなければいけないってことですね。

Shuzo said...

コメントありがとうございました。

> データ解析に1年。。。すごい

ちょっと大げさすぎました。。。すみません。

けど、3年以上前に取った実験データに今ももがいているのはホントなので、ウソと言うわけではないです。

もちろん、これだけ時間がかかるのは、研究デザインが悪かったり、仮説がショボかったりしたのが大きな原因ですので、ホントに頭の良い方なら、サクッとデータを取って、サクッとデータ解析を終えて、サクッと論文を出せると思いますよ。

ただ単に私が無能(無脳?)なだけです。。。