kolmas.tech note

雑記と思索、偏った技術の覚え書き

機械学習の話をしている?

以前のエントリで言及した藤居氏等の著作『自閉症―「からだ」と「せかい」をつなぐ新しい理解と療育』(以下「同書」とする)を読んだ。中々刺激的な読書であった。2007年発行の本なので、現在の自閉症理解においてはごく一般的な説なのかもしれないし、逆に棄却された説なのかもしれないが。そのあたりは、私にとって更に諸々の勉強が必要な所ではある。

読んでみて、まず第一の感想は、これ機械学習の事を知らないと読むの辛くないか?である。逆に私は、全くの専門外とはいえ、野良プログラマ兼研究者くずれとして機械学習について多少の知識はあるので、氏等の提唱する一般化障害仮説は肌感覚的にも極めて理解しやすいものであった。

階層浅すぎパーセプトロン

氏等の提唱する一般化障害仮説の根幹は、脳の認知機能において世界から情報を取得する「抽出処理」と、そこから一般化されたルールを導く「一般化処理」との間で、抽出処理と比較して一般化処理の能力が相対的に弱い事が自閉症の特徴であるとする点にある。その相対的差異が生じた理由が、一般化処理が通常よりも障害されて弱まっていることによるものか、もしくは抽出処理が通常よりも強すぎることによるものか、あるいはその中間的な状態であるのか、の匙加減によって、自閉症スペクトラム障害の幅広い臨床像が現れるとしている。

同書では、認知心理学コネクショニズムの立場からその説明を試みている。コネクショニズムという言葉は初めて目にしたが、同書の説明によると、これは脳機能をニューロンの相互接続によってモデル化しようとするものであるらしい。一定程度の信号刺激を受けたニューロンは、次のニューロンに対して信号を発する。そして、頻繁に信号が授受されるニューロン間の結合は強化され、そうでないニューロン間の結合は弱まっていく。これがコネクショニズムの立場からみた時の脳の学習機序であるとのことである。それを数理モデルに落とし込むと、個々のニューロンをノードとしてそれらの結合を表す有向グラフとなり、さらにグラフのエッジに重みを付けることでニューロン間の結合度を表現する。これは要するに、機械学習分野におけるニューラルネットワークの話である。一応コンピュータを専門の一つとしている身としては、すんなり理解できる概念である。 ja.wikipedia.org

このコネクショニズム、コンピュータ屋としてはニューラルネットワーク、の視点から見た時、自閉症スペクトラム障害ニューロンが縦列に連なる階層が相対的に浅いことによって表出していると捉えられる、というのが同書の立場である。逆に、相対的に多いのは、感覚入力である最も浅い層のニューロンである。即ち、横方向に浅く広がったネットワークになっている。充分な深さがないニューラルネットワークに複雑なルールを学習させる事は出来ない。同書でも紹介されている通り、例えば単層パーセプトロンは線形分離可能な問題しか学習出来ない。さらに、必要以上に多い入力は学習の精度を下げる可能性があり、それは学習の失敗や、過学習として表出し得る。

これは、単層パーセプトロン程度であれば実装して試してみた事がある身としては、感覚的に同意できる所ではある。自閉症を説明する時に、所謂「心の理論」1が挙げられる事があるが、同書の、それらの課題は単に複雑度が高過ぎるだけ、という主張は中々痛快である。

世界の解像度が高過ぎる

以前のエントリで触れた長男について、世界に対する解像度とでも言うべき何かが高いなぁとは何となく思っていた。田園地帯を車で走っていた時、そこそこ遠くにある高架を走り抜けていく新幹線を見つけ、「新幹線」と言ってきた事がある。私はそもそも運転に集中していたのでその高架には一切注目していなかったのだが、横目に見ると確かに新幹線が丁度走っていく所である。目を凝らす程ではないが、言われて見てみないと気付かないような小ささである。長男は、電車が好きとはいえ2普段から高架を凝視している風ではない。にも関わらず良く気付いたなと思い、そこに長男が持っている世界の解像度の高さが感じられた。

感覚過敏という程の傾向も長男にはあまり見られないので、その時は、世界の解像度が純粋に高いという事は悪い事ではないように思えた。しかし先述の一般化障害仮説を鑑みて振り返るに、その高い解像度=強い抽出処理が、長男における諸々の学習を阻害する要因にもなり得るという事である。勿論、抽出処理が絶対的に強い事自体は悪い事ではなくて、一般化処理と比べて「相対的に」強い事が問題である訳だが。即ち、入力に位置するニューロンの多さに対して充分に深いネットワークが構成されていれば問題はないのに対して、そうでなく、横に広く浅いネットワークになっている事が問題である。

そうは言えど、機械学習文脈でのニューラルネットワーク検討であれば形式ニューロンの組み換えなど造作もなく出来る一方で、人の頭にそのような直接的アプローチは出来ない。それに対して同書が提示するアプローチの方向性は、大別すれば課題の単純化とフィードバックの明確化の二点である。

非線形性(出来るだけ)排除

課題の単純化は、自閉症児が理解しやすいように環境や課題を調整することを指している。いわば、環境や課題に含まれる非線形性をできるだけ排除し、浅いニューラルネットワークでも扱い得る形に落とし込んでやる事である。

長男に関しては、この考え方は特に、守るべきルール的なものや定型的な受け答え、生活動作など決まってやらねばならない事を教えるのに有効であるように感じられる。長男は、大人が言う簡単な指示を一定程度理解する事は出来ているように見えるし、年齢に対しては大きく遅れているものの言葉もある程度出ている。その長男に、例えば帰って来たら手を洗うとか、机には乗らない3とか、その類のルーチンやルールを教えるには、この考え方が重要であるように思う。

この時重要なのは、ルーチン・ルールそのものからの非線形性の排除は勿論であるが、さらに加えて、それを運用する大人等の対応を統一する事であろう。同書でも触れられているが、人間の行動なんてものはそれ自体が非線形性の塊である。あるルーチン・ルールを適用するにしても、その時の状況や体調、精神状態等によって我々の行動は細かく変化する。例えば私の場合、外出から帰って来た時、基本的にはまず最初に手洗い場4で手を洗うが、冷凍食品の買い出しをして来た帰りの際は、一旦手洗い場を無視して部屋に行き、冷凍食品を妻に引き渡してから改めて手を洗いに行く。この、ルーチン・ルールを運用するちょっとした大人の匙加減で、このルールを厳密に説明するための変数が一つ増えている。そしてそのような変数は恐らく先のようなまだ比較的分かりやすいものだけでなく、最早我々の認識の域外も含めて多数存在してしまっている。単純化が必要である。

また、大人によって言う事が違うというのも、言われる側にとってはルーチン・ルールに非線形性をもたらし得ると考えられる。家庭内なら家庭内で、長男に伝えるルーチン・ルールに関する認識を統一出来ているべきとなる。そのような単純化・統一がなされていない場面において長男には、上述の高い解像度によってその差異が見えてしまうのだ。その複雑性を伴った入力を階層の深さが足りないニューラルネットワークに入れた時に、思うように学習が進まないというのは容易に想像できる。

一方で上述の通り、人間の行動というのはそもそも非線形なものであって、程度問題こそあれ、将来的には一定程度それに適応する事も求められよう。既存の学習成果を破壊する事なくルールの複雑性を少しずつ増していくアプローチの検討は更に必要なように思われる。

対人間バックプロパゲーション

学習対象となるルーチン・ルールの単純化は勿論のこと、学習を進めるには適切なフィードバックが必要である。機械学習文脈でのニューラルネットワークにおける言葉遣いで言う所の、バックプロパゲーション=誤差逆伝播である。同書の図の中にも、これ機械学習分野の人から見たらバックプロパゲーションの説明にしか見えないよね、という感じの図がある。

学習を進めるためのフィードバックを適切に与えるための手法として同書で挙げられているのが、ABA=応用行動分析を適用したものである。ABAは、行動に与えられたフィードバックが、そのフィードバック対象の今後の行動にどのような影響を与えるかを体系化したものであると理解している。その知見を、フィードバック対象の行動変容に活用するわけである。実際、ABAの考え方は様々な自閉症療育手法の中でフィードバックの与え方として活用されていて、関連する文献も多々あるようである。長男を通わせている自閉症療育施設でもABAを適用した手法を導入している。

ABAの自閉症療育への適用については、まだ概要に触れられている程度でちゃんと勉強できていない。同書を読んだ上での今の私の理解で述べるならば、行動に対するフィードバックの与え方を構造化して非線形性を排除することに、自閉症療育におけるABA導入の価値の一つがあるように感じられる。フィードバックを与えるのが人間の役目であるからには、何も考えていないとフィードバックもまた場面場面で様子が変わり、結果として非線形性を生じ得る。ABAの考え方を理解して適用する事によって、フィードバックにおけるその非線形性を排除し、学習をより効果的に進める事が出来そうである。

次の読み物、そして実適用へ

ここまでまとめたように、私にとって同書の内容は示唆に富んだ物であった。ただ、冒頭述べた通り2007年の本なので、現在の自閉症理解においてどのように捉えられるのかは分からない。その辺の勉強は深めていく必要がある。現在広く用いられている自閉症療育手法と対照して考える事も有効だろう。実際に長男に対してどんな働きかけをするか、という観点からしても、療育手法の本を読むのは重要である。また、上述の通り勉強途中であるABAの理解も進めねばならぬ。

余談:LLMで自閉症傾向を再現できるか?

自閉症の説明において、同書で述べられている一般化障害仮説、その背景としてのニューロン結合が浅く広い事、が適用できるのならばと思いついたメモ書き。

流行りの生成AI、その背景にあるLLM=大規模言語モデルにおいて、自閉症のように見える応答を返す、というより、自閉症のように見える応答しか返せないような物は作れないだろうか。この思いつきを得てから見かけた記事に、例えば以下がある。 note.com この記事が引用している論文は読めていないが、記事には、LLMを構成するネットワークの前半にはデッドニューロンの割合が高いという事が紹介されている。これ即ち、上述の横に広く浅いネットワークの対極である。では、敢えてそれを横に広く浅いネットワークに寄せてみたら、自閉症傾向の再現が出来ないだろうか?

機械学習界隈の皆様からしたら、この仮説はどう映るのだろう。


  1. 「サリーとアン課題」などで評価されるというアレである。ja.wikipedia.org
  2. しかも長男が好きなのはどちらかといえば在来線の方で、新幹線にはあまり愛がなさそう。
  3. 危ないし、次男が真似する。
  4. 帰って来た流れのまま手を洗えるよう、玄関からどの部屋に行くにも必ず通る廊下に手洗い場を置いている。