言葉とは何だろう。それはおそらく、人間とは何かを問うのと同じだけの時間、問われ続けてきた根源的な問いだろう。なぜ人間だけが言葉をもつのか、なぜ子どもは文法など何も知らないうちから言葉を話し始めるのか、言語の起源は何か……等々、言葉にまつわる疑問は尽きない。哲学や心理学、文化人類学、言語学など多様な角度から研究されてきたテーマである言葉に、工学と物理学の観点からアプローチしているのが、東京大学大学院工学系研究科准教授の峯松信明さんである。柏キャンパスから本郷キャンパスの工学部2号館に移転中の実験室には、運びこまれたばかりのコンピュータがカバーをかけられたまま並ぶ。峯松さんの研究室もまだ真っ新な何もない状態だが、研究は大きな展開を見せていた。
自閉症への関心
峯松さんはここ数年、計算機に音声を認識させる技術を構築する中で自閉症という障碍と出会い、彼らの音声認知を物理的な側面から考察している。今年5月にはコロラド州立大学を訪問し、テンプル・グランディン准教授と面会した。テンプル・グランディンは、農場の家畜用囲いや食肉プラントの設計など多様な動物管理システムを研究する動物科学者で、自閉症の当事者として世界で初めて自伝(『我、自閉症に生まれて』原著1989)を著した人物だ。脳神経科医オリヴァー・サックスが脳障碍をもつ人々との交流を綴った『火星の人類学者』に登場し、自らの障碍を冷静に見つめ、自立した生活を送る彼女の姿は多くの読者の感動を呼んだ。
「ぼくにとっては奇跡みたいな人です」
峯松さんは開口一番、そういった。
「音声情報処理を研究して、より賢い機械を作りたいと思うなかで、自閉症の症状と今の音声認識機のふるまいに類似点があることを感覚するようになり、彼女の『動物感覚』という本に出会った。彼女が動物学者で、本当に嬉しかった」
音声認識機と自閉症の接点とは何か。なぜ峯松さんはテンプル・グランディンが動物学者でよかったと話すのか。まずは峯松さんの言葉への関心の起点にさかのぼることにしよう。
音声研究者になるまで
高校時代、峯松さんは英語と演劇が大好きだった。将来英語教師になることも選択肢の一つと考えたこともある。
今も大切な記憶として峯松さんの心に残るのが、文化祭で発表した「ある罪の裏側」という公演だ。演劇は本来、体育館で発表しなければならなかったが、その年は発表を希望するグループの数が予定を上回ったため、くじにはずれた峯松さんらのクラスはやむなく記念会館という別の建物の小さなスペースで公演するしかなかった。ところがこれが結果的に奏効した。
「ある罪の裏側」の原作は、密室劇の金字塔といわれる「十二人の怒れる男」だった。シドニー・ルメット監督の映画で知られる本作は、裁判所の小さな一室に集まった12人の陪審員の会話だけで構成され、大掛かりな舞台装置は必要ない。まさに小さなスペース向けの演目だったのである。目の前で展開する芝居は臨場感にあふれ、観客を魅了した。
後にNHK放送技術研究所に就職するエンジニアの兄の影響で東京大学・理科一類へ進んだ峯松さんは、高校の文化祭の舞台での快感が忘れられず,また英語との接点を求める中で、大学ではESSドラマセクションに所属し、英語劇の舞台に立ち、演出も担当した。後輩に英語の発音を教えたこともある。
工学系にいながら言葉や声に関わる研究ができないものか。大学院を目前にして峯松さんが選んだのが、音声研究だった。大学院への進学を控えた学部4年から音声言語情報処理を専門とする藤崎博也・廣瀬啓吉研究室に所属し、計算機やコンピュータを用いたソフト開発を目指した。
「鉄腕アトムの耳と口を作ろうというのがわれわれのキャッチフレーズでした。こちらが言葉で語りかけると、それを理解して言葉で返してくれるようなインターフェイスを作ろうということです」
そのためには何が必要か、どういう処理を計算機で行えばよいか。試行錯誤は続いた。
音声研究への違和感
峯松さんに転機が訪れたのは、2002年の秋。音声工学の礎を作ったグンナー・ファントら世界的な音声学者が研究するストックホルムのスウェーデン王立工科大学に客員研究員として赴任したときだった。大学を拠点に欧州各国を旅してさまざまな研究者と議論するうちに、過去15年間にわたり音声を研究してきた峯松さんの中にあったもやもやしたものが徐々に明確になっていったのである。
「なんかしっくりこないな、という感覚があったんです。教科書にはそう書いてあるんだけど、どうもしっくりこない。じゃあ、何がしっくりこないのか。スウェーデンにいたときはそのことをじっくり考えました」
しっくりこない――峯松さんが繰り返す言葉の意味は次のようなことだ。
音声は空気の振動だが、観測を続けていると、不思議なことに気づくようになる。たとえば、ジャイアント馬場のような背の高い人と身長50センチほどの小さな人がいたとしよう。彼らにそれぞれ「おはよう」と発音してもらったとする。日本語のわかる人であれば、彼らの声がどんな声であろうが、「おはよう」は「おはよう」と認識できるだろう。ところが、これまでの音声研究では、これが困難だった。フォルマント周波数、すなわち、声の音色は声道(喉)の長さに大きく依存するため(長い喉は太い声になる)、身長の高い人の声と低い人の声は異なる物理現象として計測されるためだ(注1)。つまり、話者が違えば別のもの。世界60億人が「おはよう」といえば、60億通りの「おはよう」がある、と認識するのが機械処理の原理原則なのである。
話者が誰であれ、「おはよう」は「おはよう」と認識できる機械を作るために現在行われている主な方法は、できるだけたくさんの音声を集めることだ。某メーカーが音声認識の機械を開発するにあたって35万人の音声を集めたことが宣伝文句になることもある。新しい携帯電話が開発されたからまた新たな音声を,その機種で録音し直し、データベースを作り直そう、といった議論が学会で交わされることもあった。
「いつまでそんなことをやるんだというのが正直な思いでした。子どもが35万人の声を聞いて初めて言葉がしゃべられるようになるとでもいうのでしょうか。たとえば、新婚夫婦の乗った船が難破して無人島に流されて、そこで子どもを産んだとします。その子どもは両親の言葉を聞きながら言葉を覚えるでしょうが、何年か後に助けられて本国に戻り、迎えに来た総理大臣に声をかけられたとき、この人、何をいってるのかわからない、なんて事態がその子どもに起こると思いますか。でも、これまでの音声認識研究はそういう考え方しかできなかった。父親と母親の声だけで音声認識の機械をつくると、基本的に、両親以外の声は認識率がガタンと落ちてきます」
教科書に書かれていることを実行すれば、ある程度の音声認識は可能だろう。しかしそれは人間が実際に行っていることとは違う。峯松さんは教科書をいったん離れることを決意した。
こうして峯松さんがスタートさせたのが、話者が誰であっても「おはよう」は「おはよう」、「あいうえお」は「あいうえお」と認識できる機械の開発だった。峯松さんが発声した「おはよう」という声の物理現象から峯松であることは消せないのか。個々の現象の物理量に縛られることなく、その現象を支配する原理原則を見極めることこそが科学的研究の基本姿勢ではないか――峯松さんはそう考えたのである。
音声の絶対音感と相対音感
実は、峯松さんの取材にあたり、拙著『絶対音感』からインスピレーションを得たことがある、とうかがっていた。拙著は、基準音なくランダムに提示された音に音名をつけられる能力として知られる絶対音感について取材したノンフィクションだ。歌であれ話し言葉であれ、人の口から出る声であることには変わりない。ならば、音声言語にも絶対音感者と相対音感者がいるのではないかと考え、新しい音声認識の機械を開発しようとしたときに拙著を読んでくださったという。
「メロディを移調しても同じ音楽に聞こえる人たち、つまり、音に音名をつけられない相対音感者のように(注2)、男であれ女であれ、どんな音声であってもその同一性を認識できる機械を作ることができるのではないかと考えたんですね。つまり、個々の音の絶対的な音色ではなくて、音色の相対的な特性や動的なパターンを通して音声を処理できるユニバーサルなシステムの構築です」
音声工学の技術を使って生成された機械の音声を聞かせてもらった。男性の声、中性的な声、子どもっぽい声、女性の声、と話者はさまざまであった。峯松さんが作りたいシステムは、すべて「あいうえお」は同じ「あいうえお」と認識してしまうシステムだ。まだ個々の単語の同定しかできないが、そのシステムはおよそ完成した。ところが、この機械にも弱点はあった。
「人間は、一個の音を『あ』とか『え』とか、ひらがな単位で認識できますが、うちの機械ではできないんです。「あいうえお」といったときの音の動き、音と音の関係だけに着目したから当然なのですが、困ったなと思いました。より人間に似たシステムを作ろうとしてきたのですが、個々の音を別々に提示すると、平仮名として同定できない。少なくとも私の回りにはこういう人はいません。35万人の声を必要とする人もいないでしょうが、「あ」という声を、カテゴリ(音韻)としての『あ』であると同定できない人も私の周りにはいませんでしたからね」
構築したシステムの問題点に向き合いさまざまに思考するなかで、峯松さんの脳裏にある仮説が浮かんだ。メロディーを音名や階名といった音のラベルを使って書き起こすことができない人々(言語化がむずかしい相対音感者)に、あるメロディを聞かせてその3番目の音を覚えさせ、たとえば5分後に別のメロディを聞かせて、さきほどの音と同じ音が聞こえたら挙手してください、というと戸惑うだろう。そういう人は世の中にたくさんいる。ならば、音楽ではなく、ある発話を聞かせて、3番目の音を覚えてくださいといい、しばらくして別の発話を聞かせたときに、さきほどと同じ音が出たら挙手してくださいといって困惑する人がいてもおかしくはないのではないか。「おはよう」と聞かされても、3番目の「よ」という声をカテゴリ(音韻)としての『よ』とは認識できない人だ。音声の流れを全体像として捉える傾向が強すぎて、「おはよう」を「お」「は」「よ」「う」という音韻の列として理解することが非常に困難――すなわち、文字言語をうまく使えない人々である。
ディスレクシアとの出会い
「英語は日本語やイタリア語に比べると母音の数が多いですね。フォルマント周波数を比較するとよくわかるのですが、母音間の重なりが多い上に、話者によって母音のフォルマント周波数にばらつきが生じますから、音の絶対量を使って識別することがむずかしくなる。話者が違えば声が変わることと、『あ』と『い』で声が変わることとは、物理的には同じ要因で音色が変わるだけです。男女の違いも、大人と子どもの違いも、どちらも音色が違うのです。ですから、話者がたくさんいるとオーバーラップしてしまうし、1個の音を提示した場合の識別はむずかしくなってくる。音の絶対的な特性をとらえて情報処理するのがむずかしい言語体系なら、相対音感的に音を捉える人が多いのではないか。音声言語は流暢だし雄弁、知的能力は高いかもしれないけど、なぜか本が読めない、手紙が書けない、そういう成人が英語圏の国には多いのではないか、そう思ったんです」
あくまでも仮説であり、峯松さん自身、実際にそんな人が存在するとは思えず、しばらくはそのままにしていた。ところがある日、勇気を出して知人の言語聴覚士の櫻庭京子さんに質問してみた。
「音声言語は流暢だし雄弁。頭は良いのかもしれない。でも何故か本が読めない。手紙が書けない。そういう成人が米国や英国に多かったりしませんか? え〜と、教育を受けていないとか、そういう事ではなく、彼らの認知特性として文字言語が何故か難しい……」「先生、ディスレクシアってご存知なんですか? 特に音韻性のやつ。」「でぃすれ……何ですかそれ?」「変だな。先生、今、自分でディスレクシアの説明してたじゃないですか」(注3)
学習障碍の一種であるディスレクシアにはさまざまなタイプがあるのですべてにあてはまるわけではないが、峯松さんは音声の物理学に基づいて彼らの存在をいい当てていたのである(注4)。峯松さんは驚いた。と同時に、怒りがこみ上げてきた。音楽の場合、音楽を聞いて音名や階名がつけられない相対音感者であっても音楽は楽しめる。彼らを障碍者として扱うことはない。ところが、言葉の場合、文字の読み書きができないというだけで社会は障碍者にしている。
「そういう社会にしたわれわれが悪いと思いましたね」
峯松さんは当事者の手記をむさぼるように読み、櫻庭さんやディスレクシアの専門家と議論を重ねた。そしてあるとき、まったく逆の発想をした。音色の究極の絶対音感者、たとえば、父親と母親がいった「おはよう」を同じ「おはよう」と認識できない人もいるのではないかと推察し、自閉症の男の子に会ったのである。自閉症であることを公にして手記や詩集を出版している少年だ。彼は母親の声ならわかるが、他の人の声はむずかしい。第一言語は文字言語だった。
自閉症者の音声研究が蓄積されているわけではないため、彼らが音声を絶対的に捉えているかどうかは結論が出ているわけではない。だが峯松さんは、もし自分の推察が正しければ、自閉症には音真似をする人たちがいるのではないかと考えた。音の関係性より音そのものを捉える能力のほうが高いなら、その可能性があるはずと思えたのだ。別の当事者の家族に聞いてみると、案の定、よくやっていますという回答が返ってきた。車の音、ドアの音、老若男女を使い分ける中村メイコの”七色の声”(ただしカセットテープ)をそっくりそのまま真似て遊ぶ子もいる。
「そうか、彼らにとって言葉は音なのか」
まるで九官鳥のようだ。峯松さんはそう思った。発達心理学では、幼児は親の声を模倣して言語を獲得する、と説明される(音声模倣)。しかし、両親の声をそっくりそのまま真似る幼児はいない。一方、九官鳥は声を真似る。良く訓練された九官鳥の声を聞くと飼い主がわかるらしいが、幼児の声を聞いて父親を当てられる人はいない。音声模倣は霊長類ではヒトだけにみられる行為であり,他の動物では鳥やクジラに観測される。しかし、
「動物の音声模倣は基本的に,音の模倣だといわれています。ヒトのみが個体サイズを超えた模倣をしてくる、とね」(注5)
となれば、自閉症者は……動物に近いのか。峯松さんの脳裏をよぎった考えである。だが,人にはとてもいえない。テンプル・グランディンの著書『動物感覚 アニマル・マインドを読み解く』(2006)に出会ったのはそんなときだった。今年の正月のことだ。
『動物感覚』の衝撃
「正月にどこにも行かずに読みふけりました。こんな人がいたのか、奇跡だと思いましたね」
それは、テンプル・グランディンが自閉症(成人になってアスペルガー症候群と診断された)の当事者として、自身の幼児期の経験を振り返りつつ、自閉症だからこそ知り得た動物の感覚について報告したノンフィクションだった。同じ言葉を何度も繰り返して「テープレコーダー」と悪口をいわれた全寮制の高校時代、彼女を救ってくれたのが動物たちだったこと。近所の牧場に行ったとき、注射をするために牛が動かないように「締めつけ機」に入れられるとおとなしくなるのを見て、自分用の締めつけ機を作ってみたこと。じわりと圧力を感じる、しかもそれを自分でコントロールできることがいかに心地よく気分が落ち着くかを知ったことが、のちに家畜の飼育施設の設計に取り組むことにつながるのである。自閉症者には画像をデジカメで捉えたように正確に記憶する人がいるが、彼女もまたそうであり、それが彼女の母語が言葉ではなく視覚(絵)であることが関係していると思うことなども、まさしく当事者でなければ語り得ない話だった。
「自閉症者であり、かつ、動物学者である彼女が書いているんです。動物と自閉症者の情報処理はよく似ていると。局所的な情報に執着した詳細な記憶があるとか、大きな音に脅えたりといったことも詳細に書かれていました。彼女の自伝も読んで、彼女の情報発信が自閉症研究の扉を開けた、という事実を知りました。今でこそ自閉症の人たちの手記がよく発表されるようになりましたが、それまでは彼らを外から観測するしかなかった。腹立たしかったです。だって、自閉症の歴史は人間の歴史と同じでしょう、なぜそれが今になってわかったんですか。そう怒っていたら、櫻庭さんにいわれました。そうなのよ、わかってないのよ、峯松さん研究してくださいって」
峯松さんはテンプル・グランディンにメールを送った。タイトルは、「May I visit you?」。答えは、「Yes」だった。
テンプル・グランディンと会う
今年5月、ブラジルで開催された国際会議の帰り道、峯松さんはコロラド州立大学に立ち寄った。テンプル・グランディンは、「グランディン畜産動物扱いシステム会社」の社長として、家畜にストレスを与えずにと殺するシステムを設計し、いまや全米のファーストフード店のうち半数の食肉処理に携わっている。自閉症の啓蒙活動と家畜の権利保護に関しては、世界でもっとも影響力のある研究者の一人といえるだろう。
峯松さんはテンプル・グランディンにまず最初に、「あなたが存在していてよかった」と感謝の言葉を伝え、峯松さんが構築した音声認識の原理について説明した。更には、彼女自身に、大人と子どもの声の聞き分けができるかどうか、電話の音声を正確に認識できるかどうか、といった質問もしてみた。大人と子どもの声の聞き分けはできるが、電話音声はむずかしい。彼女はそう答えた。
「もう60歳を超えているのですが、カウボーイみたいな服を着て、元気なおばあちゃんという印象でした。複数回会った人によれば、昔に比べるとかなり社会性が出てきたそうです。ということは、社会性は訓練で身につくのかと思いました。印象に残ったのは、彼女の会社の人から電話があったとき、”健常者はディテールにこだわらない。忘れっぽいしすぐに抽象化してしまう。困るのよね”、と文句をこぼしていたことでした。抽象的な空間でパターン化ができて初めて可能になる情報処理もあるんだ、と説明すると、ふむふむと聞いてくれましたが……。それから、自閉症者の子どもをもつお母さんたちから、テレビやラジオの声をよく真似るとか、子どもからいつも同じようにしゃべることを要求される、という悩みを聞いていたんですが、それについて訊ねたら、”だってテレビやラジオのコマーシャルの声っていつも一緒でしょ。お母さんの声っていつも変わるじゃない。だから真似られないのよ。同じだから真似るのよ”、っていわれましたね」
帰り際、峯松さんは、人の顔は鼻や耳の細かな特徴にとらわれて顔全体がなかなか覚えられないという彼女に、「ぼくのことも忘れちゃうのかな」と訊ねてみた。すると、彼女は
「日本から来てくれた研究者とおいしいメキシコ料理を食べて楽しい時間を過ごしたことは忘れないわ」といい、『動物感覚』の原著にメッセージを添えた。
“ノブアキ・ミネマツへ
あなたが脳の数学的な基本原理を解明できる日がきますように。
テンプル・グランディン”
研究者ができること
――音そのもの、即ち、声の絶対的な物理量への着眼を基本とする音響音声学、そして、それを工学として纏め上げ、様々な技術を構築して来た音声工学。これらは科学的にどれだけ正しい活動だったのだろうか?
これは、峯松さんがこの春、ある雑誌に投稿した記事の一節だ(注3)。教科書から離れ、人間がやっていることの本質に近づこうと研究を重ねるうちに、自閉症の人々に出会った。音声研究が峯松さんを導いたとすれば、決して過去の研究が無駄だったとはいえない。ただ、それが科学的に正しいかどうかは別の問題だ。少なくとも音声言語については、人間がやっていることとは違うことをやってきたことは確かだろう。
峯松さんは最近、工学者がシステム(たとえばロボット)をより人間らしくすることは、自閉症者に対してセラピストや家族が何をやるべきなのかという議論によく似ていると思うようになった。自閉症者やその両親の手記を読むと、自分たちが見過ごしていたことに気づかされる。
「以前、英語の発音評価システムを作ったとき、ある自閉症研究者にいわれたんです。今の音声情報処理が音そのものを捉えて処理することしかできないなら、自閉症者とどうコミュニケーションをとるかという発音訓練システムができると思う、と。テンプル・グランディンもいっていましたが、自閉症の子どもをもつお母さんには、同じ発声を子どもに要求される、さっきと同じようにいってくれといわれることがあるのだそうです。変わらない固定的ないい方を訓練する、あるいは要求する機械ならすぐに作れます。得意です。音声工学の技術は基本的に、安定した固定パターンを要求しますからね。
ただ、研究者として自閉症の人たちに歩み寄れることは何かといわれると、実はまだよくわかっていません。学生とも議論するんです。たとえば、自閉症の人は、見たもの、聞いたもの、違うものは違うと認識する場合が多い。ならば、違うけど同じだと捉える情報処理を宿してあげることはできないものか。違うものをいろいろ聞いてもらって、それらが同じだという感覚が湧き出てくるプログラム、心理学の言葉でいうゲシュタルトを宿せるプログラムが作れないものか、そうすればわれわれ工学者も貢献できるのではないか、そんなことも考えています」
しょせん、計算機で議論している人の発想だ。自閉症は先天的な脳機能障碍で、遺伝的要因によるものだから、コンピュータのプログラムを変えるように簡単に変えられるものではない――そんな批判は承知の上だ。だが、テンプル・グランディンのように、時間はかかっても変わる人がいる以上、手助けできることはあるはず。峯松さんはそう信じている。
『我、自閉症に生まれて』に登場する、思慮深く愛情豊かなテンプル・グランディンの母親がテンプルに送った手紙の一節を紹介して本編の結びとしよう。
――ある違いについてお話ししましょう。人間は生きていて反応を確かめ合います。物はあなたに話しかけることも、あなたを抱くこともできません。物は想像とエネルギーと素材ででき上がっています。物は人間の使い方しだいで意味を持つことになります。人間は私的な象徴でも努力の代替物でもなく、お互いに応え合う血の通った存在なのです。<中略>あなたも私も完成を目ざす夢を持っており、その夢を分かつことで、お互いから学び合っているのです。共に力を合わせ、お互いの中に支えを強めていくのです。私たちは”愛する”ばかりでなく、お互いに“愛される”――のです。
*峯松信明さんとテンプル・グランディン(一番下の写真)