『コンピューターは人のように話せるか?―話すこと・聞くことの科学』2020/10/8
トレヴァー・コックス (著), 田沢恭子 (翻訳)

 音の科学の第一人者のコックスさんが、声の進化から人工知能による会話まで、科学・社会・文化・政治などあらゆる角度から「話すこと」と「聞くこと」の奥深い世界を紹介してくれる本です。
『コンピューターは人のように話せるか?』というタイトルだったので、機械(人工知能)による会話がメインなのかと思っていたのですが、それは後半部分だけで、前半部分は、ネアンデルタール人の声や、成長(老化)にともなう人間の声の変化、声だけで人物像を当てるテストなど、「話すこと」「聞くこと」の進化や成長、文化的側面など、機械とはほとんど関係のない話ばかりだったので、ちょっと戸惑ってしまいました(勉強にはなりましたが)。
「話すこと」と「聞くこと」に関する、かなり総合的な話題を網羅している本で、「訳者あとがき」に簡潔なまとめがあったので、以下にそれを紹介させていただきます。
「本書において原作者のトレヴァー・コックスは、話す能力の生物学的進化を扱う第1章「進化」から、コンピューターによる言語的創造活動の可能性を論じる最終章「コンピューターのラブレター」まで、言語によるコミュニケーションの進化を多様な角度から展望していく。生物学・医学的な観点から人の一生における声の変化を追う「声の三つの時代」、人の声に対する工学的技術の影響を分析する「電気で声を変える」、ロボットが人間に代わって役者となる可能性を探求する「ロボットは役者にすぎない」など、どの章も膨大なリサーチに裏づけられた説得力をもって、「声」をめぐる新たな視野を読者に与えてくれる。(中略)
 言語によるコミュニケーションという、ふだんはなにげなくこなしている行為が、じつは人類の長い歴史から生まれた複雑で高度な作業であった。そしてこれがテクノロジーの発達と密接にかかわっていて、これからも「語ること」と「テクノロジー」は手を携えて進歩していく。」
 ……ということで、「会話」というのは、実はとてつもなく高度な技だそうです。
「1 進化」には、「会話」能力が、ホモ・サピエンスを勝利に導いたことが書かれていました。
「ハイデルベルク人とホモ・サピエンスには同じような聴覚能力があったと思われるので、ネアンデルタール人も話声を聞き取ることが完璧にできたと考えられる。この見方は、ネアンデルタール人の耳小骨の調査で裏づけられた。(中略)発生に対する中耳の適応は、今から五〇万年以上前にハイデルベルク人が出現したときに完了したらしい。したがって、話す能力は既存の聴覚能力を利用して進化したのであって、その逆ではない。」
「(前略)しかし、二〇万年ほどにホモ・サピエンスが誕生すると、何かが変わった。おそらくなんらかの遺伝的変化による認知能力の向上が好循環をもたらし、それによってさらに高度な言語がもっと複雑な思考を可能にし、そのおかげで現生人類はネアンデルタール人よりも高度な思考ができるようになって彼らを駆逐したのだ。」
 ただし言語の進化に関しては、まだ明確にはなっていないようで、この本にも、他の説もあることが書かれていました。
 そして、とても面白かったのは、「6 ロボットは役者にすぎない」。いろいろな音声(会話)システムの例が紹介されていました。
 日本の初音ミクも、録音した言葉の断片をつなぎ合わせて文を作る「波形接続型音声合成」という手法を使った音声合成技術であることが解説されています。
 もちろん最近のスマートアシスタント(アマゾンエコー(アレクサ)やSiriなど)についても紹介されています。これらの技術がとても便利で使えるものだというのは間違いないですが、個人的には、プライバシー問題がとても気になるので、まだ積極的に利用したいとは思っていません。この本にも次の記述がありました。
「最近ではテクノロジー企業によるデータ収集をめぐって、しばしばプライバシーの問題が取りざたされる。同様に、スマートアシスタントでもプライバシーの問題が出てくる。」
 ただ……ライターのニューマンさんが、自閉症スペクトラム障害(ASD)の息子さん(ガス)とSiriとの関係について語っている記事を読んだ時、スマートアシスタントは、障害のある人にとっては、とても支援になる技術だということに気づかされました。
「(前略)彼(ガス)にしてみれば、テクノロジーが架空の友達を連れてきてくれたようなものだ。ASDをもつ人にとって、人間と顔を合わせるやりとりよりもコンピューターとのやりとりのほうが予測可能であり、それゆえストレスが少ない。ASDをもつ人にありがちで、ガスも延々と果てしなく質問をくり返す。しかし人間と違って、Siriはいらだったりせず、いつでも礼儀正しく中立的な答えを返す。
 ニューマンはまた、Siriのおかげでガスが以前よりも言葉をはっきり発音するようになったことにも気づいている。」
 ……こういう使い方が出来るのは、とても良いですね!
 また、会話に支障をきたす運動ニューロン疾患(MND)患者にとっても、音声合成機械はとても役に立つそうです。
「エディンバラ大学のサイモン・キングらはMND協会と共同で、人の本来の声がもつ特徴をいくらか保つ音声合成装置の開発に取り組んでいる。」
 機械による「会話」技術の進歩が、一般人の生活を便利にするだけでなく、障害を持つ人の生活を支援するのにも役に立っている一方で、犯罪での悪用も懸念されます。この本にも次の記述がありました。
「遠くない将来、悪意のある声の物まねが行われるのは間違いないだろう。じつに気がかりなことだ。私たちはすでにフィッシングメールの攻撃を受けている。友人からメールが届き、海外で強盗に遭ってしまったので自分の口座に大至急送金してくれと書いてあったりする。メールでなく、友人にそっくりな物まねでボイスメールのメッセージが届くことだってあるかもしれない。声を悪用した詐欺にたくさんの人が引っかかってしまわないかと、私は心配でならない。」
 ……私も心配です。画像もそうですが、音声も合成技術がどんどん進んでいくと……何が本物で何が偽物なのか分からなくなってしまいそう……技術が進み過ぎないよう、歯止めをかけるべきなのでしょうか? でもそんな紳士的要請に従ってくれるのは、もともと悪用などしない人だけで、肝心の犯罪者たちは知らんぷりして技術の悪用に知恵を絞るだけなのかもしれません。何とか出来るといいのですが……。
 最新の技術動向も含めて、「話すこと」と「聞くこと」のことを総合的に紹介してくれる本でした。とても興味深い話が満載ですので、ぜひ読んでみてください。
   *    *    *
 なお社会や科学、IT関連の本は変化のスピードが速いので、購入する場合は、対象の本が最新版であることを確認してください。
<Amazon商品リンク>