(Written by Tomoya Igarashi, Chief Architect)
2045年にAIは人類を超えると言われ、様々な議論が巻き起こっている。人とテクノロジーの境界線がどんどんなくなっていく中、我々が賭ける次世代のインターフェースの役割とは?
人間が”理解できる”インターフェースへ
世界初のコンピューターであるENIACの大きさは公立小学校の教室2つ分(167m2)だったこともあり、どこをどのように操作すれば思った結果を得られるのか、とても分かりにくいものだったという。そのため、コンピューターをより直感的・効率的に操作したいという要求が強まり、その実現のために人とコンピューターを橋渡しするための様々なヒューマンインターフェースが考え出されてきた。
初期のコンピューターはパンチカードで一括して命令を与え、処理を実行させるバッチ方式が主流であったが、より生産性と応答性を高めるためにコンピューターへの情報の入出力はリアルタイムな対話方式へと変化していった。その中にはディスプレイに絵を描いて対話するものやキーボード、マウスなどがあり、コンピューターを誰でも使えるようにとヒューマンインターフェースは一般化されていった。
そして、ムーアの法則に基づきコンピューターが高性能・小型化することで、人がいつでもどこでもコンピューターにアクセスできるパーソナルコンピューターの概念が生まれ、さらにiPodに代表されるようなスマートフォンやタブレット、AlexaやGoogleHomeなどのスマートスピーカーといった24時間接することができるデバイスが登場した。つまり、タッチパッドや音声入力といったヒューマンインターフェースの進化も続いてきた。
これらのインターフェースは、必要な時に必要なことを伝え、コンピューターに処理を実行してもらうことに特化してきたという特徴がある。それは、上で述べてきたように人がコンピューターに対しより生産性と応答性を求めてきたからである。
次世代インターフェース:バーチャルヒューマンの可能性
効率性を重視して作られてきたコンピューターマシーンには、どこか無機質さが漂う。また映画ではよく、「AI vs 人間」といった構図が扱われたり、AIは人間の”道具”として見られることも多い。そこに「温かさ、優しさ、おもしろさ」などはない。
だからこそ我々は「機械と人間」、「機械と機械」のコミュニケーションがより人間に寄り添った次世代インターフェースを開発している。
そう、バーチャルヒューマンである。
バーチャルヒューマンのインターフェースを用いたある大学の実験では、バーチャルヒューマンと対話を行うと、人と対話を行うよりも対話者のパーソナル情報がより多く引き出されたという。
また、バーチャルヒューマンというインターフェースは、店舗や受付業務においてスタッフとコミュニケーションをとるように、自然な会話でコンピューターと受け答えできるようになる。これにより得られる効果のインパクトは、労働人口減少へのひとつのソリューションになり得るし、他にも様々な影響を社会に与えるものになると考えられる。
そしてヘルスケアの領域では、バーチャルヒューマンとコミュニケーションを取ることにより、認知症やうつ症状の改善、脳の老化抑制などの様々な効果が得られたという研究報告もある。
このようにお互いにコミュニケーションを取り合いながらコンピューターと対話するヒューマンインターフェースを実現できることがバーチャルヒューマン最大の特徴となる。そしてこの特徴は、人が生まれたときからずっと行ってきている性質や習慣、「相手の表情や動作などをみてコミュニケーションをとる」ことに対し、人が不気味の谷などその振る舞いに少しでも違和感を感じてしまうと成り立たなくなってしまう。振る舞いが人間らしいと認識されて初めて実現可能となるのである。
バーチャルヒューマンは、人からコンピューターに命令を行う一方通行の方式からの大きな変化であり、かつ様々な可能性を拡げることのできるヒューマンインターフェースであると考えられる。人間らしく振る舞えるということは、人の数と同等のバリエーションが出せるということでもあるからだ。
バーチャルヒューマンを実現させるために
また、このバーチャルヒューマンを実現させるにあたっては、AIの進化とも密接な関係がある。そもそもバーチャルヒューマンがある種の振る舞いを実現するには、人間と同じように感覚器官から外界からの情報を受け取るのと同じように何らかのインプットがなければ振る舞いを行うことができない。DeepLearningに代表されるAIの進化により画像や音声、自然文などのインプットを人間以上の精度で判断・判別できるようになってきたことにより、そのインプットを用いて人とコミュニケーションを行うバーチャルヒューマン実現の土台が整ってきたと言える。バーチャルヒューマンがどのような振る舞いをすればより人間らしいと感じるのだろうか。
人間らしさを生み出すためのキャラクターAIエンジンの設計
AIの進化により人間らしく振るまえる土壌は確かに整いつつあるが、人以上の認識精度を持てることと人間らしい振る舞いが行えることは必ずしもイコールとは限らない。例えば、自然文を理解するスマートスピーカーは、音声を基にコンピューターと対話をスムーズに行えるようになったが、あくまで人からの命令を聞くだけの存在であり、スマートスピーカーと対話する時に人間らしさを感じることはほとんどないのではないだろうか。
人間らしい振る舞いを実現するために重要なもうひとつのAIがある。それはゲームの世界で何十年と行われてきた、キャラクターを動かすためのAIである(以下:キャラクターAI)。キャラクターAIは、人が当たり前に行っている、「外界の情報を受け取り、記憶・判断して、反応に結びつける」という一連のプロセスをモデル化することにより実現できる。外からの情報に対して判断を行い、様々な反応をするキャラクターAIを用いることで、バーチャルヒューマンが”人間らしさ”に近づいていく。我々が開発を進めているキャラクターAIエンジンもこの一連のプロセスを徹底的に研究し、AIエンジンの開発に反映させている。更に、人間の「感情」の要素を取り入れたキャラクターAIエンジンによって、バーチャルヒューマンが多様な感情表現を行う。その結果、より自然なコミュニケーションを実現することができる。
このような人間らしい振る舞いを実現するためのキャラクターAIエンジンを開発するにあたっては、人間は外界の情報をどのように認知して、記憶・判断して、反応に結びつけているのか、という一連のプロセスをよく理解し、それをモデル化する必要がある。
次回は、このキャラクターAIのベースとなる基本的な人間の認識と反応のプロセスにフォーカスしていく予定である。
----
クーガーでは、キャラクターAIをはじめ、さまざまな分野のAIエンジニアがコラボレーションすることで、人間のように記憶や感情を持ち、人と会話できる次世代インターフェイス「バーチャルヒューマンエージェント」の開発を進めています。
ぜひ、私たちと一緒に働きませんか?
■AIエンジニア
・【キャラクター】ゲームAI:次世代インターフェースの頭脳を造る最強のAI開発チームに参画!
・【画 像】画像認識:次世代インターフェースの頭脳を造る最強のAI開発チームに参画!
・【言 語】自然言語処理:次世代インターフェースの頭脳を造る最強AI開発チームに参画!
■テクニカル・エバンジェリスト
・ブレードランナーの世界を目指す技術者コミュニティを支えるエバンジェリスト!