電気、水道、ガス。インフラの契約を好き好んでする人は少ないだろう。引っ越しのとき、仕方なく手続きを済ませる。料金プランを多少比べることはあっても、それはついでの最適化であって、積極的な関心ではない。
そして一度契約してしまえば、あとはほとんど意識しない。水道をひねるとき、どのダムから来たかを考えない。発電が火力なのか水力なのかを考えない。どのパイプを通ってきたかを考えない。毎月きた請求書を淡々と処理する。インフラとはそういうものだ。存在を忘れられたとき、はじめて成熟したと言える。意識するのは、料金がいつもと違った時ぐらいだろう。
AIも、そうなる
いまのAIはまだ、選ばれようとしている。どのモデルが賢いか、どのサービスが使いやすいか、SKILLSをどう書けばいいか。ユーザーに考えさせ、比べさせ、覚えさせている。これは道具の段階であって、インフラではない。
インフラになるとは、契約手続きのような扱いになることだ。好き好んで選ぶのではなく、そこにあるから使う。どう動いているかを知らなくても、望む結果だけが届く。そういう当たり前さの中に、体験の中に溶け込んで、はじめてインフラと呼べる。
AIがインフラと化す日、ユーザーは「AIを使っている」とは言わなくなる。「シャワーは利根川水源の水道を使って浴びている」とわざわざ言わないように。
Howが見えないことは、個人的には悲しい。
正直に言うと、技術を作る側の人間として、Howが意識されない世界には一抹の寂しさがある。どのアルゴリズムが動いているか、どう最適化されているか、どれだけ精巧に設計されているか。それを誰にも気づかれないまま、結果だけが消費されていく。
でも、と思う。その寂しさを相手に押しつけるのは、もっと違う。Howを意識させることは、作り手の自己満足であって、ユーザーへの負担でしかない。発電所の仕組みを知らなくても、部屋は明るくていい。それが相手への誠実さだと、いまは思っている。
むしろ、知らなくてもいいユーザが増えることで、Howに経済的合理性が生まれて、Howのさらなる投資に繋げられる。
Ambient Agent はHowを秘匿することが、体験の向上になる
モコボイスは、Ambient Agentが設計思想に取り組まれている。
コストの最適化、モデルの選択、コンテキストの管理、エラーの吸収。これらは発電方法やダムの場所と同じく、ユーザーが知る必要のないHowだ。経済合理性の根拠ではあっても、体験に持ち込む必要はない。むしろ持ち込むほど、体験は損なわれる。
処理中の表示、モデル名、レスポンスの遅延。ユーザからは認知できない情報・・・それが見えるたびに、ユーザーはインフラを意識させられる。水道管が透明だったら、誰もリラックスして水を飲めないように。
モコボイスは、聞くことに徹する
モコボイスは音声認識のプロダクトだ。ただし私たちの定義は少し違う。音声をテキストに変換するツールではなく、ユーザーの声を起点にAmbient Agentへの入り口を開く層だと考えている。
声は最もナチュラルなインターフェースだ。キーボードを打つとき、人は「打つ」という行為を意識する。しかし話すとき、人は「伝えること」だけを意識する。その差は小さいようで、体験の質として決定的に違う。
だからモコボイスは、聞くことに徹する。解釈を急がない。意図を補正しない。ユーザーの声をそのまま受け取り、バックエンドのAmbient Agentへ渡す。どのダムから来たかを考えさせないように、Howはすべてその先で引き取る。
気づかれなかった日が、一番うまくいった日だ
インフラの契約者は、普段その会社の名前を口にしない。止まったときだけ、はじめて意識する。それがインフラの証明だ。
AIも同じ場所に向かっている。使われていることを忘れられる日、誰もモデル名を口にしない日、声をかけたら当たり前のように世界が動く日。モコボイスはその世界への入り口を、声という最も人間的な手段で開こうとしている。
ユーザは、現場の本業に集中し、モコボイスの存在が気づかれなかった日が、一番うまくいった日だ。
こんな人と働きたい
AIの固定観念に捉われず、人の体験を考えれる人。「なんか違う」という違和感を、流さずに持ち続けられる人。正解を探すより、現場で答えを作りに行ける人。
我々は、そんな現場を主役とするAmbient Agentを、現場の声を拾うことで作る音声AI モコボイスを提供しています。
Wantedlyの「話を聞きに行きたい」から、お待ちしています。