1
/
5

人口減少社会の生産性を高める。スマートスピーカーの元開発責任者が語る、音声AIの可能性。

こんにちは、RevComm(レブコム)採用担当です。こちらの記事では、当社で働くメンバーの人となりや、仕事への思いを赤裸々に綴ったインタビューをお届けしています。

今回紹介するのは、東京工業大学の特任助教授(特任准教授)の経歴を持つ橋本泰一(はしもと たいいち)です。大学で自然言語処理の研究に従事したのち、グリー株式会社でビッグデータ分析プラットフォームの開発。その後、LINE株式会社でスマートスピーカーの開発を統括し、2021年にRevCommへ入社。現在はR&D部門の統括を務めます。

研究者として9年過ごし、メガベンチャー2社を経験した上で、創業4年目のベンチャー企業に転職を決意した理由。音声AIを用いたプロダクト開発にかける思いを聞きました。

音声AIは世界を変える

ーー橋本さんは前職の経験から、音声AIの可能性を強く感じていると伺いました。どのような経験をされたんですか?

最近ようやく音声コンテンツや、音声メディアなど、音声サービスに対しての関心が高まってきましたが、テクノロジーでみれば、まだまだレガシーな領域です。電話が発明されて以降、特に大きな発明はありません。未開拓な領域だからこそ、当社のミッション「コミュニケーションを再発明し、人が人を想う社会を創る」の『コミュニケーションの再発明』ができる余地が多分にあると感じています。

前職のLINEで、『LINE CLOVA(ラインクローバ)』という、話しかけるだけでLINEの送受信もできるスマートスピーカーの開発をしていました。このプロダクトを使うと、小さな子供が「いつ帰ってくる?ご飯はいっしょに食べられる?」とスピーカーに話しかけるだけで、テキストメッセージになって職場にいるお父さんに届く。さらに、テキストでした返信もスピーカーが音読してくれます。

コンピューターはスマホによって低年齢化したと言われていますが、それはせいぜい10歳前後の話。音声ユーザーインターフェースなら、4・5歳のまだスマホを扱えない子供ですら自由に使うことができます。さらに言えば、子供に限らず、お年寄りやタッチパネルの操作が苦手な人たちまで、簡単にインターネットと繋がれるんです。

これは本当に凄いことです。もともとテクノロジーの領域で働くことを決めたのは、労働者人口が減っている日本で、人を代替し、サポートする技術を開発し、社会の生産性をあげたいという思いからでした。音声を使うことによって、これまでコンピューターをうまく操作できなかった人たちがインターネットを利用できるようになれば、その人たちの生活もより豊かになりますし、社会全体も豊かにすることができます。音声AIに世界を変える可能性が秘められていることを確信しました。

ーーありがとうございます。大学の研究ではなく、ビジネス領域で挑戦されるようになったのはなぜですか?

現在のAIは、データがあればあるほど効率よく学習し、良いアルゴリズムを生み出せます。しかし、大学で大量のデータを集めることや、それを計算するための計算機資源を手に入れることは、一研究者には限界があるのが現状です。技術的にもある程度確立されてきて、先進的な研究のためのデータと実践が必要になってきたので、大学ではなくビジネス領域で挑戦することを決めました。

1社目のグリーでは、ビッグデータを扱う仕事を担当し、その後LINEに転職して、先ほど話したスマートスピーカーの開発に携わりました。現在ビッグデータを土台にしたAIや、音声認識の領域はGoogleやAmazonなどの企業が先行しています。想像していた通りの未来が来たと思いますし、その技術を用いてプロダクト開発ができていることに非常に面白みを感じています。

推進力と素直さを武器に挑戦したい

ーー大量のデータを保有するメガベンチャー2社を経験したのち、なぜ創業間もないRevCommに入社したのか、その経緯を教えて下さい。

確かにグリーやLINEは大量のデータを保有していますが、そのデータはユーザーの持ち物だと、僕は考えています。企業はサービスを始める際に、利用規約やプライバシーポリシーを策定して、データの管理方法や使用用途の範囲をしっかり決め、その範囲内でしかデータを使用することはできません。昔はその境界線が曖昧だった部分もありますが、最近では明確化しようとする流れがあり、ある事業で得たデータを、他の事業に横展開するのは難しくなりつつあるんです。

実際、前職でプロダクトを開発する際は、その点をすごくケアしました。ユーザーの不審に繋がらない大規模データの使用方法を設計する中で、大変な思いをしてきました。

そういった観点からいうと、2017年に創業したRevCommはスタートしたばかりなので、シンプルな環境です。今後のビジネス展開を想定しながら、お客様と当社の利害が一致するデータの使用用途を策定し、データ提供をお願いすることができる。ゼロから設計ができるからこそ、可能性は広がると思っています。

ーーその他の理由はありますか?

新しい技術を開発していく上で、RevCommの「人」がすごく魅力的だったんです。初めて代表の會田と会ったとき、大きなビジョンを持って、非常にパワフルに物事を推進していく力がある人だと思いました。これまで誰もやったことないことを実現するのは、こういう経営者だなと感じたんです。

また、採用のプロセスの中でリサーチのメンバーと食事をした際に、彼らにとても良い印象を覚えました。いわゆるベンチャー企業の社員にありがちな「自分たちが最高だ」「自分たちだけで実現するんだ」という勢いだけの人たちではなく、周りの意見を素直に吸収できるメンバーばかり。

長い教員の経験から、素晴らしい人材へと成長する人には「素直さ」が不可欠だと思っていましたが、RevCommのメンバーは、まさにその特徴が当てはまりました。技術力としての伸び代はありますが、一緒に仕事をさせてもらう中で、彼らの能力を最大限に伸ばしながら、いいプロダクトを作っていく未来が見えたんです。革新的なことを実現する推進力と、学ぶことへの素直さを持ったメンバーが集まっている環境で、新しく挑戦したいと思い入社を決めました。

若い技術者が世の中を変えていける環境を

ーー橋本さんにとってRevCommは魅力的な仲間と、新しいチャレンジをしていく場所なんですね。これからどのような挑戦をしていきたいですか?

文字データに比べ、音声データは大切な情報を多く含んでいます。例えば、会議の議事録に書かれている文字情報は、究極的には事実かどうかわかりません。書き手の感じ方によってニュアンスが変わってしまう可能性もあります。実際に話している内容が正確に文字化され、その時の感情やニュアンスすらも分析・可視化することできれば、事実に近く、かつ活用しやすいデータを得ることができます。

僕個人のミッションは、R&D(研究開発)部門として、データの活用方法を開発していくことです。テキストに自動変換した会話が、即座に3・4行に要約できたり、成績のいい営業パーソンの声のトーンや間の取り方を分析したりできれば、生産性の向上や育成強化につながります。このように音声データの使い道は多種多様にあるので、ユーザーのためになる開発とは何か、社会の生産性を高め、より豊かにするプロダクトとは何か。そういうことを真剣に考えて、チームを率いていけたらと思っています。

ーー最後に、意気込みを教えてください。

RevCommはこれからまだまだ成長していきます。そして、そのために優秀なリサーチャーやエンジニアの力が必要です。特に学生の頃からAIやディープラーニングの技術に触れてきた20代の技術者が、これからのビジネスを主導していくことは間違いありません。彼らの持っている感覚やセンス、技術が最大限生かされれば、本当に世の中は変わると思います。音声の領域で挑戦したい人たちが活躍できる環境を、引き続き作っていきたいです。

[執筆・編集] 佐藤史紹 [撮影] 矢野 拓実


株式会社RevComm's job postings
18 Likes
18 Likes

Weekly ranking

Show other rankings