T-4POのコア技術の1つである、しゃべって翻訳について解説します。
「会話相手の話した内容を翻訳して、使用者の言語で表示する」という機能です。
コンセプトムービーにも登場します。
https://www.youtube.com/watch?v=LAa2B_XisN0&feature=youtu.be
ウェアラブルデバイスだけでなく、Skypeのようなビデオチャットシステムでも利用できます。
会議の議事録取りにも使うことができる、汎用性の高い技術です。
基本的には、下記の流れです。
(1)音声をマイクで録音
(2)音声をサーバーへ送信
(3)サーバー側でSpeech to textを実行
(4)テキストを翻訳
(5)翻訳データをサーバーから取得
(6)画面に表示
この機能については例えばGoogle翻訳でスマホアプリとして既に実現しています。
CMで話題のポケトークもほぼ同じです。
T-4POではウェアラブルデバイスに搭載します。
「移植するだけ」と思うかもしれませんが、
・高速でレスポンスを返すにはどうするか
・音声認識の開始トリガーをどうするか
・専門用語対応をどうするか
他にも多くの課題があります。
「どうやって解決するの?」の答えは特許に関わることなので今回はやめておきましょう。
ロゼッタが翻訳で優れている点は2つです。
1.自社でエンジン自体の開発を行っている
ロゼッタでは、自社でエンジンの開発を行っています。
例えば、ウェアラブルデバイスでは翻訳速度が重要になります。
会話に特化し、高速でレスポンスを返すエンジンを作ることができます。
2.専門用語のカスタマイズ
業界用語や社内用語、固有名詞等をカスタマイズすることができます。
例えば建設業界では「ネコ」は一輪車を指します。
このように専門用語に対応してカスタマイズした翻訳エンジンを作る技術はロゼッタ独自のものです。
12月4,5,6日の社会インフラテックに飛島建設と共同で展示を出します。
そこでも開発中のしゃべって翻訳機能も体験できます。
12月16日頃に西新宿オフィスで体験イベントもやります。