Airion、トヨタ自動車未来創生センターが開発するパートナーロボット向けの音声合成AIを開発
Airion株式会社のプレスリリース(2024年11月7日 11時10分)Airion、トヨタ自動車未来創生センターが開発するパートナーロボット向けの音声合成AIを開発
https://prtimes.jp/main/html/rd/p/000000004.000118893.html
Airion株式会社は、製造業特化のAIシステム開発とDXコンサルティングを行う東大発スタートアップです。
今回は、音声合成やRAG(Retrieval-Augmented Generation)などのプロジェクトに関わるAIエンジニア、吉平貴秀さんにインタビューをしました。
大学生でありながら、スタートアップで大規模なプロジェクトに関わる彼の視点から、Airionで働く魅力やAIの未来を探ります。
スタートアップに飛び込んだきっかけ
プロジェクトを通じて見えた手応え
現在の挑戦:知識グラフとRAGの最前線
Airionで働く環境とAIエンジニア像
学生インターンとしてAirionを選ぶ理由
――本日はよろしくお願いします。まずは、Airionでインターンをすることになった経緯を教えてください。
吉平:今年の5月、AIに関する勉強をしていたときに、Airionのメンバーから声をかけてもらったのがきっかけです。その頃、ちょうど2年生の春学期で週3コマしか授業がなく、時間に余裕があったんです。本来はその時間を使ってKaggleなどのデータ分析の勉強をしようと思っていたのですが、実務でAIを使える機会は貴重だと感じて、参加することにしました。
――AIにはもともと興味があったんですか?
吉平:はい。最初に興味を持ったのは自然言語処理ですね。高校生のときにGoogle翻訳を触ったのがきっかけで、『これ、どうやって動いているんだろう?』と好奇心を抱きました。その後、大学でさらに興味を深めていきました。現在も、機械と情報の両方を学べる学科に所属していて、AIに関連する技術や知識を幅広く勉強しています。
音声分野は自然言語処理と関連が深いので、Airionのプロジェクトでやってみたら面白いと感じました。たとえば、音声合成では音声を一度テキストに変換して、それをさらに大規模言語モデル(LLM)で処理するといった部分で共通する技術が多いんです。そういう意味で、音声も自然言語処理もどちらも興味を持ちながら学んでいます。
――入社してから最初に携わったプロジェクトは何ですか?
吉平:音声合成のプロジェクトですね。今年の5月から10月にかけて、トヨタさんとの音声合成ロボットシステムの開発プロジェクトを担当しました。自分が関わった成果物がYouTubeで公開されているのを見たときは、やはり大きな達成感がありました。
――具体的にはどんな役割を担っていたのですか?
吉平:音声のアクセントや音質の改善に取り組みました。実際にPythonを使ってコードを実装しながら、アルゴリズムの精度比較を繰り返す作業が中心でした。このプロジェクトは試行錯誤を重ねるプロセスが非常に多かったです。あらかじめどのような実験を進めるかをチームでミーティングで決めて、それを実装・検証し、『うまくいった部分』『失敗した原因』『次にどうすれば良いか』をタスクベースで進めていくというスタイルでした。精度が向上して明らかな成果が出たときは、エンジニアとしてのやりがいを強く感じました。ただ、アクセントに関しては人間レベルの自然さに到達するのはまだ難しいと感じています。
※ トヨタ様とのプロジェクトに関する詳しい情報はこちら
このプロジェクトの詳細や成果物を知りたい方は、以下からぜひご覧ください。
――Airionの環境で働くことについて、Kaggleとの比較ではどう感じますか?
吉平:Kaggleでは一人で実験を回しながら改善していくスタイルでしたが、Airionではチームで協力し合いながらタスクを進めていくプロセスが魅力的だと感じます。裁量が大きく、自分たちで計画を立てて実験を進めていくというスタイルが、Kaggleのアプローチに少し似ている部分もあります。失敗したら『何が原因なのか』『次はどう改善するか』といった議論を重ねていくので、自分の好奇心や探究心が活かせる環境ですね。
――現在はどのようなプロジェクトに取り組んでいますか?
吉平:最近はグラフRAG(Retrieval-Augmented Generation)に関連するサーベイを中心に行っています。これは、チャットボットの応答精度を向上させるための仕組みで、専門知識を知識グラフとしてAIに提供し、より正確で高度な回答を生成するシステムです。グラフRAGは、従来のRAGシステムがキーワード検索や類似度検索に頼っていたため捉えにくかった文書間の関係性を考慮に入れることができ、より高度で文脈に沿った応答を生成できる可能性を秘めていて、とても興味深いです。
※ GraphRAG(グラフRAG)は、生成AIの精度を向上させるためにナレッジグラフを活用する技術です。
従来のRAG(Retrieval-Augmented Generation)は、非構造化データから情報を取得していましたが、GraphRAGは構造化されたナレッジグラフを利用することで、より文脈に富んだ情報を提供します。
詳しく知りたい方は以下の記事をご覧ください。
――Airionの業務をやっていて辛いと思ったことはないのですか?
吉平:ないですね。AIに関する勉強自体が好きなので、Airionの業務も全然苦になりません。むしろ、隙間時間にもAIに関する情報を見たり、関連資料を読んだりしています。それが本当に楽しいんです。今は大学でも知識を蓄える段階ですが、将来的に何かを生み出すときに役立つことを楽しみにしています。
――Airionの環境で特に魅力的だと感じる部分はどこですか?
吉平:自由度が非常に高いところですね。提案やアイデアをそのまま実験に落とし込める環境が整っています。PMとの距離も近く、フラットに『こんなことを試してみたい』といった提案を気軽に相談できる雰囲気があります。また、お客様へのプレゼンに同行させてもらえる機会もあり、技術だけでなく、現場の声を直接聞けるのも大きな魅力です。自分の手がけた技術がどのように社会で活用されるかを実感できるのは、とても貴重な経験ですね。
Airionは製造業特化という特徴を持っているので、AI技術を応用して現場に役立つものを作るプロセスが多いです。そのため、ただ研究をするだけでは得られない実務的な視点を養うことができます。AI技術をどのように社会に活かすかを考えるには、これ以上ない環境だと思います。
――どんなAIエンジニアと一緒に働きたいですか?
吉平:やはりAIが好きで、深掘りしていくことを楽しめる人ですね。技術をブラックボックス的に扱うのではなく、『なぜこうなるのか?』と中身を理解しようとする姿勢が求められると思います。また、Kaggleのように、計画を立てて実験し、改善を繰り返していく。そのループを楽しめる人が向いていると思います。
さらに、Airionでは自由度の高さが求められる分、自分で課題を見つけて主体的に取り組む力が必要です。与えられたタスクをこなすだけでなく、自ら提案し、プロジェクトをリードする姿勢が求められる環境なので、そうした自主性や探究心のある人と一緒に働きたいですね。
――学生インターンやスタートアップを目指す人に向けて、Airionならではの魅力を教えてください。
吉平:Airionは、AI技術を応用して実装していくことに特化しているので、応用研究やプロジェクト型の実験に興味がある人に最適です。既存技術を組み合わせて新しい価値を生み出すプロセスは、スタートアップならではの魅力があります。
――本日はありがとうございました!
Airionでは、現在AIエンジニアを募集しています!
この記事を読んで、AirionのAIエンジニアとしての仕事や環境に少しでも興味を持っていただけたら、ぜひ下記のポジション募集要項をご覧ください!
Airionでは、技術への熱意を持った仲間と一緒に製造業の未来をAIで変革する挑戦をしています。少しでも興味があれば、ぜひ代表とのカジュアルな面談を通じてお話ししましょう!面談はオンラインでも、本郷オフィスでの対面でも可能です。
あなたのアイデアやスキルを活かして、社会にインパクトを与える挑戦を一緒に始めませんか?
👇 詳細はこちらから!
学生の方用
中途の方用
Airionでは、AIエンジニア以外にも営業、PM、バックオフィスなど、幅広いポジションで仲間を募集しています!技術だけでなく、事業の成長を支える役割を担いたい方も大歓迎です。
少しでも興味があれば、ぜひ下のAirion募集情報のページをご覧ください!