音声・言語・画像を処理できる機械学習エンジニアを全方位にWanted

Rimo合同会社

機械学習エンジニア

Mid-career

on 2025-06-02

769 views

30 requested to visit

音声・言語・画像を処理できる機械学習エンジニアを全方位にWanted

Rimo合同会社

Mid-career

Engineer/programmer

UXエンジニア

デザイナー

Naoyoshi Aikawa

Rimoの代表社員兼エンジニア。早稲田大学の学生時代は検索/自然言語処理の研究に従事し、北京のMicrosoft Researchでのインターンを経験。2011年にGoogleに新卒入社し、検索システムの開発に従事。2012年にWantedlyの開発に参画しランキング、課金システム、インフラ基盤の開発をリード。2016年8月よりWantedly Peopleアプリの開発リーダー。2019年10月よりRimo合同会社創設。

Rina Takase

デザイナーと近いところで体験を議論したりしながらプロダクトを作っていくのが好きです。

Ayumi Nishiya

にしやあゆみ、略してにしゃみです。19年卒の新卒デザイナーとして Wantedly に入社しました。Wantedly の新しいユーザ体験を創るため、ユーザインタビューを始め実験的なUXコンセプト設計、UIデザイン、コンセプト検証などを行っています。直近の課題だけでなく、未来を見据えた "意味のイノベーション" をしていくこと、それを形にする仕事にココロオドルデザイナーです

Naoyoshi Aikawa

Engineer/programmer

Rina Takase

UXエンジニア

Ayumi Nishiya

デザイナー

What we do

Rimo Voiceは動画をアップロードし、文字起こし、話者分離、議事録作成をするサービスです。今後はこのデータをもとに、人事評価や経営判断までAIができるようにすることも目指しています。この領域はつまり、音声認識や言語処理で、GoogleやMicrosoftが扱っている領域を真っ向勝負しているプロダクトともいうことができるかと思います。UI/UXでGoogle MeetやDocs / Teams などと差別化するのももちろんですが、その本質はやはり機械学習にあり、日本語領域においてはそれらのサービスに引けをとらない精度が必要だと思っています。実際に、精度面では日本語においてGoogleのAPIなども凌駕できており、それがサービスの拡大につながっていますが、WhisperやChatGPTなどが出てきている今、あぐらをかいている場合ではない認識です。代表の相川は、昔 Microsoft Researchのインターンなども行き、研究も好きでしたが、データがないと始まらない部分や、大学ではメインストリートの研究では論文が書けず、結局重箱の隅をつつくような研究をするしかないことが辛いなと思ってエンジニアリングの道に進み、Googleやベンチャーで経験を積み、今この領域でチャレンジを始めました。この領域で一緒にチャレンジしてくれる機械学習エンジニアを求めています。

What we do

Why we do

Rimoは「はたらくを未来に」を企業理念として活動しています。大人になると人生の中で大部分の時間を占める「はたらく」時間をより良いものにすれば、より幸せな人が増えるはずだと考えています。より新しい概念の働き方は、既に広まってきているもので言えば、副業/複業やリモートワークが可能なこと。もう少し新しいものだと、週4日勤務の正社員や、自律分散組織(DAO)、給料を完全公開することによる経営戦略に全員がアクセス可能なことなどが挙げられます。AIが発展することにより、ベーシックインカムが実現しもしかしたら労働がラグジュアリーなものになる可能性すらあります。 Rimoの「未来に」という言葉は5年後10年後においてもより新しい働き方でその時代にあったより良い働き方を、自らの企業もしていくし、それをサポートするようなサービス群を提供し続けようと思っています。 Rimoが現在メインで取り組んでいる「議事録」領域は会社の仕事の流れ全てが「言葉」で集まってくるところなので、それをしっかり集めて整理し解析することで、将来はAIの補助により良い経営戦略や、働き方によらないより公平な評価を実現することもできるようになると考えています。なので、今はまずしっかり会議の中身を理解し、的を射た議事録を作ることにフォーカスし事業を進めています。

How we do

「はたらくを未来に」を体現するように、より未来に、普通に良いとされるはたらき方を模索しています。ただどんな制度でも採用してみようとすると訳がわからなくなり組織崩壊してしまうので、以下の3つの基準を設けて企業文化として取り入れる制度を考え日々進化させています。 ■ 1. Fair exception: 意味のない平等をなくした公平な組織であろう「全員平日5日9時から5時で出社」平等ですね。でも、職種や役職、人生のフェーズ(仕事バリバリやりたい/子育てもしっかりしたいetc.)は違うのに本当にそれでいいのでしょうか？給与だってみんな違う訳だから、お互いに迷惑がかかりすぎない範囲で、それぞれに合った働き方ができた方がいいはずです。それを模索していきます。(e.g. 週3勤務、奥さんの休みに合わせ休日を自由に移動可能) プロダクトにおいても、基本は一つの製品だけれども、業界や利用用途によってしっかりカスタマイズされたようなものを目指します。 ■ 2. Go for excellence: いまは優秀でなくとも、優秀であろうとしよう抜きん出た存在よりも、いまいる人たちを大切にしながら、一緒に心地よく高みを目指します。競争の激しいAIベンチャー領域だからこそ、どんどん働かせて、どんどん高い給与でよりできる人を採用して元いた人を食い潰していくみたいなことは起きないようにしつつ、ちゃんと会社が成長するようにそれぞれが成長できるような組織を目指します。 ■ 3. Care yourself: まずは自分を大切にしようまずはそれぞれが自分を大切にし、次に自分に近しい人を大事にする。それが満たされているからこそ、その延長線上に、良い組織が生まれ、良いプロダクトが作れ、お客様の成功を心から考えられるようになると信じています。

As a new team member

RimoはInputが動画という特性上、音声・言語・画像のどれを処理できる機械学習エンジニアで全方位で求めています。具体的には以下のような業務がありますが、この先作りたくて公開できないものも多いので、これだけにとどまりません。 - [音声認識] 文字起こし、話者分離 - 最近はWhisperのファインチューニングがメインテーマになっています。 - Facebook(Meta)なども良いものを出してきているので別の方法でもいいです。 - 話者分離も、高速で、精度が良く、事前の声紋があるときにも使え、ないときにも使えるなどの条件を全て満たすものがなかなかなく、この領域も鋭意探索中です。 - [言語処理] 要約/議事録生成 - ここはWritingだと記事生成、商談だとSalesForceに入力する項目を自動抽出など応用により変化します。 - ここはChatGPT等を利用できるため、プロンプトエンジニアリングも重要です。 - ローカルLLMを利用することもできますが、費用対効果が現状薄そうなので現状そこまで手を出さない判断です。今後この判断は覆ることがあり得ます。 - 要約や抽出箇所のオリジナルの場所を特定する必要があるため、そこは自前で行っています - ToDoの抽出などではChatGPTの処理の後に、誰がいつまでにやるべきかなどをさらに推論しより精度を上げる必要がありそうです - [画像認識] 動画からの情報抽出 - 資料を共有しているところを見つけ出してその中身も議事録に反映させる - 顔認識を通じて、動画からの話者分離 ## 求める人物像要件としては、Kagglerでも大学の助教授や、企業の研究所の方、MLエンジニアでも大丈夫です。ただし、Rimoは調達なしで売上から皆の給与を出し、一人当たり給与を上げようと努力している組織なことは頭に入れておいてください。現状、サーバー代を莫大に使い、成果が1年以内に出るかわからないものには投資できないです。それを分かった上で、まずは1ヶ月で実装方針が立つものから始め、3-6ヶ月で身を結ぶものをユーザーに届けていくことを楽しめる人が向いているかと思います。また、副業で働いてくれている人で論文を何本も国際学会に通してICPCなどでも世界大会経験のある人がいるため、機械学習の知識はないけれど、実装力には自信があって色々実験できますという人でも大丈夫です。 ## 必須スキル - 求める人物像に書いた内容に当てはまっていること ## 歓迎スキル - タスクをKaggleのように整理でき、データセットを準備し解ける問題にできる - コードを高速にできる限りバグを出さずに書くノウハウを持っている - 特定のタスクが与えられたとき、そのデータセット、論文、実装済みコードを探せる - 採用候補者のいるような学会の論文を書き、スポンサードし、Rimoの代表として学会に参加できる ## この仕事の魅力 - 機械学習の内容自体が面白い。 - 音声認識×GPTという世の中のトレンドを捉えたサービスであることから、利用者を飛躍的に向上させるチャンスがある。現在も契約者数が急増中。 - 世界展開を計画しており、プロダクトを日本だけではなく世界に広げて行ける。 ## 開発環境言語：Python, Go, TypeScript フレームワーク：pytorch, fastAPI, sklearn, openai api, LangChain, gin, React(Next.js), データベース：Firestore(Firebase), BiqQuery ソースコード管理：GitHub 情報共有ツール：Slack, Zoom, Notion, Rimo インフラ：GCP(Kubernetes Engine, Cloud Run)

3 recommendations