Devin
Devin is an AI coding agent and software engineer that helps developers build better software faster. Parallel cloud agents for serious engineering teams.
https://devin.ai/
2023年以降、ChatGPTをはじめとする生成AIが一気に普及し、「AIをどう活用するか」があらゆる業界で注目されています。特にシステム開発の現場では、AIがコードを書くだけでなく、設計・ドキュメント・レビューにまで関与できる時代が到来。私たちスパイスファクトリーでも、AIを「試す」段階から「業務に落とし込む」段階に移行することが強く求められてきました。
属人的だった開発プロセスを標準化や改善をする試みとして開発部門のエンジニアメンバーによる「改善マラソン」という取り組みを継続的に実施しています。今回はAIの力で効率と品質を同時に向上させるためのオフライン分科会を2025年4月に実施しました。メインコンテンツは、今話題のAI開発アシスタント「Devin」を使ったデモとハンズオン実践です。
改善マラソン: AIワークショップの実施
Devinとは?
Devinワークショップで話題になった機能
1. Wiki自動生成
2. Timelapse機能
Devinを実際に触ってみる
フロントエンドUIの微調整
Devinによる動作確認の課題
Devinの設計精度
生成AI活用の取り組み事例を共有
ディスカッションで見えた課題と今後
AI活用におけるオンボーディング
技術に触れる“場”としての全社イベント
AI利用におけるリスクとリテラシー
AIオンリーハッカソン
“みんなでAIと向き合う”文化を作るアドベントカレンダー
まとめと今後の展望
スパイスファクトリーでは、以前からChatGPT、Claude、CursorなどのAIツールを積極的に導入してきました。会社負担でのアカウント提供という体制を整えていますが、使いこなせているのは一部のメンバーに限られているのが現状です。「便利だけど業務でもっと生かす方法がわからない」という声が多く、AI活用の知見がまだチーム全体に浸透していないことが課題でした。
そこで今回の「改善マラソン」では、開発部門のリーダー層が半日間オフラインで集まり、実際にAIを使い倒す体験を通じて、知見と意識を深めることを目指しました。
ハンズオン当日にすぐに作業が始められるよう、前日には環境構築を実施しました。
DevinはCognition社が提供しているAIエージェントで、完全自律型AIソフトウェアエンジニアと定義されています。AIがコード生成だけでなく、ドキュメント作成、システム設計、プロジェクトの見える化まで一括サポートしてくれるツールです。ブラウザやターミナルを操作しながら実際に開発を進める様子はまるで1人のエンジニアのようです。Devinはソフトウェア開発の生産性を飛躍的に向上させると謳われており、今回はその実力を現場で確かめる機会となりました。
ワークショップの様子
デモ開始直後、参加者全員が驚いたのがWiki(ベータ版)自動生成機能。ソースコードを読み込ませると、プロジェクト概要・構造・APIクライアント・UIフレームワークまで、章立てされたドキュメントを自動で作成。さらにER図やフロー図まで出力し、「これだけで設計レビューがかなり楽になる」という声が上がりました。
Devinは作業中の挙動をタイムラプスで視覚的に追えるのも特徴。チャット、ターミナル、IDE、ブラウザが一画面に展開され、実際に行き来して実装が行われる様子を確認することができる。参加者からは「AIと一緒に作業している感覚が新鮮」「ここまで見せてくれるのは安心感がある」といった感想が。また、おかしな操作を行い始めたときに気づくことができ、リアルタイムでDevinに軌道修正を指示するといった任せっぱなしではない開発体制にも可能性を感じました。
今回の改善マラソンでは、Devinの実力を検証すべく、2つのケースを題材にハンズオン形式でタスクを実施しました。それぞれのケースからは、AIの可能性と限界、人間との役割分担の重要性が浮かび上がってきました。
まず最初の題材では、Reactで実装された画面の中にあるSelectコンポーネントの見た目調整をDevinへ依頼。具体的には「プルダウン項目の文字列が長くなると、右側のアイコンとの間に余白がなくなる」という状態に対し、
「Selectコンポーネントの文字数が多いと右側の余白が足りないので、余白を追加して欲しいです」
という、あえてやや雑な自然言語での指示をDevinに出しました。これは、実際の業務の中でありがちな“曖昧なオーダー”への対応力を試す意図もありました。
Devinはこの指示を受け、対象のCSSプロパティ(--input-padding-inline-end)を調整する形で即座にコード修正を提案。実際にソースコードの変更内容は妥当で、生成そのものの精度は高いことが確認できました。
課題となったのは「Devinによる変更結果の確認プロセス」です。対応した結果の確認とPR作成を指示した際、Devinは「修正された」として作業を完了とみなしていましたが、実際にはローカル環境の立ち上げには失敗しており、確認はできていませんでした。これは我々が操作ログ(Timelapse)を遡ることで初めて「ローカル環境が立ち上げられていない」ことに気づけました。
修正前後の画面をスクリーンショットで比較することを指示したのですが、Devinが提示したのは、文字記号で描かれた四角形による自作図と、その補足説明。これではビジュアル的な確認ができず、開発チームとしても納得しきれない状態となりました。
この一件から得られた大きな教訓は、「Devinは理論上正しい処理をしても、その成果物の確認・保証までは自動ではない」という点です。今後の活用に向けて、段階的な確認フローをDevinに明示的に指示することの重要性を強く示しています。
AIが作成したコードレビューを行う様子
2つ目の検証では、既存のデータベース構成(ER図)に対して、新機能の追加を行う設計検討をDevinと共に進めました。対象となったER図は、特別に「AIに優しい」構成を意識したものではありませんでしたが、要素数が少なく、四角形とテキストのみで構成された比較的シンプルな図だったこともあり、Devinはスムーズに理解して作業に入ることができたようです。
今回加えたかったのは、4種類のアカウントロール間でのタスクの受渡しを可視化・実装するためのデータ構造です。私たちはその背景情報として、以下の資料をDevinに渡しました。
これらを読み込ませた上で、Devinは新たに追加されるテーブル構造と既存構造との関係を整理し、差分を示すMarkdownファイル(.md)形式の出力を行いました。
Devinによって出力された内容は、そのまま実装に使える正解とは言い難いものでしたが、手動で図を作成する工数を大幅に削減できた点、また出力図をもとに「何が足りないか」「論点はどこか」を議論するための土台として非常に有効でした。
このワークショップを通して得た大きな学びは、Devinはコード生成AIであるだけでなく、「設計検討の起点を用意するAI」としてのポテンシャルもあるということです。単に「命令に従うツール」ではなく、構造的な議論のパートナーとして活用する未来が現実味を帯びてきました。
会では、Devinだけでなく社内の他AI活用例も共有されました。以下のように開発・管理部門を横断した取り組みが進行しています。
特にNotion + NotebookLMによる案件DBの自然言語検索は、「ナレッジの見える化」と情報の有効活用としてかなり定着しています。
実践を通じてDevinや生成AIの可能性と課題が見えてきた今回の「改善マラソン」。後半のディスカッションでは、参加者からさまざまな提案や懸念、今後の展望が語られました。
部署内やプロジェクト単位でのAI導入に温度差がある現状を踏まえ、“ワークショップ”による理解促進の重要性が話題に挙がりました。
AIだけでなく、日常的にテクノロジーと向き合うエンジニアたちが知見や視点を交換しあえるイベントの必要性も議論されました。
対象はエンジニア全員を前提としつつ、非エンジニアの参加も有効という話題が出ました。
生成AIの活用が進む一方で、セキュリティリスクについても改めて触れられました。自律型AIを利用していくに当たり以下のようなリスクについても留意する必要があるという意見が挙がっています。
「AIが“成果物”を持ってくるようになった今、ソースの出どころや信頼性を問う習慣がますます重要になってきています。
スパイスファクトリーではAI活用へ積極的に取り組みつつも、AI基本方針や社内でのAIツール利用に関するガイドラインを策定しており、データの取扱いや利用についてベースラインの整備を行っています。AI活用を促進しつつも、基本的なセキュリティガイドラインは守るような仕組みも合わせて整えています。
今回の検証では、「AIと一緒にコードを書く」ということに焦点を当てましたが、参加者からは「“AIだけで全てやってみる”という制約をつけた方が学びになるのでは?」という意見も出ました。
「人間がコードを書かない」ことで、人間の介入を最小限にし、どこまでAIが対応できるかという実力を検証するだけでなく、人間側が何を準備・判断すべきかが明確になるのでは、という提案です。AIの実力と限界を把握することで、人間が本当に必要な場面を特定することができるのではないか、という期待が込められていました。
技術的なノウハウや成功例だけでなく、ちょっとした失敗談や試行錯誤の記録も含めて公開していくことで、学びの幅を広げられるという狙いがあります。誰もが“自分なりのAIの使い方”を見つけて、それを言語化して共有する。そこから新たな発見が生まれることに繋がります。
今回の「改善マラソン」を通じて、生成AIは「使えば便利」だけでなく、「組織文化の変革を促すもの」であることを改めて感じました。課題はまだまだありますが、技術の進化に合わせて私たちも進化し続けなければなりません。
各プロジェクトでの利用事例が増えていけば、議論すべき観点は増えていくことが予想されます。組織全体の課題として再度取り上げ、継続的な取り組みを続けていく必要を再認識しました。
今後も、スパイスファクトリーのAI活用事例を随時発信していきます。興味を持たれた方は、ぜひSNS等でご意見や質問をお寄せください!
CTO泰さんも出演中!スパイスファクトリーの「スパイストーク」も合わせてお聴きいただけたら嬉しいです