ヤフー株式会社 / Tech Lead / AI エンジニア / PO / PdM
掲載「Data-centric AI入門」にACP Data Qualityが事例掲載
私がプロジェクトを立ち上げて設計・開発したデータ品質管理システム ACP Data Qualityが、技術評論社から発売の「Data-centric AI入門」で事例として5ページにわたって紹介されています。 データを固定してモデルを改善する考え方はModel-centric AIと呼ばれています。これに対し、モデルを固定してデータを改善していく考え方をData-centric AIと呼びます。 LINEヤフーでは、優れたモデルを開発する体制が整っていましたが、一方で実運用において多くの事故が発生し、成果を最大化できていませんでした。例えばデータに異常が起きた時にサービスサイドのエンジニアが対応できなかったり、時間の経過でデータの性質が変わりモデルが性能を発揮できない状態が発見されず放置されるといったことが実際に起きていました。 私はAIプラットフォームを開発しており、データのドリフト検出システムも開発していましたが、もう一歩踏み込んで「あらゆるサービスが本格的なデータ品質管理を実践できる仕掛け」こそがエンタープライズでのAI活用のスケールアウトにおける重要なファクターだと考えました。モデルを良くすることだけではなく、モデル性能を最大限に発揮するためにデータの品質を一貫して継続的に改善するプロセスを標準化するシステムとして開発したのが、この書で紹介されているACP Data Qualityです。モデルではなくデータを改善していくという考え方が、Data-centric AIの特徴です。 この本では画像ロボットLLMまで様々なデータの管理や評価に関する情報が解説されているだけでなく、LY以外にも何社もの実例が紹介されています。とても良い本だと思います!ぜひ手に取ってみてください!