ヤフー株式会社 / Tech Lead / AI エンジニア / PO / PdM
MLモデルモニタリングシステム
モデルのデプロイ後、推論性能の低下を引き起こすデータドリフトやコンセプトドリフトを検知するためのモニタリングシステムの開発に貢献。Kubernetesカスタムコントローラを使って最小限のコストで素早くモニタリング体制を構築できる社内独自システムです。SHAPを用いたFeature Attributionドリフト検知など、最先端の検知アルゴリズムを実装しています。大規模Kubernetesクラスタで最適に動作するように最適化し、多くの検知アルゴリズムをサポートしました。