正しい予測のために:機械学習のリークとは? | Data Driven Knowledgebase
見せかけの高精度にご注意!手元のデータでは高精度なのに本番で予測が当たらない原因「リーク」について解説します。 未来の情報が学習データに混ざる仕組みや具体例から、正しいモデルを構築するための防ぎ方まで、データ分析で失敗しないための必須知識を解説します。
https://blog.since2020.jp/ai/machine-learning-data-leakage/
モデル開発において、「手元のテストデータでは非常に高い精度が出たのに、本番環境に導入すると予測があまり当たらない」というケースは少なくありません。このような事態を引き起こす代表的な原因のひとつが「リーク」です。今回は、データ分析において必ず知っておくべきリークの概念と、その防ぎ方について分かりやすく解説します。
続きはこちらから。