✨AI-900対策ノート:過学習(Overfitting)とは?
目次
*試験対策用のメモ✍
🎯 過学習(Overfitting)とは?
-
訓練データに対しては高い精度を出す一方で、
未知のデータ(テストデータや実際の運用データ)にはうまく対応できない状態。 -
モデルが「データの一般的な傾向」ではなく、「ノイズや例外」にまで過剰に適応してしまうのが原因。
📌 例:
猫の画像分類モデルが「猫の横にあるソファの色」まで覚えてしまい、
違う背景の猫画像だとうまく判断できない…というような状態。
🛡 過学習を防ぐ方法
対策方法 | 説明 |
---|---|
① データ量を増やす | より多くの多様なデータを使って学習することで、一般化能力が向上する。 |
② シンプルなモデルを使う | パラメータが多すぎる複雑なモデルよりも、シンプルな方が過学習を起こしにくい。 |
③ 正則化(Regularization) | モデルの重みが極端にならないようにペナルティを課す(例:L1/L2正則化)。 |
④ 交差検証(Cross-validation) | 学習と検証を複数パターンで繰り返し、過学習を検知する方法。 |
✅ 試験に出やすいポイント
-
「訓練データにだけうまく合っている状態」は過学習。
-
正則化は頻出キーワード。
-
過学習の逆は「未学習(Underfitting)」で、これは訓練データにさえうまく適合していない状態。