データ・DX
過学習とは?
読み: かがくしゅう英語: Overfitting更新日: 2026-06-26
学習データにはよく合うが、新しいデータへの予測性能が低くなる状態です。
試験で問われるポイント
- 訓練データと検証データの性能差で気づくことがあります。
- 交差検証、正則化、データ分割、モデル複雑度の調整と関係します。
- DS検定やG検定では評価と汎化性能の文脈で問われやすいです。
具体例
過去データでは高精度なのに、実運用では予測が外れやすい状態です。
混同しやすい点
- 訓練データの正解率だけでモデルが良いと判断する。
- データを増やせば必ず過学習が解決すると考える。
対応試験
DS検定G検定
関連する表記: 過学習 / Overfitting / オーバーフィッティング
関連問題で復習
DS検定データサイエンス
データサイエンス領域で扱う「過学習」の説明として最も適切なものはどれか。
G検定機械学習の概要・具体的手法
「過学習(オーバーフィッティング)」の説明として、最も適切なものはどれか。
AWS AI PractitionerAI・機械学習の基礎
過学習を説明するものとして最も適切なものはどれか。
G検定機械学習の概要・具体的手法
過学習を防ぐための手法として、適切でないものはどれか。
生成AIパスポートAI・生成AIの基礎
学習中にランダムにニューロンを無効化して過学習を防ぐ手法を何と呼ぶか。
生成AIパスポートAI・生成AIの基礎
モデルの学習中に性能を監視し、過学習を検出するために使用されるデータはどれか。
生成AIパスポートAI・生成AIの基礎
検証データでの性能が悪化し始めたら学習を停止して過学習を防ぐ手法を何と呼ぶか。
生成AIパスポートAI・生成AIの基礎
開発したAIモデルが学習データでは99%の精度だが、新しいデータでは60%しか出ない。この現象の名称と対策に関する記述として最も適切なものはどれか。
関連用語
FujiCertの用語解説は、各試験の公式問題ではなく、学習者が問題演習で つまずきやすい観点を整理した非公式の学習支援コンテンツです。