AI基礎

強化学習とは?

読み: きょうかがくしゅう英語: Reinforcement Learning更新日: 2026-06-23

エージェントが環境で行動し、得られる報酬を最大化するように学習する方法です。

試験で問われるポイント

  • 教師あり学習の正解ラベルではなく、報酬を手がかりにします。
  • ゲームAI、ロボット制御、最適化問題などで使われます。
  • 生成AI文脈ではRLHFとの関係も押さえたい用語です。

具体例

ゲームで高得点を取る行動を試行錯誤しながら学ぶAIが例です。

よくある誤解

  • 報酬を正解ラベルと同じ意味で扱う。
  • 強化学習は生成AIだけに使われると考える。

対応試験

生成AIパスポートG検定AWS AI Practitioner

関連する表記: 強化学習 / Reinforcement Learning / RL / 報酬

関連問題で復習

関連用語

FujiCertの用語解説は、各試験の公式問題ではなく、学習者が問題演習で つまずきやすい観点を整理した非公式の学習支援コンテンツです。