AI基礎

強化学習とは？

読み: きょうかがくしゅう英語: Reinforcement Learning更新日: 2026-06-23

エージェントが環境で行動し、得られる報酬を最大化するように学習する方法です。

試験で問われるポイント

教師あり学習の正解ラベルではなく、報酬を手がかりにします。
ゲームAI、ロボット制御、最適化問題などで使われます。
生成AI文脈ではRLHFとの関係も押さえたい用語です。

具体例

ゲームで高得点を取る行動を試行錯誤しながら学ぶAIが例です。

よくある誤解

報酬を正解ラベルと同じ意味で扱う。
強化学習は生成AIだけに使われると考える。

対応試験

生成AIパスポートG検定AWS AI Practitioner

関連する表記: 強化学習 / Reinforcement Learning / RL / 報酬

関連問題で復習

AWS AI PractitionerAI・機械学習の基礎

強化学習の説明として最も適切なものはどれか。

G検定機械学習の概要・具体的手法

「強化学習」の説明として、最も適切なものはどれか。

G検定ディープラーニングの応用例

「強化学習」における「報酬」の役割として、最も適切なものはどれか。

G検定ディープラーニングの応用例

深層強化学習の応用例として、最も適切なものはどれか。

G検定ディープラーニングの応用例

「RLHF（Reinforcement Learning from Human Feedback）」の説明として、最も適切なものはどれか。

G検定ディープラーニングの応用例

「DQN（Deep Q-Network）」の説明として、最も適切なものはどれか。

生成AIパスポートAI・生成AIの基礎

機械学習の主要カテゴリとして適切なものを3つ選べ。

AWS AI Practitioner基盤モデルの活用

RLHFの説明として最も適切なものはどれか。

関連用語

機械学習

データからパターンや規則を学び、予測や分類などに利用するAIの手法です。

AIエージェント

目標に向けて計画を立て、ツール利用や複数ステップの処理を実行するAIシステムです。

RLHF

人間の評価やフィードバックを使い、モデルの出力を望ましい方向へ調整する手法です。

FujiCertの用語解説は、各試験の公式問題ではなく、学習者が問題演習でつまずきやすい観点を整理した非公式の学習支援コンテンツです。