LLM・生成AI

RLHFとは?

読み: あーるえるえいちえふ英語: Reinforcement Learning from Human Feedback更新日: 2026-06-23

人間の評価やフィードバックを使い、モデルの出力を望ましい方向へ調整する手法です。

試験で問われるポイント

  • 強化学習と人間評価を組み合わせた考え方です。
  • 安全性や有用性の向上に関係します。
  • 完全な正確性を保証する仕組みではありません。

具体例

ユーザーにとって有用で安全な応答を選好するようにモデルを調整します。

よくある誤解

  • RLHFで誤回答が完全になくなると考える。
  • 人間が毎回リアルタイムで回答を書いていると考える。

対応試験

生成AIパスポートG検定

関連する表記: RLHF / 人間のフィードバック / Reinforcement Learning from Human Feedback

関連問題で復習

関連用語

FujiCertの用語解説は、各試験の公式問題ではなく、学習者が問題演習で つまずきやすい観点を整理した非公式の学習支援コンテンツです。