G04-04-01

強化学習の基本

当テーマの動画は現在準備中です。先行して問題を解いていただくことは可能です。

強化学習の基本を確認します。エージェント・環境・状態・行動・報酬・方策・価値関数・マルコフ決定過程(MDP)・割引率など、G検定で頻出の強化学習の基礎用語を4択問題で復習できます。

この動画で学ぶ主なキーワード

  • 強化学習
  • 状態
  • 方策
  • 価値関数
  • 状態価値関数
  • 行動価値関数
  • マルコフ性
  • 報酬

難易度を選んでください