試験によく出る用語集

アルファベット
数字
  • 0
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
次のページへ
基礎理論

強化学習

試行錯誤を通じて、評価(報酬)が得られる行動や選択を学習するタイプの機械学習のこと。例えば、将棋で敵軍の王将をとることに最大の評価を与え、勝利に近い局面ほど高い評価を与えて、将棋の指し方を反復して学習させる。