iPAS 備考 / 考試題庫 / 第 57 題 第 57 題(共 548 題) 下列何者最適合訓練電腦下圍棋、自動駕駛等動態重複地互動的問題? A 監督式學習(Supervised Learning) B 非監督式學習(Unsupervised Learning) C 半監督式學習(Semi-supervised Learning) D 強化學習(Reinforcement Learning) 解析 下圍棋、自動駕駛等需要在動態環境中重複互動並從獎勵中學習的問題,最適合強化學習。 正確答案:D. 強化學習(Reinforcement Learning) ← 返回題庫 查術語庫 →