第 488 題(共 548 題)

RLHF(Reinforcement Learning from Human Feedback)在大型語言模型中的主要作用為何?