AI 安全 深入

Constitutional AI

Constitutional AI / 憲法 AI

白話解析

Anthropic 提出的 AI 對齊方法,讓 AI 用一組原則自我評估和修正輸出

生活化比喻

像內化了法律的公民——不需要警察在旁,自己知道什麼能做什麼不能做