第 545 題(共 548 題)
GPT-3的預訓練資料規模約為多少?
解析
GPT-3擁有1,750億參數,使用約45TB原始資料(約5,000億tokens)進行預訓練。1GB是極小規模(A);40GB是GPT-2的規模(B);1PB過大(D)。這說明LLM對大數據的極度需求。
正確答案:C. 45TB原始資料(約5,000億tokens)
GPT-3擁有1,750億參數,使用約45TB原始資料(約5,000億tokens)進行預訓練。1GB是極小規模(A);40GB是GPT-2的規模(B);1PB過大(D)。這說明LLM對大數據的極度需求。
正確答案:C. 45TB原始資料(約5,000億tokens)