第 475 題(共 548 題)
下列關於Transformer架構的敘述,何者「正確」?
解析
正確答案是(B)。Self-Attention的突破在於:不像RNN需要逐步處理序列,它可以同時計算序列中任意兩個位置之間的關係,且不受距離限制。(A)錯誤陷阱:Transformer的核心是Self-Attention機制,不是卷積層。卷積是CNN的核心。(C)錯誤:Transformer已廣泛應用於電腦視覺(ViT)、語音(Whisper)等領域。(D)錯誤陷阱:標準Self-Attention的計算複雜度與序列長度呈二次方關係O(n²),這其實是其效率瓶頸之一。關鍵概念:Transformer = Self-Attention + 平行處理,解決了RNN的長距離依賴和無法平行化的問題。
正確答案:B. 自注意力機制(Self-Attention)讓模型能夠平行處理序列中所有位置的關係,不受距離限制