科技翰林院

首頁
文章
iPAS 備考
課程
關於

首頁
文章
iPAS 備考
課程
關於
前往學院

iPAS 備考 / 考試題庫 / 第 530 題

第 530 題（共 548 題）

Transformer架構中，Self-Attention機制的注意力分數計算公式為何？

解析

Transformer的Scaled Dot-Product Attention公式為 Attention(Q,K,V) = softmax(QK^T / sqrt(d_k)) V。除以sqrt(d_k)是為了防止點積值過大導致softmax梯度消失。A順序錯誤；C用sigmoid而非softmax；D應除以而非乘以。

正確答案：B. softmax(QK^T / sqrt(d_k)) V

← 返回題庫查術語庫 →

科技翰林院

AI 知識媒體，讓非技術背景的人也能掌握 AI 時代的生存技能。

內容

文章
iPAS 備考
AI 術語庫
課程

美第奇未來職涯 AI 學院

前往學院購買課程
Facebook 粉絲專頁

© 2026 科技翰林院. 林思翰創立.