AI 術語庫
118 個 AI 術語白話解析,每個術語用比喻法說明。iPAS 備考必讀。
AI 基礎
AI Agent
能自主感知環境、使用工具、規劃和執行多步驟任務的 AI 系統
Hallucination
LLM 生成看似合理但實際上不正確或捏造的內容,是目前最嚴重的問題之一
Grounding
將 LLM 輸出連接到可驗證的外部知識來源,減少幻覺和提升可信度
Multimodal AI
能同時處理多種類型資料(文字、圖像、音頻、影片)的 AI 模型
Natural Language Processing
讓電腦理解、解釋和生成人類語言的 AI 子領域
Computer Vision
讓電腦從圖像或影片中「看懂」內容的 AI 子領域,包含分類、偵測、分割等任務
Automatic Speech Recognition
將語音轉換為文字的技術,如 Whisper、Siri 的語音辨識功能
Text-to-Speech
將文字轉換為自然語音的技術,現代 TTS 已能模擬特定人聲
AI 安全
Federated Learning
讓多個設備或機構在不共享原始資料的情況下協同訓練模型,保護資料隱私
AI Bias
AI 系統因訓練資料或設計缺陷,對特定群體產生不公平或歧視性結果
AI Fairness
確保 AI 系統對不同群體(性別、種族等)公平,不產生歧視性結果
Adversarial Attack
對輸入資料加入人眼難以察覺的微小擾動,使 AI 模型產生錯誤輸出
Differential Privacy
在資料分析或模型訓練中加入受控噪音,數學上保證個別資料不被推斷
Homomorphic Encryption
讓計算在加密狀態下進行,解密後得到正確結果,無需暴露明文資料
Zero Trust Architecture
不預設任何用戶或系統可信任,每次存取都需驗證的安全架構
Constitutional AI
Anthropic 提出的 AI 對齊方法,讓 AI 用一組原則自我評估和修正輸出
Model Card
記錄 AI 模型預期用途、限制、評估指標和倫理考量的標準化文件
Responsible AI
確保 AI 系統以符合倫理、透明、公平、可問責方式開發和部署的原則框架
AI 工具
Automated Machine Learning
自動化機器學習流程(特徵選擇、模型選擇、超參數調整)的技術
Hugging Face
最大的開源 AI 模型和資料集社群平台,提供 Transformers 函式庫和 Hub
LangChain
建構 LLM 應用程式的 Python/JavaScript 框架,整合了提示管理、記憶、工具使用
LlamaIndex
專注於 RAG 和資料索引的 LLM 框架,讓 LLM 能高效查詢私有知識庫
Stable Diffusion
Stability AI 發布的開源文字生圖模型,基於潛在擴散模型架構
DALL-E
OpenAI 的文字生圖模型系列,能根據文字描述生成高品質圖像
Whisper
OpenAI 發布的開源多語言語音辨識模型,準確度高且支援翻譯
GitHub Copilot
GitHub 和 OpenAI 合作開發的 AI 程式設計助理,能根據上下文自動補全程式碼
Cursor
內建 AI 的程式碼編輯器,能理解整個程式庫並根據自然語言指令修改程式碼
Claude
Anthropic 開發的 LLM 系列,以憲法 AI(Constitutional AI)方法訓練,強調安全性
Pandas
Python 資料科學的核心庫,提供 DataFrame 結構用於資料清洗、分析和轉換
RAG
Retrieval-Augmented Generation
先從知識庫檢索相關資料,再連同問題一起送給 LLM 生成回答,解決幻覺和知識截止問題
Knowledge Graph
以節點(實體)和邊(關係)儲存結構化知識的圖形資料庫,常用於增強 RAG
Chunking
RAG 預處理步驟,將長文件切成適當大小的片段後再向量化存入資料庫
Reranking
RAG 的後處理步驟,用更精確的模型對初步檢索結果重新評分排序
Semantic Search
基於語意相似度而非關鍵字匹配的搜尋方式,能找到意思相近但用詞不同的結果
XAI
大數據
Big Data
具有量(Volume)、速(Velocity)、多樣(Variety)特徵的資料集,需要特殊工具處理
Data Lake
以原始格式儲存所有結構化和非結構化資料的集中儲存庫
Extract, Transform, Load
從來源系統擷取資料、轉換為目標格式、載入到目標系統的資料工程流程
Data Warehouse
儲存結構化、清洗過的歷史資料,專為分析和報表設計的資料庫系統
Apache Spark
開源分散式資料處理框架,比 Hadoop MapReduce 快很多,支援機器學習
技術
Embedding
將離散符號(文字、ID)轉換為連續向量空間表示,讓語義相近的詞靠得近
Token
LLM 處理文字的最小單位,可以是字、詞、或子詞,英文約 4 字符一個 token
Context Window
LLM 單次能處理的最大 token 數量,超出視窗的內容會被截斷
Model Context Protocol
Anthropic 提出的開放協議,標準化 AI 助理連接外部工具和資料來源的方式
Application Programming Interface
讓不同程式互相溝通的規格接口,AI API 讓開發者用程式碼調用模型能力
Vector Database
專門儲存和搜索高維向量的資料庫,RAG 系統用它做語義相似度搜索
Machine Learning Operations
將 ML 模型開發和部署流程標準化、自動化的工程實踐
Feature Engineering
從原始資料中創建、選擇、轉換有助於模型學習的輸入變數
Inference
用訓練好的模型對新資料進行預測的過程,與訓練階段對應
Graphics Processing Unit
原為圖形計算設計,因大量平行運算能力成為深度學習的主要加速硬體
Tensor Processing Unit
Google 為機器學習設計的專用 ASIC 晶片,矩陣運算效率遠超 GPU
Edge AI
在終端裝置(手機、IoT)而非雲端伺服器執行 AI 推理,降低延遲和保護隱私
Tokenizer
將原始文字轉換為 token ID 序列的工具,每個模型有自己的分詞規則
指標
Precision
在所有模型預測為正的樣本中,實際為正的比例,衡量預測的準確程度
Recall
在所有實際為正的樣本中,模型正確預測出來的比例,衡量找全的能力
F1 Score
Precision 和 Recall 的調和平均數,當兩者都重要時使用
AUC-ROC
衡量二元分類器辨別兩類樣本能力的指標,AUC=1 完美,AUC=0.5 等於亂猜
BLEU Score
評估機器翻譯品質的指標,比較生成文字與參考翻譯的 n-gram 重疊程度
Perplexity
衡量語言模型預測能力的指標,困惑度越低代表模型越能準確預測下一個 token
ROUGE
評估文字摘要品質的指標族,比較生成摘要和參考摘要的 n-gram 重疊
提示工程
Prompt
給 LLM 的輸入指令或問題,設計好壞直接影響輸出品質
Prompt Engineering
系統性設計和優化提示詞以提升 LLM 輸出品質的技術
Chain-of-Thought
引導 LLM 逐步展示推理過程的提示技術,能顯著提升複雜推理任務的準確性
Few-shot Learning
在提示中提供幾個範例讓 LLM 學習格式或任務要求的技術
Zero-shot Learning
不提供任何範例,直接讓模型執行未見過任務的能力或提示方式
概念
模型
Convolutional Neural Network
專門處理圖像的神經網路,用小窗口(卷積核)掃過圖片提取局部特徵,參數共享大幅減少計算量
Recurrent Neural Network
有「記憶」的神經網路,能處理序列資料,前一步的輸出會回饋影響下一步
Long Short-Term Memory
改良版 RNN,用「記憶閘門」解決傳統 RNN 的長距依賴問題
Transformer
使用自注意力機制的深度學習架構,現代大型語言模型(LLM)的核心結構
Large Language Model
以超大規模文字資料訓練的語言模型,能理解和生成自然語言
Generative Pre-trained Transformer
OpenAI 開發的自回歸語言模型系列,每次預測下一個 token 的條件機率
Bidirectional Encoder Representations from Transformers
雙向 Transformer 編碼器,同時看句子前後文的預訓練模型,擅長理解任務
Generative Adversarial Network
由生成器和判別器互相競爭訓練的架構,能生成逼真的合成資料
Variational Autoencoder
將輸入壓縮成潛在空間分布後再重建的生成模型,能學習資料的連續潛在結構
Diffusion Model
透過逐步加噪再去噪的過程學習資料分布的生成模型,Stable Diffusion 的核心
Attention Mechanism
讓模型在生成每個輸出時動態決定輸入哪些部分最重要的機制
Foundation Model
在大規模多樣資料上預訓練,能適應多種下游任務的通用大型模型
Text-to-Text Transfer Transformer
Google 的統一文字到文字框架,把所有 NLP 任務統一為「給定輸入文字,生成輸出文字」
Pathways Language Model
Google 的大型語言模型,使用 Pathways 架構訓練,是 Gemini 的前身
Gemini
Google DeepMind 開發的多模態大型語言模型,整合文字、圖像、音頻理解能力
Llama
Meta 發布的開源大型語言模型系列,社群廣泛基於它微調和部署
Mixtral
Mistral AI 的混合專家架構(MoE)模型,用少量激活參數達到高效能推理
Mixture of Experts
每次前向傳播只激活部分「專家」子網路,大幅減少推理計算量的架構
模型訓練
Low-Rank Adaptation
凍結原始模型,只訓練低秩矩陣的微調方法,大幅減少可訓練參數量
Reinforcement Learning from Human Feedback
用人類偏好評分訓練獎勵模型,再用強化學習微調 LLM,使輸出更符合人類期望
Fine-tuning
在預訓練模型基礎上,用特定領域資料繼續訓練,使其適應特定任務
Quantization
用較低精度(如 INT8、4-bit)儲存模型參數,減少記憶體需求和推理速度
Model Distillation
用大模型(教師)訓練小模型(學生),讓小模型達到接近大模型的效果
Parameter-Efficient Fine-Tuning
只更新少量參數就能有效微調大型模型的方法族,包含 LoRA、Prefix Tuning 等
Instruction Tuning
用指令-回應格式的資料微調預訓練模型,讓它學會遵從自然語言指令
機器學習
Supervised Learning
用有標籤的資料訓練模型,每筆訓練資料都附有正確答案
Unsupervised Learning
從無標籤資料中自動發現結構和模式,沒有預設正確答案
Reinforcement Learning
智能體透過與環境互動,根據獎懲信號學習最優行為策略
Transfer Learning
將已學好的知識(預訓練模型)應用到新任務,大幅減少新任務所需的資料量
Overfitting
模型過度學習訓練資料的細節和雜訊,導致在新資料上表現差
Underfitting
模型太簡單,無法捕捉資料的真實規律,在訓練資料和新資料上表現都差
Regularization
在損失函數加入懲罰項,防止模型參數過大,避免過擬合
Gradient Descent
沿著損失函數梯度的反方向更新參數,逐步找到使損失最小化的最優解
Learning Rate
控制每次梯度更新步伐大小的超參數,太大跳過最優解,太小收斂太慢
Hyperparameter
訓練前手動設定的配置參數(如學習率、層數),影響模型架構和訓練過程
Cross-validation
將資料集分成多份輪流當訓練集和驗證集,更可靠地評估模型泛化能力
Epoch
訓練過程中完整看過一次所有訓練資料的計數單位
Batch Size
每次梯度更新使用的訓練樣本數量,影響訓練速度和穩定性
Loss Function
衡量模型預測值和真實值之間差距的函數,訓練目標是最小化損失
法規
深度學習
Dropout
訓練時隨機關閉部分神經元,防止過擬合的正則化技術
Batch Normalization
在神經網路層之間標準化輸入,加速訓練並穩定梯度
Activation Function
神經元決定是否「激活」的非線性函數,如 ReLU、Sigmoid,賦予網路非線性表達能力
Backpropagation
計算損失函數對每個參數的梯度,用鏈式法則從後往前傳遞,是神經網路訓練的核心算法
Softmax
將一組數字轉換為概率分布(總和為1)的函數,常用於多分類問題的輸出層
Sigmoid Function
將任意實數映射到 (0,1) 之間的 S 形曲線,常用於二元分類輸出
Rectified Linear Unit
輸入為負時輸出零、正時原樣輸出的激活函數,計算簡單且能緩解梯度消失