AI 術語庫

118 個 AI 術語白話解析，每個術語用比喻法說明。iPAS 備考必讀。

AI 基礎（8） AI 安全（10） AI 工具（11） RAG（5） XAI（3）大數據（5）技術（13）指標（7）提示工程（5）概念（3）模型（18）模型訓練（7）機器學習（14）法規（2）深度學習（7）

AI 基礎

Agent 進階

AI Agent

能自主感知環境、使用工具、規劃和執行多步驟任務的 AI 系統

→

Hallucination 基礎

Hallucination

LLM 生成看似合理但實際上不正確或捏造的內容，是目前最嚴重的問題之一

→

Grounding 進階

Grounding

將 LLM 輸出連接到可驗證的外部知識來源，減少幻覺和提升可信度

→

Multimodal 基礎

Multimodal AI

能同時處理多種類型資料（文字、圖像、音頻、影片）的 AI 模型

→

NLP 入門

Natural Language Processing

讓電腦理解、解釋和生成人類語言的 AI 子領域

→

Computer Vision 入門

Computer Vision

讓電腦從圖像或影片中「看懂」內容的 AI 子領域，包含分類、偵測、分割等任務

→

ASR 基礎

Automatic Speech Recognition

將語音轉換為文字的技術，如 Whisper、Siri 的語音辨識功能

→

TTS 入門

Text-to-Speech

將文字轉換為自然語音的技術，現代 TTS 已能模擬特定人聲

→

AI 安全

聯邦學習深入

Federated Learning

讓多個設備或機構在不共享原始資料的情況下協同訓練模型，保護資料隱私

→

Bias 基礎

AI Bias

AI 系統因訓練資料或設計缺陷，對特定群體產生不公平或歧視性結果

→

Fairness 基礎

AI Fairness

確保 AI 系統對不同群體（性別、種族等）公平，不產生歧視性結果

→

Adversarial Attack 深入

Adversarial Attack

對輸入資料加入人眼難以察覺的微小擾動，使 AI 模型產生錯誤輸出

→

差分隱私深入

Differential Privacy

在資料分析或模型訓練中加入受控噪音，數學上保證個別資料不被推斷

→

同態加密深入

Homomorphic Encryption

讓計算在加密狀態下進行，解密後得到正確結果，無需暴露明文資料

→

零信任架構進階

Zero Trust Architecture

不預設任何用戶或系統可信任，每次存取都需驗證的安全架構

→

Constitutional AI 深入

Constitutional AI

Anthropic 提出的 AI 對齊方法，讓 AI 用一組原則自我評估和修正輸出

→

Model Card 基礎

Model Card

記錄 AI 模型預期用途、限制、評估指標和倫理考量的標準化文件

→

Responsible AI 基礎

Responsible AI

確保 AI 系統以符合倫理、透明、公平、可問責方式開發和部署的原則框架

→

AI 工具

AutoML 基礎

Automated Machine Learning

自動化機器學習流程（特徵選擇、模型選擇、超參數調整）的技術

→

Hugging Face 入門

Hugging Face

最大的開源 AI 模型和資料集社群平台，提供 Transformers 函式庫和 Hub

→

LangChain 進階

LangChain

建構 LLM 應用程式的 Python/JavaScript 框架，整合了提示管理、記憶、工具使用

→

LlamaIndex 進階

LlamaIndex

專注於 RAG 和資料索引的 LLM 框架，讓 LLM 能高效查詢私有知識庫

→

Stable Diffusion 基礎

Stable Diffusion

Stability AI 發布的開源文字生圖模型，基於潛在擴散模型架構

→

DALL-E 入門

DALL-E

OpenAI 的文字生圖模型系列，能根據文字描述生成高品質圖像

→

Whisper 入門

Whisper

OpenAI 發布的開源多語言語音辨識模型，準確度高且支援翻譯

→

Copilot 入門

GitHub Copilot

GitHub 和 OpenAI 合作開發的 AI 程式設計助理，能根據上下文自動補全程式碼

→

Cursor 入門

Cursor

內建 AI 的程式碼編輯器，能理解整個程式庫並根據自然語言指令修改程式碼

→

Claude 入門

Claude

Anthropic 開發的 LLM 系列，以憲法 AI（Constitutional AI）方法訓練，強調安全性

→

Pandas 入門

Pandas

Python 資料科學的核心庫，提供 DataFrame 結構用於資料清洗、分析和轉換

→

RAG

RAG 基礎

Retrieval-Augmented Generation

先從知識庫檢索相關資料，再連同問題一起送給 LLM 生成回答，解決幻覺和知識截止問題

→

Knowledge Graph 進階

Knowledge Graph

以節點（實體）和邊（關係）儲存結構化知識的圖形資料庫，常用於增強 RAG

→

Chunking 基礎

Chunking

RAG 預處理步驟，將長文件切成適當大小的片段後再向量化存入資料庫

→

Reranking 進階

Reranking

RAG 的後處理步驟，用更精確的模型對初步檢索結果重新評分排序

→

Semantic Search 基礎

Semantic Search

基於語意相似度而非關鍵字匹配的搜尋方式，能找到意思相近但用詞不同的結果

→

XAI

XAI 進階

Explainable AI

讓 AI 決策過程透明可理解的技術和方法，解決深度學習「黑盒子」問題

→

LIME 深入

Local Interpretable Model-agnostic Explanations

用簡單的局部近似模型解釋複雜模型單筆預測結果的 XAI 方法

→

SHAP 深入

SHapley Additive exPlanations

基於賽局論 Shapley 值，公平計算每個特徵對預測結果貢獻度的 XAI 方法

→

大數據

大數據入門

Big Data

具有量（Volume）、速（Velocity）、多樣（Variety）特徵的資料集，需要特殊工具處理

→

Data Lake 基礎

Data Lake

以原始格式儲存所有結構化和非結構化資料的集中儲存庫

→

ETL 基礎

Extract, Transform, Load

從來源系統擷取資料、轉換為目標格式、載入到目標系統的資料工程流程

→

Data Warehouse 基礎

Data Warehouse

儲存結構化、清洗過的歷史資料，專為分析和報表設計的資料庫系統

→

Spark 進階

Apache Spark

開源分散式資料處理框架，比 Hadoop MapReduce 快很多，支援機器學習

→

技術

Embedding 基礎

Embedding

將離散符號（文字、ID）轉換為連續向量空間表示，讓語義相近的詞靠得近

→

Token 入門

Token

LLM 處理文字的最小單位，可以是字、詞、或子詞，英文約 4 字符一個 token

→

Context Window 基礎

Context Window

LLM 單次能處理的最大 token 數量，超出視窗的內容會被截斷

→

MCP 進階

Model Context Protocol

Anthropic 提出的開放協議，標準化 AI 助理連接外部工具和資料來源的方式

→

API 入門

Application Programming Interface

讓不同程式互相溝通的規格接口，AI API 讓開發者用程式碼調用模型能力

→

Vector DB 進階

Vector Database

專門儲存和搜索高維向量的資料庫，RAG 系統用它做語義相似度搜索

→

MLOps 進階

Machine Learning Operations

將 ML 模型開發和部署流程標準化、自動化的工程實踐

→

Feature Engineering 進階

Feature Engineering

從原始資料中創建、選擇、轉換有助於模型學習的輸入變數

→

Inference 入門

Inference

用訓練好的模型對新資料進行預測的過程，與訓練階段對應

→

GPU 入門

Graphics Processing Unit

原為圖形計算設計，因大量平行運算能力成為深度學習的主要加速硬體

→

TPU 進階

Tensor Processing Unit

Google 為機器學習設計的專用 ASIC 晶片，矩陣運算效率遠超 GPU

→

Edge AI 基礎

Edge AI

在終端裝置（手機、IoT）而非雲端伺服器執行 AI 推理，降低延遲和保護隱私

→

Tokenizer 基礎

Tokenizer

將原始文字轉換為 token ID 序列的工具，每個模型有自己的分詞規則

→

指標

Precision 基礎

Precision

在所有模型預測為正的樣本中，實際為正的比例，衡量預測的準確程度

→

Recall 基礎

Recall

在所有實際為正的樣本中，模型正確預測出來的比例，衡量找全的能力

→

F1 Score 基礎

F1 Score

Precision 和 Recall 的調和平均數，當兩者都重要時使用

→

AUC-ROC 進階

AUC-ROC

衡量二元分類器辨別兩類樣本能力的指標，AUC=1 完美，AUC=0.5 等於亂猜

→

BLEU 進階

BLEU Score

評估機器翻譯品質的指標，比較生成文字與參考翻譯的 n-gram 重疊程度

→

Perplexity 進階

Perplexity

衡量語言模型預測能力的指標，困惑度越低代表模型越能準確預測下一個 token

→

ROUGE 進階

ROUGE

評估文字摘要品質的指標族，比較生成摘要和參考摘要的 n-gram 重疊

→

提示工程

Prompt 入門

Prompt

給 LLM 的輸入指令或問題，設計好壞直接影響輸出品質

→

Prompt Engineering 基礎

Prompt Engineering

系統性設計和優化提示詞以提升 LLM 輸出品質的技術

→

Chain-of-Thought 基礎

Chain-of-Thought

引導 LLM 逐步展示推理過程的提示技術，能顯著提升複雜推理任務的準確性

→

Few-shot 基礎

Few-shot Learning

在提示中提供幾個範例讓 LLM 學習格式或任務要求的技術

→

Zero-shot 基礎

Zero-shot Learning

不提供任何範例，直接讓模型執行未見過任務的能力或提示方式

→

概念

AI 入門

Artificial Intelligence

讓電腦模擬人類思考和決策的技術總稱，包含 ML、DL 等子領域

→

ML 入門

Machine Learning

讓電腦從資料中自動學習規律的 AI 子領域，不需要人類一條條寫規則

→

DL 基礎

Deep Learning

使用多層神經網路的 ML 方法，能自動學習複雜的特徵階層

→

模型

CNN 進階

Convolutional Neural Network

專門處理圖像的神經網路，用小窗口（卷積核）掃過圖片提取局部特徵，參數共享大幅減少計算量

→

RNN 進階

Recurrent Neural Network

有「記憶」的神經網路，能處理序列資料，前一步的輸出會回饋影響下一步

→

LSTM 進階

Long Short-Term Memory

改良版 RNN，用「記憶閘門」解決傳統 RNN 的長距依賴問題

→

Transformer 進階

Transformer

使用自注意力機制的深度學習架構，現代大型語言模型（LLM）的核心結構

→

LLM 基礎

Large Language Model

以超大規模文字資料訓練的語言模型，能理解和生成自然語言

→

GPT 基礎

Generative Pre-trained Transformer

OpenAI 開發的自回歸語言模型系列，每次預測下一個 token 的條件機率

→

BERT 進階

Bidirectional Encoder Representations from Transformers

雙向 Transformer 編碼器，同時看句子前後文的預訓練模型，擅長理解任務

→

GAN 進階

Generative Adversarial Network

由生成器和判別器互相競爭訓練的架構，能生成逼真的合成資料

→

VAE 深入

Variational Autoencoder

將輸入壓縮成潛在空間分布後再重建的生成模型，能學習資料的連續潛在結構

→

Diffusion 深入

Diffusion Model

透過逐步加噪再去噪的過程學習資料分布的生成模型，Stable Diffusion 的核心

→

Attention 進階

Attention Mechanism

讓模型在生成每個輸出時動態決定輸入哪些部分最重要的機制

→

Foundation Model 基礎

Foundation Model

在大規模多樣資料上預訓練，能適應多種下游任務的通用大型模型

→

T5 進階

Text-to-Text Transfer Transformer

Google 的統一文字到文字框架，把所有 NLP 任務統一為「給定輸入文字，生成輸出文字」

→

PaLM 進階

Pathways Language Model

Google 的大型語言模型，使用 Pathways 架構訓練，是 Gemini 的前身

→

Gemini 基礎

Gemini

Google DeepMind 開發的多模態大型語言模型，整合文字、圖像、音頻理解能力

→

Llama 基礎

Llama

Meta 發布的開源大型語言模型系列，社群廣泛基於它微調和部署

→

Mixtral 進階

Mixtral

Mistral AI 的混合專家架構（MoE）模型，用少量激活參數達到高效能推理

→

MoE 深入

Mixture of Experts

每次前向傳播只激活部分「專家」子網路，大幅減少推理計算量的架構

→

模型訓練

LoRA 深入

Low-Rank Adaptation

凍結原始模型，只訓練低秩矩陣的微調方法，大幅減少可訓練參數量

→

RLHF 深入

Reinforcement Learning from Human Feedback

用人類偏好評分訓練獎勵模型，再用強化學習微調 LLM，使輸出更符合人類期望

→

Fine-tuning 基礎

Fine-tuning

在預訓練模型基礎上，用特定領域資料繼續訓練，使其適應特定任務

→

Quantization 進階

Quantization

用較低精度（如 INT8、4-bit）儲存模型參數，減少記憶體需求和推理速度

→

Model Distillation 進階

Model Distillation

用大模型（教師）訓練小模型（學生），讓小模型達到接近大模型的效果

→

PEFT 深入

Parameter-Efficient Fine-Tuning

只更新少量參數就能有效微調大型模型的方法族，包含 LoRA、Prefix Tuning 等

→

Instruction Tuning 進階

Instruction Tuning

用指令-回應格式的資料微調預訓練模型，讓它學會遵從自然語言指令

→

機器學習

監督式學習入門

Supervised Learning

用有標籤的資料訓練模型，每筆訓練資料都附有正確答案

→

非監督式學習基礎

Unsupervised Learning

從無標籤資料中自動發現結構和模式，沒有預設正確答案

→

強化學習進階

Reinforcement Learning

智能體透過與環境互動，根據獎懲信號學習最優行為策略

→

遷移學習基礎

Transfer Learning

將已學好的知識（預訓練模型）應用到新任務，大幅減少新任務所需的資料量

→

過擬合基礎

Overfitting

模型過度學習訓練資料的細節和雜訊，導致在新資料上表現差

→

欠擬合基礎

Underfitting

模型太簡單，無法捕捉資料的真實規律，在訓練資料和新資料上表現都差

→

正則化進階

Regularization

在損失函數加入懲罰項，防止模型參數過大，避免過擬合

→

梯度下降進階

Gradient Descent

沿著損失函數梯度的反方向更新參數，逐步找到使損失最小化的最優解

→

學習率基礎

Learning Rate

控制每次梯度更新步伐大小的超參數，太大跳過最優解，太小收斂太慢

→

Hyperparameter 基礎

Hyperparameter

訓練前手動設定的配置參數（如學習率、層數），影響模型架構和訓練過程

→

Cross-validation 基礎

Cross-validation

將資料集分成多份輪流當訓練集和驗證集，更可靠地評估模型泛化能力

→

Epoch 入門

Epoch

訓練過程中完整看過一次所有訓練資料的計數單位

→

Batch Size 基礎

Batch Size

每次梯度更新使用的訓練樣本數量，影響訓練速度和穩定性

→

Loss Function 基礎

Loss Function

衡量模型預測值和真實值之間差距的函數，訓練目標是最小化損失

→

法規

GDPR 基礎

General Data Protection Regulation

歐盟 2018 年實施的個人資料保護法規，AI 系統若處理歐盟居民資料必須遵守

→

AI Act 進階

EU AI Act

全球首部 AI 綜合法規，按風險高低分類監管 AI 系統，高風險 AI 需通過嚴格審查

→

深度學習

Dropout 進階

Dropout

訓練時隨機關閉部分神經元，防止過擬合的正則化技術

→

Batch Normalization 進階

Batch Normalization

在神經網路層之間標準化輸入，加速訓練並穩定梯度

→

Activation Function 基礎

Activation Function

神經元決定是否「激活」的非線性函數，如 ReLU、Sigmoid，賦予網路非線性表達能力

→

Backpropagation 深入

Backpropagation

計算損失函數對每個參數的梯度，用鏈式法則從後往前傳遞，是神經網路訓練的核心算法

→

Softmax 進階

Softmax

將一組數字轉換為概率分布（總和為1）的函數，常用於多分類問題的輸出層

→

Sigmoid 基礎

Sigmoid Function

將任意實數映射到 (0,1) 之間的 S 形曲線，常用於二元分類輸出

→

ReLU 基礎

Rectified Linear Unit

輸入為負時輸出零、正時原樣輸出的激活函數，計算簡單且能緩解梯度消失

→