iPAS 備考 / 考試題庫 / 第 232 題 第 232 題(共 548 題) 將連續文本轉換為詞彙單位的方法稱為? A 詞形還原 (Lemmatization) B 停用詞移除 (Stop Words Removal) C 斷詞 (Tokenization) D TF-IDF 解析 Tokenization(斷詞/分詞)是 NLP 的第一步,把一整段文字切成一個個的詞或子詞單位,讓電腦能逐一處理。 正確答案:C. 斷詞 (Tokenization) ← 返回題庫 查術語庫 →