第 460 題(共 548 題)
某公司收集了10萬筆客戶交易資料,發現「欺詐交易」僅佔0.1%。若直接用這份資料訓練分類模型,下列敘述何者最正確?
解析
正確答案是(A)。在極度不平衡的資料集中,模型可能走捷徑——全部預測為多數類(正常),就能獲得極高的準確率(99.9%),但完全無法偵測欺詐。(B)錯誤陷阱:資料量大不能解決類別不平衡問題。(C)錯誤陷阱:深度學習不會自動解決不平衡,仍需搭配過採樣、欠採樣、損失函數調整等技術。(D)錯誤陷阱:刪除太多正常交易會損失大量有用資訊,正確做法是用SMOTE過採樣或調整類別權重。關鍵概念:類別不平衡時,準確率是誤導性指標,應改用精確率、召回率、F1-Score或AUC-ROC。
正確答案:A. 模型可能學會「全部預測為正常」就能達到99.9%的準確率,但實際上毫無用處