基于樣本分布特征的數(shù)據(jù)投毒防御
計算機應用研究
頁數(shù): 6 2023-04-10
摘要: 流量分類模型在更新過程中易受數(shù)據(jù)污染的干擾而降低模型性能,現(xiàn)有基于數(shù)據(jù)清洗的防御方法需依賴專家經(jīng)驗和人工篩選,且無法有效應對利用未知分布樣本構(gòu)造的投毒攻擊。針對上述問題,受分布外檢測和判別主動學習的啟發(fā),設計一種基于樣本分布特征的數(shù)據(jù)投毒防御方法,通過二分類判別器篩選每輪新增樣本中的已知及未知分布樣本。對于新增的已知分布樣本,通過模型預測與標注結(jié)果一致率評估新增樣本的數(shù)據(jù)質(zhì)量,... (共6頁)