基于雙層數(shù)據(jù)增強的監(jiān)督對比學(xué)習(xí)文本分類模型
吉林大學(xué)學(xué)報(理學(xué)版)
頁數(shù): 9 2024-09-20
摘要: 針對DoubleMix算法在數(shù)據(jù)增強時的非選擇性擴充及訓(xùn)練方式的不足,提出一種基于雙層數(shù)據(jù)增強的監(jiān)督對比學(xué)習(xí)文本分類模型,有效提高了在訓(xùn)練數(shù)據(jù)稀缺時文本分類的準(zhǔn)確率.首先,對原始數(shù)據(jù)在輸入層進行基于關(guān)鍵詞的數(shù)據(jù)增強,不考慮句子結(jié)構(gòu)的同時對數(shù)據(jù)進行有選擇增強;其次,在BERT隱藏層對原始數(shù)據(jù)與增強后的數(shù)據(jù)進行插值,然后送入TextCNN進一步提取特征;最后,使用Wasserste... (共9頁)