基于大語言模型的中文科技文獻標注方法
計算機工程
頁數: 8 2024-01-19
摘要: 高質量的標注數據是中文科技文獻領域自然語言處理任務的重要基石。針對目前缺乏中文科技文獻的高質量標注語料以及人工標注質量參差不齊且效率低下的問題,提出一種基于大語言模型的中文科技文獻標注方法。首先,制定適用于多領域中文科技文獻的細粒度標注規(guī)范,明確標注實體類型以及標注粒度;其次,設計結構化文本標注提示模板和生成解析器,將中文科技文獻標注任務設置成單階段單輪問答過程,將標注規(guī)范和帶... (共8頁)