政策文本多标签分类模型训练

项目概括

应用场景

政府部门对政策文件自动化归类、标签化;作为政策数据加工方法融合到政策资讯平台供用户(企业、创业者等政策惠及人员)快速查阅相关政策。

政策标签空间:

  • 项目申报

  • 财政奖补

  • 减税降费

  • 企业培训

  • 要素保障

  • ……

技术概况

  • 硬件:Nvidia RTX 4090 24G

  • 任务类型:多标签文本分类

  • 预训练模型:Ernie3 Base

  • 训练方法:基于预训练模型进行微调,先基于AdamW优化器使模型快速达到较优的效果,再使用SGD优化器精调

  • 优化策略:针对数据类别不平衡情况,采样训练集时刻意尽量提高类别较少样本的比例。

  • 评价方法:多标签微平均

  • 结果:通过测试,投入生产使用。

评价指标

候选指标

基础评价指标

  • 召回率

  • 精确率

  • F-Measure

针对多标签分类的评价指标

  • 微平均召回率/精确率/F-Measure

    计算方式:在样本级别计算全局平均指标

    适用场景:更关注模型的整体表现,且更关注主导类别的影响(样本类别不平衡情况下数量最多的类别)

  • 宏平均召回率/精确率/F-Measure

    计算方式:计算每个类别的评价指标,再以同等权重对各类别的平均值求平均。

    适用场景:避免模型只关注多数类而忽略少数类的情况。

选择宏平均还是微平均?

希望提高常见政策类别的分类准确性,因此选择微平均作为主要评价指标。

CoolCats
CoolCats
理学学士

我的研究兴趣是时空数据分析、知识图谱、自然语言处理与服务端开发