大学生生活方式查询分类与新冠疫情推文情感及主题分析
1. 大学生生活方式查询分类
1.1 集成模型成员性能
研究采用了多种分类器进行大学生生活方式查询分类,以下是各分类器的性能报告:
| 分类器 | 准确率(%) | 召回率(%) | F1 - 分数(%) |
| ---- | ---- | ---- | ---- |
| XGBoost | 73 | 68 | 70 |
| S - SVC | 79 | 69 | 73 |
| RF | 83 | 71 | 75 |
| LR | 78 | 66 | 70 |
从表格数据可以看出,RF 模型在准确率、召回率和 F1 - 分数上都取得了最高值。不过,最终的预测结果显示,将 RF 模型与其他表现稍弱的模型(XGBoost、S - SVC、LR)组合后,整体表现更佳。
1.2 性能指标解释
- 准确率 :指在某一类别中,被正确识别为正类别的学生查询数占该类别所有正查询数的比例。
- 召回率 :衡量模型正确识别出的学生查询数量。
- F1 - 分数 :基于准确率和召回率来量化模型性能的指标。
1.3 集成学习与投票方法
研究提出了一种基于集成学习和投票技术的多类多模型分类系统。该模型使用极端提升 XGBoost、随机森林、逻辑回归和支持向量分类器作为集成成员,通过对这些成员进行投票来预测类别标签。整体模型的平均准
超级会员免费看
订阅专栏 解锁全文
93

被折叠的 条评论
为什么被折叠?



