基于数字人文视域下机器学习的古诗文关键词抽取
2026.05.05点击:
摘要:<正>数字人文将计算机技术有机融合于人文学科研究之中,旨在深入、全面地探索、理解和挖掘人文内涵。基于数字人文视域,利用TextRank、TF-IDF(词频-逆文档频率)和LDA算法对辛弃疾的诗词进行关键词抽取探究。通过Pooling的评价方法发现,TextRank算法抽取的关键词结果更好,准确率能达到76.67%,而传统的TF-IDF和LDA算法准确率分别为63.33%和53.33%。同时,根据抽取的关键词,还可以发现辛弃疾诗词的内容主要围绕青山、英雄、江山等关键词进行描述。
专辑: 信息科技;哲学与人文科学
专题: 中国文学;计算机软件及计算机应用;自动化技术
分类号: I206.2;TP181;TP391.1
- 上一篇:Pandas和Matplotlib在数据分析与可视化中的应用 2026/5/5
- 下一篇:智能手机中框检测控制系统的设计与实现 2026/5/5