论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>专科论文>范文阅读
快捷分类: 文献检索网站 论文中怎么引用文献 文献 外文文献网站 书籍参考文献 英文参考文献格式举例 网络爬虫参考文献 文献利用论文 文献综述事例 体育游戏文献综述 房地产财务风险文献综述 有参考文献的论文

关于文献论文范文 基于多标签分类的学术文献潜在时间意图识别相关论文写作参考文献

分类:专科论文 原创主题:文献论文 更新时间:2024-01-28

基于多标签分类的学术文献潜在时间意图识别是关于文献方面的的相关大学硕士和相关本科毕业论文以及相关文献论文开题报告范文和职称论文写作参考文献资料下载。

摘 要:為了提高检索结果的时间相关性,将文本特征抽取和多标签分类算法应用于文献检索的潜在时间意图分类研究之中.从检索潜在时间意图分类的角度出发,提出一种基于文本时间信息抽取和Labeled LDA(标签主题模型)的文献潜在时间意图自动分类算法.首先,在获取的文献时间信息基础上,将文献检索潜在时间意图映射至具体时间类别.其次,为了减少时间信息的稀疏性对分类特征学习过程的影响,利用交叉学科中时间短语分布特征优化Labeled LDA分类模型的标签选择过程.最后,将所提算法与其他多标签分类算法进行对比实验,分析和评估文献检索潜在时间意图自动分类的准确率.结果表明,所提算法的AUC的值达到79.6%,较同类基准算法ECC(整体分类链)提高约10.9%,且针对不同学科均取得了较好的分类效果,是一种有效的文献检索潜在时间意图学习方法.

关键词:多标签分类;主题模型;潜在时间意图;文本特征抽取;文本分类

中图分类号:TP391.1 文献标志码:A

Research on Identifying Potential Temporal Intentions of AcademicLiterature Based on Multi-label Classification

SHEN Si1,WU Xiyu2

(1.School of Economics and Management,Nanjing University of Science and Technology,Nanjing 210094,China;

2. School of Computer Science,South China Normal University,Guangzhou 510631,China)

Abstract:In order to enhance the temporal relevance of retrieval result,the text feature extraction and algorithm of multi-label classification were applied to potential temporal intention classification of literature retrieval. From the perspective of retrieving the classification of potential temporal intentions,an algorithm was proposed to automatically classifiy potential temporal intentions of literature,based on text temporal information extraction and labeled LDA. Firstly,by use of such temporal information,the potential temporal intention of literature retrieval was mapped onto specific temporal categories based on temporal information gained from literature. Secondly,the distribution features of temporal phrases across disciplines were used to optimize the process of label selection of the classification model of labeled LDA in order to reduce the impact of sparsity of temporal information on the learning process of classification features. Finally,the proposed algorithm was compared with other multi-label classification algorithms in specific experiments,and the accuracy of automated classification of potential temporal intentions of literature retrieval was analyzed and evaluated. The result shows that the AUC value of the proposed algorithm reaches 94.3%,which increases approximately 4.3%,compared with the algorithm of ECC (Ensembles of Classifler Chains). In addition,the present algorithm has produced forable classifying effects in different disciplines. Thus,it is an effective learning method for potential temporal intention of literature retrieval.

Key words:multi-label classification; topic model; temporal information need; text feature Extraction; ext classification

总结:这篇文献论文范文为免费优秀学术论文范文,可用于相关写作参考。

参考文献:

1、 我院人员学术文献利用情况分析 摘要:目的 加强山东省食品药品检验研究院图书馆文献资源建设,探究图书馆文献利用规律,对作为知识传播和成果报道的纸质文献(中文、外文)、电子文献进。

2、 海量学术文献资源知识挖掘技术和模式 摘要:知识挖掘技术是采集检索海量学术文献资源所必需具备的。文章分析了知识挖掘的四大关键技术:联机分析挖掘技术、Web挖掘技术、数据仓库技术和信息。

3、 面向学术文献的知识挖掘方法 〔摘要〕学术文献中包含的大量有价值的知识往往无法在摘要中体现出来。本文提出一种基于位置加权的核心知识挖掘方法,旨在以句为知识处理粒度,抽取正文中。

4、 关于启用科技期刊学术不端文献检测系统(AMLC)通知 为了保证学术论文的真实性和原创性,杜绝学术论文抄袭、剽窃、伪造、篡改、不当署名、一稿多投等现象的发生,本着对本刊论文作者和读者负责的态度,《风湿。

5、 海量学术资源背景下对论文参考文献引著质量探究 【摘 要】 文章在海量学术资源背景下,从规范学术道德,引导学术风气;保证研究成果的继承和创新;提升学术论文的档次,反映作者跟踪学科发展动向的能力。

6、 关于学术不端文献检测系统杜绝抄袭启事 关于使用“学术不端文献检测系统”杜绝抄袭的启事近日,本刊委托中国学术期刊(光盘版)电子杂志社对2009年本刊发表的论文进行“文字重复率”检测,。