论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>毕业论文>范文阅读
快捷分类: 学术论文参考文献格式 外文文献网站 书籍参考文献 英文参考文献格式举例 著名学术期刊 学术期刊论文 八篇护理学术文献题目 学术文献翻译 学术文献总库 护理学术文献题目 学术文献数据库 会计学术文献

关于学术文献论文范文 面向学术文献的知识挖掘方法相关论文写作参考文献

分类:毕业论文 原创主题:学术文献论文 更新时间:2024-02-07

面向学术文献的知识挖掘方法是适合不知如何写学术文献方面的相关专业大学硕士和本科毕业论文以及关于学术文献论文开题报告范文和相关职称论文写作参考文献资料下载。

〔摘 要〕学术文献中包含的大量有价值的知识往往无法在摘 要中体现出来.本文提出一种基于位置加权的核心知识挖掘方法,旨在以句为知识处理粒度,抽取正文中的核心句子作为独立的知识单元.该方法通过量化句子间的关联,将正文表示成一个以句子为节点,句子间关联为边的文本关系网络,提出基于章节的位置加权算法,结合社会网络分析方法,挖掘出文本中核心知识单元部分的句子.实验结果表明,该方法可以实现对文章核心章节中重要句子的抽取,达到初步预期效果.

〔关键词〕学术文献;知识挖掘;方法;位置加权;知识抽取;文本网络;社会网络分析

DOI:10.3969/j.issn.1008-0821.2017.05.009

〔中图分类号〕G203〔文献标识码〕A〔文章编号〕1008-0821(2017)05-0047-05

Research on Method of Knowledge Minning in Academic DocumentsWang KaiSun JiqingLi Nan

(Institute of Science and Technology Information,East China University of

Science and Technology,Shanghai 200237,China)

〔Abstract〕There is abundant valuable knowledge inside academic documents that is not revealed in abstracts.This paper promoted a method of core knowledge discovery based on position weights,aiming to extract the core sentences as separated knowledge units in the main text with the processing size of sentence.By measuring the connection between sentences,the paper tranormed main text into a text network that considers sentences as dots and connection between sentences as sides.An algorithm to compute position weights based on chapters was promoted in this paper.With the help of social network analysis,the paper could find sentences that revealed the core knowledge of the text.The result of the experiment showed that this method could realize the extraction of key sentences in the core chapter from the text,which is primarily expected.

〔Key words〕academic documents;knowledge minning;method;position weight;knowledge extraction;text network;social network analysis

互联网技术的发展使得信息,尤其是文本信息呈爆炸式的发展,在海量的文本信息面前,人们希望可以从中抽取出最关键最有价值的信息,并转化成知识进行存储应用.学术文献中包含大量有学术价值的知识,特别是期刊论文,凝聚着科学家的研究成果与智慧,论文中知识点非常丰富,而且比较新颖,实现自动对学术文献中的关键知识进行提取并利用是一个研究趋向.学术文献与其他类型的文献,如新闻、博客、网页等文献不同,学术文献具有独特的结构化特性,其基本形式为标题、摘 要、关键词、正文、参考文献组成;而正文又通常包括引言、相关研究、方法、实验、结论几大部分.早期的研究主要是针对学术文献的题录信息来研究学术文献中所包含的主题内容,利用标题、关键词、参考文献以及摘 要作为研究对象.摘 要和关键词虽然可以对文献的内容进行高度概括和总结,但是却往往没有体现文献中的核心知识,这些核心知识往往包含在正文之中.为更好地挖掘文献中内涵的知识,本文提出一种位置加权的方法,以句子为粒度,将学术文献正文表达成一个句子为节点的文本网络,通过句间关系来抽取出学术文献中的核心知识.

1相关研究

知识抽取(Knowledge Extraction)是对蕴含于文献中的知识经识别、理解、筛选、格式化,从而把文献中的各个知识点抽取出来,是信息抽取的升华和深化[1].温有奎,朱晓芸,文孝庭等人在国内较早提出了知识元的概念,表示知识单元是文章中可以表达知识且可以独立使用的最小单位,并对其的抽取规则进行了描述[2-5].知识抽取的方法可以分为3大类:基于模式匹配的抽取方法、基于本体的抽取方法以及基于语义的抽取方法.

1)基于模式匹配的抽取方法主要用于实体和属性的抽取,适用于有一定规则可循的抽取对象.Chunxia Zhang和Peng Jiang研究了如何对汉语语料进行定义抽取.他们通过设定句子模式,然后利用模式的匹配进行抽取;温有奎等利用学术文獻中创新点表述的句子结构特点对创新点进行抽取[6-7].这种方法要求所抽取的知识表述具有一定的规则和模式,对于那些大量无规则的非结构化文本无法很好地完成抽取工作.

总结:本文关于学术文献论文范文,可以做为相关论文参考文献,与写作提纲思路参考。

参考文献:

1、 海量学术文献资源知识挖掘技术和模式 摘要:知识挖掘技术是采集检索海量学术文献资源所必需具备的。文章分析了知识挖掘的四大关键技术:联机分析挖掘技术、Web挖掘技术、数据仓库技术和信息。

2、 分析高中生物学知识记忆方法 摘 要:基于高中生物教学知识,提出简化记忆法、口诀记忆法、联系实际记忆法以及英汉对照记忆法等相关高中生物学知识的记忆方法,旨在有效提升高中学生的。

3、 小学数学知识巩固方法分析 摘 要:教师应课堂教学中巩固学生课堂所学的知识以及注重学生创新意识的培养,与此同时,应尽可能抓住一切可利用的机会来使得学生的创新思维得到培养,运。

4、 面向自主能力的知识产权贸易法律政策 摘 要:加入WTO后,我国现有贸易法律政策仍存在知识产权海外维权机制不完善,部门间尚未形成良好的协作机制,政策执行不到位及各项政策间缺乏衔接沟通。

5、 高职课堂陈述性知识教学方法 摘要:在“物流信息技术与应用”课程的教学中,将教师角色转变为“作家”和“导演”,通过设计生动的情境教学和职业角色扮演等教学环节,引导学生像演员那。