论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>硕士论文>范文阅读
快捷分类: 毕业论文数据怎么找 统计学数据分析论文 大数据杂志 论文数据 有关大数据的论文 数据挖掘论文 数据挖掘关联规则论文 写社会学论文自杀数据 如何利用数据写论文 数据挖掘技术开题报告 什么是大数据论文 实证论文的数据分析

关于关联数据论文范文 基于社会网络分析和共词分析国内关联数据相关论文写作参考文献

分类:硕士论文 原创主题:关联数据论文 更新时间:2024-03-15

基于社会网络分析和共词分析国内关联数据是关于关联数据方面的的相关大学硕士和相关本科毕业论文以及相关关联数据是什么论文开题报告范文和职称论文写作参考文献资料下载。

摘 要:文章选取CNKI数据库收录的相关关联数据研究文献,利用SATI软件构建共词矩阵,使用社会网络分析软件Ucinet和社会科学统计软件SPSS绘制知识图谱和聚类树状图,对关联数据领域作者共现和高频关键词共现进行分析,揭示出国内关联数据研究现状和未来发展趋势.

关键词:关联数据 社会网络分析 共词分析 Ucinet SPSS

中图分类号: G254 文献标识码: A 文章编号: 1003-6938(2013)05-0129-04

关联数据(Linked Data)概念由“万维网之父”Tmi Berners-Lee于2006年首次提出[1]. 关联数据是语义web的主题之一,描述了通过可链接的 URI 方式来发布、分享、连接Web 中各类资源的方法.关联数据通过网络把以前没有关联的相关数据链接在一起,允许用户发现、关联、描述并再利用各种数据,因而自关联数据提出以来便得到了社会广泛的认同和快速的发展,BBC、纽约时报、美国国会图书馆等都纷纷加入到关联数据的出版发布之列[2],关联数据也日益成为国内学术界的关注热点.因此本文运用社会网络分析方法和共词分析方法,通过关联数据领域作者合著网络、关键词共现网络和关键词共词聚类分析,了解我国关联数据研究团队发展现状、研究热点和内容结构,以期为后续研究和实践的开展提供参考.

1 数据来源和研究方法

1.1 数据来源

本文选取CNKI的中国学术期刊网络出版总库为数据来源库,以“关联数据”或“linked data”为检索词在主题字段检索,检索时间是2013年4月10日,剔除重复和非相关文献后得到有效学术论文117 篇.

1.2 数据处理工具

在共词分析和社会网络分析方法中,数据处理是十分重要的步骤.使用浙江大学信息资源管理系刘启元开发的文献题录信息统计分析工具(Statistical Analysis Toolkit for Informetrics,SATI).该软件通过对期刊全文数据库题录信息的字段抽取、频次统计,进而生成共现矩阵.生成的共现矩阵可以直接导入Ucinet和SPSS软件进行处理分析[3].

1.3 研究方法

本文运用社会网络分析法生成作者合著网络和关键词共现网络图谱来分析关联数据领域的作者合著关系及学科的研究热点;运用共词聚类分析法生成共词聚类树状图来分析关联数据研究论文的主流研究领域的结构及其关系.

2 构建共现矩阵

将从CNKI中导出的Endnote格式的文献题录信息导入 SATI 软件,分别选取作者和关键词字段,进行抽取和频次统计,构建高频作者合著共现矩阵和高频关键词共现矩阵,保存为 Excel文件,便可直接导入Ucinet和SPSS进行处理分析.

3 高频作者合著分析

3.1 高频作者合著网络分析

打开 Ucinet 导入 Excel 格式的高频作者共现矩阵,利用Ucinet软件集成的可视化工具Netdraw绘制高频作者合作关系网络图,通过K-cores分析,将所有节点分类,选择 Transform—node attribute editor 添加节点的大小和连线的粗细对网络进一步调整后,得到高频作者合著网络图谱(见图1).图中每个节点代表作者,节点越大代表著者的频次越高,节点之间的连线粗细表示作者之间的合作强度.图中最大的团体是上海图书馆和广东外语外贸大学图书馆为合作机构下的刘炜、夏翠娟、张春景、赵亮、钱国富,在该合著网络中频率达到最高.该团体以刘炜和夏翠娟为代表围绕国家社会基金项目“关联数据的理论和应用研究”和“《资源描述和检索》的中文化及其应用研究”对关联数据发布技术及其实现、开放应用协议、RDA进行了研究;四川大学和中国医学科学院医学信息研究所为合作机构下的范炜、方安、洪娜和邹庆围绕国家社会科学基金项目“关联数据中潜在知识关联的发现方法研究”对生物医学关联数据研究、语义管道技术、词表资源关联化、术语服务进行了研究;以中国科学院国家科学图书馆和中国科学院研究生院为合作机构下的的李春旺、黄永文、刘媛媛和邓兰兰等人围绕国家社会科学基金资助项目“我国数字图书馆集成融汇方法研究”和中国科学院国家科学图书馆青年人才领域前沿项目“利用LOD实现数字图书馆中数字资源和知识内容关联揭示的技术方法研究”对关联参考服务、对象共指问题、关联数据应用的体系框架、关联数据资源集相似度计算方法、Web数据关联创建、信息检索服务和注释服务等进行了研究.从图中还可以看出,作者合著网络图谱整体联系稀疏,网络中大多数节点之间没有连线,关联程度非常小,表明目前关联数据领域还没有形成一支成熟的研究队伍.

3.2 网络密度分析

网络密度可以用来度量网络成员之间联系的紧密程度.一般来说,密度高的网络信息沟通性较强;而密度低的网络常信息不畅[4].利用Ucinet软件得到高频作者合著网络密度(见图2)为0.0097,这是一个相对偏低的密度值,网络连通性不好,这也印证了在前面作者合著网络分析中的结果.说明作者之间的合作程度低,作者之间不能很好地进行深层次的知识构建,不利于我国关联数据研究的快速发展.

3.3 高频作者合著中心性分析

中心性是社会网络分析中的重点之一,它反映了行动者在其社会网络中所处的地位及权力影响.

3.3.1 点度中心性分析

本文使用点度中心性来测量作者在网络中的重要性.作者点度中心性越高者,表示其在网络中和较多的作者合作,在网络中具有较高的影响力,从而可以认为其具有核心作用.利用Ucinet进行点度中心性分析得到点度中心度排名在前10位的作者(见图3).一般情况下,频次较高的作者和其他作者合作的机会更多,因而普遍点度中心性也较高.通过分析可知,张勇、邢春晓等的点度中心性较原先频次排名有较大幅的提升,说明这些作者具备相对其频次排名有更高的影响力;而范炜、刘炜、黄永文等的点度中心性较原先频次排名有较大幅度的回落,说明这些作者发表独著的频率高.由图3可见,张春景的点度中心性最大,其次为夏翠娟,表明这些作者和网络内其他作者的知识交流更加频繁,在关联数据作者合作网络中具有核心作用.

总结:本论文为免费优秀的关于关联数据论文范文资料,可用于相关论文写作参考。

参考文献:

1、 基于共词分析国内近10年反竞争情报 [摘要]利用SPSS和BICOMB软件,对CNKI数据库中2002-2011年国内反竞争情报领域发表的期刊文献进行共词分析。并借助聚类分析,研究。

2、 基于共词分析国内在线商品评论热点 〔摘要〕国内随着2004年网购的兴起,研究在线商品评论的文章开始逐年增多,本研究尝试利用文献计量学的方法对国内在线商品评论的学术文献进行统计分析。

3、 社会网络部落词典专栏社会流行词 【帝吧】帝吧今晚七点出征fb讨伐“台独”!帝吧出征,寸草不生!(2016年1月20日李毅吧的贴吧导语)截至2016年1月20日,帝吧已有超过。

4、 基于社会网络分析P网络借贷行为模式 摘 要:本文基于“拍拍贷”平台的数据,通过社会网络分析(SNA)方法探讨了P2P网络借贷的行为模式,以提高P2P网络借贷平台的效率,降低管理成本。

5、 城乡居民个体特征、社会网络和借贷途径 摘 要:金融可获得性对于鼓励城乡居民借款进而刺激消费具有重要作用。城乡居民借贷作为家庭消费金融意识和需求的体现而备受关注。以2014年中国家庭追。

6、 社会网络、股权集中度和大股东减持 【摘 要】 文章首次从学术角度基于社会网络分析法,分别从大股东职位权力发散网络、大股东社交发散网络、大股东网络声誉与积累网络等,构建大股东减持的。