论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>论文范文>范文阅读
快捷分类: 大数据杂志 论文数据 有关大数据的论文 档案杂志 数据挖掘论文 档案论文 硕士论文数据挖掘银行 数据挖掘论文参考文献 数据挖掘期刊 数据挖掘论文下载 数据挖掘应用论文 数据挖掘技术开题报告

关于档案数据挖掘论文范文 大数据技术和档案数据挖掘相关论文写作参考文献

分类:论文范文 原创主题:档案数据挖掘论文 更新时间:2024-03-23

大数据技术和档案数据挖掘是关于档案数据挖掘方面的的相关大学硕士和相关本科毕业论文以及相关档案数据挖掘论文开题报告范文和职称论文写作参考文献资料下载。

摘 要:档案数据深度挖掘是大数据技术应用于档案管理中的主要特点,推动档案管理模式发生变化:一是档案管理流程走向精细化,二是这种精细化使档案资源和用户需求的双向控制关系发挥到极致.为了保证档案数据深度挖掘,促使档案管理走向精细化,提出了实现对策:建立以数据挖掘技术为核心的信息系统,构建以人为本的用户关系管理,保证数据挖掘技术中的数据隐私安全,借力“智慧因子”完善数据挖掘技术等.

关键词:大数据技术;数据挖掘;档案管理

伴随着大数据时代的到来,数据挖掘技术在档案管理中的应用将进入一个新的发展时期.尽管档案学术界很早就提出知识管理与知识挖掘,但知识挖掘尚停留在概念和理论探讨阶段[1].大数据挖掘,即从大数据中挖掘知识,大数据挖掘技术有效地解决了数据和知识之间的鸿沟,是将数据转变成知识的有效方式[2].因此,有档案学研究者认为“档案馆的传统业务将向档案资源的数据分析、数据挖掘方向转移,对大量数据的分析处理将成为档案馆的主要业务”[3],“档案信息服务的底层基础可能不再是检索,而是智能化的数据挖掘”[4].

大数据时代给数据挖掘技术带来的根本性改变是使数据的深度挖掘成为可能,对大量数据进行分析处理和智能化挖掘,从管理角度来看,要达到最优的结果,不仅数据要全面、可靠、有价值,而且需要对数据进行深度挖掘.

1 数据深度挖掘是大数据技术应用于档案管理中的主要特点

数据挖掘技术是通过对海量数据进行建模,并通过数理模型对企业的海量数据进行整理与分析,以帮助企业了解其不同的客户或不同的市场划分的一种从海量数据中找出企业所需知识的技术方法[5].数据深度挖掘,是一个对数据进行建模的过程,并对数据进行分类与统计,查找得出数据分布的关联性,这也是探索规律的过程.

如,档案人员想要做好档案编研选题,不仅要对用户利用档案数据,包括档案调卷数量、档案利用次数、复制档案数量、制发档案证明数量等进行深度挖掘,而且还需要对用户访问记录,包括网页采用的关键字、下载记录、检索词、用户利用网页时间和频度等信息进行深度挖掘,然后利用分类功能及数据分析,建立档案编研选题的用户模型,一是按需确定不同类型的编研选题,提供个性化的服务;二是根据档案用户需求特点,预测其未来趋向,结合社会热点选定档案编研题目,从而使档案编研部门推出用户满意的编研成果.在档案利用方面,对档案利用登记数据库进行深度挖掘,分别选取不同方面数据进行建模,可以得出不同档案利用形式的变化趋势,从而对档案利用趋势进行分析和预测,对利用频率高的档案进行全文数字化,既可以提高档案利用效率,又可以起到保护档案原件的作用.

因此,档案数据的深度挖掘是大数据时代的主要特点,档案学的发展历程告诉我们,每一次重大的技术变革都必然影响着档案学的发展,如计算机和网络技术的引入,引起了档案管理理念与实践的变革,改变了文件与档案的处理流程[5].大数据技术对档案数据的深度挖掘为档案管理流程由粗放走向精细化提供了可能.

2 大数据技术对档案数据深度挖掘使档案管理模式走向精细化

大数据挖掘技术基于传统的数据挖掘,使用的是数据仓库,构造的是“泛关系”的聚分类模型,采取的是海量数据分析方法,机器与人类一样具备语义知识,提供的是可视化视图来揭示信息,可以说是传统数据挖掘方法的深化.由中国人民大学网络与移动数据管理实验室开发ScholarSpace,大数据处理的最基本流程由数据来源、数据抽取与集成、数据分析、数据解释等过程组成[6],分析认为大数据技术对档案数据挖掘由数据采集层、数据整理层、数据分析层、数据展示层组成.

2.1 数据采集层收集高质量的档案数据,为档案管理精细化奠定基础.数据采集是大数据技术处理流程中最为基础的一步,高质量的数据是大数据技术发挥效能的前提,大数据技术只有在高质量的大数据环境下才能提取出隐含的、有用的信息.由于大数据具有实时与动态性特征,“在线”、“近线”和“离线”的各种数字资源均是采集对象.为了使所获得的数据更具有代表性,通过什么方式获取数据信息显得格外重要.数据采集层要收集不同数据源产生的数据,为档案数据挖掘的后续工作做好准备.

2.2 数据整理层改变传统数据处理方式,凸显档案管理精细化过程.经过各种渠道获取的档案数据种类繁杂、结构多样,通过处理、集成、存储可以做到:

一是将结构复杂的数据转换为单一的或便于处理结构的数据.现代互联网应用呈现出半结构化和非结构化数据大幅度增长的趋势,这些资源将成为馆藏的重要来源.如,对档案系统运行日志资料等数据,就需要转换成结构化数据,形成档案统一的语言.二是对采集到的数据进行“去噪”和“清洗”,以保证数据的质量和可靠性.由于原始数据中有噪声数据、冗余数据等问题,对数据进行解析、清洗、重构,以提高待挖掘数据的质量.三是对整理好的数据进行存储,建立专门的数据库分门别类地放置,减少数据查询和访问的时间,提高数据提取速度.

2.3 数据分析层对档案数据的精细分析,凸显档案管理精细化的思维模式.数据分析是整个大数据处理流程最为核心的部分.“相关性”分析是大数据技术重要的思维模式,通过对数据彼此关联性的分析,能够更清楚地看到隐藏在背后的看似不相关的数据之间彼此的密切联系,使档案数据挖掘从常规分析向广度、深度分析转变.

“相关性”分析可激活数字档案资源,大数据技术的核心作用就是挖掘出庞大的数据仓库独有的价值,不管是网络实时运算的“热数据”,还是非在线的“冷数据”,通过对档案数据的综合挖掘、深度整合和数据分析,激活休眠状态的档案资源,展现数据价值,创造出新知识、新价值.“相关性”分析能有效破除信息孤岛的数据壁垒,使各个孤立的、互不联通的数据库之间资源实现充分共享.

2.4 数据展示层为档案用户提供更加精准服务,凸显档案管理精细化“以人为本”的价值追求.对档案用户来说,最关心的不是数据分析处理过程,而是对大数据分析结果的解释与展示.若数据分析的结果不能得到精准的展示,会对档案用户产生困扰,甚至会误导用户.通过档案管理信息系统,将深度挖掘的数据可视化,可以使用户清楚地看到未来发展的方向,从而对决策结果作出评价,这也是决定整个系统挖掘技术是否成功的标准.

总结:关于免费档案数据挖掘论文范文在这里免费下载与阅读,为您的档案数据挖掘相关论文写作提供资料。

参考文献:

1、 应用大数据技术开发数字档案信息资源现实困境和策略 摘要:近年来,档案界对大数据技术的研究较热,但整体来看在目前条件下应用大数据技术开发数字档案信息资源存在现实困境,数字档案信息资源开发中的数据化。

2、 数据挖掘技术在档案管理中应用 [摘 要]信息技术快速发展,数据挖掘技术的出现使信息管理逐渐实现智能化、信息化。数据挖掘技术在档案管理中也发挥着至关重要的作用,其能够使档案管理。

3、 大数据时代医院档案管理多媒体技术 【摘要】在大数据背景下,医院需加大对医院档案管理的重视程度,把大数据技术应用到医院档案管理内。本文主要就大数据背景下医院电子档案管理展开分析。。

4、 蚂蜂窝完成1.33亿美元D轮融资加码旅游大数据技术 本报讯(记者 米太平)12月12日,自由行旅游攻略平台蚂蜂窝宣布完成1 33亿美元D轮融资。新一轮融资由鸥翎投资、美国泛大西洋资本集团、淡马锡、。

5、 黄冈运用大数据技术改进财政审计 本报讯(记者 米太平)11月2日,记者从湖北省黄冈市审计局了解到,今年以来,该局积极探索运用大数据分析技术开展财政预算执行审计,有效扩大了财政审。

6、 大数据技术在企业战略管理中整合运用 随着时间的不断推移,企业战略管理的方法和手段,都必须做出阶段性的革新,如果继续按照传统的理念来落实,不仅无法在将来的成绩上获得有效的提升,还有可。