论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>论文范文>范文阅读
快捷分类: 内部审计论文 审计学论文 审计期刊 审计论文题目 审计论文选题 审计杂志 中小企业内部审计国内外文献综述 审计实训论文 社保审计论文 审计独立性开题报告 审计论文结尾 审计职业判断论文

关于审计论文范文 审计全覆盖中大数据技术应用相关论文写作参考文献

分类:论文范文 原创主题:审计论文 更新时间:2024-03-26

审计全覆盖中大数据技术应用是大学硕士与本科审计毕业论文开题报告范文和相关优秀学术职称论文参考文献资料下载,关于免费教你怎么写北京审计公司方面论文范文。

此次研究将理论与实务有效融合,以医保审计为例,在其间应用Hadoop、云计算等技术,对以往软硬件技术处理大量数量慢、错误率高等问题予以解决,大幅提升了审计质量及效率.并且,还通过运用跨行业数据关联、聚类等大数据挖掘技术,对审计组开展工作提供帮助,有效改进了工作效率,不但给审计全覆盖给予了技术支撑,也为日后大数据审计的实施给予了新思路.

伴同我国社会经济的迅猛发展以及改革的持续深化,便需对公共、国有资产与国有资源等落实经济责任的状况实施审计全覆盖.但实际上,实施审计全覆盖具有较大困难,其所应对的最大问题即需针对各大行业海量数据信息、图片等加以处理,如此便对当前的审计技术运用、数据收集等带来了较大抨击.在此形势下,经由应用大数据技术便可将上述问题有效处理,其不但与大数据时代发展需求相符,也属于执行党中央、国务院有关强化审计监督的关键.基于此,针对审计实务里面大数据技术的应用予以研讨具备显著的学术及运用价值.此次研究把计算机、审计学等相应理论和审计实务有效衔接,将大数据技术引进到医保审计中,显著改善了审计质量与效率,给大数据时代下审计工作的实施给予了新路径.

一、创设医保审计大数据体系

当前,医保大数据审计需解决的最大难题即数据量巨大.为处理以往设备和方式收集难度大、资源损耗严重、数据处理分析效率不高等问题,此次研究应用Hadoop框架,构建形成了医保审计大数据体系.

借助Hadoop集群技术以增强数据处理水平.依照审计署要求与医保审计实际需求,此次研究对湖南省人社、卫计、民政与公积金四大部门设计了23张标准表,对医保、新农合等部门数据加以采集,合计7TB.如此庞大的数据量借助以往的审计方式难以实施,加之医保审计时间紧张、收集整理与分析任务繁重,故强化数据处理能力便成为了建设基础设施层的关键.

Hadoop属于以Java为基础构建形成的开源软件框架,主要是位于较多计算机构成的集群里面针对庞大的数据信息加以存储、实施分布式计算.其意义在于由单一的服务器扩张至数千台机器,所有单台机均能够实施本地计算与存储.该框架的优势即成本投入不高,用户不受限制,不但可对大规模数据予以处理,还可以对程序员工作进行精简,达成计算调度管理、负载均衡等目的.同時,该框架的主要设计即分布式文件系统( HDFS)与计算框架( MapReduce),前者主要适用到存储大量数据的计算中.

在医保审计里面先施行模拟压力测试,经由当前数据加以复制、更改,模拟当地预期数据量,对服务器数据承载和计算压力予以测试,依照结果借助Hadoop集群技术创设服务器集群,以处理海量数据分析效率不高的问题.结果表明,把5台容量为512G的服务器经由Hadoop集群技术整合为1台服务器,其处理数据的能力较之单台服务器要上涨5倍.

借助分布式文件系统以强化数据容错能力.针对湖南省医保数据收集期间,由于各区域应用系统众多且匮乏统一性,故依照分级采集市州汇总原则开展工作.抽取汇总上报数据统一创设数据库期间,假设选择以往关系数据库的文件存储方法,则一旦某一数据错误,那么便应编写语句针对整个数据库实施错误数据删除,不但耗时且操作繁琐.故而,为对数据容错能力较差的情况予以处理,此次研究将选择分布式文件系统(HDFS)为底层结构.其主要用于大量数据的分布式存储,能把较多计算机借助通信网络整合,在统一管理系统的控制下,协同达成大规模数据处理任务.并且,其在文件存储写入期间,把文件划分为文件块,分散存储于所有子节点主机中,但文件基础信息依旧存储于主节点,其优势即易拓展、容错性好、经济适用性高.通过HDFS把百余个区域的数据依照行政区域代码自主分布存储于4台子节点服务器中,且基于此产生若干副本,假设其间某一数据发生错误,则其他副本经由便捷操作能及时恢复.

借助达梦数据库与Hive数据仓库处理工具以改善数据采集加载效率.对大量医保数据抽取加载期间,为处理以往的关系数据库仅能将数据存储于服务器本地的文件系统、无法应用HDFS处理大量数据与审计工作者习惯选择SOL分析数据等问题,此次研究尝试选择Hive集成国产达梦软件创设数据仓库.

Hive是以Hadoop为基础构建形成的数据仓库处理工具,在数据提取加载(ETL)方面极为便捷,是一项能够存储、查询与分析存储于Hadoop分布式文件系统里面的大数据机制.尽管较之关系数据库而言,其具有扩张自身存储性能的作用,以及较好的计算能力,然而在面向大量数据运用时,数据挖掘、实效性不足,故此次研究应用国产关系数据库达梦软件集成应用.

Hive达成了医保数据的迅速分布式存储,然而其间如果存储表、字段名等元数据信息需持续更新、变动,因分布式文件系统里面的数据以多读少改为主,故无法把元数据存储到Hive里面.因而,为缩减检索期间执行语义检查的时间,且确保数据实时查询,便可通过国产达梦数据库对元数据予以存储,其语法和SOL相似,且导入各类型表格、数据等极为便捷.

借助MapReduce、分布式SQL引擎处理技术以改善数据分析效率.对审计数据分析期间,审计工作者往往需应对如下问题:其一,审计工作者编写的分析语句总需反复测试,依照结果多次修改SOL语句,但医保数据量庞大,位于全库中直接编写语句、测试时间较长;其二,分析任务繁重,但Hadoop体系会损耗较多资源,单次仅可执行1条查询语句.

为处理上述问题,此次研究借助MapReduce、分布式SQL引擎处理技术的同步应用并行计算对数据分析处理.其间,前者以HDFS为基础针对存储于分布式文件系统的数据实施分布式计算,该框架软件位于彼此协同的并行计算机中把大的祭祀环任务划分为若干小任务,经由一组计算机并行实施,提高计算效率;后者通过定制查询、执行引擎、相应操作符对SQL语法提供支撑,数据分析迅速且具备实效性,数据处理位于内存中实施,且具有复杂查询等功能.

总结:本论文为您写审计毕业论文范文和职称论文提供相关论文参考文献,可免费下载。

参考文献:

1、 电子商务物流中大数据技术的应用 摘要:目前,互联网金融体系的形成使互联网经济发展成为未来主要的经济体系构成,为更好的运用互联网经济做好市场环境管理体系优化,将大数据信息技术加以。

2、 大数据时代下医院审计全覆盖实现路径 [摘 要] 《中共中央关于全面推进依法治国若干重大问题的决定》、《国务院关于加强审计工作的意见》和《关于完善审计制度若干重大问题的框架意见》都明。

3、 如何实现市级烟草行业审计全覆盖 摘 要 烟草行业财审工作会议提出要贯彻《关于实行审计全覆盖的实施意见》精神,积极落实审计全覆盖,发挥审计监督职能。作为市级局,审计工作应在注重基。

4、 审计全覆盖工作机制 随着社会的发展和国家建设水平的提升,审计“全覆盖”工作在目前得到了较高的关注,且产生的影响特别突出。从客观的角度来分析,我国的经济发展相对迅速,。

5、 双向立体思维构建高校内部审计全覆盖体系 【摘 要】 在中央要求审计全覆盖并鼓励体制机制创新的大背景下,基于高校内部审计资源与审计对象规模明显不匹配的现实情况,探索如何利用现有条件,以促。

6、 实施投资审计全覆盖助力宝鸡经济新 近年来,宝鸡市审计局把政府建设项目审计作为重中之重,依照“依法审计”、“实事求是”、“兼顾各方利益”的原则,积极探索政府投资审计新路子,努力实现。