论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>硕士论文>范文阅读
快捷分类: 毕业论文数据怎么找 统计学数据分析论文 大数据杂志 论文数据 有关大数据的论文 数据挖掘论文 编数据论文技巧 写社会学论文自杀数据 如何利用数据写论文 数据挖掘技术开题报告 什么是大数据论文 实证论文的数据分析

关于数据分析论文范文 数据分析12个误区相关论文写作参考文献

分类:硕士论文 原创主题:数据分析论文 更新时间:2024-04-17

数据分析12个误区是大学硕士与本科数据分析毕业论文开题报告范文和相关优秀学术职称论文参考文献资料下载,关于免费教你怎么写数据分析方法五种方面论文范文。

在IT界,炒作越大误区就越多,数据分析也不例外.数据分析是当下IT界最热门的领域之一,它可以带来显著的业务效益,但是误区会妨碍企业顺利和及时地交付可能使业务用户、最终使客户受益的分析功能.企业在制定或夯实分析策略时,应当提防这12个误区.

误区1:数据分析需要大量投入

这年头,实施的每一项技术似乎都要过财务稳健性这道关卡.IT和业务经理们提议启动项目或部署新工具时,首先面临的问题之一是“这要花多少钱?”

一些人认为,数据分析本质上很烧钱,因此仅限于预算庞大或内部资源丰富的大企业.不过移动和在线房地产服务提供商Trulia的工程副总裁Deep Varma表示,并非所有的数据分析工作都需要大量投入.

Varma说:“现在市场上有众多的开源及其他工具可以帮助你开始展示数据分析具有的价值.你要深入了解内部数据存储和想解决什么样的问题.有了云计算,试着用分析技术解决业务问题也变得很容易.”

安永咨询公司的全球分析主管Beatriz SanzSaiz补充道,现代分析技术“基于云系统和大数据架构,它们本身比传统的数据仓库系统便宜得多.”

Saiz说:“此外,数据和分析技术通常用来获得三个结果:提高流程效率、增加收入和积极主动的风险管理.所以总的来说,运用数据和分析技术可以为任何公司带来大幅节省成本的好处.”

误区2:需要大数据才能执行分析

对许多人来说,大数据和分析这两个概念密不可分.这种想法指的是,企业需要在执行分析之前收集大量数据,以便获得业务洞察力和改进决策制定等.

当然,大数据分析的好处已得到了公认,拥有资源的公司确实可以利用其存储的数据作为分析工作的一部分,从而获得显著的竞争优势.但大数据对分析来说必不可少的想法是错误的.

人力资源公司Allegis Global Solutions的商业智能执行董事Tim Johnson说:“人们常常努力采集尽可能多的数据;他们一听到‘大数据’就来劲.一个误区是以为数据越多越好,机器会分门别类.”

然而分析员需要的是具体的数据,而不是更多的数据.Johnson说:“95%的用户在寻找和其工作相关的信息,支持决策和提高业绩.”企业切忌一味获取更多的数据,而是要明白业务用户不光关注需要访问哪些数据,还关注如何展示数据.

Johnson说:“让员工可以访问每一个信息(这些信息采用多种格式)会让人无所适从,实际上阻碍采用.而是应搞清楚对他们来说重要的信息,以及如何以最简单的格式向他们展示这些信息.”

误区3:分析可以消除人为偏差

自动化系统执行的方式不应该有偏差.但技术是人类开发的,所以消除所有偏差几乎不可能.一些人认为,分析技术和机器学习可以消除人为偏差.

全球技术咨询公司ThoughtWorks的技术负责人Mike Mason说:“遗憾的是,这根本就不对.算法和分析使用‘训练数据’加以调整,会重现该训练数据具有的任何特征.”

Mason表示,在一些情况下,这会给分析结果带来无害的偏差;在其他情况下,会带来较严重的偏差.他说:“就因为‘算法这么说’并不意味着答案是合理的或有用的.”

误区4:最好的算法总是胜出

实际上,有了足够的数据,“有时候算法并不重要.”在Mason提到的IEEE上的一篇文章《数据的不合理有效性》中,谷歌的工程师认为,简单的统计模型加上超海量数据比含有众多特征和摘 要的“更智能化”模型取得了更好的结果.

Mason说:“在一些情况下,仅仅处理数量更多的数据就能取得最好的结果.”

误区5:算法万无一失

Johnson表示,人们天生就高度信任统计模型和算法;随着许多企业纷纷搞分析项目,它们日益依赖复杂的模型来支持决策.

“由于人们不了解模型、算法及其他先进的数据科学实践,所以信任它们.”Johnson表示,用户不觉得自己具备可以挑战模型的知识,于是他们只好信任构建模型的“聪明人”.

“在过去五六十年,我们听说过人工智能会在20年内取得主导地位,我们会继续听到人们这么说.在我们能公然信任机器学习和结果之前,还有好多事情要做.在此之前,我们要让构建算法和模型的人解释是如何得出答案的.不是我们不能依赖结果,而是需要透明度,以便我们能够信任和验证分析.”

误区6:数据科学是神秘的“魔法”

近年来数据科学备受关注,有时让人犯疑:它到底是什么样的学科.数据科学基本上是利用算法找出数据中的模式.

数据存储公司Micron的CIO Trevor Schulze说:“数据科学似乎很神秘,因为这些算法能够分析人脑理解能力之外的更多变量和更庞大数据集.”

“近年来随著计算能力和内存增大,我们现在能够迅速解决仅仅10年前用任何技术都解决不了的问题.数据科学是几十年来广为人知的统计推论技术的自然演变的产物.一旦你了解数学,数据科学毫无神秘可言.”

误区7:想搞更多的数据科学,你需要更多的数据科学家

数据科学家是如今所有技术专业人员中最紧俏的.如果企业调整一下工作重心,也许用较少的数据科学家就可以.

Mason说:“许多数据科学家把时间花在了非增值型活动上,比如寻找数据集、把数据放到可以处理它们的地方以及转换和清理数据.鉴于招聘数据科学家很难,你不希望他们处理那些低价值的任务.”

“优步(Uber)的Michelangelo平台让数据科学家可以专注于特征工程、提取和分析,而不是将数据倒来倒去,因而大大提高了生产力.”

总结:这是一篇与数据分析论文范文相关的免费优秀学术论文范文资料,为你的论文写作提供参考。

参考文献:

1、 当前档案大数据误区和重点领域 摘要:本文从大数据的概念和档案发展规律入手,认为当前档案大数据的发展方向是基于数据流的实时信息处理、分析与归档,指出当前档案大数据研究上存在的误。

2、 大数据新闻认识误区分析 【内容提要】大数据及相关分析技术推动着新闻报道方式与新闻生产手段的变革,对传统新闻报道的运作范式提出了新的挑战。本文主要针对大数据新闻报道的3个。

3、 数据时代法律挑战 数据时代需要清晰的法律制度框架。在框架中,个人信息应受到严密保护,但数据产业的发展也应拥有一个界面友好型的法律制度环境。二者如何协调和均衡,很大。

4、 硅谷死敌玛格丽特·维斯塔格:并购审查重点关注大数据垄断 因一系列针对科技巨头公司的处罚,欧盟委员会竞争专员玛格丽特·维斯塔格被称为西方世界最有权力的反垄断者、欧盟竞争秩序的“守护者”和大公司“死对头”。

5、 谁能赢得汽车数据战 随着互联化、智能化趋势席卷全球汽车行业,这一此前通常被置于传统制造业领域的产业发生了巨大改变,其中最值得关注的一点是:汽车数据将成为产业价值链中。

6、 最严数据法规立法参和者人们不应持续被在线监控 一项即将在欧盟生效的法律,正前所未有地挑动全球范围内互联网企业们的神经。许多欧洲用户已体验到变化——5月开始,他们的谷歌和雅虎邮箱开始涌入大量。