数据挖掘论文范文协同云计算下的差异区域数据挖掘平台设计和实现有关论文写作资料-论文范文网

协同云计算下的差异区域数据挖掘平台设计和实现是关于本文可作为数据挖掘方面的大学硕士与本科毕业论文数据挖掘论文开题报告范文和职称论文论文写作参考文献下载。

摘要：针对在协同云计算下差异区域数据挖掘偏差较大,准确度不高的问题,提出基于非线性时间序列分析且分层调度控制的差异区域数据挖掘方法.首先构建协同云计算下差异区域数据的信息传输模型,进行数据信息流的时间序列采样分析；然后采用非线性时间序列分析方法重构特征空间,在重构的特征相空间进行自适应分层调度控制,提取关联规则特征,有效挖掘数据；最后进行仿真测试,结果表明该方法的数据挖掘精度较高,抗扰性能较强.

关键词：协同云计算；数据挖掘；调度控制；平台设计

中图分类号： TN915?34； TP391 文献标识码： A 文章编号： 1004?373X（2017）05?0118?04

Abstract： Since the difference area data mining has large deviation and low accuracy under collaborative cloud computing, a difference area data mining method based on nonlinear time series analysis and hierarchical scheduling control is proposed. The information tranission model of the difference area data under collaborative cloud computing was constructed to analyze the time series sampling of the data information stream. The nonlinear time series analysis method is used to reconstruct the feature space, in which the adaptive hierarchical scheduling control was conducted to extract the characteristics of the association rules and mine the data effectively. The method was performed with simulation test. The results show that the method has high data mining precision, and strong interference resistance.

Keywords： collaborative cloud computing； data mining； scheduling control； platform design

0 引言

协同云计算平台是一个高度开放、异构、分布的信息空间,由于资源信息的特征差异性以及干扰作用,出现差异区域数据,对协同云计算下差异区域数据挖掘是进行云计算资源调度和优化分区学习的重要环节,研究协同云计算下差异区域数据挖掘方法具有重要意义[1].

在以往的协同云计算差异区域数据挖掘中,采用子图同构检测技术,结合频繁项挖掘方法加强信息语义特征,提高数据挖掘的数据导向性.协同云计算下的差异区域数据具有非线性、自耦合性等特点[2],传统方法需要建立学习资源本体,采用非线性特征分析和自耦合控制进行信息特征空间采样和重构,结合特征压缩设计,降低数据挖掘的开销[3?4].美国Washington大学开发的PROMPT数据挖掘平台,通过本体匹配方法构建协同云计算的资源本体匹配,结合数据核心集DCMS进行差异数据挖掘[5?6].

为了提高协同云计算下差异区域数据挖掘的精度,提出一种基于非线性时间序列分析和分层调度控制的差异区域数据挖掘方法,通过仿真实验进行性能测试,验证了本文方法的优越性.

1 协同云计算的差异区域数据采样模型

在协同云计算环境下,差异区域数据采用区间概念格中的节点模型进行存储机制构架,采用有向图模型[G1等于Mα1,Mβ1,Y1,][G2Mα2,Mβ2,Y2]描述差异区域数据的存储结构分布式层次模型,[G1?G2?Y1?Y2.]令[A等于a1,a2,等,an]为信息采样时间序列,数据挖掘本体结构为一个五元组[O等于（C,I,P,Hc,R,A0）],其中,[C]为数据语义本体模型的阶数,[I]是字符串实例集,协同云计算下差异区域数据挖掘的总体结构模型如图1所示.

3 性能测试

实验训练集和测试集协同云计算平台下的两个区域性特征大数据集,训练集记为set1,测试集记为set2,set1采用分区间隔特征频率为12.5 Hz,区域分区数据包大小为15.2 MB,初始校验频率[B等于1 000]Hz,CSLOGS为实际数据集,包括两个大小为4.24 MB的分区.首先进行协同云计算下的差异区域数据采样,采样点[N等于1 024],采样通道为3通道,得到协同云计算中出现差异区域数据时的特征采样结果如图3所示.

将训练样本输入到本文构建的协同云计算下差异区域数据挖掘平台中,图4为本文方法和传统方法在set1和set2数据集上进行数据挖掘时随不同数据点数变化的平均运行时间性能对比结果.从图4可知,两种方法的运行时间曲线均随差异区域数据点数的增大而增大,但本文方法运行时间随数据规模的增大相对平缓,运行时间的差异性随着数据规模的增大而增加,说明本文方法更适用于大数据规模下的差异区域数据挖掘.

见本文方法和传统方法随着数据维数变化的运行时间对比结果见图5.从图5可知,随着数据维数的增大,运行时间增长,这是因为在高维状态下,数据点相对分散,數据挖掘的计算开销较大,本文方法的运行时间低于传统方法,可高效完成数据的处理.

总结:这是一篇与数据挖掘论文范文相关的免费优秀学术论文范文资料,为你的论文写作提供参考。

参考文献：

1、云计算下非结构化大数据存储系统设计摘要：当前云计算下非结构化大数据存储系统设计方法是通过使用分布式数据库存储跨区域的云计算数据和全局数据存储管理目录实现的，运行系统复杂，成本。

2、基于关联规则运动训练生化指标数据挖掘系统设计摘要：传统数据挖掘系统存在挖掘速率慢、时间长、数据可靠度低等问题，无法达到运动训练生化指标精准数据挖掘的标准，为此，对基于关联规则的运动训练。

3、搭建大数据服务平台助推现代化服务型统计建设随着科学技术水平和信息化程度的提升，我们迎来以大规模生产、分享和应用数据为主要内容和特征的大数据时代。面对大数据带来的新形势和新变化，作为生产和。

4、大数据挖掘在工程项目管理中运月近年来，传统的工程项目管理模式已经无法满足新形势下工程项目管理模式的需求，探索工程项目管理新模式具有十分重要的现实意义。本文基于大数据挖掘技术，。

5、数据挖掘作为交叉学科特点【摘要】本文主要讲述了数据挖掘的内涵以及作为机器学习，数据仓库，统计学，智能决策等多个学科的交叉学科的特点。【关键词】数据挖掘机器学习数据。

6、数据挖掘在车险欺诈和识别中应用【摘要】随着我国保险行业的不断发展，针对车险的欺诈问题也日益严峻，使得保险公司每年遭受巨大的损失。为了发现和防止保险中的欺诈，保险公司在不断的寻。

关于数据挖掘论文范文协同云计算下的差异区域数据挖掘平台设计和实现相关论文写作参考文献

关于数据挖掘毕业论文范文

相关职称论文题目

关于数据挖掘开题报告写作参考资料