论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>论文范文>范文阅读
快捷分类: 毕业论文数据怎么找 统计学数据分析论文 大数据杂志 论文数据 有关大数据的论文 数据挖掘论文 期刊管理系统数据流图 写社会学论文自杀数据 如何利用数据写论文 数据挖掘技术开题报告 什么是大数据论文 实证论文的数据分析

关于数据流论文范文 一种基于随机空间树的数据流异常检测算法相关论文写作参考文献

分类:论文范文 原创主题:数据流论文 更新时间:2024-04-20

一种基于随机空间树的数据流异常检测算法是关于对写作数据流论文范文与课题研究的大学硕士、相关本科毕业论文数据流论文开题报告范文和相关文献综述及职称论文参考文献资料下载有帮助。

摘 要: 针对现有的数据流异常检测算法的不足,提出一种基于随机空间树的数据流异常检测算法.首先,采取统计策略对数据流特征范围进行估计,分割得到多棵随机空间树(RS?Tree),形成RS森林(RS?Forest).然后,RS?Forest采用单窗口策略对数据流进行处理,通过打分和模型更新来实现异常检测.针对实例落入的树节点,定义分段恒定密度,求取密度估计值相对于森林中所有树的平均值,并将其作为数据流中每个新来实例的得分.利用相对于森林中所有树的平均得分对每个新来实例进行排序.窗口满后则采用对偶式节点剖度技术进行模型更新,并利用采集的节点尺寸信息对下一轮到达窗口的数据进行打分.利用多种基准数据集进行仿真实验,结果表明RS?Forest算法在大部分数据集下的AUC得分和运行时间性能均优于当前其他基准算法.

关键词: 数据流; 异常检测; 随机空间树; 单窗口策略; AUC得分; 运行时间

中图分类号: TN915.08?34; TP393 文献标识码: A 文章编号: 1004?373X(2017)19?0056?06

A data stream anomaly detection algorithm based on randomized space tree

QIN Weirong1, WANG Ning2

(1. School of Electronics and Information Engineering, Qinzhou University, Qinzhou 535000, China;

2. School of Information Engineering, Zhengzhou University, Zhengzhou 450001, China)

Abstract: Aiming at the shortcomings of the ailable data stream anomaly detection algorithms, a data stream anomaly detection algorithm based on randomized space tree (RS?Tree) is proposed. The statistical strategy is adopted to estimate the characteristic range of data stream, by which several randomized space trees are obtained by means of segmentation to form RS?Forest. The single window policy is used by RS?Forest to process the data stream, and realize anomaly detection by means of scoring and model updating. According to the tree node that an instance falls in, the piecewise constant density is defined to get the erage value of the density estimation values relative to all the trees in forest, which is taken as the score of each new instance in data stream. The erage score of all the trees relative to forest is employed to sort each new instance. When the windows are occupied, the antithetic node dissection technology is used to update the model, and the acquired node size information is used to mark the data arriving at the window in the next round. The simulation experiments were carried out with variety of benchmark datasets. Its results show that the AUC scoring and run time performance of RS?Forest algorithm for most datasets are superior to those of other benchmark algorithms.

Keywords: data stream; anomaly detection; randomized space tree; single window policy; AUC scoring; run time

0 引 言

异常或离群点是指与正常点或预期点不吻合或偏离正常点的罕见事件或罕见点.对于军事侦查、网络安全管理、工业系统监控等众多领域,如果不能立即检测出这些异常事件,便有可能造成严重后果.随着近些年硬件技术的迅速发展,上述领域的持续性数据采集能力获得显著提升,采集到的大部分数据不再是有限的或静态数据,而是无限制的大容量高速实时数据,称其为数据流.

异常检测一直是数据挖掘领域的研究热点[1?3].然而,数据流的内在特点对当前大部分异常检测技术(如HSTa[4],LOADED[5],Hoeffding Trees(HT)[6]以及BoostHT[7]等)构成严重挑战.首先,数据流的生成速度前所未有,因此需要迅速处理.这便要求检测模型的更新速度快于数据率,而且检测器必须能够适应数据流信息生成速度较快这一特点.其次,传统的异常检测算法[8?9]在构建模型时需要将数据保存于内存中.由于数据流的数据量极大,容易将内存耗尽,所以传统方法将会失效.再次,对数据流来说,无论是正常事件还是异常事件均处于不断变化之中,容易使利用老旧数据学习而得到的检测模型过时.因此,检测算法应该能够适应于正常行为随时间不断变化这一特点.最后,实践中数据流的异常实例非常罕见,甚至无法获得.这就要求异常检测技术即使只利用正常事件进行训练,也应该能够准确地检测出可疑行为.针对以上方法的不足,本文提出一种基于随机空间树(Randomized Space Tree,RS?Tree)的数据流异常检测算法,并通过理论分析和仿真实验验证了该算法的有效性.

总结:这篇数据流论文范文为免费优秀学术论文范文,可用于相关写作参考。

参考文献:

1、 一种电能计量设备运维作业动态优化模型算法 摘 要:针对电网企业传统模式下运维作业所存在的任务分配不科学、路径规划不合理和无法实时响应动态需求等问题,提出了一种新的动态优化模型及求解算法 。

2、 一种杀虫灯监控系统数据交互的设计 摘要:该文通过对上行数据和下行数据的分析,使用系统API接口的方式实现了监控平台系统对杀虫灯的远程采样、状态、运行策略、终端时间等数据的监视和相。

3、 一种改进的RDF数据k—hop划分算法 摘要:RDF数据k-hop划分算法是基于RDF大图顶点划分的算法,通过数据复制冗余以优化分布式RDF查询处理系统在特定SPARQL查询模式下的查。

4、 在学生生命里种下一棵树 记者:孟局长,您好!2016年6月,您的两部教育专著《用生长定义教育》《从原点到远点》正式出版,两本书里都聚焦“生长”这个关键词。孟局长,您是怎。

5、 大学是我们亲手种下一棵树 前不久,我回了趟高中母校,那栋破旧的实验楼已被夷为平地,食堂旁边的一幢新建筑物拔地而起,校园里许多地方修葺一新,变化不大的只有那幢“高三生專属”。

6、 永新光学难显微自身瑕疵采、存、销数据多方位异常 宁波永新光学股份有限公司(简称“永新光学”)是一家主要生产生物显微镜及工业显微镜、条码扫描仪镜头、平面光学元件和专业成像光学部组件的企业,其拟在。