论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>职称论文>范文阅读
快捷分类: 毕业论文数据怎么找 统计学数据分析论文 大数据杂志 论文数据 有关大数据的论文 数据挖掘论文 数据集参考文献 学位论文数据集 学位论文数据集是什么 学位论文数据集如何填写 什么是大数据论文 实证论文的数据分析

关于高维数据集论文范文 高维数据集中局部离散文本数据挖掘方法相关论文写作参考文献

分类:职称论文 原创主题:高维数据集论文 更新时间:2024-04-06

高维数据集中局部离散文本数据挖掘方法是关于本文可作为高维数据集方面的大学硕士与本科毕业论文高维数据集论文开题报告范文和职称论文论文写作参考文献下载。

摘 要: 提出利用基于多目标优化软子空间聚类理论的关联规则数据挖掘方法对高维数据集中局部离散文本数据实现数据特征有效挖掘.首先,利用多目标优化软子空间聚类思想结合非支配排序遗传理论优化加权类内紧致及加权类间分离函数,获取优化后的目标函数及非占优Pareto最优解集,运用加权子空间划分方法对最优解集完成特征聚类;其次,基于关联规则思想运用一种特征提取和关联文本的识别方法,对聚类后的文本特征进行文本间及文本内部的特征识别和分类,即实现了文本信息数据的有效挖掘.实验证明,利用多目标优化软子空间聚类数据挖掘方法可以有效实现高维集中局部离散文本数据的挖掘.

关键词: 高维数据; 数据特征聚类; 数据挖掘; 关联规则

中图分类号: TN911.1?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)19?0138?04

Research on local discrete text data mining method in high?dimensional dataset

NONG Xiaofeng

(Modern Educational and Technological Center, Guilin Touri University, Guilin 541006, China)

Abstract: An association rules data mining method based on the theory of multi?objective optimization soft subspace clustering is proposed to mine the data feature of local discrete text data in high?dimensional dataset effectively. The thought of multi?objective optimization soft subspace clustering is combined with the theory of non?dominated sorting genetic optimization to optimize the weighted intra?class compactness and weighted inter?class separation function, and obtain the optimized objective function and non?dominated Pareto optimal solution set. The weighting subspace classification method is used to cluster the features of the optimal solution set. A recognition method for feature extraction and text association based on the thought of association rules is used to recognize and classify the features among texts and within texts for the clustered text features, which can realize the effective mining of the text information data. The experimental results show that the data mining method of multi?objective optimization soft subspace clustering can realize the local discrete text data mining in high?dimensional dataset effectively.

Keywords: high?dimensional data; data feature clustering; data mining; association rule

0 引 言

文献[1]指出,在人工智能和数据库领域中,目前各种数据挖掘方法也获得了不同程度的关注.20世纪末开始,人们对各种不同的数据挖掘方法进行深入研究.数据挖掘作为一种决策支持手段,帮助各个领域的专家和开发人员分析各种类型的数据[2?3],然后从中挖掘出潜在的模式并做出正确决策判断.文献[4]中提到数据挖掘通常会利用人工智能、机器学习、模式识别、统计学、可视化等技术来实现该过程.

当前数据挖掘研究领域发展迅速,其面临的问题与挑战也越来越多.第一,越来越大的数据规模,也称之为大规模数据问题;第二,不断增加的数据特征维数引起的问题也称为维数灾难问题;第三,有生物学、脑科学、证券金融等学科的知识背景[5?6].文献[7]中提出基于上述问题面临的挑战,部分学者提出针对大规模数据的流数据分析方法、针对高维数据的特征加权和特征选择方法.目前数据挖掘领域的研究重点包括很多学科的交叉领域.

由于数据挖掘方法被越来越广泛的应用,本文提出对高维数据集中局部离散文本数据进行有效数据挖掘.首先,运用多目标优化软子空间聚类思想获得优化后的目标函数和非占优Pareto最优解集,最优解集的获取即实现了数据特征聚类;其次,以关联规则思想为基础,通过一种特征提取和关联文本的识别方法实现对聚类后的文本特征进行文本之间及文本内部的特征识别和分类,最终达到有效挖掘文本信息数据的目的[8?9].

1 高维数据集中局部离散文本数据挖掘研究

总结:本文关于高维数据集论文范文,可以做为相关论文参考文献,与写作提纲思路参考。

参考文献:

1、 基于改进Hadoop云平台海量文本数据挖掘 摘 要 针对常用的文本数据挖掘系统在处理海量文本数据时时间效率较低的问题,论文提出了一种基于改进Hadoop云平台的海量文本数据挖掘方法 该方法。

2、 数据挖掘方法和功能的基本 摘要:数据挖掘是集成了多方面技术的交叉学科。该文详细介绍了分析方法、决策树、粗糙集法、神经网络法、遗传算法、关联规则、数据可视化以及联机分析处理。

3、 基于BP神经网络的高空气象数据挖掘方法 摘 要: 针对传统的高空气象数据挖掘方法中存在的数据挖掘深度问题,提出一种基于BP神经网络技术的高空气象数据挖掘方法。采用BP神经网络技术以及小。

4、 大数据背景下数据挖掘方法其应用 摘要:人类已迈入大数据时代,但很多时候我们会感到被数据淹没,却缺乏知识的困窘,并没有“得数据者得天下”的能力。因此,数据挖掘成了我们提取海量数据。

5、 文本和数据挖掘技术(TDM)和著作权保护 摘 要:生活在一个信息化的“大数据”时代下的我们,习惯性得使用互联网包括关键词搜索、资料搜集、数据库检索、馆藏电子图书阅读等基于文本和数据挖掘技。

6、 数据挖掘在车险欺诈和识别中应用 【摘要】随着我国保险行业的不断发展,针对车险的欺诈问题也日益严峻,使得保险公司每年遭受巨大的损失。为了发现和防止保险中的欺诈,保险公司在不断的寻。