论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>职称论文>范文阅读
快捷分类: 文后参考文献著录规则 数据挖掘关联规则论文 检索期刊条目著录规则 法学论文食品安全的法律规则 参考文献规则 关联挖掘论文 从关联理论看字幕翻译策略论文目录

关于关联规则论文范文 基于关联规则Apriori算法的学生成绩分析相关论文写作参考文献

分类:职称论文 原创主题:关联规则论文 更新时间:2024-02-09

基于关联规则Apriori算法的学生成绩分析是关于关联规则方面的论文题目、论文提纲、关联规则论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

摘 要:关联规则挖掘是数据挖掘领域研究的热点问题,其中Apriori算法是经典的关联规则算法.将关联规则Apriori算法应用到学生成绩分析中,挖掘出课程与课程之间的相互关系,寻找各方面影响学生成绩的因素,发现隐藏在数据背后有价值的信息,从而为学生选课和教师教学以及教学管理工作等提供辅助性的建议与决策.

Abstract: Association rule mining is a hot topic in the field of data mining. Apriori algorithm is a classical association rule algorithm. This paper applies the association rule apriori algorithm to analyze student achievement data, digs out the relationship between the course and the curriculum, finds out the factors that affect the student achievement in all aspects, and finds the hidden information behind the data, so as to provide supplementary advice and decision-making for student course selection, teacher teaching and teaching management.

關键词:学生成绩分析;数据挖掘;关联规则技术;Apriori算法

Key words: student achievement analysis;data mining;association rule technique;Apriori algorithm

中图分类号:TP311.1 文献标识码:A 文章编号:1006-4311(2018)05-0171-03

0 引言

近年来随着信息技术的飞速发展,数据资源变做到越来越丰富,在高校的教学管理系统中存储了大量的学生成绩数据信息,但由于缺乏必要的技术手段,因此只能对这些数据信息进行简单的统计、备份和查询.隐藏在这些大量成绩数据背后的信息不能做到到有效的利用,不利于人才的培养和教学质量的提高,因而迫切需要有更新的技术方法对这些数据进行处理分析.

关联规则挖掘[1-2]就是一门从历史数据集中发现隐含模式,从海量数据集中发现潜在的有价值信息的技术方法,它反映了一个事件与其他事件直接依赖或关联的知识,这几年已经成为数据挖掘技术研究领域的热门话题[3].本文运用关联规则Apriori算法挖掘学生成绩数据,可以挖掘出课程与课程之间的相互关系、影响学生成绩的因素等一些有价值的信息,这些信息可为教学及管理工作提供支持性的建议,同时也为更加合理的制定人才培养方案和提高教育教学质量提供科学依据.

1 关联规则基本理论

2 关联规则挖掘算法

2.1 寻找频繁项目集

在对学生成绩数据进行关联规则分析时,这里采用了Apriori算法来寻找全部的频繁项目集.Apriori算法是一种重要的关联规则挖掘算法,它使用了一种被称为逐层搜索的迭代算法,k-项集用于搜索(k+1)-项集.首先需要扫描事物数据库,累积每个项的计数,然后收集满足最小支持度的项,从而找出频繁1-项目集的集合L1.L1用于寻找频繁2-项目集的集合L2,而L2用于寻找频繁3-项目集的集合L3,如此下去,直至不能找到频繁k-项目集Lk为止[4].

运用频繁k-项集用于搜索(k+1)-项集是Apriori算法的核心,该步骤分为连接步和剪枝步:

①连接步骤:为了寻找Lk,在k(k>1)次扫描数据库时,通过Lk-1与自身连接产生候选k-项集的集合Ck.

②剪枝步骤:由于Ck是Lk的超集,即Ck的成员可能是也可能不是频繁的.需要扫描全部的事务数据库,确定Ck中每个候选的计数,判断是否大于或者等于最小支持度计数,如果是,那么便认为该候选是频繁的.为了压缩Ck,可以运用Apriori性质:任何一个频繁项集的全部非空子集也一定是频繁的,若某个候选的非空子集不是频繁的,那么该候选项集肯定也不是频繁的,从而可以将其从Ck中删去.

Apriori算法描述如下[5-6]:

输入:数据库D;最小支持度min_Support

输出:D中的频繁项目集L

方法:

L1等于find_frequent_1-itemsets(D);;

for(k等于2;Lk-1≠Φ;k++){

Ck等于apriori_gen(Lk-1,min_Support)

for each transaction t∈D{

Ct等于subset(Ck,t);

for each candidate c∈Ct

c.count++;

}

Lk等于{c∈Ck|c.count?叟min_Support}

}

return L等于UkLk

2.2 生成强关联规则

对于上面做到到的每个频繁项目集L,生成强关联规则的步骤如下:

①生成L的所有非空子集;

②对于L的每个非空子集S,令R等于L-S.

如果有

?叟Min_Confidence

即S?圯R满足最小置信度阈值,那么输出关联规则S?圯R.又因为这个规则是从频繁项目集L中生成的,因此一定满足最小支持度阈值,所以这个规则为强关联规则.根据上面的两个步骤,就可以做到出事物数据库D的全部强关联规则.

总结:本文是一篇关于关联规则论文范文,可作为相关选题参考,和写作参考文献。

参考文献:

1、 基于决策树的学生成绩对毕业影响分析 摘要:高校生源质量的下降使得学生顺利毕业问题成为关注的焦点,该文以温州商学院会计学专业学生的毕业情况为例,运用决策树分类技术对学生的成绩进行综合。

2、 BP神经网络算法在图书借阅和学生成绩相关性中的应用 摘要:该文通过与学校网络中心及教务处联系,对学校图书馆数据库与教务管理系统数据库进行对接。利用数据挖掘的常用算法BP神经网络算法,抽取图书馆数据。

3、 关联规则中基于模糊遗传算法和改进挖掘技术 摘 要: 网络数据通常以爆炸式的聚集形式出现,导致曾提出的关联规则挖掘方法挖掘性能不好。基于上述原因,提出一种关联规则中基于模糊遗传算法的挖掘方。

4、 基于关联规则运动训练生化指标数据挖掘系统设计 摘 要: 传统数据挖掘系统存在挖掘速率慢、时间长、数据可靠度低等问题,无法达到运动训练生化指标精准数据挖掘的标准,为此,对基于关联规则的运动训练。

5、 大数据时代的学生成绩诊断报告 【关键词】 成绩诊断报告;大数据;数据采集;个性化【中图分类号】G63 【文献标志码】A 【文章编号】1005-6009(2016)23-00。

6、 改进模拟退火算法K—means聚类方法在学生成绩上应用 【摘 要】本文以学生管理系统中学生的成绩作为测试集,提出一种新的基于改进模拟退火的k-means算法的评价函数,挖掘学生成绩中的有效数据,用改进。