论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>论文范文>范文阅读
快捷分类: 论文级别分类 期刊分类 学术期刊分类 期刊级别分类 杂志分类 论文分类号查询 食品分类调查论文 船舶的分类论文 浮头式换热器设计开题报告 毕业设计的工作方法分类 逆变器参考文献 中图论文分类号

关于分类器论文范文 基于随机森林分类器的C2C电子商务欺诈识别模型构建相关论文写作参考文献

分类:论文范文 原创主题:分类器论文 更新时间:2024-03-23

基于随机森林分类器的C2C电子商务欺诈识别模型构建是关于本文可作为分类器方面的大学硕士与本科毕业论文分类器论文开题报告范文和职称论文论文写作参考文献下载。

【摘 要】C2C电子商务模式由于虚拟性和信息的不对称性,导致交易欺诈现象频发,其发展受到严重影响.论文通过构建具有一定分类精度的随机森林分类器模型,探索从C2C交易商家数据中发掘和识别出异常信息并分析评判的方法,帮助电子商务企业及时发现问题并做出决策,对C2C交易欺诈风险防范具有现实意义.

【Abstract】Due to the virtual nature and asymmetric information of the C2C e-commerce mode, there often occurs transaction fraud, and its development is seriously affected. Through constructing a random forest classifier mode, which has certain classification accuracy, we explore the method of discovering and identifying abnormal information from C2C trading merchant data and analyzing and judging it, so as to help e-commerce enterprises find problems and make decisions in time, it also has practical significance for the prevention of C2C transaction fraud risk.

【关键词】C2C电子商务;欺诈识别;随机森林;决策树

【Keywords】C2C e-commerce;fraud identification;random forest;decision-making tree

【中图分类号】F724.6 【文献标志码】A 【文章编号】1673-1069(2018)08-0171-03

1 C2C电子商务发展及其交易欺诈问题

随着互联网的发展,C2C电子商务交易模式不断成熟稳定,以其不受地域时间的限制、高效率、低成本等优势而受到越来越多人的青睐.近年来我国电子商务消费者人数迅速增长,根据CNNIC第41次《中国互联网络发展状况统计》,截至2017年12月底我国电子商务市场的交易总额高达29.16亿元,较之2016年增幅约为11.7%.网络购物市场总交易规模高达6.2亿元,比2016年增长24%.2010年C2C市场的交易额约为4651亿元,2015年C2C电子商务在中国整体网络购物市场规模中增长率为19.5%,2017年天猫双11全球狂欢节交易额高达1682亿元,年增长39%,数据表明C2C电子商务模式发展空间很大.

2 相关理论方法介绍

2.1 分类器原理

分类器是利用分类技术构建的模型,主要是用来预测数据对象的离散类别,经过对训练集(由类别已知的数据组成)的学习得到一个分类模型,可视作一个目标函数,待测集(所属类别未知的数据)中的每个样本通过该目标函数的映射,得出一个被预测的类别.

2.2 分类器性能评价指标

在分类器构建完成后,通常需要使用一系列的指标去衡量它的分类性能,首先是混淆矩阵.混淆矩阵,现在假设分类变量只有两个类别,分别为正例(positive)和负例(negative),其中,True positives(TP):表示实际为正例且被分类器判断为正例的样本的数量;False positives(FP):表示实际为负例但被分类器判断为正例的样本的数量;False negatives(FN):表示实际为正例但被分类器判断为负例的样本的数量;True negatives(TN):表示实际为负例且被分类器判断为负例的样本的数量.

2.3 决策树与随机森林

决策树可以抽象理解为一个树形结构,树中的每个非叶子节点代表某个属性,每个分支代表某个属性值,每个叶子节点对应着从根节点到该叶子节点所经历的路径表示的样本的类别,即叶子节点代表的属性就是该样本的分类结果.

随机森林分类器是包含多个决策树的一种组合分类器,最终的分类结果由这些决策树共同决定.随机森林的特点主要体现在它的两个随机性上,第一个随机性是它在构建每一个决策树时,采用自助法(bootstrap)重采样技术,即有回放地从数据集中随机抽取一定数量的样本,第二个随机性是在决策树进行节点分裂时,随机选择若干属性参与比较,以确定分裂节点.

3 基于随机森林的C2C交易欺诈识别模型构建

3.1 数据收集及属性确定

本研究从淘宝网收集了真实交易数据,整理后共包含41个属性,其中属性“is_cheat”为目标属性,用来表示样本的类别(欺诈商家,非欺诈商家),由于随机森林算法在构建决策树节点时,从数据集所有变量(除目标属性和用于标识的属性)中随机选取若干属性进行比较,所以它能够处理拥有属性较多的数据,无需进行特征选择[1].如表1所示为各属性名和它们的含义.

该数据集含样本1456条,类别为“欺诈卖家”的样本数为621,类别为“非欺诈賣家”的样本数为835,训练集和测试集的样本数量.

3.2 随机森林分类器的构建与训练

3.2.1分类器相关参数选择

①mrty参数的选取

mrty参数表示随机森林在分类节点处选择参考的属性的数量,对随机森林分类的准确度有很大影响.为了确定mrty的最优取值,本文设计如下实验:将mrty的值分别取为50、100、150,mrty取3至10之间的整数(若数据集的属性个数为M,则mrty的值一般取为,由于本研究中,“count_id”和“is_cheat”属性不计算在内,则M等于39,的值介于6和7之间,所以取3至10之间的整数进行实验),以训练集为数据集,以F的值为评价指标,分类器的分类性能和F的值呈正相关.当mrty等于6时,F的值比较稳定且普遍较高,所以选定mrty的值为6,即将要构建的随机森林分类器在分类节点处选择参考的属性的数量为6.

总结:本论文为免费优秀的关于分类器论文范文资料,可用于相关论文写作参考。

参考文献:

1、 互联网转型驱动的线下旅行社电子商务能力识别 [摘要]随着互联网时代的到来,线下旅行社能否识别企业潜在的电子商务能力决定其互联网转型的方式,也是新时期旅行社创新创业的重要形式。尽管很多研究探。

2、 基于电子商务创业课程体系构建模式 摘 要: 培养创业型人才是高校提高大学生综合素质的有效途径之一,对大学生的就业产生了一定的促进作用。在计算机网络技术迅速普及的今天,基于电子商务。

3、 基于WBSRBS电子商务风险识别和评估 [摘要] 基于新环境下电子商务企业存在的风险,建立一套新的电子商务风险管理模型。通过将WBS-RBS模型和电子商务进行结合,找出电子商务中的WB。

4、 电子商务法律救助体系构建分析 摘 要:随着计算机技术的不断更新以及经济的快速发展,我国的电子商务企业也得到了较快的发展。而电子商务作为我国最大的经济新增点之一,其的快速发展可。

5、 我国C2C电子商务物流配送模式问题对 近年来,我国C2C网购市场规模不断扩大,绝对优势明显,但物流配送却成为其发展的瓶颈之一,制约了C2C电子商务的发展。C2C电子商务物流配送是指物。

6、 基于社群营销生态云农业电子商务平台策划和构建 摘要:随着互联网、物联网技术的飞速发展以及人们生活方式和消费观念的转变,消费者对生态健康食品的需求日益增大。本文在以“浙江祺神农业有限公司”为例。