算法基于云平台的矩阵分解协同过滤算法在煤炭销售系统中的研究

云销售系统  时间:2021-01-07  阅读:()

基于云平台的矩阵分解协同过滤算法在煤炭销售系统中的研究

祝振欣

河北政法职业学院河北石家庄050000

摘 要协同过滤技术被广泛地应用在推荐系统中。随着电子商务的快速发展煤炭产业也引进了电子销售系统。近年来矩阵分解的协同过滤算法得到了煤炭销售系统的广泛应用。但是随着互联网的快速发展煤炭电子销售记录呈现指数级增长传统的基于矩阵分解的协同聚类算法不能有效、快速地完成销售系统的推荐工作。文章针对大规模煤炭数据推荐工作提出了分布式矩阵分解协同过滤算法该算法基于云计算平台能够分布式、高效地完成推荐系统的推荐工作。通过实验结果进一步展示了本算法与传统协同过滤算法相比具有很高的加速比以及很好的可扩展性。

关键词矩阵分解协同过滤推荐工作煤炭销售系统云计算

中图分类号 TP 393 09 TP 31 1 13 文献标志码 A 文章编号 1008  8725 201401  0247  02

Research and Application of Cloud Platform Based Matrix

Factorization Collaborative Filtering Algorithm in Coal Sale System

commerce, coal industry also induces electronic sale system In recent years,matrix factorization based collaborative filtering algorithm is popularly used in coal website recommender system However, with the high development of E-commerce area, the sale records of coal sale are increasing exponentially and traditional matrix factorization based collaborative filtering algorithm could not complete recommendation work effectively in sale system In this paper, focusing on recommendation works of big scale coal sale data,we propose distributed matrix factorization collaborative filtering algorithm This algorithm is based on cloud platform, and could complete the recommendation work distributed and effectively Through the results, we show that the algorithm has high speed-up and good scalability, comparing with traditional collaborative filtering

Key words:matrix factorization collaborative filtering recommender work coal sale system cloud computing

综合这些相似用户对某一信息的评价形成系统对该 计算pq上面公式的最小值完成不同用户p和

应用并能够更加准确的预测推荐排名工作。但是 定义eui=rui-puTqi

1 基于矩阵分解的协同过滤算法  1将训练数据集平均分布到N个计算结点中收稿日期20130222修订日期2013-1 1-16

作者简介祝振欣1972-  男河北保定人硕士讲师研究方向数据库技术电子商务安全。

·248· 煤 炭 技 术 第33卷

并将用户p和项目q的初始值分布到各个计算结点中 分为两组实验分别测试算法的效率以及可扩展

2针对在不同计算结点中的训练集得到该结 性。在第一组实验中比较分布式矩阵分解协同过滤点中的用户集、项目并利用初始值计算 算法DMFCF与传统基于矩阵分解的协同过滤算法

数传递重复1和3 直至迭代终止。 在第二组数据中主要测试算法的可扩展性为

下面是基于Map Reduce的分布式矩阵分解协同 了测试算法的可扩展性从数据集D4中等比例抽过滤算法的伪代码 取四组数据 S1  S2 S3  S4含有的记录个数分别为

3:for each item i 呈现等比例增大。同时随着计算结点个数的增大针

4: computeeui=rui-puTqi; 对相同数据集的分布式矩阵分解协同过滤算法的执

5: qi←qi+γeuipuλqi 行时间成比例减少。可以看出当数据规模增大的情

6:pu←p u+γeuiqi-λpu 况下可以通过增加计算结点的个数提高算法的执行

7:end for 效率减少算法的执行时间。说明算法具有很好的可

8:end for 扩展性。

9:e nd for

Output:r^ ui 图1 加速比实验 图2 可扩展性实验

1: Mapper(); 5 结语

6 r^ ui=puTqi; 解协同过滤算法。该算法能够分布式完成推荐系统的

7: end for 推荐工作实验结果也进一步证明了算法能够高效地

8:e nd for 完成推荐工作。

9:return 0; 参考文献

4 实验结果 [1 ] Kore n

系统整合应用

D4 873 232 责任编辑 丛培建

器安装环境和运维管理工具推荐

今天看到一个网友从原来虚拟主机准备转移至服务器管理自己的业务。这里问到虚拟主机和服务器到底有什么不同,需要用到哪些工具软件。那准备在下班之间稍微摸鱼一下整理我们服务器安装环境和运维管理中常见需要用到的软件工具推荐。第一、系统镜像软件一般来说,我们云服务器或者独立服务器都是有自带镜像的。我们只需要选择镜像安装就可以,比如有 Windows和Linux。但是有些时候我们可能需要自定义镜像的高级玩法,这...

新版本Apache HTTP Server 2.4.51发布更新(有安全漏洞建议升级)

今天中午的时候看到群里网友在讨论新版本的Apache HTTP Server 2.4.51发布且建议更新升级,如果有服务器在使用较早版本的话可能需要升级安全,这次的版本中涉及到安全漏洞的问题。Apache HTTP 中2.4.50的修复补丁CVE-2021-41773 修复不完整,导致新的漏洞CVE-2021-42013。攻击者可以使用由类似别名的指令配置将URL映射到目录外的文件的遍历攻击。这里...

Sparkedhost($8/月)美国迈阿密AMD Ryzen高性能VPS;免费100G高防

sparkedhost怎么样?sparkedhost主机。Sparkedhost于2017年7月注册在美国康涅狄格州,2018年收购了ClynexHost,2019年8月从Taltum Solutions SL收购了The Beast Hosting,同年10月从Reilly Bauer收购了OptNode Hosting。sparkedhost当前的业务主要为:为游戏“我的世界”提供服务器、虚拟...

云销售系统为你推荐
虚拟主机服务你好,我自己做了一个网站,看到有的虚拟主机服务有数据库,有的没有,这个重要吗?我是新手,谢谢域名注册com注册一个.com的域名需要多少钱服务器租用游戏服务器租用多少钱一年?虚拟空间租赁做个自己公司的网站,是租啊还是注册虚拟空间啊?租虚拟空间要钱吗php虚拟主机免费的国内的php虚拟主机有吗域名空间什么是空间 什么是域名租服务器租服务器是什么意思?com域名空间域名解析,我是一个新手站长,我买了一个空间跟一个COM域名,空间自带一个2级域名,我想把这个COM域名绑定到空间上,咋么办?急急急!求大神帮我,我创建一个游戏论坛,也查不到资料,可以给20元,我的手机13685455534,谢谢网站域名域名和网址有什么区别成都虚拟空间虚拟主机哪家最好~~~
in域名注册 如何注册中文域名 中国特价网 建立邮箱 免费防火墙 阿里校园 1g空间 免费美国空间 流媒体加速 免费mysql数据库 腾讯总部在哪 服务器是干什么用的 秒杀品 杭州电信宽带优惠 沈阳idc 火山互联 sockscap教程 大容量存储控制器驱动 百度空间登陆首页 web服务器下载 更多