算法基于云平台的矩阵分解协同过滤算法在煤炭销售系统中的研究

云销售系统  时间:2021-01-07  阅读:()

基于云平台的矩阵分解协同过滤算法在煤炭销售系统中的研究

祝振欣

河北政法职业学院河北石家庄050000

摘 要协同过滤技术被广泛地应用在推荐系统中。随着电子商务的快速发展煤炭产业也引进了电子销售系统。近年来矩阵分解的协同过滤算法得到了煤炭销售系统的广泛应用。但是随着互联网的快速发展煤炭电子销售记录呈现指数级增长传统的基于矩阵分解的协同聚类算法不能有效、快速地完成销售系统的推荐工作。文章针对大规模煤炭数据推荐工作提出了分布式矩阵分解协同过滤算法该算法基于云计算平台能够分布式、高效地完成推荐系统的推荐工作。通过实验结果进一步展示了本算法与传统协同过滤算法相比具有很高的加速比以及很好的可扩展性。

关键词矩阵分解协同过滤推荐工作煤炭销售系统云计算

中图分类号 TP 393 09 TP 31 1 13 文献标志码 A 文章编号 1008  8725 201401  0247  02

Research and Application of Cloud Platform Based Matrix

Factorization Collaborative Filtering Algorithm in Coal Sale System

commerce, coal industry also induces electronic sale system In recent years,matrix factorization based collaborative filtering algorithm is popularly used in coal website recommender system However, with the high development of E-commerce area, the sale records of coal sale are increasing exponentially and traditional matrix factorization based collaborative filtering algorithm could not complete recommendation work effectively in sale system In this paper, focusing on recommendation works of big scale coal sale data,we propose distributed matrix factorization collaborative filtering algorithm This algorithm is based on cloud platform, and could complete the recommendation work distributed and effectively Through the results, we show that the algorithm has high speed-up and good scalability, comparing with traditional collaborative filtering

Key words:matrix factorization collaborative filtering recommender work coal sale system cloud computing

综合这些相似用户对某一信息的评价形成系统对该 计算pq上面公式的最小值完成不同用户p和

应用并能够更加准确的预测推荐排名工作。但是 定义eui=rui-puTqi

1 基于矩阵分解的协同过滤算法  1将训练数据集平均分布到N个计算结点中收稿日期20130222修订日期2013-1 1-16

作者简介祝振欣1972-  男河北保定人硕士讲师研究方向数据库技术电子商务安全。

·248· 煤 炭 技 术 第33卷

并将用户p和项目q的初始值分布到各个计算结点中 分为两组实验分别测试算法的效率以及可扩展

2针对在不同计算结点中的训练集得到该结 性。在第一组实验中比较分布式矩阵分解协同过滤点中的用户集、项目并利用初始值计算 算法DMFCF与传统基于矩阵分解的协同过滤算法

数传递重复1和3 直至迭代终止。 在第二组数据中主要测试算法的可扩展性为

下面是基于Map Reduce的分布式矩阵分解协同 了测试算法的可扩展性从数据集D4中等比例抽过滤算法的伪代码 取四组数据 S1  S2 S3  S4含有的记录个数分别为

3:for each item i 呈现等比例增大。同时随着计算结点个数的增大针

4: computeeui=rui-puTqi; 对相同数据集的分布式矩阵分解协同过滤算法的执

5: qi←qi+γeuipuλqi 行时间成比例减少。可以看出当数据规模增大的情

6:pu←p u+γeuiqi-λpu 况下可以通过增加计算结点的个数提高算法的执行

7:end for 效率减少算法的执行时间。说明算法具有很好的可

8:end for 扩展性。

9:e nd for

Output:r^ ui 图1 加速比实验 图2 可扩展性实验

1: Mapper(); 5 结语

6 r^ ui=puTqi; 解协同过滤算法。该算法能够分布式完成推荐系统的

7: end for 推荐工作实验结果也进一步证明了算法能够高效地

8:e nd for 完成推荐工作。

9:return 0; 参考文献

4 实验结果 [1 ] Kore n

系统整合应用

D4 873 232 责任编辑 丛培建

hostkvm:美国VPS,三网强制CU-VIP线路,$5/月,1G内存/1核/15gSSD/500g流量

hostkvm在2021年3月新上线洛杉矶新VPS业务,强制三网接入中国联通优化线路,是当前中美之间性价比最高、最火热的线路之一,性价比高、速度非常好,接近联通AS9929和电信AS4809的效果,带宽充裕,晚高峰也不爆炸。 官方网站:https://hostkvm.com 全场优惠码:2021(全场通用八折,终身码,长期) 美国 US-Plan0【三网联通优化线路】 内存:1G CPU:...

月费$389,RackNerd美国大硬盘独立服务器

这次RackNerd商家提供的美国大硬盘独立服务器,数据中心位于洛杉矶multacom,可选Windows、Linux镜像系统,默认内存是64GB,也可升级至128GB内存,而且硬盘采用的是256G SSD系统盘+10个16TSAS数据盘,端口提供的是1Gbps带宽,每月提供200TB,且包含5个IPv4,如果有需要更多IP,也可以升级增加。CPU核心内存硬盘流量带宽价格选择2XE5-2640V2...

易探云香港云服务器价格多少钱1个月/1年?

易探云怎么样?易探云是目前国内少数优质的香港云服务器服务商家,目前推出多个香港机房的香港云服务器,有新界、九龙、沙田、葵湾等机房,还提供CN2、BGP及CN2三网直连香港云服务器。近年来,许多企业外贸出海会选择香港云服务器来部署自己的外贸网站,使得越来越多的用户会选择易探云作为网站服务提供平台。今天,云服务器网(yuntue.com)小编来谈谈易探云和易探云服务器怎么样?具体香港云服务器多少钱1个...

云销售系统为你推荐
域名域名是干什么的租用虚拟主机租用空间,租用虚拟主机,租用服务器,三者有什么不同?me域名注册.me是什么域名com域名空间域名和空间是什么意思免费国内空间中国有什么免费的空间ip代理地址IP代理什么意思?国外主机空间2个国外主机空间,都放了BLOG,看看哪个更快?网站域名空间网站域名和空间jsp虚拟空间java虚拟主机空间怎么选择,国内jsp虚拟主机比较稳定java项目做好后需要推荐一下吧网站空间商域名空间商怎么做
买域名 过期域名查询 vps教程 互联网域名管理办法 vir 东莞电信局 sharktech 日本软银 hawkhost 美国主机推荐 鲨鱼机 香港新世界电讯 tk域名 全能主机 赞助 百度云1t 如何用qq邮箱发邮件 申请免费空间和域名 umax cdn加速 更多