舆情基于免疫机理的网络商务舆情监控系统研究

舆情监控系统  时间:2021-02-25  阅读:()

基于免疫机理的网络商务舆情监控系统研究

目录

1、细胞免疫学机理的引入

2、 网络商务舆情监控系统的构建

2. 1 网络商务舆情数据的采集

2. 2网络商务舆情的抗原识别及抗体提取

2. 3网络商务舆情监控系统的整体架构

3、小结

正文

摘要针对网购用户在线评价为主的网络商务舆情本文尝试引入细胞免疫机理借鉴细胞免疫学中的抗原、抗体概念将网络商务舆情中的负面信息视为抗原采用与细胞免疫系统相同的工作机制通过计算网络商务舆情负面信息抗原的特点来提取出抗体再利用

抗体来对网络商务舆情进行准确识别和控制帮助企业更加准确地掌握市场及用户状况为企业营销提供支撑

关键字商务舆情舆情监控免疫机理抗原抗体

据中国质量万里行2016年3月的投诉报告显示 2015年网购投诉仍居各行业投诉之首投诉量为23386例而与此同时在线商品评论的好评率常常接近100%但所售商品仍伴随着居高不下的投诉率或退货率[1] 。在电子商务领域 由于在线交易具有虚拟性、隐蔽性、发散性、渗透性等特点随之而来的网络商务舆情又有数据量大、高度分散、传染性强、随意性大等新的特点这些都迫切需要一个高效的网络商务舆情传播及控制系统为企业的在线商务运营收集各种舆情信息帮助企业应对当前复杂的网络信息传播状况应对日益严峻的电子商务方面的竞争态势。而目前针对网购用户在线评价为主的网络商务舆情研究不多传统的网络舆情监控主要针对的是大型门户网站及重要的论坛、社区、博客等[2] 对网络商务领域中的客户、产品等要素 由于信息量大且关键词不易确定传统的网络舆情监控效果不佳。

本文尝试引入细胞免疫学概念力求突破有限初始关键词以及有限指定网址的局限根据网络商务舆情的传播线路来自动产生抗体关键词及网址扩大信息解析及吸取的范围从而更加准确地开展网络商务舆情监控。企业也可以通过实时的网络商务舆情监督更加准确掌握产品和市场情况监控竞争对手和行业动态是企业市场营销决策的重要支撑。

1、细胞免疫学机理的引入

人类免疫系统经过生物进化被证明是有效的、适应性良好的防御系统。在生物免疫系统与网络商务舆情传播与控制系统的异同点分析的基础上研究建立网络商务舆情传播与控制人工免疫系统的可行性提出网络商务舆情风险的抗原识别机理揭示网络商务舆情的免疫接种机理。在免疫学概念中抗原是入侵者被机体识别后机体会产生反应来消灭不属于机体本身的抗原产生反应形成的物质就是抗体抗体就是来对抗抗原的物质。生物细胞免疫系统防御异物入侵的过程就是一个不断识别风险和处理风险的过程。免疫学研究已经证明每一个类型的抗体都有特定抗原决定基抗体与抗原之间的匹配模式越接近识别效果越好[3]

借鉴细胞免疫学中的抗原、抗体概念将网络商务舆情中的负面信息视为抗原借助细胞免疫系统的相同工作机制测算出网络商务舆情负面信息的相关特点 即抗原特点再根据抗原特点来找出最合适的抗体这个抗体体现的就是机体对负面信息的敏感反应可以用来准确地识别网络商务舆情抗原

本文的核心就是借鉴细胞免疫学机理从已知抗原中提取抗体再利用抗体来准确识别网络商务舆情中的不良信息抗原 增强商家的主动防御能力。其中最关键的技术就是对抗原的识别要对网络商务舆情的负面信息进行各种分类和比对从而产生多样抗体 以识别各类抗原。

2、 网络商务舆情监控系统的构建

2. 1网络商务舆情数据的采集

现有电商平台中的商品数据、评论数据的结构复杂均采用了Frame框架及JavaScr ipt动态写入内容或采用了Ajax技术实时自动刷新内容这些都是普通的数据抓取技术很难处理或无法处理的。先模仿人工通过电商平台的搜索引擎输入初始关键词从多个电商平台上获得初始关键词的相关商品搜索结果再通过这些商品的链接收集进一步的商品详情信息接着重点采集商品的各项用户评价信息尤其是负面评价信息最后对收集到的所有舆情数据进行进一步的清理和整理便于后面的抗原选定及抗体识别。

获取在线商品数据关键就是通过程序来发送网页请求从而获取相应页面的源码然后再对源码进行解析获取到需要的商品信息。观察H TML源码是非常重要的第一步决定了所需数据应该怎么获取。比如仔细查看淘宝搜索页面中某件商品的链接地址其H TML代码如图1所示。

该商品的链接地址是位于"detail_url":"后面的一串字符又以" "view_price"符号结束。把这两个看成是分隔符的话就可以取出该商品的链接地址了。接下来通过商品页面地址将该页所有源代码下载到本地再分析这些数据的组成。其中的用户评论数据是用JS脚本代码获取的在网页源码中研究script脚本代码从中得到JSON格式的用户评论如图2所示。

获取到JS ON格式的用户评论后就可以根据用户舆情数据的文本组成结构对舆情数据进行抽取实现基于网页结构的网络商务舆情数据的自动采集。

2.2网络商务舆情的抗原识别及抗体提取

对采集到的网络商务舆情信息挑选出一部分作为训练集 因为不同的产品对象其抗原及抗体均有差异 因此网络商务舆情的抗原识别及抗体提取应该针对不同领域、不同产品进行分别操作。本文的负面信息训练集主要来自于户外产品的差评从某购物平台上随机抽取并经过人工标注筛选后将其中的500条典型负面评价作为初始训练集。

先采用中科院发布的最新NLPI R 原ICTCLAS中文分词系统对这500条对负面信息抗原进行分词处理再通过语义角色标注

Semantic Role Labeling简称SRL进行语义分析提取出负面信息中包含的评价对象、特征、相应的情感词。如从某条负面信息中提取出评价对象为冲锋衣特征为材质相应情感词为不透气。为了抗体生成的准确性训练集中的负面信息抗原都包含有显式的评价对象、特征、相应的情感词内容。

接着就是要从这些评价对象、特征、相应的情感词内容中提取出抗体基本工作思路如下

●统计评价对象、特征、相应的情感词出现的频率

●计算情感词与评价对象、特征之间的关联关系

●将重点情感词设置为抗体备选

●计算抗体间相似度合并相似度高的抗体

●最终确定抗体主体。

具体的抗原识别及抗体提取过程如图3所示

2.3网络商务舆情监控系统的整体架构

免疫系统对抗原采取的不是以静制动的策略而是以变应变或者通过超变异产生尽可能多的抗体类型的策略 因为不同产品对象的负面信息及风险各不相同 网络商务舆情监控系统也是一个根据监控对象不同而随时自我调节的系统非常适合采用与免疫系统同样的策略进行舆情防御及免疫。将网络商务舆情负面信息作为抗原其抗原基因与抗体基因的结构类型一致 以抗体基因作为研究基础产生的则是网络商务舆情事件的非自体抗原基因库。 网络商务舆情负面信息特质基因则是互补性决定区的抗体基因 网络商务舆情负面信息的识别则依靠特质基因片段识别特定产品领域的网络商务舆情负面信息将免疫机理与网络商务舆情监控结合起来构成一个完整的网络商务舆情监控系统。

在抗体提取之前先进行目标对象的识别分类及该类训练集的准备再依据不同的训练集提取该类别对应的抗体接着基于抗体进行该类别对象的网络舆情监控然后根据不同的监控结果进行持续的抗

体优化最后通过持续地分类别网络舆情监控建立起一个完整的网络商务舆情监控系统并不断更新分类。具体的网络商务舆情监控系统整体架构如图4所示。

3、小结

传统网络舆情监控方法对电子商务领域的舆情识别效果不佳而网络商务舆情中不同产品对象的舆情特点不同恰好与免疫学中的机体免疫机理吻合。因此基于免疫学中的抗原、抗体原理将网络商务舆情中的不良信息视为抗原通过研究抗原特点找出抗体再通过抗体来识别未知的网络舆情可以有效的提升网络商务舆情的监控精度。

本文在抗原识别及抗体提取阶段采用的是目前比较经典的网络文本采集及文本分类识别技术 由于目前的文本识别技术尚不成熟抗体提取的精确性还有很大的提升空间。此外 网络商务舆情中的图片、声音信息的识别及监控也是后期需要进一步开展的工作。

野草云提供适合入门建站香港云服务器 年付138元起 3M带宽 2GB内存

野草云服务商在前面的文章中也有多次提到,算是一个国内的小众服务商。促销活动也不是很多,比较专注个人云服务用户业务,之前和站长聊到不少网友选择他们家是用来做网站的。这不看到商家有提供香港云服务器的优惠促销,可选CN2、BGP线路、支持Linux与windows系统,支持故障自动迁移,使用NVMe优化的Ceph集群存储,比较适合建站用户选择使用,最低年付138元 。野草云(原野草主机),公司成立于20...

virmach:3.23美元用6个月,10G硬盘/VirMach1核6个月Virmach

virmach这是第二波出这种一次性周期的VPS了,只需要缴费1一次即可,用完即抛,也不允许你在后面续费。本次促销的是美国西海岸的圣何塞和美国东海岸的水牛城,周期为6个月,过后VPS会被自动且是强制性取消。需要临时玩玩的,又不想多花钱的用户,可以考虑下!官方网站:https://www.virmach.comTemporary Length Service Specials圣何塞VPS-一次性6个...

美国cera机房 2核4G 19.9元/月 宿主机 E5 2696v2x2 512G

美国特价云服务器 2核4G 19.9元杭州王小玉网络科技有限公司成立于2020是拥有IDC ISP资质的正规公司,这次推荐的美国云服务器也是商家主打产品,有点在于稳定 速度 数据安全。企业级数据安全保障,支持异地灾备,数据安全系数达到了100%安全级别,是国内唯一一家美国云服务器拥有这个安全级别的商家。E5 2696v2x2 2核 4G内存 20G系统盘 10G数据盘 20M带宽 100G流量 1...

舆情监控系统为你推荐
中国电信互联星空中国电信宽带于互联星空的区别百度抢票浏览器现在火车票越来越难买了,新版百度手机浏览器,除了抢票外,还有什么其他功能吗?bluestacks安卓模拟器BlueStacks如何安装使用?bluestacksBluestacks安卓模拟器是什么机型的?不兼容安卓手机软件不兼容怎么办?qq空间装扮QQ空间装扮商标注册查询官网如何在网上查询商标是否注册?如何快速收录如何掌握百度收录之快速收录虚拟机软件下载谁有好的虚拟机软件?宽带接入服务器宽带接入服务器的五大功能是什么?
免费域名申请 中国域名网 美元争夺战 香港主机 ixwebhosting 搜狗抢票助手 免费个人空间 工作站服务器 idc是什么 phpmyadmin配置 vip域名 web服务器安全 无限流量 中国电信测速器 lamp什么意思 杭州电信宽带优惠 杭州电信 杭州电信宽带 北京主机托管 腾讯云平台 更多