数据爬虫代理

爬虫代理  时间:2021-05-05  阅读:()
ModernManagement现代管理,2019,9(1),51-58PublishedOnlineFebruary2019inHans.
http://www.
hanspub.
org/journal/mmhttps://doi.
org/10.
12677/mm.
2019.
91006文章引用:吴昊,赵西阳,何红,徐冬.
基于网络舆情的企业危机案例分析[J].
现代管理,2019,9(1):51-58.
DOI:10.
12677/mm.
2019.
91006CaseAnalysisofEnterpriseCrisisBasedonInternetPublicOpinion—TakingSMobilePhoneExplosionasanExampleHaoWu1,XiyangZhao2,HongHe3,DongXu41GuangyuanDistrictBureauofCommerce,GuangyuanSichuan2BusinessSchoolofSichuanUniversity,ChengduSichuan3WestSichuanDrillingCompany,ChengduSichuan4SichuanHuaxinModernVocationalCollege,ChengduSichuanReceived:Jan.
20th,2019;accepted:Feb.
4th,2019;published:Feb.
11th,2019AbstractWiththecontinuousexpansionofinfluencessuchasWeChatandWeibo,consumersregarditastheplatformofchoiceforcomplaintsandcontinuetoferment,whichcausesenterprisecrisisofnetworkpublicopinion.
ThepapertakestheSmobilephoneexplosionasacase.
First,itreviewsthewholeprocessfrominitiationtoquelling.
Secondly,throughemotionalanalysisandkeywordanalysis,itstudiestheemotionalattitudesandcausesoftheInternetatvariousstagesofScom-pany,andthengetstheemotionaltimeseries.
Graphscanvisuallyshowemotionalchanges.
Final-ly,regressionmodelsareusedtoconstructmodelstoanalyzethefactorsthatinfluencethechangesinnetworkpublicopinion.
CaseanalysisshowsthatScompanydidnotdealwiththeSmobilephoneexplosioncrisis,whichledtothenetworkpublicopinionthathasbeennotcondu-civetoScompany,affectingitsdevelopmentintheChinesemarket.
KeywordsSMobilePhone,EnterpriseCrisis,EmotionAnalysis,InternetPublicOpinion,RegressionAnalysis基于网络舆情的企业危机案例分析——以S手机爆炸为例吴昊1,赵西阳2,何红3,徐冬41广元市昭化区商务局,四川广元2四川大学商学院,四川成都3川西钻探公司,四川成都吴昊等DOI:10.
12677/mm.
2019.
9100652现代管理4四川华新现代职业学院,四川成都收稿日期:2019年1月20日;录用日期:2019年2月4日;发布日期:2019年2月11日摘要随着微信、微博等影响力的不断扩大,消费者将其作为抱怨投诉的首选平台,并且不断发酵,从而引起企业网络舆情的危机.
论文以S手机爆炸事件作为案例,首先回顾整个事件从发起到平息的过程,其次通过情感分析和关键词分析研究网络大众对S公司各阶段的情感态度及原因,再其次得到情感方面的时间序列图,可以直观展现情感变化,最后,通过回归分析构建模型,分析影响网络舆情变化的因素.
案例分析表明,S公司并没有处理好S手机爆炸危机,导致网络舆情一直不利于S公司,影响了它在中国市场发展.
关键词S手机,企业危机,情感分析,网络舆情,回归分析Copyright2019byauthorsandHansPublishersInc.
ThisworkislicensedundertheCreativeCommonsAttributionInternationalLicense(CCBY).
http://creativecommons.
org/licenses/by/4.
0/1.
引言微博、微信以及各种话题论坛是新媒体的典型代表,S公司作为一家巨头公司,自2016年8月世界第一起S手机爆炸和2016年9月中国第一起S手机爆炸之后,新浪微博与IT之家论坛上就有了广泛而热烈的讨论,S公司的每一次声明都会获得极高的关注度.
所以,研究S公司应对此次企业危机事件的策略,中国消费者对"S手机爆炸事件"的态度和关注点具有实际意义.
文章将微博数据和IT之家论坛数据作为数据来源,研究公众对于"S手机爆炸事件"随着S公司的声明和时间的发展,中国消费者情感的变化分析.
国外研究有关网络舆情和危机公关的文献众多,Zheng,B.
,H.
LiuandR.
M.
DaviSon[1]揭示了公众如何从社会控制的角度参与SCC(次级危机传播)的决策过程;Fan,K.
andW.
Pedrycz[2]提出了一个社会判断为基础的意见(SJBO)动力学模型,以探讨在知情代理人的影响下的意见演变;Lian,Y.
,X.
DongandY.
Liu[3]严格推导了一个用于描述网络舆情拓扑的模型;Liu,D.
,W.
WangandH.
Li[4]研究了网络突发事件中的舆情演化机制和信息监管.
国内许多学者通过案例分析来评判企业的危机公关策略并给出建议[5][6],同时在危机公关过程中观察公众的情感态度变化[7];李立耀[8]等从概述信息传播规律、信息传播模型、传播预测模型、意见领袖挖掘4个方面对信息传播机制进行了研究;戴杏云[9]等认为依据用户在网络中影响力的大小和群体情绪的动态变化状况,可以生成直观的社交网络情感图谱;万源[10]将语义统计分析应用到网络舆情研究中;林敏[11]全面揭示了网络舆情发生过程中的多层次因素及其内在的演化机理和规律.
现有的国内外很多针对企业危机公关的研究都是基于市场营销的角度做描述性案例分析或者做企业公关理论研究,而基于大数据的研究集中在人群画像和商务智能等内容上,采用社交网络研究方法的多用于建立模型.
而文章不同于现有研究,是基于大数据做企业公关案例分析,将两个不同社区上爬取的OpenAccess吴昊等DOI:10.
12677/mm.
2019.
9100653现代管理针对这次危机事件的评论数据进行整合分析,得到定量的数据结果,同时绘制情感时间序列图,描述网络大众的情感变化过程并进行预测和验证.
2.
研究设计2.
1.
数据收集论文数据收集一共有两个来源,一是微博文本数据,二是网页论坛数据.
前者是在微博搜索页面进行以"S手机爆炸"为话题的搜索,收集从2016年9月至2017年8月的关注度较高的博文的评论数据,采用网络爬虫软件进行数据抓取.
后者是在著名的数码、科技和生活门户网站IT之家上抓取新闻评论数据,搜索关键词"S手机爆炸",得到若干新闻条目,选取关注度较高的新闻进行评论数据抓取.
2.
2.
数据清洗论文采用EXCEL软件做数据清洗,一共有以下步骤:将.
txt文本数据转化为EXCEL格式.
获取的微博文本数据是EXCEL格式的,不需要转化,但是运用python编程语言获得的在数据库中的数据是.
csv或者.
txt格式的,需要先在WORD文档中将文本数据转化为表格格式,然后再复制到EXCEL表格中.
清除数据中的空值和不需要数据,增添需要的数据.
在用八爪鱼工具采集数据时,有可能采集到了空的评论数据,将该条数据删除;在使用Python编程语言只采集到了评论数据,从数字1开始编号,为用户设计一个ID.
合并同一时间段的数据在一个文件中.
在后续的数据分析中,按照需求设置时间单位,并将在微博采集到的数据(以下简称微博数据)和在IT之家门户网站采集到的数据(以下简称网页数据)这两个不同社区的数据合并在一起.
2.
3.
情感分析设计首先将每条评论数据进行文本预处理,即以标点符号为分割点,将每条评论分为某几段,再提取每段中的情感词;然后以这个情感词为中心,寻找临近的程度副词、否定词等,对照情感词表进行综合打分;最后进行反问、感叹等语气判断,在之前的分数基础上改变相应程度的分数.
一般来说,情感词表将最积极的情感数值设为"1",最消极的情感数值设为"0",高于0.
5代表一句话带有积极情感,反之低于0.
5表明这句话含有消极情感.
将微博数据或网页数据中每一条评论数据的情感打分取平均值,最终得到综合情感分.
2.
4.
关键词分析设计以评论数据构造关键词网络图,选取了名词做关键词相关分析.
当结点之间存在相互联系的关系时,就会产生一条连接的线;两个结点之间距离越近,表明两个词的联想度越大;某个结点越大,表明在关键词中的权重越大,越能代表总体的看法.
每一个关键词得出的权重的过程和方法是:首先在情感分析过程中将评论数据分词的基础上,得到形容词、名词、动词等性质的词语;然后采用购物篮的分析方法,计算某个词语到其他词语的置信度;最后将这个词语到其他词语的所有置信度数值求和,并设置信度和的数值大于1才被列为关键词,此时这个和值也是这个关键词的权重.
2.
5.
回归分析设计结合情感分析数据和关键词分析数据,通过观察关键词权重表,除去在评论中一定会被提到的话题吴昊等DOI:10.
12677/mm.
2019.
9100654现代管理中心词,选取在每个时间段出现频率较高的几个关键词,并且以天为时间单位计算关键词的权重数值,同时为了准确表现网友对关键词的关注程度,将计算出来的关键词权重再除以评论数量,最后与每天的情感综合分做相关分析.
3.
实证分析3.
1.
数据获取及预处理文章采用网络爬虫软件进行数据抓取,一共抓取微博数据20,198条和网页数据25,568条.
通过EXCEL软件进行数据清洗和预处理,清除数据中的空值和不需要的数据,增添需要的数据.
最后将相同时间段的两个数据(微博数据和网页数据)合并一起,一共获得微博数据19,590条,网页数据22,167条.
表1为得到的各个月份的评论数据数量:Table1.
Commentdataquantitydistributiontable表1.
评论数据数量分布表月份微博数据(条)网页数据(条)2016年9月366937782016年10月317241092016年11月234130762016年12月180820142017年1月104418842017年2月125215762017年3月117012032017年4月96314602017年5月13269842017年6月8767932017年7月8924142017年8月6673563.
2.
情感分析在合并微博评论数据和网页评论数据为一个评论数据集时,以月份为单位合并数据,并且选取三个关键月份,2016年9月,2017年1月和2017年7月,这三个时间段分别为第一起爆炸发生时、S公司官方给出电池爆炸的权威解释时以及S公司的此次危机在中国暂时平息的时候.
通过计算出这三个关键月份的情感综合分,直观感受网络舆情在整个危机事件进行过程中的总体情感反应.
Table2.
Commentdatasentimentdistributiontable表2.
评论数据情感分布表时间正面评论数负面评论数评论总数负面评论占比综合得分2016年9月20325415744772.
49%0.
4682017年1月8042124292872.
12%0.
4692017年7月396910130669.
41%0.
476吴昊等DOI:10.
12677/mm.
2019.
9100655现代管理根据表2,可以分析得出:首先,评论总数随时间变化是减少的.
其次,在这三个时间段,情感综合得分小于0.
5,则表明网友对"S手机爆炸"事件的情感总是负面的.
最后,虽然在2017年7月,即这次危机事件基本结束的时候,情感综合分对比2017年1月有明显上升,但是仍然是负面的情感态度.
分别统计出微博数据和网页数据每个月的评论数据的数量n1和n2,则某个月平均情感综合分数为(微博情感综合分*n1+网页情感综合分*n2)/(n1+n1).
再将情感数据导入SPSS软件,利用指数平滑法做情感的时间序列分析.
情感综合分数走势如图1所示.
Figure1.
Emotionalcompositescorechart图1.
情感综合分数走势图据图1分析,随着网络舆情热度的下降,情感综合得分在不断上升.
但在2018年4月"S手机爆炸"事件尚未平息时,又出现S企业其他手机自燃事件,导致情感综合得分迅速降低.
针对此次危机,S企业迅速采取公关措施,情感综合得分逐步上升.
3.
3.
关键词分析与情感分析处理数据的方法类似,通过以月份为单位合并数据对两个社区做关键词分析,计算出关键词的权重,如表3所示,权重数值越大,说明网友评论时提及越多.
Table3.
Commentdatakeywordweighttable表3.
评论数据关键词权重表2016年9月2017年1月2017年7月S公司385.
15S公司225.
45S公司142.
07手机150.
09电池80.
98手机50.
51中国135.
67手机75.
68爆炸31.
18爆炸100.
36中国64.
74电池30.
50电池72.
47问题47.
87召回28.
01召回68.
47爆炸46.
50华为22.
54消费者55.
18棒子27.
92中国14.
67问题53.
59消费者27.
32问题14.
00苹果41.
94态度25.
78苹果10.
89产品31.
59设计25.
42应该10.
82评论数据关键词权重表表明,随着时间推移,"S公司"这个关键词的权重在降低,即人们对S公司这家公司的讨论度降低,同时排列在前的关键词的权重得分在不同程度下降,说明随着事件的发展,9月201610月201611月201612月20161月20172月20173月20174月20175月20176月20177月20178月2017日期数值0.
4850.
4800.
4750.
4700.
4650.
460观测值平均情感综合分-模型吴昊等DOI:10.
12677/mm.
2019.
9100656现代管理人们的注意力在被分散.
另外值得注意的是,借着"S手机爆炸"事件的热点,人们开始拿S手机和其他品牌的手机做比较,如苹果和华为,这说明S公司也在失去它原本的潜在顾客.
因为S公司在对待中国消费者和外国消费者的方法上有些差异,所以网友在评论的时候"中国"也成为了一个重要的关键词,特别是在前两个时间段,在除"S公司""手机"和"电池"这三个极其中心的关键词之外,"中国"是权重得分最高的.
另外,不出人意料的,"电池"和"爆炸"都成为了网友从一开始就评论的重点,说明对官方解释"电池为什么爆炸",网友是抱有期待之情的.
然而因为S公司没在短时间内给消费者和用户一个满意答复,所以导致在2017年1月的检验报告发布活动之后,"棒子"这个侮辱性词汇成为网友对此事件发表看法的重要用语.
3.
4.
回归分析结合情感分析数据和关键词分析数据,选取在每个时间段出现频率较高的七个关键词"态度"、"召回"、"苹果"、"中国"、"华为"、"消费者"和"产品",与每天的情感综合分做相关分析.
表4是进行Pearson相关分析的结果.
Table4.
Correlationanalysis表4.
相关分析关键词态度关键词召回关键词苹果关键词中国关键词华为关键词消费者关键词产品情感综合分情感综合分PearsonCorrelation0.
491*0.
499*0.
602**0.
507*0.
491*0.
716**0.
2661Sig.
(2-tailed)0.
0150.
0130.
0020.
0110.
0150.
0000.
208**.
CorrelationisSignificantatthe0.
01level(2-tailed).
*.
CorrelationisSignificantatthe0.
05level(2-tailed).
在进行相关分析后,情感综合分分别与关键词"态度"、"召回"、"苹果"、"中国"、"华为"、"消费者"的双侧检验值Sig都小于0.
05,通过显著性检验,且皆为负相关.
其中,关键词"苹果"、"消费者"与情感综合分与的相关程度最大,前者相关系数在0.
05的置信水平下为0.
602,后者为0.
716.
但是,关键词"产品"没通过与情感综合分的相关性的显著性检验,因此做情感综合分为因变量的回归分析,只能选取关键词"态度"、"召回"、"苹果"、"中国"、"华为"和"消费者"为自变量做多元线性回归分析.
在进行数据预处理的时候,发现回归分析系数表中系数Sig值小于0.
05,但是得出的系数却为0,是因为系数只保留小数点后三位,于是将数据中的情感综合分数值扩大100倍.
表5是进行回归分析的结果.
在回归分析中,首先,拟合优度R(goodnessoffit)调整之前为0.
688,表明自变量可以解释因变量68.
8%的变化,拟合效应比较好.
其次,Sig值为0,小于0.
05,说明通过了显著性检验.
最后,表5显示只有五个自变量即关键词"态度"、"苹果"、"中国"、"华为"和"消费者"的Sig值都小于0.
05,通过t检验,而关键词"召回"的Sig值大于0.
05,未能通过显著性检验,因此不能列入回归方程.
通过看Beta数值的大小,得知各个自变量的系数大小.
下面是通过回归分析得到的线性回归方程,F表示"情感综合分",Wt表示关键词"态度",Wp表示关键词"苹果",Wz表示关键词"中国",Wh表示关键词"华为",Wx表示关键词"消费者":吴昊等DOI:10.
12677/mm.
2019.
9100657现代管理Table5.
Regressionanalysiscoefficienttable表5.
回归分析系数表ModelUnstandardizedCoefficientsStandardizedCoefficientstSig.
BStd.
ErrorBeta1(Constant)49.
6910.
59982.
9520.
000关键词态度0.
0300.
0140.
3242.
1660.
025关键词召回0.
0010.
0070.
0320.
1720.
065关键词苹果0.
0160.
0440.
0920.
3720.
015关键词中国0.
0340.
0280.
2111.
2280.
036关键词华为0.
1190.
0470.
4802.
5310.
022关键词消费者0.
0240.
0120.
4472.
0700.
034a.
DependentVariable:情感综合分.
49.
6910.
0300.
0160.
0340.
1190.
024FWtWpWzWhWx1)线性回归方程(1)表明,首先两个社区的网友对S公司处理这次手机电池爆炸事件的态度越关注,则对S公司的情感态度越消极;其次对S手机的竞争对手"苹果"和"华为"讨论度越高,对S公司的负面情感越多;再其次,"中国"字眼的关注程度也影响着网络舆情对S公司向不利的方向发展;最后,网友关注"消费者"越多也导致S手机消极情感的产生,但是影响低于前几者.
4.
结语论文以S手机电池爆炸为案例分析,综合了两个社区的评论数据,运用情感分析、关键词分析和回归分析的分析方法,得到了大众对此次事件的情感态度自始至终皆为消极的结论,说明S公司对这次危机的公关效果不尽人意,甚至导致了S手机被迫淡出中国市场的严重后果.
在此次企业危机公关过程中,还得出以下结论:首先,当事件开始发生时,是S公司进行干预的绝好时机,但是S公司在国外召回S手机而在中国继续销售,从而发生更多爆炸事件,导致这起危机事件在2016年9月、10月开始发酵.
所以当危机事件发生时,企业要迅速找到问题根源,并做出反应;其次,当事件开始发酵的时候,即引起社会大众广泛关注时,S公司竟然和消费者硬碰硬,甚至起诉消费者,导致这次危机事件愈演愈烈.
企业在面对事件开始发酵时,应迅速把握舆论对危机事件的关注点,对事件处理的痛点和难点予以最真诚和积极的回应;再其次,当危机全面爆发的时候,S公司的公关行为石沉大海,社交网络上的网络舆情已经呈现"一边倒"的态势,S手机短时间内在中国市场上已很难取得销售佳绩,华为、苹果等品牌受到更多关注.
此时,企业需要顶住压力迎难而上,敢于承担危机带来的后果,尊重消费者,化危机为契机.
最后,S公司真诚地与消费者交流,公布电池爆炸的真实原因是值得肯定的,但是"S手机"在消费者心中已经和"电池爆炸"紧紧联系在一起了.
当危机变成"危难"时,外部环境已经束手无策,只能管理好公司的内部,以期平稳度过此次危机.
文章的不足之处有两点,一是基于社区的评论数据的研究,但是没有收集发表评论的用户数据,二是对于不同的数据源没有区分研究.
未来的研究可收集多类别的数据,分析不同类人群的正面或负面情绪,寻找意见领袖.
吴昊等DOI:10.
12677/mm.
2019.
9100658现代管理参考文献[1]Zheng,B.
,Liu,H.
andDavison,R.
M.
(2018)ExploringtheRelationshipbetweenCorporateReputationandthePub-lic'sCrisisCommunicationonSocialMedia.
PublicRelationsReview,44,56-64.
[2]Fan,K.
andPedrycz,W.
(2016)OpinionEvolutionInfluencedbyInformedAgents.
PhysicaA:StatisticalMechanicsandItsApplications,462,431-441.
[3]Lian,Y.
,Dong,X.
andLiu,Y.
(2017)TopologicalEvolutionoftheInternetPublicOpinion.
PhysicaA:StatisticalMechanicsandItsApplications,486,567-578.
[4]Liu,D.
,Wang,W.
andLi,H.
(2013)EvolutionaryMechanismandInformationSupervisionofPublicOpinionsinIn-ternetEmergency.
ProcediaComputerScience,17,973-980.
[5]靳明,张英.
肯德基速生鸡事件危机公关广告与公众态度变化——基于新浪微博的内容分析[J].
财经论丛,2014(8):70-77.
[6]孙彩,张剑英,李煜华.
企业危机公关若干问题探讨[J].
工业技术经济,2004,23(1):24-25.
[7]何跃,朱灿.
基于微博的意见领袖网情感特征分析——以"非法疫苗"事件为例[J].
数据分析与知识发现,2017(9):65-73.
[8]李立耀,孙鲁敬,杨家海.
社交网络研究综述[J].
计算机科学,2015,42(11):8-21.
[9]戴杏云,张柳,戴伟辉,等.
社交网络的情感图谱研究[J].
管理评论,2016,28(8):79-86.
[10]万源.
基于语义统计分析的网络舆情挖掘技术研究[D]:[博士学位论文].
武汉:武汉理工大学,2012.
[11]林敏.
网络舆情:影响因素及其作用机制研究[D]:[博士学位论文].
杭州:浙江大学,2013.
知网检索的两种方式:1.
打开知网页面http://kns.
cnki.
net/kns/brief/result.
aspxdbPrefix=WWJD下拉列表框选择:[ISSN],输入期刊ISSN:2160-7311,即可查询2.
打开知网首页http://cnki.
net/左侧"国际文献总库"进入,输入文章标题,即可查询投稿请点击:http://www.
hanspub.
org/Submission.
aspx期刊邮箱:mm@hanspub.
org

HostYun 新增美国三网CN2 GIA VPS主机 采用美国原生IP低至月15元

在之前几个月中也有陆续提到两次HostYun主机商,这个商家前身是我们可能有些网友熟悉的主机分享团队的,后来改名称的。目前这个品牌主营低价便宜VPS主机,这次有可以看到推出廉价版本的美国CN2 GIA VPS主机,月费地址15元,适合有需要入门级且需要便宜的用户。第一、廉价版美国CN2 GIA VPS主机方案我们可看到这个类型的VPS目前三网都走CN2 GIA网络,而且是原生IP。根据信息可能后续...

百星数据(60元/月,600元/年)日本/韩国/香港cn2 gia云服务器,2核2G/40G/5M带宽

百星数据(baixidc),2012年开始运作至今,主要提供境外自营云服务器和独立服务器出租业务,根据网络线路的不同划分为:美国cera 9929、美国cn2 gia、香港cn2 gia、韩国cn2 gia、日本cn2 gia等云服务器及物理服务器业务。目前,百星数据 推出的日本、韩国、香港cn2 gia云服务器,2核2G/40G/5M带宽低至60元/月,600元/年。百星数据优惠码:优惠码:30...

创梦网络-江苏宿迁BGP云服务器100G高防资源,全程ceph集群存储,安全可靠,数据有保证,防护真实,现在购买7折促销,续费同价!

官方网站:点击访问创梦网络宿迁BGP高防活动方案:机房CPU内存硬盘带宽IP防护流量原价活动价开通方式宿迁BGP4vCPU4G40G+50G20Mbps1个100G不限流量299元/月 209.3元/月点击自助购买成都电信优化线路8vCPU8G40G+50G20Mbps1个100G不限流量399元/月 279.3元/月点击自助购买成都电信优化线路8vCPU16G40G+50G2...

爬虫代理为你推荐
mediawikimediawiki的乱码问题波音737起飞爆胎飞机会爆胎?特朗普吐槽iPhone为什么iphone x卖的这么好什么是支付宝支付宝是什么意思flashfxp下载求最新无需注册的FlashFXP下载地址面板flash阅读http客服电话中国移动的人工服务电话号码是多少温州商标注册温州注册商标需要注册公司吗pintang目前世界上最稀有、最珍贵的钱币是什么?
海外域名注册 香港vps 最便宜的vps cn域名个人注册 香港服务器99idc BWH 谷歌香港 名片模板psd 密码泄露 万网优惠券 网站被封 免费ftp站点 gg广告 太原联通测速平台 网站卫士 电信虚拟主机 上海电信测速 iki lamp什么意思 深圳域名 更多