PageRank算法研究现状与展望
摘要为了能使用户在Inte rnet海量的信息中准确的找到需要的资源 Web挖掘这项新技术出现了。而PageRank算法就是在这种背景下产生的。它是基于Web超链接结构分析算法最成功的代表之一 已经成功的运用在了实际系统中。但同时PageRank算法也有一定的局限性和不足之处。本文讨论了PageRank算法的背景、算法原理及其主要的缺陷。
关键词 P age Rank算法 Web结构 超链接
1.引言
随着Inter ne t的飞速发展Web上的信息量也以惊人的速度增长人们也越来越多的在Interne t上发布和获取信息万维网已经成为资料共享和信息交流的最大平台。那么一个很突出的问题就出现了如何在互联网中海量的资源中迅速、准确的找到自己所需的信息而Web挖掘这项新技术就是为了解决这一难题的。Web挖掘技术是数据挖掘技术和Inte rnet技术的结合是当今计算机研究领域的新热点。
2.经典的Web结构分析算法
传统的互联网应用技术大多是基于文档内容的业界对互联网搜索功能的理解是某个关键词在一个文档中出现的频率越高该文档在搜索结果中的排列位置就要越显著。这种做法都是忽略了互联网包含而传统数据环境没有的另一种丰富信息互联网的超链接拓扑结构。所谓的超链接就是指从一个网页指向另一个目标的连接关系。另一个目标可以是其它网页也可以是本网页其它位置。假设网页A有一条超链接指向网页B那么我们就认为网页A的创建者判定网页B包含了有价值的信息。因此充分利用互联网间的链接结构信息对互联网的搜索具有重大意义。
基于超链接的分析方法 Page Rank、HI TS、 SALSA等算法应运而生。其中不少算法已经在实际系统中使用并取得了良好的效果而PageRank算法就是其中应用最广泛的一个。
3.PageRank算法原理
PageRank算法是Google创始人Sergey Brin和Lwarence Page于1998年提出来的它是基于Web超链接结构分析的算法中最成功的代表也是评鉴网页权威性的重要工具。
PageRank算法借鉴了传统的情报检索理论中的引文分析方法。核心思想就是 当网页A存在一条超链接指向网页B时就理解为“网页A向网页B投了一票”网页B的重要级数就得到增加。PageRank算法还认为网页B的重要性不
CloudCone的[2021 Flash Sale]活动仍在继续,针对独立服务器、VPS或者Hosted email,其中VPS主机基于KVM架构,最低每月1.99美元,支持7天退款到账户,可使用PayPal或者支付宝付款,先充值后下单的方式。这是一家成立于2017年的国外VPS主机商,提供独立服务器租用和VPS主机,其中VPS基于KVM架构,多个不同系列,也经常提供一些促销套餐,数据中心在洛杉...
捷锐数据官网商家介绍捷锐数据怎么样?捷锐数据好不好?捷锐数据是成立于2018年一家国人IDC商家,早期其主营虚拟主机CDN,现在主要有香港云服、国内物理机、腾讯轻量云代理、阿里轻量云代理,自营香港为CN2+BGP线路,采用KVM虚拟化而且单IP提供10G流量清洗并且免费配备天机盾可达到屏蔽UDP以及无视CC效果。这次捷锐数据给大家带来的活动是香港云促销,总共放量40台点击进入捷锐数据官网优惠活动内...
spinservers美国圣何塞机房的独立服务器补货120台,默认接入10Gbps带宽,给你超高配置,这价格目前来看好像真的是无敌手,而且可以做到下单后30分钟内交货,都是预先部署好了的。每一台机器用户都可以在后台自行安装、重装、重启、关机操作,无需人工参与! 官方网站:https://www.spinservers.com 比特币、信用卡、PayPal、支付宝、webmoney、Payssi...