页面提高网站在Google中的排名(二)网络毕业论

google排名  时间:2021-01-31  阅读:()

提高网站在Google中的排名二)网络毕业论

目录

一篇新闻页面中

一个页面中关键词命中权重链入文字>HTML标题文字>HTML页面主体内容>>出链文字

正文

提高网站在Google中的排名二)

如何突出关键词面向主题(Theme)的关键词匹配

ThemeEngine正在逐步超过PR成为结果排序中更主要的因素可以比较一下以下现象

为什么查“新闻”  “汽车”之类的文字各种门户网站的首页不在第一位要知道他们的页面中都有相应频道的链接文字的

一篇新闻页面中搜索引擎如何不通过模板匹配 自动将新闻的主体和页面中的页头栏目导航条页尾等部分的内容区分开的

其实以上问题都可以归结为网页内容摘要的提取策略和关键词在其中的命中

首先将能够描述一个页面内容的分成以下几种类型

链入文字描述 inboundl inktexthttp:terms-inbound-link. shtml

HTML页面标题 t i t l e好标题一般会将页面中最重要的关键词放在最前面 比如 AB C-10型吸尘器-XX家电城

HTML内容主体 contenttext

链出文字 outboundl inktext

如果按照以下规则

一个页面中关键词命中权重链入文字>H TML标题文字>H TML页面主体内容>>出链文字 以上现象就比较好解释了。

链入文字是页面上看不见的但链入文字对被链接页面有巨大的作用在现代搜索引擎在关键词匹配的过程中匹配的过程不只看当前页面的内容摘要很大程度上不只看这个网页自己说自己有什么内

容还要看别人如何链接时如何描述你的网站别人怎么称呼你 比你自己说自己更重要。

比如查 “世界卫生组织” 返回结果中有http:而这个页面中是没有中文的之所以能匹配上是因为很多链接它的中文网站使用了世界卫生组织所以这个页面中不存在的中文关键词也成为了页面摘要的一部分。这样一想就可以知道链出链接的文字其实是为被链接的子频道首页或者内容详情页服务的。对自身页面的关键词密度只有负面的影响这也是Google建议一个页面中链接不要超过100个的原因他根本不索引100个链接以后的内容。按照以上规则搜索引擎将一篇新闻详情页中的新闻内容提取出来就是把页面上所有带HTTP链接的文字都去掉就是新闻的内容部分了更精确一些可以通过取最长文本段落等策略实现而很多网站首页或频道首页中几乎全部都是链接经过搜索引擎分析的结果就是什么内容也没有能够被命中的关键词仅仅是别人链接你用的“网站首页”和频道标题Title中的站点名称等的几个关键词而页面中其他的文字则远远不如相应子频道和具体内容页面的匹配度高而搜索引擎能够通过以上规则让用户更快的直接定位到有具体内容的内容详情页面。因此希望通过一个首页尽可能多的命中所有希望推广的关键词是不可能的。让网页尽可能多的进入搜索引擎的索引然后把握好整个网站的主题风格是非常重要的让网站的主题关键词能够比较均匀的按照金字塔模式分布到网站中可以参考 网站的主题金字塔设计网站名称用户通过12个抽象关键词

子频道1子频道2 用户通过23个关键词命中

产品1产品2文章1文章2(用户通过34个关键词命中这种用户最有价值)

不要空着标题空着无异于浪费了最有价值的一块阵地

传统的页面中 HTML页面中会有类似以下的隐含信息用于说明当前网页的主要内容关键字

后来由于这种人工添加关键词的方式被滥用大量网页中为了提高被搜索引擎命中的概率经常添加一些和实际网页内容无关的热门关键比如 “mus icmp3download”等所以新一代的搜索引擎已经不再关心页面头文件中的人工metakeyword声明而页面标题在搜索引擎的关键词的命中命中过程中往往有着更高的比重如果一个关键词在标题中命中会比在页面中命中有更高的得分从而在相应的搜索结果排名中更靠前。

标题长度和内容不要过长一般在40个字符以内并充分突出关键词的比重

如果更长的标题搜索引擎一般会忽略掉所以要尽可能将主要关键词放在标题靠前的位置。省略掉不必要的形容词吧毕竟用户主要通

过名词来找到需要的内容。标题内容尽量用一些别人可以通过关键词找到的字眼也别太过头如果标题中的字眼超过1半内容中都没有有可能被搜索引擎排除出索引  因此基于web日志中来自其他搜索引擎的关键词查询统计非常必要。

如果网页很多的话尽量使用不同的网页标题争取让自己网站的内容更多的进入搜索引擎索引范围

因为搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围http:phpMan.php是我的网站上的一个小应用一个web界面的unix命令手册manpage 在以前的设计中所有动态页面使用的都是同样的标题 "phpMan:manpage/perldoc/infopagewebinterface"Google索引了大约3000多个页面后来我将页面标题改成了

"phpMan: [命令名]"这样的格式 比如 "phpMan:l s"这样大部分动态页面的标题就都不一样了一个月后Google从这个页面入口索引了大约6000个页面。因此如果网站中很多网页都使用相同的标题 比如 “新闻频道”  “论坛” 这些页面中很大一部分就会被排重机制忽略掉。

除了外还可以用标题行突出内容主题加强标题的效果

在我的网站设计中我会把用[标题]这样的模板把标题突出显示而不是通过改变字体的方式突出标题。

其他网站设计提示

静态链接 Blog网站另外一个优势在于其网页是静态链接动态网页占到整个互联网内容的90以上。各个搜索引擎其实能够表现的都只不过是互联网的冰山一角(3-5%) 不同的只是谁让优质网页排名靠前的策略更优秀而已大部分搜索引擎都认为静态链接的网页是优质网页 Google在优先抓取索引的网页中70%以上是不带参数链接的静态网页。而且即使同样的内容静态网页也会比动态网页权重高很容易理解 query?a=1&b=2这样的链接由于参数顺序颠倒的query?b=2&a=1完全相同。尽量使用静态网页 目前能够动态网页进行全面的索引还比较难而即使是Google也更不会索引所有的内容 因此很少会对参数超过2个的动态网页进行进一步的抓取和分析。 以下是一个phpBB论坛页面返回的HTTP头信息 科教范文网

HTTP/1. 1200OKDate:Wed

28Jan200412:58:54GMTServer:Apache/(Unix)mod_gzip/. 1aPHP/-Powered-By:PHP/-

Cookie:phpBB_data=a%3A0%3A%7B%7D;expires=Thu 27-Jan-

200512:58:54GMT;path=/;Set-

Cookie:phpBB_sid=09f67a83ee108ecbf 11e35bb6f36fcec;path=/;Content-Encoding:gzipCache-Control:private pre-check=0 post-check=0 max-age=0Expires:0Pragma:no-cacheConnection:closeContent-Type:text/html

为了避免隐私问题 Googlebot可以通过对页面httpheader中的sessionid和sessioncookie进行一些甄别这样很多需要认证信息的论坛内容就无法进入索引了。

总体上说Google喜欢新的静态的内容。因此无论从效率上讲还是方便搜索引擎收录使用内容发布系统将网站内容发布成静态网页都是非常必要的从某种程度上说googlefriendly=anonymouscachefriendly。

比如http:phpMan.php/maintro/3http:phpMan.php?mode=man&;parameter=intro&section=3这样的链接更容易进入搜索引擎的索引。而且在URL中的命中也能突出关键词。

能够进入Google索引的页面数量越多越好。用类似以下的脚本可以统计自己的网站被搜索引擎索引的情况。

#!/b ihYESTERDAY=`date-dyesterday+%Y%m%d`#forFreeBSD:YESTERDAY=`date-v-

1 d+%Y%m%d`LOG_FILE='/home/apache/logs/access_log'grep-iGooglebot$LOG_FILE. $YESTERDAY|awk' {print$7} ' |sort|uni q-c|sort-rn>spide$-ibai duspider$LOG_FILE. $YESTERDAY|awk' {print$7} ' | sort|uniq-c|sort-rn>spide$-imsnbot$LOG_FILE. $YESTERDAY|awk' {print$7} ' |sort|uni q-c|sort-

rn>spide$-i inktomi$LOG_FILE. $YESTERDAY|awk' {pr int$7} ' |sort|un iq-c|sort-rn>spide$-i openbot$LOG_FILE. $YESTERDAY|awk' {pr int$7} ' |sort|uniq-c|sort-rn>spide$

DMIT:美国cn2 gia线路vps,高性能 AMD EPYC/不限流量(Premium Unmetered),$179.99/月起

DMIT怎么样?DMIT最近动作频繁,前几天刚刚上架了日本lite版VPS,正在酝酿上线日本高级网络VPS,又差不多在同一时间推出了美国cn2 gia线路不限流量的美国云服务器,不过价格太过昂贵。丐版只有30M带宽,月付179.99美元 !!目前,美国云服务器已经有个4个套餐,分别是,Premium(cn2 gia线路)、Lite(普通直连)、Premium Secure(带高防的cn2 gia线...

NameCheap黑色星期五和网络礼拜一

如果我们较早关注NameCheap商家的朋友应该记得前几年商家黑色星期五和网络星期一的时候大促采用的闪购活动,每一个小时轮番变化一次促销活动而且限量的。那时候会导致拥挤官网打不开迟缓的问题。从去年开始,包括今年,NameCheap商家比较直接的告诉你黑色星期五和网络星期一为期6天的活动。没有给你限量的活动,只有限时六天,这个是到11月29日。如果我们有需要新注册、转入域名的可以参加,优惠力度还是比...

创梦网络-四川一手资源高防大带宽云服务器,物理机租用,机柜资源,自建防火墙,雅安最高单机700G防护,四川联通1G大带宽8.3W/年,无视UDP攻击,免费防CC

? ? ? ?创梦网络怎么样,创梦网络公司位于四川省达州市,属于四川本地企业,资质齐全,IDC/ISP均有,从创梦网络这边租的服务器均可以****,属于一手资源,高防机柜、大带宽、高防IP业务,另外创梦网络近期还会上线四川联通大带宽,四川联通高防IP,一手整CIP段,四川电信,联通高防机柜,CN2专线相关业务。成都优化线路,机柜租用、服务器云服务器租用,适合建站做游戏,不须要在套CDN,全国访问快...

google排名为你推荐
软银支付烧钱,玩家多,生态复杂,印度的移动支付大战有多火爆视频制作软件哪个好我想学做视频跟作图,推荐下什么软件好锦天城和君合哪个好记忆棉和乳胶哪个好手机浏览器哪个好手机上的浏览器哪个比较好?三国游戏哪个好玩三国游戏哪个最好玩手机炒股软件哪个好什么手机炒股软件好用,你们都用哪个海克斯皮肤哪个好lol100块抽11次的海克斯宝箱值得买吗清理手机垃圾软件哪个好清理手机垃圾的软件哪个好群空间登录群空间无法正常登陆的问题qq空间登录不上为什么我的qq空间登不上去
淘宝虚拟主机 便宜域名注册 合租服务器 krypt arvixe softlayer winhost 512m godaddy域名优惠码 太原联通测速平台 softbank邮箱 200g硬盘 最好的免费空间 169邮箱 国外代理服务器软件 idc查询 raid10 web应用服务器 cdn网站加速 注册阿里云邮箱 更多