页面提高网站在Google中的排名(二)网络毕业论

google排名  时间:2021-01-31  阅读:()

提高网站在Google中的排名二)网络毕业论

目录

一篇新闻页面中

一个页面中关键词命中权重链入文字>HTML标题文字>HTML页面主体内容>>出链文字

正文

提高网站在Google中的排名二)

如何突出关键词面向主题(Theme)的关键词匹配

ThemeEngine正在逐步超过PR成为结果排序中更主要的因素可以比较一下以下现象

为什么查“新闻”  “汽车”之类的文字各种门户网站的首页不在第一位要知道他们的页面中都有相应频道的链接文字的

一篇新闻页面中搜索引擎如何不通过模板匹配 自动将新闻的主体和页面中的页头栏目导航条页尾等部分的内容区分开的

其实以上问题都可以归结为网页内容摘要的提取策略和关键词在其中的命中

首先将能够描述一个页面内容的分成以下几种类型

链入文字描述 inboundl inktexthttp:terms-inbound-link. shtml

HTML页面标题 t i t l e好标题一般会将页面中最重要的关键词放在最前面 比如 AB C-10型吸尘器-XX家电城

HTML内容主体 contenttext

链出文字 outboundl inktext

如果按照以下规则

一个页面中关键词命中权重链入文字>H TML标题文字>H TML页面主体内容>>出链文字 以上现象就比较好解释了。

链入文字是页面上看不见的但链入文字对被链接页面有巨大的作用在现代搜索引擎在关键词匹配的过程中匹配的过程不只看当前页面的内容摘要很大程度上不只看这个网页自己说自己有什么内

容还要看别人如何链接时如何描述你的网站别人怎么称呼你 比你自己说自己更重要。

比如查 “世界卫生组织” 返回结果中有http:而这个页面中是没有中文的之所以能匹配上是因为很多链接它的中文网站使用了世界卫生组织所以这个页面中不存在的中文关键词也成为了页面摘要的一部分。这样一想就可以知道链出链接的文字其实是为被链接的子频道首页或者内容详情页服务的。对自身页面的关键词密度只有负面的影响这也是Google建议一个页面中链接不要超过100个的原因他根本不索引100个链接以后的内容。按照以上规则搜索引擎将一篇新闻详情页中的新闻内容提取出来就是把页面上所有带HTTP链接的文字都去掉就是新闻的内容部分了更精确一些可以通过取最长文本段落等策略实现而很多网站首页或频道首页中几乎全部都是链接经过搜索引擎分析的结果就是什么内容也没有能够被命中的关键词仅仅是别人链接你用的“网站首页”和频道标题Title中的站点名称等的几个关键词而页面中其他的文字则远远不如相应子频道和具体内容页面的匹配度高而搜索引擎能够通过以上规则让用户更快的直接定位到有具体内容的内容详情页面。因此希望通过一个首页尽可能多的命中所有希望推广的关键词是不可能的。让网页尽可能多的进入搜索引擎的索引然后把握好整个网站的主题风格是非常重要的让网站的主题关键词能够比较均匀的按照金字塔模式分布到网站中可以参考 网站的主题金字塔设计网站名称用户通过12个抽象关键词

子频道1子频道2 用户通过23个关键词命中

产品1产品2文章1文章2(用户通过34个关键词命中这种用户最有价值)

不要空着标题空着无异于浪费了最有价值的一块阵地

传统的页面中 HTML页面中会有类似以下的隐含信息用于说明当前网页的主要内容关键字

后来由于这种人工添加关键词的方式被滥用大量网页中为了提高被搜索引擎命中的概率经常添加一些和实际网页内容无关的热门关键比如 “mus icmp3download”等所以新一代的搜索引擎已经不再关心页面头文件中的人工metakeyword声明而页面标题在搜索引擎的关键词的命中命中过程中往往有着更高的比重如果一个关键词在标题中命中会比在页面中命中有更高的得分从而在相应的搜索结果排名中更靠前。

标题长度和内容不要过长一般在40个字符以内并充分突出关键词的比重

如果更长的标题搜索引擎一般会忽略掉所以要尽可能将主要关键词放在标题靠前的位置。省略掉不必要的形容词吧毕竟用户主要通

过名词来找到需要的内容。标题内容尽量用一些别人可以通过关键词找到的字眼也别太过头如果标题中的字眼超过1半内容中都没有有可能被搜索引擎排除出索引  因此基于web日志中来自其他搜索引擎的关键词查询统计非常必要。

如果网页很多的话尽量使用不同的网页标题争取让自己网站的内容更多的进入搜索引擎索引范围

因为搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围http:phpMan.php是我的网站上的一个小应用一个web界面的unix命令手册manpage 在以前的设计中所有动态页面使用的都是同样的标题 "phpMan:manpage/perldoc/infopagewebinterface"Google索引了大约3000多个页面后来我将页面标题改成了

"phpMan: [命令名]"这样的格式 比如 "phpMan:l s"这样大部分动态页面的标题就都不一样了一个月后Google从这个页面入口索引了大约6000个页面。因此如果网站中很多网页都使用相同的标题 比如 “新闻频道”  “论坛” 这些页面中很大一部分就会被排重机制忽略掉。

除了外还可以用标题行突出内容主题加强标题的效果

在我的网站设计中我会把用[标题]这样的模板把标题突出显示而不是通过改变字体的方式突出标题。

其他网站设计提示

静态链接 Blog网站另外一个优势在于其网页是静态链接动态网页占到整个互联网内容的90以上。各个搜索引擎其实能够表现的都只不过是互联网的冰山一角(3-5%) 不同的只是谁让优质网页排名靠前的策略更优秀而已大部分搜索引擎都认为静态链接的网页是优质网页 Google在优先抓取索引的网页中70%以上是不带参数链接的静态网页。而且即使同样的内容静态网页也会比动态网页权重高很容易理解 query?a=1&b=2这样的链接由于参数顺序颠倒的query?b=2&a=1完全相同。尽量使用静态网页 目前能够动态网页进行全面的索引还比较难而即使是Google也更不会索引所有的内容 因此很少会对参数超过2个的动态网页进行进一步的抓取和分析。 以下是一个phpBB论坛页面返回的HTTP头信息 科教范文网

HTTP/1. 1200OKDate:Wed

28Jan200412:58:54GMTServer:Apache/(Unix)mod_gzip/. 1aPHP/-Powered-By:PHP/-

Cookie:phpBB_data=a%3A0%3A%7B%7D;expires=Thu 27-Jan-

200512:58:54GMT;path=/;Set-

Cookie:phpBB_sid=09f67a83ee108ecbf 11e35bb6f36fcec;path=/;Content-Encoding:gzipCache-Control:private pre-check=0 post-check=0 max-age=0Expires:0Pragma:no-cacheConnection:closeContent-Type:text/html

为了避免隐私问题 Googlebot可以通过对页面httpheader中的sessionid和sessioncookie进行一些甄别这样很多需要认证信息的论坛内容就无法进入索引了。

总体上说Google喜欢新的静态的内容。因此无论从效率上讲还是方便搜索引擎收录使用内容发布系统将网站内容发布成静态网页都是非常必要的从某种程度上说googlefriendly=anonymouscachefriendly。

比如http:phpMan.php/maintro/3http:phpMan.php?mode=man&;parameter=intro&section=3这样的链接更容易进入搜索引擎的索引。而且在URL中的命中也能突出关键词。

能够进入Google索引的页面数量越多越好。用类似以下的脚本可以统计自己的网站被搜索引擎索引的情况。

#!/b ihYESTERDAY=`date-dyesterday+%Y%m%d`#forFreeBSD:YESTERDAY=`date-v-

1 d+%Y%m%d`LOG_FILE='/home/apache/logs/access_log'grep-iGooglebot$LOG_FILE. $YESTERDAY|awk' {print$7} ' |sort|uni q-c|sort-rn>spide$-ibai duspider$LOG_FILE. $YESTERDAY|awk' {print$7} ' | sort|uniq-c|sort-rn>spide$-imsnbot$LOG_FILE. $YESTERDAY|awk' {print$7} ' |sort|uni q-c|sort-

rn>spide$-i inktomi$LOG_FILE. $YESTERDAY|awk' {pr int$7} ' |sort|un iq-c|sort-rn>spide$-i openbot$LOG_FILE. $YESTERDAY|awk' {pr int$7} ' |sort|uniq-c|sort-rn>spide$

美国云服务器 1核 1G 30M 50元/季 兆赫云

【双十二】兆赫云:全场vps季付六折优惠,低至50元/季,1H/1G/30M/20G数据盘/500G流量/洛杉矶联通9929商家简介:兆赫云是一家国人商家,成立2020年,主要业务是美西洛杉矶联通9929线路VPS,提供虚拟主机、VPS和独立服务器。VPS采用KVM虚拟架构,线路优质,延迟低,稳定性强。是不是觉得黑五折扣力度不够大?还在犹豫徘徊中?这次为了提前庆祝双十二,特价推出全场季付六折优惠。...

昔日数据月付12元起,湖北十堰机房10M带宽月付19元起

昔日数据怎么样?昔日数据是一个来自国内服务器销售商,成立于2020年底,主要销售国内海外云服务器,目前有国内湖北十堰云服务器和香港hkbn云服务器 采用KVM虚拟化技术构架,湖北十堰机房10M带宽月付19元起;香港HKBN,月付12元起; 此次夏日活动全部首月5折促销,有需要的可以关注一下。点击进入:昔日数据官方网站地址昔日数据优惠码:优惠码: XR2021 全场通用(活动持续半个月 2021/7...

Vinahost - 越南VPS主机商月6美元 季付以上赠送时长最多半年

Vinahost,这个主机商还是第一次介绍到,翻看商家的介绍信息,是一家成立于2008年的老牌越南主机商,业务涵盖网站设计、域名、SSL证书、电子邮箱、虚拟主机、越南VPS、云计算、越南服务器出租以及设备托管等,机房主要在越南胡志明市的Viettle和VNPT数据中心,其中VNPT数据中心对于国内是三网直连,速度优。类似很多海外主机商一样,希望拓展自己的业务,必须要降价优惠或者增加机房迎合需求用户...

google排名为你推荐
海贼王644海贼王645集是漫画的多少话手动挡和自动挡哪个好自动挡手动挡哪个好?朗逸和速腾哪个好买同等价位的朗逸和速腾哪个好?三国游戏哪个好玩三国系列的游戏哪个好玩?手机音乐播放器哪个好手机音乐播放器哪个好英语词典哪个好哪个英语词典好电陶炉和电磁炉哪个好电陶炉和电磁炉哪个好?主要是炒菜,爆炒。dnf魔枪士转职哪个好DNF魔枪士转职转哪个好 决战者征战者转职51空间登录51空间怎么进qq空间登录界面我的手机QQ打开应该是九个选项,什么空间,但是现在打开怎么直接是QQ登录界面,这个撇手机
韩国vps 便宜vps 过期域名抢注 互联网域名管理办法 GGC 主机点评 l5639 腾讯云数据库 网站保姆 ixwebhosting 免费ddos防火墙 个人域名 idc是什么 qq云端 服务器是干什么用的 百度云加速 lamp是什么意思 lamp架构 带宽测试 密钥索引 更多