页面提高网站在Google中的排名(二)网络毕业论

google排名  时间:2021-01-31  阅读:()

提高网站在Google中的排名二)网络毕业论

目录

一篇新闻页面中

一个页面中关键词命中权重链入文字>HTML标题文字>HTML页面主体内容>>出链文字

正文

提高网站在Google中的排名二)

如何突出关键词面向主题(Theme)的关键词匹配

ThemeEngine正在逐步超过PR成为结果排序中更主要的因素可以比较一下以下现象

为什么查“新闻”  “汽车”之类的文字各种门户网站的首页不在第一位要知道他们的页面中都有相应频道的链接文字的

一篇新闻页面中搜索引擎如何不通过模板匹配 自动将新闻的主体和页面中的页头栏目导航条页尾等部分的内容区分开的

其实以上问题都可以归结为网页内容摘要的提取策略和关键词在其中的命中

首先将能够描述一个页面内容的分成以下几种类型

链入文字描述 inboundl inktexthttp:terms-inbound-link. shtml

HTML页面标题 t i t l e好标题一般会将页面中最重要的关键词放在最前面 比如 AB C-10型吸尘器-XX家电城

HTML内容主体 contenttext

链出文字 outboundl inktext

如果按照以下规则

一个页面中关键词命中权重链入文字>H TML标题文字>H TML页面主体内容>>出链文字 以上现象就比较好解释了。

链入文字是页面上看不见的但链入文字对被链接页面有巨大的作用在现代搜索引擎在关键词匹配的过程中匹配的过程不只看当前页面的内容摘要很大程度上不只看这个网页自己说自己有什么内

容还要看别人如何链接时如何描述你的网站别人怎么称呼你 比你自己说自己更重要。

比如查 “世界卫生组织” 返回结果中有http:而这个页面中是没有中文的之所以能匹配上是因为很多链接它的中文网站使用了世界卫生组织所以这个页面中不存在的中文关键词也成为了页面摘要的一部分。这样一想就可以知道链出链接的文字其实是为被链接的子频道首页或者内容详情页服务的。对自身页面的关键词密度只有负面的影响这也是Google建议一个页面中链接不要超过100个的原因他根本不索引100个链接以后的内容。按照以上规则搜索引擎将一篇新闻详情页中的新闻内容提取出来就是把页面上所有带HTTP链接的文字都去掉就是新闻的内容部分了更精确一些可以通过取最长文本段落等策略实现而很多网站首页或频道首页中几乎全部都是链接经过搜索引擎分析的结果就是什么内容也没有能够被命中的关键词仅仅是别人链接你用的“网站首页”和频道标题Title中的站点名称等的几个关键词而页面中其他的文字则远远不如相应子频道和具体内容页面的匹配度高而搜索引擎能够通过以上规则让用户更快的直接定位到有具体内容的内容详情页面。因此希望通过一个首页尽可能多的命中所有希望推广的关键词是不可能的。让网页尽可能多的进入搜索引擎的索引然后把握好整个网站的主题风格是非常重要的让网站的主题关键词能够比较均匀的按照金字塔模式分布到网站中可以参考 网站的主题金字塔设计网站名称用户通过12个抽象关键词

子频道1子频道2 用户通过23个关键词命中

产品1产品2文章1文章2(用户通过34个关键词命中这种用户最有价值)

不要空着标题空着无异于浪费了最有价值的一块阵地

传统的页面中 HTML页面中会有类似以下的隐含信息用于说明当前网页的主要内容关键字

后来由于这种人工添加关键词的方式被滥用大量网页中为了提高被搜索引擎命中的概率经常添加一些和实际网页内容无关的热门关键比如 “mus icmp3download”等所以新一代的搜索引擎已经不再关心页面头文件中的人工metakeyword声明而页面标题在搜索引擎的关键词的命中命中过程中往往有着更高的比重如果一个关键词在标题中命中会比在页面中命中有更高的得分从而在相应的搜索结果排名中更靠前。

标题长度和内容不要过长一般在40个字符以内并充分突出关键词的比重

如果更长的标题搜索引擎一般会忽略掉所以要尽可能将主要关键词放在标题靠前的位置。省略掉不必要的形容词吧毕竟用户主要通

过名词来找到需要的内容。标题内容尽量用一些别人可以通过关键词找到的字眼也别太过头如果标题中的字眼超过1半内容中都没有有可能被搜索引擎排除出索引  因此基于web日志中来自其他搜索引擎的关键词查询统计非常必要。

如果网页很多的话尽量使用不同的网页标题争取让自己网站的内容更多的进入搜索引擎索引范围

因为搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围http:phpMan.php是我的网站上的一个小应用一个web界面的unix命令手册manpage 在以前的设计中所有动态页面使用的都是同样的标题 "phpMan:manpage/perldoc/infopagewebinterface"Google索引了大约3000多个页面后来我将页面标题改成了

"phpMan: [命令名]"这样的格式 比如 "phpMan:l s"这样大部分动态页面的标题就都不一样了一个月后Google从这个页面入口索引了大约6000个页面。因此如果网站中很多网页都使用相同的标题 比如 “新闻频道”  “论坛” 这些页面中很大一部分就会被排重机制忽略掉。

除了外还可以用标题行突出内容主题加强标题的效果

在我的网站设计中我会把用[标题]这样的模板把标题突出显示而不是通过改变字体的方式突出标题。

其他网站设计提示

静态链接 Blog网站另外一个优势在于其网页是静态链接动态网页占到整个互联网内容的90以上。各个搜索引擎其实能够表现的都只不过是互联网的冰山一角(3-5%) 不同的只是谁让优质网页排名靠前的策略更优秀而已大部分搜索引擎都认为静态链接的网页是优质网页 Google在优先抓取索引的网页中70%以上是不带参数链接的静态网页。而且即使同样的内容静态网页也会比动态网页权重高很容易理解 query?a=1&b=2这样的链接由于参数顺序颠倒的query?b=2&a=1完全相同。尽量使用静态网页 目前能够动态网页进行全面的索引还比较难而即使是Google也更不会索引所有的内容 因此很少会对参数超过2个的动态网页进行进一步的抓取和分析。 以下是一个phpBB论坛页面返回的HTTP头信息 科教范文网

HTTP/1. 1200OKDate:Wed

28Jan200412:58:54GMTServer:Apache/(Unix)mod_gzip/. 1aPHP/-Powered-By:PHP/-

Cookie:phpBB_data=a%3A0%3A%7B%7D;expires=Thu 27-Jan-

200512:58:54GMT;path=/;Set-

Cookie:phpBB_sid=09f67a83ee108ecbf 11e35bb6f36fcec;path=/;Content-Encoding:gzipCache-Control:private pre-check=0 post-check=0 max-age=0Expires:0Pragma:no-cacheConnection:closeContent-Type:text/html

为了避免隐私问题 Googlebot可以通过对页面httpheader中的sessionid和sessioncookie进行一些甄别这样很多需要认证信息的论坛内容就无法进入索引了。

总体上说Google喜欢新的静态的内容。因此无论从效率上讲还是方便搜索引擎收录使用内容发布系统将网站内容发布成静态网页都是非常必要的从某种程度上说googlefriendly=anonymouscachefriendly。

比如http:phpMan.php/maintro/3http:phpMan.php?mode=man&;parameter=intro&section=3这样的链接更容易进入搜索引擎的索引。而且在URL中的命中也能突出关键词。

能够进入Google索引的页面数量越多越好。用类似以下的脚本可以统计自己的网站被搜索引擎索引的情况。

#!/b ihYESTERDAY=`date-dyesterday+%Y%m%d`#forFreeBSD:YESTERDAY=`date-v-

1 d+%Y%m%d`LOG_FILE='/home/apache/logs/access_log'grep-iGooglebot$LOG_FILE. $YESTERDAY|awk' {print$7} ' |sort|uni q-c|sort-rn>spide$-ibai duspider$LOG_FILE. $YESTERDAY|awk' {print$7} ' | sort|uniq-c|sort-rn>spide$-imsnbot$LOG_FILE. $YESTERDAY|awk' {print$7} ' |sort|uni q-c|sort-

rn>spide$-i inktomi$LOG_FILE. $YESTERDAY|awk' {pr int$7} ' |sort|un iq-c|sort-rn>spide$-i openbot$LOG_FILE. $YESTERDAY|awk' {pr int$7} ' |sort|uniq-c|sort-rn>spide$

LOCVPS洛杉矶CN2线路KVM上线,洛杉矶/香港云地/香港邦联7折

LOCVPS发来了新的洛杉矶CN2线路主机上线通知,基于KVM架构,目前可与香港云地、香港邦联机房XEN架构主机一起适用7折优惠码,优惠后最低美国洛杉矶CN2线路KVM架构2GB内存套餐月付38.5元起。LOCPVS是一家成立较早的国人VPS服务商,目前提供洛杉矶MC、洛杉矶C3、和香港邦联、香港沙田电信、香港大埔、日本东京、日本大阪、新加坡、德国和荷兰等机房VPS主机,基于KVM或者XEN架构。...

Hosteons:新上1Gbps带宽KVM主机$21/年起,AMD Ryzen CPU+NVMe高性能主机$24/年起_韩国便宜服务器

我们在去年12月分享过Hosteons新上AMD Ryzen9 3900X CPU及DDR4内存、NVMe硬盘的高性能VPS产品的消息,目前商家再次发布了产品更新信息,暂停新开100M带宽KVM套餐,新订单转而升级为新的Budget KVM VPS(SSD)系列,带宽为1Gbps端口,且配置大幅升级,目前100M带宽仅保留OpenVZ架构产品可新订购,所有原有主机不变,用户一直续费一直可用。Bud...

SugarHosts糖果主机圣诞节促销 美国/香港虚拟主机低至6折

SugarHosts 糖果主机商我们算是比较熟悉的,早年学会建站的时候开始就用的糖果虚拟主机,目前他们家还算是为数不多提供虚拟主机的商家,有提供香港、美国、德国等虚拟主机机房。香港机房CN2速度比较快,美国机房有提供优化线路和普通线路适合外贸业务。德国欧洲机房适合欧洲业务的虚拟主机。糖果主机商一般是不会发布黑五活动的,他们在圣圣诞节促销活动是有的,我们看到糖果主机商发布的圣诞节促销虚拟主机低至6折...

google排名为你推荐
华为p40和mate30哪个好Huawei Mate30 和 P40 哪个好?手动挡和自动挡哪个好手动挡和自动挡哪个好石英表和机械表哪个好石英表好还是机械表好?炒股软件哪个好网上买卖股票软件哪个好用海克斯皮肤哪个好LOL用100块是抽海克斯好还是抽蛮王的生化领主的活动还是直接买皮肤好云盘哪个好云盘有哪些,哪个云盘好360云盘下载下载一个360云盘,怎么下载360云网盘下载360云盘怎么下载和移走以前的文件?诛仙青云志360云盘资源诛仙青云志百全集百度云资源月抛隐形眼镜价格海昌月抛隐形眼镜要多少钱?
香港vps主机 花生壳域名贝锐 Dedicated mediafire xfce 服务器cpu性能排行 日本空间 免费个人空间申请 谁的qq空间最好看 idc是什么 重庆双线服务器托管 空间登陆首页 秒杀品 塔式服务器 西部数码主机 电信测速器在线测网速 linuxvi命令 泥瓦工 主机系统 win7配置web服务器 更多