搜索引擎英文搜索引擎

英文搜索引擎  时间:2021-05-21  阅读:()
第28卷收稿日期院2016-03-03作者简介院闫红兵袁张家口市科学技术信息研究所遥DOI院10.
13998/j.
cnki.
issn1002-1248.
2016.
08.
039农业图书情报学刊第28卷第8期灾燥造援28熏晕燥援8允燥怎则灶葬造燥枣蕴蚤遭则葬则赠葬灶凿陨灶枣燥则皂葬贼蚤燥灶杂糟蚤藻灶糟藻泽蚤灶粤早则蚤糟怎造贼怎则藻圆园16年8月Aug.
圆园16搜索引擎及其网络信息检索技巧闫红兵渊张家口市科学技术信息研究所袁河北张家口075000冤摘要院通过对搜索引擎的工作原理尧分类及其特点的分析研究袁对运用搜索引擎进行网络信息检索技巧作出总结袁为人们快速准确的检索网络信息提供参考遥关键词院搜索引擎尧网络信息尧信息检索技巧尧信息检索中图分类号院G250.
7文献标识码院A文章编号院1002-1248渊2016冤08-0164-04YANHong-bing(ScientificandTechnologicalInformationInstituteofZhangjiakou,Zhangjiakou075000,China)Throughtheanalysisontheoperationalprinciple,classificationandcharacteristicsofsearchengine,thispapersum-marizedthenetworkinformationretrievaltechniquesviasearchengine,soastoprovidereferenceforpeopletore-trievenetworkinformationfastandaccurately.
Searchengine;Networkinformation;Informationretrievaltechnique;informationretrieval搜索引擎是当前网络重要的信息检索工具袁熟悉搜索引擎的工作原理尧分类尧功能特点袁以及掌握其网络信息检索技巧袁对人们快速准确的查找到所需的信息是十分重要的遥1搜索引擎的工作原理每个搜索引擎都有自己的网页抓取程序要要要爬虫Spider袁搜索引擎工作时袁网页抓取程序沿着网页中的超链接袁逐个爬行每个网站袁通过超链接分析连续访问抓取更多的网页[1]遥搜索引擎抓到网页后还要进行大量的运算才能提供检索服务袁其中最重要的就是提取关键词建立索引库和索引袁还要进行一些特殊算法如分词渊中文冤尧关键词出现的位置尧频次尧计算各网页的相关度尧去除重复网页等一系列计算袁然后按相关度高低排序返回给用户遥最后根据用户输入的检索词袁搜索引擎从索引数据库中找到与该关键词匹配的网页袁反馈给用户遥包括提供网页的标题尧URL尧简短的网摘等内容[2]遥2搜索引擎的分类及其工作特点根据工作方式袁搜索引擎主要分为四种类型袁分别是目录搜索引擎袁全文搜索引擎袁元搜索引擎袁垂直搜索引擎遥2.
1目录搜索引擎的工作原理及特点目录搜索引擎是搜索引擎技术和目录索引技术的结合袁它是一种按目录分类的网站链接列表遥目录编辑人员通过对网络资源搜集整理袁按照一定的判断标准和规则袁将网站分门别类的分配在相关分类主题目录的不同层次目录下袁从而建立的网站链接数据库遥由于目录搜索引擎集合搜索引擎技术和目录索引技术袁用户检索时袁可以通过选择关键词查询袁也可以按目录分类进行查询遥如果选择关键词查询袁目录搜索引擎将根据信息关联度对数据库中的网站排序袁并将结果返回给用户遥如果按分类目录查询袁目录搜索引擎将按标题字母的先后顺序对数据库中的网站进行排序袁向用户呈现查询结果[3]遥目录搜索是对指定网站的某一目录下进行搜索袁而且加入了人工智能袁所以信息准确袁导航质量较高遥如果明确查询的主题所属的目录分类袁选择目录搜索第8期引擎查询袁内容更准确袁速度也更快遥国内知名目录搜索引擎主要有新浪(Sina)尧搜狐渊Sohu冤尧网易渊Netease冤遥国外的有院yahoo浴(最著名的目录搜索)尧AskJeeves(著名的自然语言搜索引擎)尧Dmoz.
com/ODP尧About.
com尧lookSmart等遥目录索引是按传统的信息分类法完全依赖人工操作组织信息袁所以存在着维护量大尧信息更新不及时等缺点[3]遥2.
2全文搜索引擎全文搜索引擎工作时袁它是通过计算机索引程序扫描网页中的每一个字或词渊中文冤袁对每一个字或词建立一个索引袁计算出该字或词在网页中出现的位置和频次袁当用户查询时袁检索程序就从事先建立的索引数据库中袁找出与该关键词匹配的网页袁按照一定排列顺序袁提供给用户[5]遥全文检索分为按字检索和按词检索两种遥按字检索是对文章中的每一个字都建立索引袁检索时将词分解为字的组合来进行检索处理遥按词检索是以词为单位建立索引袁把每个词作为独立语义单位袁并且可以对同义项做出处理遥因为全文搜索引擎的搜全率高袁所以它是网络应用最广泛的主流搜索引擎[5]遥全文搜索引擎的主要代表袁国内的有百度尧360搜索尧搜狗等遥国外的有Google尧Fast/AllTheWeb尧Oeerture尧NetscapeSearch尧Inktomi等遥全文搜索引擎是按字或词建立索引遥按字建立索引检索时袁中文会将词拆分成字的组合来处理袁字与词差别很大袁而英文的词和字是一体的遥按词建立索引检索时袁英文的词与词之间用空格分开袁实现上是按字进行检索袁因此全文搜索引擎在中文分词处理上目前存在技术难点[5]遥2.
3元搜索引擎元搜索引擎没有自己的机器人和数据库袁它的搜索结果是通过调用尧控制和优化其它多个独立搜索引擎的搜索结果袁将检索结果经过集中统一处理袁再以统一格式在同一界面上提供给用户遥如果用户需要使用不同的搜索引擎重复相同的检索袁元搜索引擎是最好的选择遥元搜索的工作原理主要包括3部分袁发出检索请求尧检索接口代理尧检索结果显示遥检索请求模块实现用户个性化的检索设置袁包括搜索引擎调用尧检索时间设定尧检索结果数量设定[6]遥检索接口模块实现把用户的检索请求野翻译冶成满足不同搜索引擎要求的语言格式遥结果显示模块将元搜索引擎的检索结果经过去重尧合并及输出遥2.
3.
1国内主要的元搜索引擎渊1冤搜魅网院集合了百度尧谷歌尧雅虎等多家主流搜索引擎的结果袁提供网页资讯网址导航等综合查询遥渊2冤佐意综合搜索院集合了谷歌尧百度尧雅虎等知名搜索引擎袁细化了搜索分类袁如新闻搜索尧网页搜索尧软件搜索尧视频搜索音乐搜索尧地图搜索等遥渊3冤觅搜院集合了谷歌尧百度尧雅虎一搜尧搜狗尧有道等遥渊4冤抓虾网聚搜院将百度尧谷歌算法各异的搜索结果去重袁呈现给用户的元搜索引擎遥通过它的搜索框袁用户可以检索到天气预报尧手机归属地尧IP地址查询尧实时汇率转换等遥此外元搜索引擎还包括360综合搜索等遥2.
3.
2国外的元搜索引擎渊1冤MetaCrawler院搜索结果来自Google尧Yahoo浴尧Search尧Yandex遥内容覆盖近20主题的目录检索服务袁包括常规检索尧高级检索尧定制检索尧国家及地区资源检索等遥渊2冤Dogpil院可并行调用Google尧Yahoo!
尧AskJee尧Msn等多个元搜索引擎遥渊3冤Ixquick院支持全球搜索袁包括中文袁日文和朝鲜语在内的18种语言袁支持各种基本的和高级的检索功能遥元搜索的优点是同时调用多个搜索引擎袁检索速度快袁查全率和准确率高遥2.
4垂直搜索引擎垂直搜索引擎也叫专业搜索引擎或者可以称之为主题搜索引擎袁它是对某一特定领域尧某一特定群体或某一特定需求设计的搜索引擎袁为查询某一学科或者某一主题提供信息检索服务袁是通用搜索引擎的细分和延伸遥2.
4.
1垂直搜索引擎的工作原理垂直搜索引擎与通用搜索引擎的工作原理大致相同袁都是派出蜘蛛程序从互联网各网站提取信息建立索引库和索引袁并通过分词处理袁去重袁排序袁标准检索语句解析分析等一系列检索技术袁检索出与用户查询条件相匹配的结果返回给用户遥由于垂直搜索引擎针对某一特定领域或主题搜索袁引入了主题词分析和主题相关度评价袁机器人爬行前需要人为收集满足特定主题的URL种子袁并构造主题词表袁指导机器人爬行满足主题需要的网页遥2.
4.
2垂直搜索引擎的特点渊1冤专业性强遥垂直搜索引擎抓取数据的来源取决于他所关注的行业或领域袁它的爬虫程序定向爬行与某一特定领域过某一个特定主题相关的全部网站收集信息袁并按照主题分类体系进行严格分类袁因此收集的信息更加专业和全面袁在解决实际查询问题时更闫红兵院搜索引擎及其网络信息检索技巧165第28卷加贴近用户的意图遥渊2冤查全率高遥垂直搜索引擎只涉及某一个领域或几个领域或专业袁相对于通用检索所涉及的所有网站信息而言袁垂直搜索引擎的词汇用语大大降低了一词或一字多义的现象袁而且由于对检索的专业词表进行了规范和控制袁因此查全率和准确率很高遥渊3冤数据倾向于结构化数据和元数据遥垂直搜索引擎将网页非结构化数据抽取成特定的结构化数据遥渊4冤结构化的数据为最小单位存在数据库中供用户检索遥比如购物搜索引擎在抽取网页中的商品信息时袁它不仅可以提取出商品的名称尧价格尧简介尧生产厂商袁甚至可以进一步将商品细分出品牌尧型号尧性能尧用户评价等袁将这些结构化的信息进行深度加工存储袁因此为用户提供的信息更加精确全面遥渊5冤内容更新及时遥垂直搜索引擎对动态URL数据敏感袁当某一特定领域或者是某一主题的网站信息发生变化袁爬虫立刻抓取新的网页数据袁及时更新检索词库的内容遥各大知名网站如百度尧搜狐都有各自的垂直搜索引擎渊分类搜索引擎冤袁如新闻搜索尧音乐搜索尧Flash搜索等遥独立的垂直搜索引擎袁旅游类的有携程网袁艺龙网遥比价类的有袁一淘网袁淘宝网袁易购网遥商业垂直搜索引擎C2C有淘宝网尧百度有啊曰B2B的中化网尧中国制造网尧环球资源网尧阿里巴巴等袁面向产业上下游提供信息资源遥B2C的有亚马逊尧当当网尧慧聪网站等遥3网络信息检索技巧3.
1选择准确的关键词因为搜索引擎提供的数据都是预存在本地数据库当中的袁受智能化影响袁只能在现有的数据库当中查找与关键词相匹配的信息袁所以在检索前袁要明确检索的目标袁包括信息的类型尧查询的时间尧查询方式等袁并确定准确的检索表达式袁运用搜索引擎准确查找结果遥3.
2细化搜索条件查询时尽可能细化搜索条件袁提问越具体袁搜索的结果越准确遥如搜索野海尔空调报价冶相关资料袁若输入野海尔空调冶袁则返回大量有关海尔空调的信息袁若输入野海尔空调报价冶袁则返回海尔空调价格的准确信息遥3.
3选择适合的搜索引擎由于不同的搜索引擎具有不同的特点袁针对不同的检索目的袁选择适合的搜索引擎可以达到事半功倍的效果遥比如查图书尧查资料袁CALIS学术搜索引擎为首选遥查询购物信息可以选择淘宝网袁易淘网袁天猫等遥查天气袁查新闻尧查股票尧查汇率等可以选择百度尧搜狐等综合性的搜索引擎遥查成果尧会议尧论文袁可以选择国内知名的清华同方袁万方数据库等专业数据库等平台遥3.
4掌握搜索引擎的检索技巧3.
4.
1分类与搜索引擎结合使用每一个搜索引擎根据其特色袁将系统信息按主题进行分类袁并建立了分类搜索引擎渊垂直搜索引擎冤袁这些分类内容全面袁层次结构清晰遥如百度的分类搜索引擎覆盖各行各业袁如旅游搜索尧购物搜索尧小说搜索尧地图搜索等遥搜索引擎的界面基本相同袁上面一行是分类袁中间是关键词输入框袁下面是分类搜索引擎遥输入准确的关键词袁选择正确分类及在正确的分类搜索引擎进行搜索袁能够获得更好的用户体验遥3.
4.
2布尔逻辑检索常用的布尔逻辑运算符分别是逻辑与野AND冶尧逻辑或野OR冶尧逻辑非野NOT冶遥不同的搜索引擎对其支持度不同袁且采用的命令驱动方式也不一样遥Infoseek尧AltaVista和Excite完全支持三种运算曰HotBot尧lycos只在其野高级检索冶模式中完全支持袁在野简单检索冶模式中部分支持遥大部分搜索引擎采用布尔算式渊AND尧OR尧NOT冤袁如AltaVista和Excite曰有的用野+冶尧野-冶号代替野AND/NOT冶进行运算曰HotBot尧lycos则用菜单中的野Allthewords冶和野Andofthewords冶分别代表AND和OR运算遥用逻辑与野AND冶连接袁表示它所连接的两个词必须同时出现在查询结果中遥如院在搜索引擎中输入野TelevisionANDHaier冶袁则返回同时包含Television和Haier的网页遥使用逻辑与野AND冶时袁一般把出现频率低的词放在野AND冶前遥逻辑或野OR冶连接袁表示所连接的两个关键词中任意一个出现在检索结果中即可遥如院输入野Televi鄄sionORHaier冶袁搜索结果将返回至少包括野Televi鄄sion冶尧野Haier冶两词之一的所有网页袁采用逻辑或野OR冶连接检索词时袁出现频次高的检索词放在野OR冶前遥逻辑非野NOT冶连接袁表示从第一个关键词概念中排除第二个关键词遥如院输入野TelevisionNOTHaier冶袁搜索结果将出现除了野Haier冶外袁包含野Television冶的所有网页遥恰当的使用逻辑表达式及其规则可以提高检索效率遥另外由于逻辑表达式存在优先级别袁所以避免逻农业图书情报学刊院信息教育166第8期辑非野NOT冶与逻辑与野AND冶同时使用遥3.
4.
3截词检索截词检索是计算机检索系统应用非常普遍的技术袁可以预防漏检袁提高查全率遥尤其对于西文检索袁合理的使用截词符袁对提高查全率效果更加明显遥数据库检索系统的截词法有前截词检索尧后截词检索尧中间截词检索尧屏蔽检索4种方法遥搜索引擎的截词符用野钥冶尧野*冶表示袁主要用于英文搜索引擎遥使用野*冶表示匹配的字符数量不受限制袁而野钥冶表示单个字符遥多数搜索引擎支持右截词法袁采用截词检索时袁截词的位置要适当袁如输入inform*袁可检索到infor鄄mal尧informant尧informantion等曰输入院infrmal袁则返回informal遥3.
4.
4字段限制搜索字段限制搜索是搜索引擎常用的检索语法遥在关键词前加入字段限制前缀符袁以表明检索内容明确特征或在数据库中出现的区域袁可以更快找到所需的信息遥目前能提供较丰富的字段限制检索功能的有院Al鄄taVista尧Hotbot等遥字段限制符有院渊1冤intitle要搜索范围限定在网页标题中袁格式院intitle:关键词袁例院intitle:电气工程及自动化袁返回包含野电气工程及自动化冶标题网页曰渊2冤site要搜索范围限定在特定网站袁格式院site:站点域名袁如想在太平洋网站查找flash教程袁可输入院site:www.
pconline.
com.
cnflash教程袁返回所有关于太平洋网站的flash教程曰渊3冤inurl要搜索结果限定在url链接中袁格式院inurl:关键词袁如输入院inurl:mp3袁则返回url中包含mp3的网页袁使用url时袁注意观察网页的资源常用什么url袁提供书籍下载袁url一般用book曰论坛的url中常含有bbs曰音乐方面用yinyue尧mp3曰提供软件用soft尧software曰新闻的用news曰体育的用sports曰渊4冤其他字段限制指令有院subject尧keywords尧summary尧image尧intext渊针对google有效冤尧domain尧host尧link尧related渊只适用于Google冤等遥注意袁冒号为英文半角格式遥关键词与字段限定符之间不加空格袁多个关键词间用空格分隔遥filetype要搜索范围限定在指定格式文档中遥输入格式院filetype:文档格式符关键词遥常用文档格式符有doc尧xls尧ppt尧pdf尧rtf尧all尧html(Google支持)等遥如要查找野计算机原理冶电子书袁在搜索引擎中输入院filetype:pdf计算机原理袁则可查询到所有pdf格式的计算机原理电子书遥目前袁百度袁Google都支持filetype指令遥注意袁关键字与文档格式符之间加空格袁冒号为英文半角遥3.
4.
5词组检索把关键词组用双引号""括起来袁作为独立的运算单元袁检索时进行严格匹配袁可以得到更加准确的检索结果遥如在搜索引擎中输入"网络工程"进行搜索袁则返回含有"网络工程"词组的所有网页遥几乎所有的搜索引擎都支持词组检索遥注意双引号""为英文半角格式遥3.
4.
6使用渊+冤尧渊-冤很多搜索引擎支持渊+冤尧渊-冤限定搜索结果遥在关键词前使用渊+冤就是限定搜索结果必须包含这一关键词遥如在百度输入野+网络+信息+技术冶袁则返回同时包含冶网络冶尧野信息冶尧野技术冶关键词的网页遥减号渊-冤一般用在英文网站遥关键词前使用渊-冤袁限定关键词不能在检索结果中出现遥如输入野Televi鄄sion-Haier冶袁则返回不包含野Haier冶的查询结果遥注意袁使用这个指令时袁减号渊-冤前面要加空格遥3.
4.
7使用书名号叶曳书名号是百度独有的一个查询语法袁加上书名号的关键词有两层功能袁一是书名号中的关键词不被拆分遥二是书名号也当做关键词的一部分出现在检索结果中遥如检索叶电气工程及自动化曳一书袁如不加书名号袁则检索结果中会出现拆分的电气尧工程尧自动化的相关内容袁加上书名号则返回叶电气工程及自动化曳一书的网页遥3.
4.
8字母区分大小写这一点在英文信息检索中非常重要袁一些英文搜索引擎要求用户输入关键词时区分大小写袁以便在搜索时依字母大小写匹配关键词袁实现精确查询遥4结语每个搜索引擎都有各自的特点和检索方法袁检索方法有的可以独立使用袁有的可以组合运用袁只有多学习尧多实践尧多总结袁才能熟练掌握袁运用自如遥参考文献院[1]搜索引擎基本工作原理[EB辕OL].
http://baike.
so.
com/doc/1403770-1483972.
html.
[2]搜索引擎.
[][].
http://baike.
so.
com/doc/311390-329744.
html.
[3]李海秋.
网络环境下信息检索技术[J].
计算机光盘软件与应,2014,(5):93-94.
[4]目录搜索引擎[][].
http://baike.
so.
com/doc/6099895-6313004.
html.
[5]全文搜索引擎[][].
http://baike.
so.
com/doc/1640013-1733588.
html.
[6]元搜索引擎[][].
http://baike.
so.
com/doc/5421958-5660149.
html.
闫红兵院搜索引擎及其网络信息检索技巧167

JustHost:俄罗斯/新西伯利亚vps,512MB内存/5GB空间/不限流量/200Mbps/KVM/自由更换IP,$1.57/月

justhost怎么样?justhost是一家俄罗斯主机商,2006年成立,提供各种主机服务,vps基于kvm,有HDD和SSD硬盘两种,特色是200Mbps不限流量(之前是100Mbps,现在升级为200Mbps)。下面是HDD硬盘的KVM VPS,性价比最高,此外还有SSD硬盘的KVM VPS,价格略高。支持Paypal付款。国内建议选择新西伯利亚或者莫斯科DataLine。支持Paypal付...

蓝竹云挂机宝25元/年,美国西雅图 1核1G 100M 20元

蓝竹云怎么样 蓝竹云好不好蓝竹云是新商家这次给我们带来的 挂机宝25元/年 美国西雅图云服务器 下面是套餐和评测,废话不说直接开干~~蓝竹云官网链接点击打开官网江西上饶挂机宝宿主机配置 2*E5 2696V2 384G 8*1500G SAS RAID10阵列支持Windows sever 2008,Windows sever 2012,Centos 7.6,Debian 10.3,Ubuntu1...

Hostodo(年付12美元)斯波坎VPS六六折,美国西海岸机房

Hostodo是一家成立于2014年的国外VPS主机商,现在主要提供基于KVM架构的VPS主机,美国三个地区机房:拉斯维加斯、迈阿密和斯波坎,采用NVMe或者SSD磁盘,支持支付宝、PayPal、加密货币等付款方式。商家最近对于上架不久的斯波坎机房SSD硬盘VPS主机提供66折优惠码,适用于1GB或者以上内存套餐年付,最低每年12美元起。下面列出几款套餐配置信息。CPU:1core内存:256MB...

英文搜索引擎为你推荐
定向fastreport2支持ipadwin10关闭445端口win10家庭版怎么禁用445端口fusioncharts如何自定义FusionCharts图表上的工具提示?重庆电信宽带管家重庆电信宽带多少钱一个月360chrome360Chrome 世界之窗极速浏览器 ChromePluschromeframechrome需要frame吗win7还原系统电脑怎么恢复出厂设置win7旗舰版google统计怎样将Google分析转换成中文显示Google中文专题交流苹果5.1.1越狱iphone 用itunes更新5.1.1需要重新越狱?然后cydia也没有了。
万网域名解析 fdcservers 电影服务器 20g硬盘 免费cdn加速 免费个人博客 双拼域名 河南m值兑换 免费mysql数据库 无限流量 环聊 空间租赁 数据库空间 稳定空间 免费主页空间 shuangcheng winds 游戏服务器 卡巴斯基免费版 压力测试工具 更多