关键词检索的得与失--甄繁就简学科馆员:吕俊生主要内容关键词及其特征关键词的规范处理关键词的检索关键词检索效率的影响因素参考文献一、关键词及其特征1、关键词及其构成原理关键词是那些出现在文献的标题(篇名、章节名)以致摘要、正文中,对描述文献主题内容具有实质意义的语词(可以作为检索"入口"的)(张琪玉,1997).
例如Wood一词出现在了题名、摘要及非控制词中:Title:Wood-polymercompositespreparedbytheinsitupolymerizationofmonomerswithinwoodAbstract:Wood-polymercomposites(WPCs)werepreparedfrompoplarwood(P.
ussuriensisKomarov)inatwo-stepprocedure.
Maleicanhydride(MAN)wasfirstdissolvedinacetoneandimpregnatedintowood;Uncontrolledterms:WoodcellwallWoodsubstrates有一文献,题名是《农用化学物质的利用与污染控制》,其中"农用"、"化学物质"、"污染控制"三个词可作为关键词;而"的"、"利用"、"与"在文中不起重要作用,属于次要词,不作为关键词;而"化学"、"物质"、"污染"和"控制"不宜拆分,因为这些词太"泛指"了,不能较准确地描述文献的意义.
;"与""利用"、"的"非关键词"农业""污染控制""化学物质"关键词"化学""污染""物质""控制"不宜拆分的词组:≠≠"化学物质""污染控制"一、关键词及其特征以《农用化学物质的利用与污染控制》为例:若干关键词的组合可以构成一条检索式,组合描述文献的关键内容,但每个关键词在检索系统中却都是彼此孤立的,在组合检索之前,它们没有任何关系.
"农业"+"化学物质"+"污染控制"数个关键词可组成一个检索式一、关键词及其特征二、关键词的规范处理1、关键词的确定与范围在数据库中,关键词不是逐个选定的,多数数据库也没有一个关键词词表.
相反,是用"排除法"来控制关键词的范围,这个方法就是建立一个"非关键词表":在用计算机自动选词的情况下,凡是"非关键词表"中未列的词,都可作为关键词.
哪些词被列入到"非关键词表"呢如,冠词、介词、连词、感叹词、代词、某些副词、某些形容词、某些名词(如"理论"、"报告"、"试验"、"学习"等)、某些动词(联系动词、情态动词、助动词).
"非关键词"表的收词数量可随各专业用词的情况及数据库构建的特定要求而定.
注:"非关键词"无法检索视不同数据库,有所不同.
二、关键词的规范处理INSPEC数据库规定,"非关键词"在"主题"和"标题"中检索无效.
二、关键词的规范处理2、关键词的规范关键词虽是直接利用自然语言的语词而不予规范的,但由于语词本身的复杂性,在实际操作中为了提高检索系统的检索效率,也要作一些规范化处理.
词和符号:β改写成beta;用"β"检索无效用"beta"检索才有结果二、关键词的规范处理如:EI数据库中提示出一些常见的缩写形式,告诉用户在检索时要兼顾全称和缩写:一些常用的缩写为:AcademyAcadAssociationAssocBureauBurCenter/reCentCollegeCollCompanyCoCorporationCorpDepartmentDepDivisionDivIncorporatedIncInstituteInstInstitutionInstInternationalIntLaboratoryLabLimitedLtdNationalNatlPublishedPubPublisherPubSchoolSchSocietySocUniversityUniv文章用全称标引时,用简称是无法检索到该文献;反之,亦然.
简称和全称二、关键词的规范处理三、关键词的检索1、随意性带来的方便与风险我们随意地想到一个词"wood",就可以检索到一定量的结果!
惊喜之时,可能落入"陷阱"!
三、关键词的检索当我们继续探究后,发现检索结果其实数量远不止于此!
三、关键词的检索我们用同义词"Pulpmaterials—Wood"检索到768条;用相关词"Lumber"检索到2536条;、、、、、、就是说,在当初的检索结果中,我们可能已经漏掉了许多相关的文献!
三、关键词的检索2、随意性带来的繁琐性词的全称与缩写:Uranium-238、Uranium238、U238、U-238、如果考虑不周,就会蒙受损失!
我必须复杂地考虑如何才能查得全找到同义词!
三、关键词的检索3、数据库简便直观的甄别功能在52864条检索结果中,与受控词"Wood"相关的记录有14562条三、关键词的检索4、从一个随意的"关键词"找到相关的控制词及分类"就简":从随意的检索词出发,就能获得可观的检索结果——轻松;"甄繁":从随意性到规范性;从模糊到清晰;从"大量"到"精量"——从容;三、关键词的检索5、"繁"与"简"的提示关键词检索是简捷的,但是,往往从直接的结果中难以找到理想的答案;数据库为我们构建了一个进一步筛选的通道,它为我们带来了方便!
在关键词检索中,还有数据库没有解决的"繁琐"问题,我们需要靠自己去甄别,付出得多,得到得亦多!
四、关键词检索效率的影响因素1、作为关键词载体的文本类型的影响文本作为关键词的载体可分为题名、小标题、章节名、摘要和正文等.
查准率考虑:由于题名最具有概括性,从针对文献整体的检准率来看,文献题名中的词最为有效,其次为小标题、章节名、摘要、正文.
查全率考虑:由于题名对文献整体描述的针对性与概括性的要求较高,文献中有意义的内容不可能被题名包揽无遗,造成查全率低.
当对查全率有较高的要求时,需要将检索扩展到摘要、正文.
数脉科技怎么样?昨天看到数脉科技发布了7月优惠,如果你想购买香港服务器,可以看看他家的产品,性价比还是非常高的。数脉科技对香港自营机房的香港服务器进行超低价促销,可选择10M、30M的优质bgp网络。目前商家有优质BGP、CN2、阿里云线路,国内用户用来做站非常不错,目前E3/16GB阿里云CN2线路的套餐有一个立减400元的优惠,有需要的朋友可以看看。点击进入:数脉科技商家官方网站香港特价阿里云...
现在宝塔面板真的是越来越过分了,删除文件、删除数据库、删除站点等操作都需要做计算题!我今天升级到7.7版本,发现删除数据库竟然还加了几秒的延时等待,也无法跳过!宝塔的老板该不会是小学数学老师吧,那么喜欢让我们做计算题!因此我写了个js用于去除各种计算题以及延时等待,同时还去除了软件列表页面的bt企业版广告。只需要执行以下命令即可一键完成!复制以下命令在SSH界面执行:Layout_file="/w...
iON Cloud怎么样?iON Cloud今天发布了7月份优惠,使用优惠码:VC4VF8RHFL,新购指定型号VPS半年付或以上可享八五折!iON的云服务器包括美国洛杉矶、美国圣何塞(包含了优化线路、CN2 GIA线路)、新加坡(CN2 GIA线路、PCCW线路、移动CMI线路)这几个机房或者线路可供选择,有Linux和Windows系统之分,整体来说针对中国的优化是非常明显的,机器稳定可靠,比...