词类彪言彪语

彪言彪语  时间:2021-03-20  阅读:()
关系数据库上泛关系查询与中文查询语言的接口曹礼德舫匕天顺〔摘要〕本文初步探讨了实现关系数据库上泛关系查询与自然语言查询接口的一种方法,文章对其中的若干问题如词典的组织、翻译算法等作了比较详细的讨论并通过实例进行了具体的说明.
主题词关系数据库,泛关系,自然语言理解,中文查询语言.
引言',一学习关系学号课程名分数一般来说,在关系数据库上进行查询时,将这两个关系看成一个泛关系为必须用它所提供的查询语言写出查询程序或学号姓名年龄性别课程名查询报告.
用户在写查询程序时,术但要对分数数据库中已有的关系了如指掌,而且还欺须学生关系相当于在属性集学号、在查询条件中给出关系的连接方式.
因此,姓名、年龄、性别少上的投影所成的关系.
这种查询语言用起来是不太方便的学习关系相当于在属性集学号、课近年来,随着关系数据库的广泛应用,程名、分数上的投影所成的关系.
一般地,人们便进一步寻求一种使用起来比较简单、假设没有一个泛关系数据库,,方便的查询语言于是出现了关系数据库的,··….
其中互互是的泛关系接日厂〕它将关系数据库中所有的'禽比关系统一在一个虚拟的关系上,这个关系就词典的组织是泛关系.
泛关系上的查询语言写起来比较词的分类简单方便,不需用户写出查询所用到的关系针对将自然语言翻译成泛关系查询语一言间的连接方式,但它仍有很多形式上语法规的需要,我们将词典中的词分为五类,具体定,比起用自然语言进行查询当然就逊色得分法如下多.
考虑到直接将自然语言的查询翻译成具第一类查询词类—与"查询"动作体关系上的查询困难较大,可以先将自然语具有同义的词.
这类词有、查询、查出、找言的查询翻译成泛关系上的查询语言一一自出、整索、有多少、有没有、是否有、是多然语言查询与泛关系查询的接口,然后再将少等等.
本类词中也包括了疑问词,道理可泛关系上的查询进一步解释成具体关系仁的以从下例看出查询、从而构成一个关系数据库上的自然语例查出数学成绩是分的学生.
言查询接口.
有多少数学成绩是分的学生将泛关系上的查询翻译成具体关系仁的尽管两句在表面上有差别,但查询的效自然连接、选择和投影等运算在数据库中已果是一样的.
因此"查出"和"有'多少"都花了大量篇幅加以讨论,很多问题都已解决归于查询词类.
〔〕下面讨论的只是自然语言与泛关系第二类条件词类—一能对查询条件起查询之间的接口问题.
到约束的间这类词可进一步细分如下为一比较具体地说明问题,我们设想一等于词类这类词有等于、是、为、个关系数据库,它有两个关系框架与…相同、…与··一样等等.
学生关系学号姓名年龄性大于同类这类词有大于、超过、别高于在…之前,一比…多等等.
1994-2009ChinaAcademicJournalElectronicPublishingHouse.
Allrightsreserved.
http://www.
cnki.
net,少于词类这类词有小于、低于、在…之后,…比…少等等大于等于词类这类词有大于等于、不小于、至少等等小于等于词类这类词有小于等于、不大于、至多等等第三类词属性词类一一与泛关系中属性同义的词.
这类词必须根据泛关系中属性的个数再进一步细分,细分的类数与泛关系中属性的个数相等.
以我们设想的泛关系为例,它共有六个属性,故相应地有六类属性词学号类学号、编号、号码姓名类姓名、名字、学生年龄类年龄、年纪、岁数.
性别类性别、性课程名类课程名、课程、课分数类分数、成绩、学习成绩第四类词属性值词类一属性的具体值泛关系中每一个属性都必须有且只有个与之相应的属性值词类.
但有些属性的具体值比较特殊,因此不把它们组织在词典之中以我们设想的泛关系为例说明如下学号值司类这类词由数字组成比较特殊,不存入词典.
姓名值词类由于姓名的具体值就是某人的姓名,因此将每个人的名字存入词典毫尤意义厂但为了让机器识别出来就必须在输入白然语言查询句子时,将姓名的具体值作仁某一特定的标记「如规定名字必须用方括号括起来、于是可定义由方括号括起来的词为姓名值词类可见姓名液间类只是一条规则,具体的名拼在词片中井不存入性别浪词类这类同只有两个男、女.
课程名位词类这类司较笔、、如数学、物理、化学等等年龄值词类与学号值词类类似分数值词类与学号值词类类似第五类词除'以四类词以外的词例如和、少父、与、而目等等词类的标准符号由于泛关系上的查询语言是一种形式语言,因此,必须将自然语言的查询转换成泛关系查询所规定的保留字或符号.
故对每一类词规定一个与之相应的标准符号.
这些标准符号必须与泛关系所规定的保留字或符号一致.
各类的标准符号如下查询词类条件词类等于词类大于词类小于词类大于等于词类二小于等于词类属性词类属性词类中的每一类的标准符号必须与数据库中的属性名相同.
以我们设想的泛关系说明如下学号类姓名类"年龄类性别类课程名类分数类属性值词类属性值词类中的每一个词均有一个标准符号这个标准符号就是在这个属性值词上加上特殊的标记,如双引号等,即每一个属性值词的标准符号形如"词本身"其它问类在其它词类中,连词是很有用的.
"和""而且""或""与"词的用法知识词的用法知识就是指普通意义下的词的习惯用法和一些特殊的使用规则,利用它们有助于写出泛关系上查询程序的查询条件和对象属性每一类词可以有一个或多个用法知识,也可以没有任何用法知识在各类同的用法知识当中,查询词类和条件词类1994-2009ChinaAcademicJournalElectronicPublishingHouse.
Allrightsreserved.
http://www.
cnki.
net的用法知识最为重要,因为这一部份知识是自然语言查询向泛关系查询的桥梁,是间题的关键下面就对各类词的用法知识进行讨论.
·查询词类的用法知识对于查询词类来说,其用法知识就是自然语言查询句子的总结构,以下是几种常见的句子.
其中代表属性词第一种条件集根据前面对.
的定义可知,仁述用法知识指的是不带主语的祈使句或者是疑问词在句首的特殊疑问句.
下列句子都属于这一种用法找出物理成绩等于数学成绩的男学生.
有没有化学成绩不低于分的学生,第二种条件集这一类句子主要疑问词在句末的特殊疑问句.
如〔张红〕的化学成绩是多少兮第三种条件集这一类句子就是要求判断真、假、有、无的一般疑问句如〔张红〕的年龄是岁吗〔张红〕学化学吗条件词类的用法知识条件词类中的词可分为两种一种是可分离的如,"与…相同"、"比…高"等.
另一种是不可分离的如"等于"、"超过''等为一下面叙述的方便、我们把可分离的两部份按光后次序分别称为前部和后部对不可分离的词,其般用法如下属性浪词,属性词条件词属性值词'属性词括号中的成份可以没有,但是根据自然语言中的习惯可知,条件词的左边和右边都必须至少有一个成份如"化学成绩超过〔张红〕"、"年龄等于成绩"、"数学成绩等于化学成绩"等都属于上述用法对于可分离的词,其一般用法如下属性值词属性词词前部属性值词属性词词后部括号中的成份可以没有,但是词后部之前必须至少有一个关于属性或属性值的词.
可分离词在用法上比较特殊的地方是词前部可以省略.
例如词"在…以上"如下用法都是可以的,"数学成绩在分以上".
"数学成绩分以上".
属性词类的用法知识以我们设想的数据库为例,有关于属性词类的用法知识有面两条学号类、年龄类以及分数类的属性词所对应的属性值词只能是数字.
姓名类的属性词所对应的姓名值词类必须是以方括号括起来的词属性值词类的用法知识以我们设想的数据库为例,假如在一个白然语言查询句子中有一个数字,这个数字究竟属于哪一类属性值就需要进行判定.
因此我们有下面的属性值词类的用法知识"数字""号",则该数字是学号值词"数字""岁",则该数字是年龄值词"数字""分"则该数字是分数值司当然有时数字后面没有"分"、"号"、"岁"之类的词此时须根据使用这个数字的条件词所连接的词来确定例如,在自然语言查询中"成绩为分"和"成绩为"均是可行的对于前者来说,由于""后面有一个"分"字,故很容易判别""是分数值词,而对于后者,""后面没有"分",必须根据条件词"为"所连接的属性词"成绩"才能判别出来.
根据以上讨论,词库中的每一个词可按下面的结构存储词词本身身所属类别别词的标准符号号,一用法知识用法知识可存储在知识库中或用程序加以实1994-2009ChinaAcademicJournalElectronicPublishingHouse.
Allrightsreserved.
http://www.
cnki.
net现.
翻译算法词库准备好之后,就可以根据该词库将自然语言查询翻译成泛关系上的查询了.
翻译算法实际上是过程叙述如下主过程输入自然语言查询句子输出泛关系上的查询语言①对输入的自然语言进行分词②写出查询条件③写出查询对象④对①②③得到的结果进行特殊分析⑤输出标准的泛关系查询语言⑥结束在该主过程中,除⑥以外都又是一个子过程具体讨论如下分词子过程在计算机上开发中文自然语言的应用,一个首要的间题就是对中文自然语言进行分词,目前国内已出现一些方法,虽不完善,但在一定范围内仍是有效的,下面的分词子过程就是根据所谓最大匹配法写出的.
分词子过程输入自然语言查询句子输出已被分词完毕的自然语言查询句子及其信息.
①置初值②读入句子的第个字的初值为③词库中有以该字开始的词并且能与句子中以第个字开始的字串匹配在句子中分出一个在词库中能匹配的最长词.
该字是特殊符号如数字等进行特殊处理分出该词·进行人机对话分出该词④记录有关于该词的所有信息,如标准符号,类型和用法知识等⑤该词所含的字的个数⑥句子长度转②⑦过程结束返回有关于分词的其它方法,有兴趣的读者可参看本文所列的参考文献〔〕、〔〕.
写出查询条件的子过程输入分词过程的结果句子和相应信息输出查询条件集①置初值②句中所有条件词均分析完毕转⑥③取得一个条件词以及它所连接的所有属性词和属性值词.
④该条件词是可分离的,厂将其转换为等价的不可分离条件词.
⑤根据该条件词的用法写出查询条件共有六种情况,由于篇幅关系,下面只介绍其中的一种情况条件词的用法为属性词条件词属性值词属性值词是属性词的可能值写出条件属性词的标准符号条件词的标准符号"属性值"能找出属性值词所对应的属性写出条件·属性值词所对应的属性词的标准符号"属性值"和·属性词的标准符号条件词的标准符号属性词的标准符号进行人机对话,弄清查询条件.
记录有关该条件词的信息并转②·…例如"成绩超过""成绩超过〔张红〕""成绩超过"对于来说,由于是成绩的可能值,故写出的条件为、"',口对来说,由于张红是姓名值,不可能是成绩值,故写出的条件为·二"张红"·这两个条件相应于"成绩超过〔张红〕的成绩"而对于来说,不可能是成绩的1994-2009ChinaAcademicJournalElectronicPublishingHouse.
Allrightsreserved.
http://www.
cnki.
net值,但又不能根据用法知识确定是哪类属性值词,故需通过人机对话加以澄清.
的接口系统的想法都是不可能实现的.
当然,,⑥对于那些未被条件词所连接的属性值词写出查询条件.
例如"找出成绩超过.
的男生"其中"男"是一个属性值词,故还应写出条件,"男"⑦过程结束返回写出查询对象的子过程输入主过程中①②的结果和相应的信急输出查询对象①句子中无查询词类,进行人机对话加以澄清②根据查询词类的用法知识,找出可能的查询对象集③为空记录相应的信息并返回对于中的每一个词该词不是属性词类进行人机对话加以澄清用标准符号代替该属性词④写出如下形式的语句对象工对象,……⑤过程结束返回特殊分析的子过程输入主过程中①、②、③、④的结果输出标准的泛关系查询语言和有关信息①检验查询条件与查询对象的正确性和一致性②对查询词类进行分析,以确定原自然语言查询的特殊要求.
③过程结束返回.
结束语上面讨论了关系数据库上泛关系查询和中文查询语言的接口,所提想法肯定有考虑不周的地方,敬请指正,由于自然语言的使用十分灵活、随便,因此我们所讨论的自然语言接口只能是在一定的范围内有效,任何想构造一个能适用于所有自然语言查询句子我们应尽量使系统完善,以使它的应用范围尽量大.
最后有一点要说就是将自然语言转换成泛关系上的查询语言程序以后,这个标准的查询语言程序也是一种自然语言的深层结构表示,只不过在形式上比按网络或概念从属理论得到的深层表示要特殊些.
参考文献〔〕·""一〔〕,,·""孟,一·〔〕梁南元汉语的自动分词与一个自动分词系统·,北京航空学院〔」〕冯志伟国外主要自然语言理解系统概况《计算机科学》,年第期一〔〕姚天顺等"计算机的汉字信息处理",辽宁科技出版社一,一梦,,,·,,】,1994-2009ChinaAcademicJournalElectronicPublishingHouse.
Allrightsreserved.
http://www.
cnki.
net

GreenCloudVPS$20/年多国机房可选,1核@Ryzen 3950x/1GB内存/30GB NVMe/10Gbps端口月流量2TB

GreencloudVPS此次在四个机房都上线10Gbps大带宽VPS,并且全部采用AMD处理器,其中美国芝加哥机房采用Ryzen 3950x处理器,新加坡、荷兰阿姆斯特丹、美国杰克逊维尔机房采用Ryzen 3960x处理器,全部都是RAID-1 NVMe硬盘、DDR4 2666Mhz内存,GreenCloudVPS本次促销的便宜VPS最低仅需20美元/年,支持支付宝、银联和paypal。Gree...

欧路云:美国CUVIP线路10G防御,8折优惠,19元/月起

欧路云新上了美国洛杉矶cera机房的云服务器,具备弹性云特征(可自定义需要的资源配置:E5-2660 V3、内存、硬盘、流量、带宽),直连网络(联通CUVIP线路),KVM虚拟,自带一个IP,支持购买多个IP,10G的DDoS防御。付款方式:PayPal、支付宝、微信、数字货币(BTC USDT LTC ETH)测试IP:23.224.49.126云服务器 全场8折 优惠码:zhujiceping...

wordpress通用企业主题 wordpress高级企业自适应主题

wordpress高级企业自适应主题,通用型企业展示平台 + 流行宽屏设计,自适应PC+移动端屏幕设备,完美企业站功能体验+高效的自定义设置平台。一套完美自适应多终端移动屏幕设备的WordPress高级企业自适应主题, 主题设置模块包括:基本设置、首页设置、社会化网络设置、底部设置、SEO设置; 可以自定义设置网站通用功能模块、相关栏目、在线客服及更多网站功能。点击进入:wordpress高级企业...

彪言彪语为你推荐
firetrap牛仔裤的四大品牌是那几个啊?罗伦佐娜手上鸡皮肤怎么办,维洛娜毛周角化修复液www.7788dy.com回家的诱惑 哪个网站更新的最快啊m.kan84.net电视剧海派甜心全集海派甜心在线观看海派甜心全集高清dvd快播迅雷下载www.bbb551.comHUNTA551第一个第二个妹子是谁呀??bbs2.99nets.com天堂1单机版到底怎么做www.ca800.comPLC好学吗www.mfav.org手机登录WWW.brcbc.org 能注册么175qq.com查询QQ登录地址月风随笔关于春夏秋冬的散文
网站域名备案查询 申请免费域名 60g硬盘 服务器日志分析 dd444 中国电信测速112 t云 卡巴斯基免费试用版 网站在线扫描 美国独立日 宏讯 东莞服务器托管 qq金券 域名转入 江苏徐州移动 hostease alexa世界排名 cloudflare 回程 华为云服务器宕机 更多