翻译颁发的拼音
颁发的拼音 时间:2021-04-11 阅读:(
)
学校编码:10384分类号密级学号:200340009UDC硕士学位论文一种具有英汉辅助翻译功能的拼音输入法APinyinInputMethodEditorwithEnglish-ChineseAidedTranslationFunction李栋指导教师姓名:史晓东教授专业名称:计算机应用技术论文提交日期:2006年5月论文答辩时间:2006年6月学位授予日期:答辩委员会主席:评阅人:2006年5月厦门大学博硕士论文摘要库厦门大学学位论文原创性声明兹呈交的学位论文,是本人在导师指导下独立完成的研究成果.
本人在论文写作中参考的其他个人或集体的研究成果,均在文中以明确方式标明.
本人依法享有和承担由此论文产生的权利和责任.
声明人(签名):年月日厦门大学博硕士论文摘要库厦门大学学位论文著作权使用声明本人完全了解厦门大学有关保留、使用学位论文的规定.
厦门大学有权保留并向国家主管部门或其指定机构送交论文的纸质版和电子版,有权将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅,有权将学位论文的内容编入有关数据库进行检索,有权将学位论文的标题和摘要汇编出版.
保密的学位论文在解密后适用本规定.
本学位论文属于1、保密(),在年解密后适用本授权书.
2、不保密()(请在以上相应括号内打"√")作者签名:日期:年月日导师签名:日期:年月日厦门大学博硕士论文摘要库摘要摘要拼音输入法不仅具有易学易会的特点,而且拥有相当多的用户.
目前市场上的拼音输入法一般是以词为单位进行输入的,具有拼音串可编辑和汉字串可编辑、混合输入、模糊输入、机器学习、特殊处理、自动转化(智能化)等特点,比较典型的有:微软拼音输入法、紫光输入法、拼音加加输入法等.
机器翻译是指通过计算机来实现不同自然语言之间的翻译,现正逐渐成为克服不同语言交流障碍的重要手段.
目前基于统计的方法已经成为机器翻译研究领域的主要研究方向之一.
统计机器翻译可以利用海量语料库直接训练得到机器翻译系统,具有无需人工干预、译文质量机械味道少等优点.
通常的拼音输入法重码率高,面向普通用户使用,而对专业从事翻译的人群来说,这些输入法则忽略了行业的特殊性和便利性.
基于统计的机器翻译技术在整句或成段英文翻译效果方面差强人意.
将拼音输入法和统计机器翻译技术结合起来,不仅可使拼音输入法具有辅助翻译功能,而且通过专业翻译人员和拼音输入法的交互,也可改善统计机器翻译中英文句子的翻译质量,产生符合专业翻译人员的要求的译文.
基于上述思想,本文开发了一种供专业翻译人员使用的交互式翻译工具——具有英汉辅助翻译功能的拼音输入法.
该工具从专业翻译人员的翻译思路出发,将目前已有的拼音输入法、基于统计的机器翻译和n元组统计技术结合起来,从而减少了翻译人员的击键次数,节省了翻译时间.
本文的创新之处如下:1、依据专业翻译人员的思路,提出了英汉双语句子中词汇模糊对齐模型,利用该模型可估计翻译人员当前预翻译单词的译文,排除单词翻译的歧义性.
2、以英汉双语句子中的词汇模糊对齐为基础,将汉字拼音输入法和基于统计的机器翻译技术结合起来,估算翻译人员想要的字词,供翻译人员确认选择,从而减少击键次数,产生高质量的译文.
关键词:拼音输入法;英汉双语句子中的词汇模糊对齐;n元组统计模型;厦门大学博硕士论文摘要库厦门大学博硕士论文摘要库AbstractAbstractPinYinInputEditMethodiseasytograsp,andhasagreatmanycustomersinmarket.
Nowadays,PinYinInputEditMethodsusuallyacceptawordasinput,andtheycaneditPinYinClustersandChineseCharactersClusters,alsotheyarecharacteristicofmixinput,blurinput,machinelearning,specialprocessing,andautomatictransferring(intelligence)etc.
Typically,thereareMicrosoftPinYinEditMethod,ZiGuangEditMethod,andPinYinjiajiaEditMethodandsoforth.
MachineTranslationimplementsthetranslationofdifferentnaturelanguagesbycomputer,andgraduallybecomesanimportantmeansinovercomingthelanguagebarrier.
Presently,statistic-basedmethodisoneofthemajorresearchfieldsinmachinetranslation.
Statisticalmachinetranslation(SMT)doesn'tneedhumanintervention,getsthemachinetranslationsystembydirecttrainingwiththelargecorpora,andreducesthemachinecharacteristicsoftranslatedarticles.
Usually,PinYinEditMethodshavehigh-duplicate-code,andobjecttogeneralcustomers,however,toprofessionaltranslators,theyneglectstheparticularityandparticularityofthetranslationindustry.
Statistic-basedmachinetranslationmethoddoesn'tworkexcellentlyintranslatingawholesentenceorparagraph.
While,combiningthePinYinEditMethodandStatisticalmachinetranslation,PinYinEditMethodcanassisttranslation,butalsoimprovethetranslationqualityofChinese-EnglishsentenceswiththeinteractionofprofessionaltranslatorsandPinYinEditMethods,generatingtherequiredtranslations.
Accordingly,thisthesisdevelopsaninteractivetranslationtoolobjectedtoprofessionaltranslators--aPinYinEditMethodwithEnglish-Chineseaidedtranslationfunction.
Thistool,fromthepointofviewofprofessionaltranslators,integratescurrentPinYinEditMethods,SMTandn-gramtechnology,reducesthetappingtimesandsavestranslationtime.
Innovationofthisthesis:1.
Aimingattheprofessionaltranslators,presentafuzzyalignmentofvocabularyinEnglish-Chinesebilingualsentences.
Thismodelcanassessthecurrentpre-translation,eliminatetheambiguityofwords.
2.
Basedonthefuzzyalignmentofvocabularyinbilingualsentences,combinetheChineseCharacterPinYinEditMethodandSMT,estimatethe厦门大学博硕士论文摘要库一种具有英汉辅助翻译功能的拼音输入法wordswantedbytranslatorsandofferthechoices,whichcanlowerthetappingtimesandgeneraterequiredtranslation.
Keywords:PinyinIME;FuzzyAlignmentofVocabularyinEnglish-ChineseBilingualSentences;N-gramStatisticalMethod厦门大学博硕士论文摘要库目录目录第1章绪论11.
1课题的提出11.
2课题的科学意义11.
3国内外研究现状21.
4本文的主要工作及创新之处41.
5本文的组织结构51.
6小结.
5第2章英汉双语句子中的词汇模糊对齐.
62.
1英汉双语句子中词汇模糊对齐概念的提出62.
2基于统计方法的英文句子翻译72.
3英文句子译文的分词122.
4英文文本中单词的翻译和词义存储132.
5英汉双语句子中词汇模糊对齐策略142.
6小结.
14第3章n元组统计模型153.
1n元组统计模型153.
2汉语语料库的加工和n元组统计173.
3基于n元组统计模型的汉字重音处理.
213.
4小结.
22第4章Windows平台下的汉字输入法技术234.
1Windows平台下汉字输入法的基本原理234.
2IME的组成244.
3IME用户界面.
254.
4输入上下文.
284.
5生成消息294.
6输入法程序设计的相关技术及实现.
294.
7应用系统与IME的关系31厦门大学博硕士论文摘要库一种具有英汉辅助翻译功能的拼音输入法4.
8小结.
32第5章系统的设计和实现335.
1系统框架设计335.
2把英文文本切分为句子345.
3汉字注音程序345.
4拼音输入法的改造355.
5系统实现365.
6小结.
41第6章系统评测426.
1系统测试426.
2测试结果分析446.
3小结.
44第7章工作总结和研究展望457.
1工作总结457.
2进一步的研究展望45参考文献.
47攻读学位期间发表的论文49致谢.
50厦门大学博硕士论文摘要库ContentsContentsChapter1Introduction11.
1SubjectProposition.
11.
2SubjectScientificSignificance11.
3DomesticandInternationalResearchStatus21.
4TheMainWorkandInnovationofThisPaper41.
5TheFrameworkofThisPaper.
51.
6Summary.
5Chapter2VocabularyFuzzyAlignmentintheSentenceofEnglishandChinese62.
1ConceptofVocabularyFuzzyAlignmentinBilingualSentenceofEnglishandChinese62.
2EnglishSentenceTranslationBasedonStatisticalMethod.
72.
3ChineseSegmentationofEnglishSentenceTranslation122.
4WordTranslationandInterpretationStorage.
132.
5StrategyofVocabularyFuzzyAlignmentinBilingualSentenceEnglishandChinese.
142.
6Summary.
14Chapter3N-gramStatisticalModels153.
1N-gramStatisticalModels.
153.
2ChineseCorporaProcessingandN-gramStatisticalApplication173.
3ChineseCharactersDuplicate-codeDisposalBasedonN-gramStatisticalMethod213.
4Summary.
22Chapter4ChineseCharactersIMEBasedonWindowsPlatform.
234.
1TheBasicPrinciplesofChineseCharactersIMEBasedonWindowsPlatform234.
2CompostionofIME.
244.
3IMEUI.
254.
4InputContext28厦门大学博硕士论文摘要库一种具有英汉辅助翻译功能的拼音输入法4.
5GenerateMessage294.
6RelatedDesignTechnologiesandImplementationofIME.
294.
7RelationoftheApplicationSystemandIME.
314.
8Summary.
32Chapter5SystemDesignandImplementation335.
1SystemDesignFramework.
335.
2SplittingEnglishTextintoSentences.
345.
3ChineseCharacterPhoneticNotationProcedure.
345.
4ThePinYinIMEModification355.
5SystemImplementation.
365.
6Summary.
41Chapter6SystemTestingandAnalysisofResults426.
1SystemTesting.
426.
2AnalysisofResults446.
3Summary.
44Chapter7SummaryandExpectationoftheFutureWork.
457.
1SummaryofThisPaper457.
2ExpectationoftheFutureWork.
45References.
47ThePapersofIssue.
49Thanks.
50厦门大学博硕士论文摘要库第1章绪论第1章绪论1.
1课题的提出语言是人类社会文化的主要载体和信息交流的重要工具.
随着经济的全球化、计算机的普及和Internet的迅猛发展,世界上不同地区的经济文化联系日益密切,人们日常工作生活的信息化和国际化程度不断提高,语言的差异己成为信息交流中面临的严重障碍.
将多种语言信息,特别是英文信息翻译成中文信息的工作量正在日益加大,这对翻译工作者来说不仅是一种挑战,而且也是一种沉重的负担.
单纯依靠人工翻译,工作量大且速度有限,人们对实用的机器翻译系统的需求急剧增长.
尽管经过无数机器翻译专家们的执著研究和不断探索,机器翻译无论在理论技术还是在实际应用方面都取得了长足的进步,但不可否认的是,现有机器翻译或辅助翻译系统的翻译质量还难以满足实用需要.
所以很多专业翻译人员往往宁愿采用人工翻译的方式,而不愿采用现有的机器翻译或辅助翻译系统.
在这种情况下,如何减轻翻译人员在使用计算机进行翻译及录入中的工作量就成为一个可研究的课题.
基于此本文提出了一种具有英汉翻译辅助功能的拼音输入法.
1.
2课题的科学意义具有英汉辅助翻译功能的拼音输入法主要涉及两方面的技术,即拼音输入法和基于统计的机器翻译技术(Statistics_basedMachineTranslation).
拼音输入法具有易学易会的特点,很容易让人接受,目前在市场上的用户占有率是相当大的,而且其中有许多种都具有词组学习记忆功能,比较典型的有:紫光输入法、拼音加加输入法、微软拼音输入法等.
但这些输入法都是提供给一般用户使用的,具有普遍性,没有针对性.
例如对专业从事翻译的人群来说,这些软件提供的功能并没有考虑到行业的特殊性和便利性.
而具有英汉辅助翻译功能的拼音输入法是专为翻译人员设计的交互式翻译工具,以英文句子"IwenttoItalylastsummer.
"为例,当要翻译单词"summer"时,紫光输入法需要输入"xiatian",微软拼音输入法需要输入"xiat",才能将"夏天"显示在输入法备选列表的第一位,而使1厦门大学博硕士论文摘要库一种具有英汉辅助翻译功能的拼音输入法用具有英汉翻译辅助功能的输入法时,用户只需输入"xt",系统便会提示"夏天"及其它相关词组,并且将"夏天"这个提示放在第一个备选项上,这样便可以将用户敲击键盘的次数至少减少两次,节省了用户的翻译时间,提高翻译效率.
设想如果是面对长篇累牍的英文文章,那么为专业翻译人员所节省的敲击键盘的次数累计起来会是相当可观的.
1.
3国内外研究现状拼音输入法最大的缺点是重码率太高,经常需用户选择,这就加大用户敲击键盘的次数,浪费了用户的时间.
为了解决同音严重的现象,不同系统采取了各种技术来提高输入速度和系统整体性能.
目前比较流行的技术有:压缩编码长度、以词为单位进行输入、拼音串可编辑和汉字串可编辑、混合输入、模糊输入、机器学习、特殊处理、自动转化(智能化)等,特别是语句级输入技术的引入.
然而语句级输入实质上是在系统内部对输入的分析和理解的过程,问题涉及到计算机科学、语言学、心理科学甚至哲学等领域的研究,因此问题的解决依赖于各学科的共同努力,才能达到满意的效果.
90年代以来,机器翻译(MachineTranslation,简称MT)领域的方法基本上可以分为两类,即基于规则(Rule-Based)和基于语料库(Corpus-Based)的方法.
基于规则的MT是传统方法,而基于语料库的MT则是80年代末以后发展起来的方法.
基于规则的MT又可分为基于转换的方法和基于中间语言(Interlingua-Based)的方法,基于语料库的MT又可分为基于统计(Statistics-Based)的方法和基于实例(Example-Based)的方法.
统计机器翻译(Statistics-BasedMachineTranslation),又称为数据驱动(data-driven)的机器翻译,目前已逐渐成为国际上机器翻译研究的主流方法之一.
其方法模型大致可以分为三种:第一种是基于平行概率语法的统计机器翻译方法,这种方法的主要代表有Alshawi的HeadTransducer和吴德恺的SITG[1](StochasticInversionTransductionGrammar)模型.
第二种是基于信源信道模型的统计机器翻译方法[2,3],它是目前最有影响的统计机器翻译方法,一般所说的统计机器翻译都是指这种方法.
第三种方法是德国Och等人最近提出基于最大熵的统计机器翻译方法[4].
这种方法是比信源信道模型更一般化的一种方法.
2厦门大学博硕士论文摘要库第1章绪论交互式机器翻译是以牺牲全自动的翻译要求而获取较高质量译文的一种翻译方法.
目前大部分系统的人工干预仅限于译前编辑、译后编辑,尤其是译后编辑.
更为深入的人机交互式翻译研究追求的目标是允许用户在翻译的任何一个阶段都可以参与.
这类研究可以根据人机交互发生的阶段分为:1、交互式分析,用户帮助系统得出正确的源语言结构,尤其是复杂句子,对多义词进行排歧等.
2、交互式转换,用户参与选择与源语言结构等价的目标语言结构,排除不适当的转换.
3、交互式生成,用户协助产生流畅译文,用户在省略、指代、主题化方面对生成提供指导.
最早的交互式机器翻译(InteractiveMachineTranslation,IMT)工具是Kay[5]的"MINDsystem".
在这个工具中,用户的作用是通过回答有关源文本中单词认知、单词参照和前置短语关联等问题,来消除源文本中翻译的歧义性.
后来的研究者,比如Blanchon[6]、Boitet[7]、Brown和Nirenburg[8]、Maruyama和Watanabe[9]、Melby[10]、Tomita[11]、Whitelocketal[12]、Zajac[13]等开发的系统也基本上沿用这种模式,他们的研究主要集中在提高消除歧义的效率和通过问题排序等技术来减少问题数量从而减轻用户的负担;根据源语言可供选择的解释找到更自然的表达方式;给用户提供多种翻译选择,而且把最可能的翻译放在所选择内容的首位.
尽管这些研究者付出了巨大的努力,但"回答问题式"的IMT系统仍旧相当耗时费力,因此这类系统主要应用在用户对目标语言的知识有限或对目标语言知之甚少的情况下.
GuyLapalme和PhilippeLanglais等于1997-2005年间开发一个专供翻译人员使用的交互式辅助翻译工具TransType[14].
TransType的新颖之处在于将目前的基于统计的机器翻译和输入法技术结合起来,旨在减少翻译人员的翻译工作量.
目前已经有了TransType2版本.
TransType首先会扫描翻译人员预翻译的源语言文本,再根据翻译人员的键入的文本,给出后继翻译的提示,用户可以接受、修改这个翻译提示,也可以继续键入文本来忽略这个提示,系统则会不断地依据用户每次新的击键,重新计算然后修正对当前文本翻译的提示.
总的来说TransType可以在以下三个方面给翻译人员的工作予以帮助:1、当翻译人员在脑子里已经对要翻译的文本有合适的措词时,系统的提示3厦门大学博硕士论文摘要库一种具有英汉辅助翻译功能的拼音输入法可以加快翻译人员的翻译速度;2、当翻译人员在脑子里对要翻译的文本尚无合适的表达时,系统的提示可以充当一个建议,启发翻译工作者;3、当翻译人员在翻译录入时出现拼写错误,系统的提示可以充当一个警告.
现在TransType2已经实现了三种语言EnglishSpanish、EnglishFrench、EnglishGerman之间的相互辅助翻译.
1.
4本文的主要工作及创新之处本文实现了一种供专业翻译人员使用的交互式翻译工具——具有英汉辅助翻译功能的拼音输入法.
其主要工作集中在以下几点:1、利用机器翻译工具包和分词工具实现了英文句子和单词的翻译及句子译文的分词.
以此为基础,从专业翻译人员的思路出发,提出了英汉双语句子中的词汇模糊对齐策略,它是本文实现的立论基础.
2、研究了n元组统计语言模型理论基础——隐马尔可夫链及其相关技术,包括n元组模型的参数估计、模型压缩等,建立了《人民日报》语料库1元组、2元组、3元组的统计文件,并对2、3元组的统计结果建立了二级索引.
以此为基础来排除在估算翻译人员心目中互译句对的词汇对齐模型时,汉语字词的重音现象对系统判断的干扰.
3、深入研究了Windows平台下的汉字输入法技术,其中分析了Windows系统下IME实现的基本原理、IME的组成、输入法的体系结构、输入法设计中用到一些重要结构和消息及其工作的方式、IME和不同应用系统之间的通信,实现了一种支持词组输入功能的拼音输入法.
4、设计了具有英汉辅助翻译功能拼音输入法的系统框架,实现了具有英汉辅助翻译功能的拼音输入法.
并以手工方式对系统进行了评测.
同时也对系统中存在的一些问题进行了分析说明.
本文的创新之处如下:1、依据专业翻译人员的思路,提出了英汉双语句子中词汇模糊对齐模型,利用该模型可估计翻译人员当前预翻译单词的译文,排除单词翻译的歧义性.
2、以英汉双语句子中的词汇模糊对齐为基础,将汉字拼音输入法和基于统计的机器翻译技术结合起来,估计翻译人员想要的字词,供翻译人员确认选择,4厦门大学博硕士论文摘要库第1章绪论从而减少击键次数,产生符合专业翻译人员要求的译文.
1.
5本文的组织结构本文的主要内容分为7章:第1章是绪论,介绍了本课题的立题依据、科学意义、国内外研究现状、主要工作、创新之处和本文的组织结构.
第2章是英汉双语句子中词汇模糊对齐,详细介绍了英汉双语句子中词汇模糊对齐策略的概念,实现基础和实现策略.
第3章是n元组统计语言模型,介绍了n元组统计语言模型的相关技术,对1998年《人民日报》1月份的语料库进行了n元组统计和索引.
第4章是Windows平台下的汉字输入法技术,在分析了IME技术基础上,实现了一种Windows平台下汉字拼音输入法程序.
第5章是系统的设计和实现,首先设计了具有辅助翻译功能的拼音输入法的系统框架,接着实现了"把英文文本切分为句子模块"、"汉字注音模块"、"拼音输入法改造"模块;然后实现了英汉辅助翻译引擎程序和拼音输入法程序进程间的通信,最后详尽地描述了具有英汉辅助翻译功能的拼音输入法的整体运行机制.
第6章是系统评测,通过手工方式评测系统在句子翻译中的效果,并在击键次数方面与紫光拼音输入法和微软拼音输入法作了比较.
实验结果表明具有英汉辅助翻译功能的拼音输入法对专业翻译人员是有帮助的.
此外对实验中存在的问题进行了分析说明.
第7章是工作总结和展望,简单总结了目前所做的工作,并提出了进一步的研究设想.
1.
6小结本章首先介绍了具有英汉辅助翻译功能的拼音输入法的立题依据、科学意义、学术思想以及相关技术的国内外研究现状,其中着重介绍了交互式辅助翻译工具TransType,最后介绍了本文的主要工作、创新之处和组织结构.
5厦门大学博硕士论文摘要库Degreepapersareinthe"XiamenUniversityElectronicThesesandDissertationsDatabase".
Fulltextsareavailableinthefollowingways:1.
IfyourlibraryisaCALISmemberlibraries,pleaselogonhttp://etd.
calis.
edu.
cn/andsubmitrequestsonline,orconsulttheinterlibraryloandepartmentinyourlibrary.
2.
Forusersofnon-CALISmemberlibraries,pleasemailtoetd@xmu.
edu.
cnfordeliverydetails.
厦门大学博硕士论文摘要库
Megalayer 商家算是新晋的服务商,商家才开始的时候主要是以香港、美国独立服务器。后来有新增菲律宾机房,包括有VPS云服务器、独立服务器、站群服务器等产品。线路上有CN2优化带宽、全向带宽和国际带宽,这里有看到商家的特价方案有增加至9个,之前是四个的。在这篇文章中,我来整理看看。第一、香港服务器系列这里香港服务器会根据带宽的不同区别。我这里将香港机房的都整理到一个系列里。核心内存硬盘IP带宽...
妮妮云的来历妮妮云是 789 陈总 张总 三方共同投资建立的网站 本着“良心 便宜 稳定”的初衷 为小白用户避免被坑妮妮云的市场定位妮妮云主要代理市场稳定速度的云服务器产品,避免新手购买云服务器的时候众多商家不知道如何选择,妮妮云就帮你选择好了产品,无需承担购买风险,不用担心出现被跑路 被诈骗的情况。妮妮云的售后保证妮妮云退款 通过于合作商的友好协商,云服务器提供2天内全额退款,超过2天不退款 物...
官方网站:点击访问青云互联活动官网优惠码:终身88折扣优惠码:WN789-2021香港测试IP:154.196.254美国测试IP:243.164.1活动方案:用户购买任意全区域云服务器月付以上享受免费更换IP服务;限美国区域云服务器凡是购买均可以提交工单定制天机防火墙高防御保护端口以及保护模式;香港区域购买季度、半年付、年付周期均可免费申请额外1IP;使用优惠码购买后续费周期终身同活动价,价格不...
颁发的拼音为你推荐
投标360flashwind用flashwind这个加速器玩游戏,会被盗号吗?会被封号吗?中国企业信息网中国企业网怎么样sqlserver数据库如何登陆sql server中的数据库支付宝调整还款日蚂蚁借呗怎么设置还款时间360公司迁至天津奇虎360公司在哪?申请支付宝账户申请支付宝账号注册sns网站有哪些有哪些好的SNS商务社交类网站?曲目iosUsercuteftp
虚拟空间免费试用 猫咪av永久最新域名 域名买卖 政务和公益机构域名注册管理中心 中文域名申请 国内永久免费云服务器 12306抢票助手 空间服务商 上海域名 免费dns解析 web服务器搭建 512mb linode支付宝 中国域名 贵阳电信 atom处理器 lamp兄弟连 lamp的音标 学生服务器 卡巴斯基试用版下载 更多