机器翻译蓝灯鱼:tf2.0基于注意力的神经机器翻译训练发布过程

木头鱼在线翻译  时间:2021-04-26  阅读:()

文档

蓝灯鱼 Tf2.0+基于注意力的神经机器翻译训练发布过程本篇是人工智能、机器翻译的干货文章面向从事人工智能的研发工程师和翻译领域的职业从业者。意在译员能更好的从计算机编程角度理解机器翻译的代码实现过程。同时也和机器翻译开发工程师共同分享源码的快乐。

实例是采用当下最新的tensorflow2.0+框架实现transforme r模型Attention注意力、MultiHeadAttention 多头注意力 、位置嵌入、掩码、按层提取翻译结果、 Flask服务发布。实例代码为完整代码拷贝即可运行如果有兴趣获得完整的.py代码请在公众号下留言获得代码文件。

本文章主要是tensorflow2.0官方教程的模拟整理而来喜欢原版和英文阅读的请参考官方教程。官方为葡萄牙语和英语的翻译只有训练和预测过程。未给出中文实例、也丌能发布应用。

实例用1000W数据训练后的结果参考

文档

文档

整个过程可以分一下几个步骤

1. 创建机器翻译模型训练数据。

2. 模型编写和超参数设置。

3. 训练模型。

4. 发布模型应用服务

5. 验证机器翻译模型结果

公共参数HyperParams.py

文档

1.创建机器翻译模型训练数据。生成源语言和目标语言的词典

文档

注意如果数据量过大会内存溢出。本人用1000W数据发生此情况另外利用jieba分词重新生成了subword的中文的词典。

2.模型编写和超参数设置。 transformer_model.py

文档

文档

文档

文档

江苏云服务器 2H2G 20M 79元/月 大宽带159元/月 高性能挂机宝6元/月 香港CN2 GIA、美国200G防御 CN2 GIA 折后18元/月 御速云

介绍:御速云成立于2021年的国人商家,深圳市御速信息技术有限公司旗下品牌,为您提供安全可靠的弹性计算服务,随着业务需求的变化,您可以实时扩展或缩减计算资源,使用弹性云计算可以极大降低您的软硬件采购成本,简化IT运维工作。主要从事VPS、虚拟主机、CDN等云计算产品业务,适合建站、新手上车的值得选择,拥有华东江苏、华东山东等国内优质云产品;香港三网直连(电信CN2GIA联通移动CN2直连);美国高...

racknerd新上架“洛杉矶”VPS$29/年,3.8G内存/3核/58gSSD/5T流量

racknerd发表了2021年美国独立日的促销费用便宜的vps,两种便宜的美国vps位于洛杉矶multacom室,访问了1Gbps的带宽,采用了solusvm管理,硬盘是SSDraid10...近两年来,racknerd的声誉不断积累,服务器的稳定性和售后服务。官方网站:https://www.racknerd.com多种加密数字货币、信用卡、PayPal、支付宝、银联、webmoney,可以付...

Sharktech:美国/荷兰独立服务器,10Gbps端口/不限流量/免费DDoS防护60G,319美元/月起

sharktech怎么样?sharktech (鲨鱼机房)是一家成立于 2003 年的知名美国老牌主机商,又称鲨鱼机房或者SK 机房,一直主打高防系列产品,提供独立服务器租用业务和 VPS 主机,自营机房在美国洛杉矶、丹佛、芝加哥和荷兰阿姆斯特丹,所有产品均提供 DDoS 防护。此文只整理他们家10Gbps专用服务器,此外该系列所有服务器都受到高达 60Gbps(可升级到 100Gbps)的保护。...

木头鱼在线翻译为你推荐
alargarios5"2014年全国民营企业招聘会现场A区域企业信息",,,,computationgraph更新iphone重庆网通重庆联通宽带windows键是哪个Windows键是哪个键啊?ipadwifiipad的wifi打不开怎么办?win7telnet怎样在win7下打开telnet 命令canvas2html5创建两个canvas后,怎么回到第一个canvasiphonewifi苹果手机怎么扫二维码连wifi
域名抢注 网站域名备案 免费动态域名 x3220 香港bgp机房 老鹰主机 韩国俄罗斯 视频存储服务器 godaddy域名转出 国外空间 ibrs 刀片服务器是什么 jsp空间 域名转接 常州联通宽带 超级服务器 学生服务器 apnic 谷歌搜索打不开 512内存 更多