机器翻译蓝灯鱼:tf2.0基于注意力的神经机器翻译训练发布过程

木头鱼在线翻译  时间:2021-04-26  阅读:()

文档

蓝灯鱼 Tf2.0+基于注意力的神经机器翻译训练发布过程本篇是人工智能、机器翻译的干货文章面向从事人工智能的研发工程师和翻译领域的职业从业者。意在译员能更好的从计算机编程角度理解机器翻译的代码实现过程。同时也和机器翻译开发工程师共同分享源码的快乐。

实例是采用当下最新的tensorflow2.0+框架实现transforme r模型Attention注意力、MultiHeadAttention 多头注意力 、位置嵌入、掩码、按层提取翻译结果、 Flask服务发布。实例代码为完整代码拷贝即可运行如果有兴趣获得完整的.py代码请在公众号下留言获得代码文件。

本文章主要是tensorflow2.0官方教程的模拟整理而来喜欢原版和英文阅读的请参考官方教程。官方为葡萄牙语和英语的翻译只有训练和预测过程。未给出中文实例、也丌能发布应用。

实例用1000W数据训练后的结果参考

文档

文档

整个过程可以分一下几个步骤

1. 创建机器翻译模型训练数据。

2. 模型编写和超参数设置。

3. 训练模型。

4. 发布模型应用服务

5. 验证机器翻译模型结果

公共参数HyperParams.py

文档

1.创建机器翻译模型训练数据。生成源语言和目标语言的词典

文档

注意如果数据量过大会内存溢出。本人用1000W数据发生此情况另外利用jieba分词重新生成了subword的中文的词典。

2.模型编写和超参数设置。 transformer_model.py

文档

文档

文档

文档

Friendhosting四五折促销,VPS半年付7.5欧元起

Friendhosting发布了针对“系统管理日”(每年7月的最后一个星期五)的优惠活动,针对VPS主机提供55%的优惠(相当于四五折),支持1-6个月付款使用,首付折扣非永久,优惠后最低套餐首半年7.18欧元起。这是一家保加利亚主机商,成立于2009年4月,商家提供VDS和独立服务器租用等,数据中心目前可选美国洛杉矶、保加利亚、乌克兰、荷兰、拉脱维亚、捷克和波兰等8个地区机房。下面以最低套餐为例...

Gcore(75折)迈阿密E5-2623v4 CPU独立服务器

部落分享过多次G-core(gcorelabs)的产品及评测信息,以VPS主机为主,距离上一次分享商家的独立服务器还在2年多前,本月初商家针对迈阿密机房限定E5-2623v4 CPU的独立服务器推出75折优惠码,活动将在9月30日到期,这里再分享下。G-core(gcorelabs)是一家总部位于卢森堡的国外主机商,主要提供基于KVM架构的VPS主机和独立服务器租用等,数据中心包括俄罗斯、美国、日...

阿里云秋季促销活动 轻量云服务器2G5M配置新购年60元

已经有一段时间没有分享阿里云服务商的促销活动,主要原因在于他们以前的促销都仅限新用户,而且我们大部分人都已经有过账户基本上促销活动和我们无缘。即便老用户可选新产品购买,也是比较配置较高的,所以就懒得分享。这不看到有阿里云金秋活动,有不错的促销活动可以允许产品新购。即便我们是老用户,但是比如你没有购买过他们轻量服务器,也是可以享受优惠活动的。这次轻量服务器在金秋活动中力度折扣比较大,2G5M配置年付...

木头鱼在线翻译为你推荐
中平迅雷contentcss更新ios支持ipad司机苹果5iphone连不上wifi苹果手机无法连接wifi是什么原因itunes备份itunes 里面的资料如何备份?重庆电信宽带管家如何才能以正确的流程在重庆电信安装上宽带icloudiphone苹果6显示已停用请连接itunes什么意思chromeframechrome需要frame吗
美国域名 什么是域名地址 阿里云os 新加坡主机 bandwagonhost sub-process 网站被封 阿里云浏览器 建立邮箱 合租空间 彩虹云 成都主机托管 黑科云 服务器托管价格 免备案jsp空间 湖南铁通 windows2008 winserver2008下载 泥瓦工 文件服务器硬件配置 更多