重磅:Kafka迎来1.
0.
0版本,正式告别四位数版本号!
Kafka从首次发布之日起,已经走过了七个年头.
从最开始的大规模消息系统,发展成为功能完善的分布式流式处理平台,用于发布和订阅、存储及实时地处理大规模流数据.
来自世界各地的数千家公司在使用Kafka,包括三分之一的500强公司.
Kafka以稳健的步伐向前迈进,首先加入了复制功能和无边界的键值数据存储,接着推出了用于集成外部存储系统的ConnectAPI,后又推出了为实时应用和事件驱动应用提供原生流式处理能力的StreamsAPI,并于今年春季开始支持仅一次处理语义.
如此广泛的应用和完备的功能以及如此悠久的历史,无一不在说明Kafka已经成为一款稳定的企业级产品.
而更为激动人心的是,Kafka现在正式迎来了1.
0.
0版本!
Kafka1.
0.
0主要更新0.
10.
0版本里开始引入的StreamsAPI在1.
0.
0版本里继续演进,改进了builderAPI(KIP-120),新增了用于查看运行时活跃任务的API(KIP-130)和用于聚合分区的cogroupAPI(KIP-150).
增强的print()和writeAsText()方法让调试变得更容易(KIP-160).
其他更多信息可以参考Streams文档.
改进了Connect的度量指标(KIP-196),新增了大量用于健康监测的度量指标(KIP-188),并提供了集群的GloabalTopicCount和GlobalPartitionCount度量指标(KIP-168).
支持Java9,实现更快的TLS和CRC32C,加快了加密速度,降低了计算开销.
调整了SASL认证模块的错误处理逻辑(KIP-152),原先的认证错误信息现在被清晰地记录到日志当中.
更好地支持磁盘容错(KIP-112),更优雅地处理磁盘错误,单个JBOD上的磁盘错误不会导致整个集群崩溃.
0.
11.
0版本中引入的幂等性生产者需要将max.
in.
flight.
requests.
per.
connection参数设置为1,这对吞吐量造成了一定的限制.
而在1.
0.
0版本里,这个参数最大可以被设置为5(KAFKA-5949),极大提升了吞吐量范围.
1/3如果想及时了解Spark、Hadoop或者Hbase相关的文章,欢迎关注微信公共帐号:iteblog_hadoopApacheKafka1.
0.
0RELEASENOTES下载ApacheKafka1.
0.
0崛起的KafkaKafka起初是由LinkedIn公司开发的一个分布式的消息系统,后成为Apache的一部分,它使用Scala编写,以可水平扩展和高吞吐率而被广泛使用.
目前越来越多的开源分布式处理系统如Cloudera、ApacheStorm、Spark等都支持与Kafka集成.
随着微服务的流行,很多公司都在尝试将现有的系统进行架构升级.
促成Movio公司架构改造的一项关键技术就是Kafka消息队列.
Kafka作为分布式消息队列,在可靠性和可扩展性方面有非常大的优势.
它不仅成为了Movio公司基础架构的关键组成部分,还为正在创建的系统架构提供了依据.
Kafka全面解析Kafka数据可靠性深度解读Kafka作为一个商业级消息中间件,消息可靠性的重要性可想而知.
如何确保消息的精确传输如何确保消息的准确存储如何确保消息的正确消费这些都是需要考虑的问题.
唯品会消息中间件团队首先从Kafka的架构着手,解释了Kafka的基本原理,然后通过对kakfa的存储机制、复制原理、同步原理、可靠性和持久性保证等等一步步对其可靠性进行分析,最后2/3通过benchmark来增强对Kafka高可靠性的认知.
KafkaStream设计详解本文介绍了KafkaStream的背景,如KafkaStream是什么,什么是流式计算,以及为什么要有KafkaStream.
接着介绍了KafkaStream的整体架构、并行模型、状态存储以及主要的两种数据集KStream和KTable.
然后分析了KafkaStream如何解决流式系统中的关键问题,如时间定义、窗口操作、Join操作、聚合操作,以及如何处理乱序和提供容错能力.
最后结合示例讲解了如何使用KafkaStream.
Kafka不只是个消息系统Confluent联合创始人兼CEOJayKreps发表了一篇博文,指出了Kafka的真正定位——它不只是个消息系统,它还是个存储系统,而它的终极目标是要让流式处理成为现代企业的主流开发范式.
人们更多的是把Kafka当成了消息队列系统.
消息队列有一些不成文的规则,比如"不要在消息队列里保存消息".
传统的消息系统在设计上存在很多不足.
从根本上讲,任何一个异步消息系统都会保存消息,只是时间很短,有时候只有几秒钟,直到消息被消费为止.
实际上,Kafka并非传统意义上的消息队列,它与RabbitMQ等消息系统并不一样.
它更像是一个分布式的文件系统或数据库.
Kafka与传统消息系统之间有三个关键区别.
Kafka持久化日志,这些日志可以被重复读取和无限期保留Kafka是一个分布式系统:它以集群的方式运行,可以灵活伸缩,在内部通过复制数据提升容错能力和高可用性Kafka支持实时的流式处理以上三点足以将Kafka与传统的消息队列区别开,我们甚至可以把它看成是流式处理平台.
因此,在Kafka里存储数据并不是什么疯狂事,甚至可以说Kafka本来就是设计用来存储数据的.
数据经过校验后被持久化在磁盘上,并通过复制副本提升容错能力.
再多的数据都不会拖慢Kafka,在生产环境中,有些Kafka集群甚至已经保存超过1TB的数据.
本博客文章除特别声明,全部都是原创!
原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载.
本文链接:【】()PoweredbyTCPDF(www.
tcpdf.
org)3/3
快云科技怎么样?快云科技是一家成立于2020年的新起国内主机商,资质齐全 持有IDC ICP ISP等正规商家。云服务器网(yuntue.com)小编之前已经介绍过很多快云科技的香港及美国云服务器了,这次再介绍一下新的优惠方案。目前,香港云沙田CN2云服务器低至29元/月起;美国超防弹性云/洛杉矶CUVIP低至33.6元/月起。快云科技的云主机架构采用KVM虚拟化技术,全盘SSD硬盘,RAID10...
pacificrack怎么样?pacificrack商家发布了七月最新优惠VPS云服务器计划方案,推出新款优惠便宜VPS云服务器采用的是国产魔方管理系统,也就是PR-M系列,全系基于KVM虚拟架构,这次支持Windows server 2003、2008R2、2012R2、2016、2019、Windows 7、Windows 10以及Linux等操作系统,最低配置为1核心2G内存1Gbps带宽1...
profitserver正在对德国vps(法兰克福)、西班牙vps(马德里)、荷兰vps(杜廷赫姆)这3处数据中心内的VPS进行5折优惠促销。所有VPS基于KVM虚拟,纯SSD阵列,自带一个IPv4,不限制流量,在后台支持自定义ISO文件,方便大家折腾!此外还有以下数据中心:俄罗斯(多机房)、捷克、保加利亚、立陶宛、新加坡、美国(洛杉矶、锡考克斯、迈阿密)、瑞士、波兰、乌克兰,VPS和前面的一样性...
暴风冯鑫被正式提起公诉为你推荐
巡查在线代理dangersbit检索网易yeahphpadmin下载免费MP3下载企业推广推广专员一般每天要做哪些工作开启javascript怎么在浏览器中启用JavaScript?linux防火墙设置怎样用iptables配置好Linux防火墙?163yeah请问网易的163,126,yeah,VIP,188邮箱各有什么特点?dell服务器bios设置戴尔服务器主板怎么设置U盘启动支付宝注册网站在哪里注册支付宝
国外vps 域名抢注工具 漂亮qq空间 uk2 优惠码 老左博客 iis安装教程 ubuntu更新源 ev证书 双十一秒杀 最好的qq空间 重庆双线服务器托管 注册阿里云邮箱 实惠 卡巴斯基试用版下载 新疆服务器 移动王卡 认证机构 comodo symantec 更多