重磅:Kafka迎来1.
0.
0版本,正式告别四位数版本号!
Kafka从首次发布之日起,已经走过了七个年头.
从最开始的大规模消息系统,发展成为功能完善的分布式流式处理平台,用于发布和订阅、存储及实时地处理大规模流数据.
来自世界各地的数千家公司在使用Kafka,包括三分之一的500强公司.
Kafka以稳健的步伐向前迈进,首先加入了复制功能和无边界的键值数据存储,接着推出了用于集成外部存储系统的ConnectAPI,后又推出了为实时应用和事件驱动应用提供原生流式处理能力的StreamsAPI,并于今年春季开始支持仅一次处理语义.
如此广泛的应用和完备的功能以及如此悠久的历史,无一不在说明Kafka已经成为一款稳定的企业级产品.
而更为激动人心的是,Kafka现在正式迎来了1.
0.
0版本!
Kafka1.
0.
0主要更新0.
10.
0版本里开始引入的StreamsAPI在1.
0.
0版本里继续演进,改进了builderAPI(KIP-120),新增了用于查看运行时活跃任务的API(KIP-130)和用于聚合分区的cogroupAPI(KIP-150).
增强的print()和writeAsText()方法让调试变得更容易(KIP-160).
其他更多信息可以参考Streams文档.
改进了Connect的度量指标(KIP-196),新增了大量用于健康监测的度量指标(KIP-188),并提供了集群的GloabalTopicCount和GlobalPartitionCount度量指标(KIP-168).
支持Java9,实现更快的TLS和CRC32C,加快了加密速度,降低了计算开销.
调整了SASL认证模块的错误处理逻辑(KIP-152),原先的认证错误信息现在被清晰地记录到日志当中.
更好地支持磁盘容错(KIP-112),更优雅地处理磁盘错误,单个JBOD上的磁盘错误不会导致整个集群崩溃.
0.
11.
0版本中引入的幂等性生产者需要将max.
in.
flight.
requests.
per.
connection参数设置为1,这对吞吐量造成了一定的限制.
而在1.
0.
0版本里,这个参数最大可以被设置为5(KAFKA-5949),极大提升了吞吐量范围.
1/3如果想及时了解Spark、Hadoop或者Hbase相关的文章,欢迎关注微信公共帐号:iteblog_hadoopApacheKafka1.
0.
0RELEASENOTES下载ApacheKafka1.
0.
0崛起的KafkaKafka起初是由LinkedIn公司开发的一个分布式的消息系统,后成为Apache的一部分,它使用Scala编写,以可水平扩展和高吞吐率而被广泛使用.
目前越来越多的开源分布式处理系统如Cloudera、ApacheStorm、Spark等都支持与Kafka集成.
随着微服务的流行,很多公司都在尝试将现有的系统进行架构升级.
促成Movio公司架构改造的一项关键技术就是Kafka消息队列.
Kafka作为分布式消息队列,在可靠性和可扩展性方面有非常大的优势.
它不仅成为了Movio公司基础架构的关键组成部分,还为正在创建的系统架构提供了依据.
Kafka全面解析Kafka数据可靠性深度解读Kafka作为一个商业级消息中间件,消息可靠性的重要性可想而知.
如何确保消息的精确传输如何确保消息的准确存储如何确保消息的正确消费这些都是需要考虑的问题.
唯品会消息中间件团队首先从Kafka的架构着手,解释了Kafka的基本原理,然后通过对kakfa的存储机制、复制原理、同步原理、可靠性和持久性保证等等一步步对其可靠性进行分析,最后2/3通过benchmark来增强对Kafka高可靠性的认知.
KafkaStream设计详解本文介绍了KafkaStream的背景,如KafkaStream是什么,什么是流式计算,以及为什么要有KafkaStream.
接着介绍了KafkaStream的整体架构、并行模型、状态存储以及主要的两种数据集KStream和KTable.
然后分析了KafkaStream如何解决流式系统中的关键问题,如时间定义、窗口操作、Join操作、聚合操作,以及如何处理乱序和提供容错能力.
最后结合示例讲解了如何使用KafkaStream.
Kafka不只是个消息系统Confluent联合创始人兼CEOJayKreps发表了一篇博文,指出了Kafka的真正定位——它不只是个消息系统,它还是个存储系统,而它的终极目标是要让流式处理成为现代企业的主流开发范式.
人们更多的是把Kafka当成了消息队列系统.
消息队列有一些不成文的规则,比如"不要在消息队列里保存消息".
传统的消息系统在设计上存在很多不足.
从根本上讲,任何一个异步消息系统都会保存消息,只是时间很短,有时候只有几秒钟,直到消息被消费为止.
实际上,Kafka并非传统意义上的消息队列,它与RabbitMQ等消息系统并不一样.
它更像是一个分布式的文件系统或数据库.
Kafka与传统消息系统之间有三个关键区别.
Kafka持久化日志,这些日志可以被重复读取和无限期保留Kafka是一个分布式系统:它以集群的方式运行,可以灵活伸缩,在内部通过复制数据提升容错能力和高可用性Kafka支持实时的流式处理以上三点足以将Kafka与传统的消息队列区别开,我们甚至可以把它看成是流式处理平台.
因此,在Kafka里存储数据并不是什么疯狂事,甚至可以说Kafka本来就是设计用来存储数据的.
数据经过校验后被持久化在磁盘上,并通过复制副本提升容错能力.
再多的数据都不会拖慢Kafka,在生产环境中,有些Kafka集群甚至已经保存超过1TB的数据.
本博客文章除特别声明,全部都是原创!
原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载.
本文链接:【】()PoweredbyTCPDF(www.
tcpdf.
org)3/3
特网云官網特网云服务器在硬件级别上实现云主机之间的完全隔离;采用高端服务器进行部署,同时采用集中的管理与监控,确保业务稳定可靠,搭建纯SSD架构的高性能企业级云服务器,同时采用Intel Haswell CPU、高频DDR4内存、高速Sas3 SSD闪存作为底层硬件配置,分钟级响应速度,特网云采用自带硬防节点,部分节点享免费20G防御,可实现300G防御峰值,有效防御DDoS、CC等恶意攻击,保障...
ReadyDedis是一家2018年成立的国外VPS商家,由印度人开设,主要提供VPS和独立服务器租用等,可选数据中心包括美国洛杉矶、西雅图、亚特兰大、纽约、拉斯维加斯、杰克逊维尔、印度和德国等。目前,商家针对全部VPS主机提供新年5折优惠码,优惠后最低套餐1GB内存每月仅需2美元起,所有VPS均为1Gbps端口不限流量方式。下面列出几款主机配置信息。CPU:1core内存:1GB硬盘:25GB ...
Hostodo又发布了几款针对7月4日美国独立日的优惠套餐(Independence Day Super Sale),均为年付,基于KVM架构,采用NVMe硬盘,最低13.99美元起,可选拉斯维加斯或者迈阿密机房。这是一家成立于2014年的国外VPS主机商,主打低价VPS套餐且年付为主,基于OpenVZ和KVM架构,产品性能一般,支持使用PayPal或者支付宝等付款方式。商家客服响应也比较一般,推...
暴风冯鑫被正式提起公诉为你推荐
企业邮局系统企业邮件系统用什么软件好?搜狗360360影视大全怎样免费看大片字节跳动回应TikTok易主互动百科被字节跳动收购意味着什么?三友网有了解唐山三友集团的吗?大学生待遇如何,工资收入,福利保障,工作环境等等12306.com如何登录12306开源网店免费开源网上商城系统有哪些商务软件EDI软件 包括那些软件?joomla模板网上下载的Joomla模板要怎么安装?localsettingsLocal Settings这个文件夹是干什么的?超级用户电脑怎么切换超级用户模式
中文域名交易中心 evssl证书 三拼域名 警告本网站美国保护 刀片式服务器 免费活动 空间租赁 工信部网站备案查询 酸酸乳 大化网 双十二促销 免费赚q币 碳云 paypal兑换 内存 ssd 9929 海尔t68驱动 衡天主机 国外bt网站 更多