重磅:Kafka迎来1.
0.
0版本,正式告别四位数版本号!
Kafka从首次发布之日起,已经走过了七个年头.
从最开始的大规模消息系统,发展成为功能完善的分布式流式处理平台,用于发布和订阅、存储及实时地处理大规模流数据.
来自世界各地的数千家公司在使用Kafka,包括三分之一的500强公司.
Kafka以稳健的步伐向前迈进,首先加入了复制功能和无边界的键值数据存储,接着推出了用于集成外部存储系统的ConnectAPI,后又推出了为实时应用和事件驱动应用提供原生流式处理能力的StreamsAPI,并于今年春季开始支持仅一次处理语义.
如此广泛的应用和完备的功能以及如此悠久的历史,无一不在说明Kafka已经成为一款稳定的企业级产品.
而更为激动人心的是,Kafka现在正式迎来了1.
0.
0版本!
Kafka1.
0.
0主要更新0.
10.
0版本里开始引入的StreamsAPI在1.
0.
0版本里继续演进,改进了builderAPI(KIP-120),新增了用于查看运行时活跃任务的API(KIP-130)和用于聚合分区的cogroupAPI(KIP-150).
增强的print()和writeAsText()方法让调试变得更容易(KIP-160).
其他更多信息可以参考Streams文档.
改进了Connect的度量指标(KIP-196),新增了大量用于健康监测的度量指标(KIP-188),并提供了集群的GloabalTopicCount和GlobalPartitionCount度量指标(KIP-168).
支持Java9,实现更快的TLS和CRC32C,加快了加密速度,降低了计算开销.
调整了SASL认证模块的错误处理逻辑(KIP-152),原先的认证错误信息现在被清晰地记录到日志当中.
更好地支持磁盘容错(KIP-112),更优雅地处理磁盘错误,单个JBOD上的磁盘错误不会导致整个集群崩溃.
0.
11.
0版本中引入的幂等性生产者需要将max.
in.
flight.
requests.
per.
connection参数设置为1,这对吞吐量造成了一定的限制.
而在1.
0.
0版本里,这个参数最大可以被设置为5(KAFKA-5949),极大提升了吞吐量范围.
1/3如果想及时了解Spark、Hadoop或者Hbase相关的文章,欢迎关注微信公共帐号:iteblog_hadoopApacheKafka1.
0.
0RELEASENOTES下载ApacheKafka1.
0.
0崛起的KafkaKafka起初是由LinkedIn公司开发的一个分布式的消息系统,后成为Apache的一部分,它使用Scala编写,以可水平扩展和高吞吐率而被广泛使用.
目前越来越多的开源分布式处理系统如Cloudera、ApacheStorm、Spark等都支持与Kafka集成.
随着微服务的流行,很多公司都在尝试将现有的系统进行架构升级.
促成Movio公司架构改造的一项关键技术就是Kafka消息队列.
Kafka作为分布式消息队列,在可靠性和可扩展性方面有非常大的优势.
它不仅成为了Movio公司基础架构的关键组成部分,还为正在创建的系统架构提供了依据.
Kafka全面解析Kafka数据可靠性深度解读Kafka作为一个商业级消息中间件,消息可靠性的重要性可想而知.
如何确保消息的精确传输如何确保消息的准确存储如何确保消息的正确消费这些都是需要考虑的问题.
唯品会消息中间件团队首先从Kafka的架构着手,解释了Kafka的基本原理,然后通过对kakfa的存储机制、复制原理、同步原理、可靠性和持久性保证等等一步步对其可靠性进行分析,最后2/3通过benchmark来增强对Kafka高可靠性的认知.
KafkaStream设计详解本文介绍了KafkaStream的背景,如KafkaStream是什么,什么是流式计算,以及为什么要有KafkaStream.
接着介绍了KafkaStream的整体架构、并行模型、状态存储以及主要的两种数据集KStream和KTable.
然后分析了KafkaStream如何解决流式系统中的关键问题,如时间定义、窗口操作、Join操作、聚合操作,以及如何处理乱序和提供容错能力.
最后结合示例讲解了如何使用KafkaStream.
Kafka不只是个消息系统Confluent联合创始人兼CEOJayKreps发表了一篇博文,指出了Kafka的真正定位——它不只是个消息系统,它还是个存储系统,而它的终极目标是要让流式处理成为现代企业的主流开发范式.
人们更多的是把Kafka当成了消息队列系统.
消息队列有一些不成文的规则,比如"不要在消息队列里保存消息".
传统的消息系统在设计上存在很多不足.
从根本上讲,任何一个异步消息系统都会保存消息,只是时间很短,有时候只有几秒钟,直到消息被消费为止.
实际上,Kafka并非传统意义上的消息队列,它与RabbitMQ等消息系统并不一样.
它更像是一个分布式的文件系统或数据库.
Kafka与传统消息系统之间有三个关键区别.
Kafka持久化日志,这些日志可以被重复读取和无限期保留Kafka是一个分布式系统:它以集群的方式运行,可以灵活伸缩,在内部通过复制数据提升容错能力和高可用性Kafka支持实时的流式处理以上三点足以将Kafka与传统的消息队列区别开,我们甚至可以把它看成是流式处理平台.
因此,在Kafka里存储数据并不是什么疯狂事,甚至可以说Kafka本来就是设计用来存储数据的.
数据经过校验后被持久化在磁盘上,并通过复制副本提升容错能力.
再多的数据都不会拖慢Kafka,在生产环境中,有些Kafka集群甚至已经保存超过1TB的数据.
本博客文章除特别声明,全部都是原创!
原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载.
本文链接:【】()PoweredbyTCPDF(www.
tcpdf.
org)3/3
Megalayer 商家在之前也有记录过,商家开始只有提供香港站群服务器和独立服务器,后来也有增加到美国独立服务器,以及前几天也有介绍到有增加香港VPS主机。对于香港服务器之前有过评测(Megalayer香港服务器配置一览及E3-1230 8GB服务器评测记录),这里申请到一台美国独立服务器,所以也准备简单的评测记录。目前市场上我们看到很多商家提供VPS或者云服务器基本上没有什么特别的,但是独立服...
每每进入第四季度,我们就可以看到各大云服务商的促销力度是一年中最大的。一来是年底的促销节日活动比较多,二来是商家希望最后一个季度冲刺业绩。这不还没有到第四季度,我们看到有些商家已经蠢蠢欲动的开始筹备活动。比如素有低价VPS收割机之称的Virmach商家居然还没有到黑色星期五就有发布黑五促销活动。Virmach 商家有十多个数据中心,价格是便宜的,但是机器稳定性和速度肯定我们也是有数的,要不这么低的...
欧路云新上了美国洛杉矶cera机房的云服务器,具备弹性云特征(可自定义需要的资源配置:E5-2660 V3、内存、硬盘、流量、带宽),直连网络(联通CUVIP线路),KVM虚拟,自带一个IP,支持购买多个IP,10G的DDoS防御。付款方式:PayPal、支付宝、微信、数字货币(BTC USDT LTC ETH)测试IP:23.224.49.126云服务器 全场8折 优惠码:zhujiceping...
暴风冯鑫被正式提起公诉为你推荐
新iphone也将禁售iPhone停用怎么解锁 三种处理方法详解企业建网站什么企业需要建网站?中国企业在线中金在线和中金公司有关系吗dell服务器bios设置dell怎样进入bios设置界面asp.net网页制作开发ASP.NET的网站,步骤是怎样?有经验的可以说说自己的经验平阴县教育和体育局下属锦东小学教学设备采购项目竞争性磋商文件台北市cuteftp连接cuteftp瑞东集团福能集团是一个什么企业?无忧登陆无忧登录好吗?
河南虚拟主机 godaddy域名注册 securitycenter 美国主机评测 idc评测网 宕机监控 42u标准机柜尺寸 好看的留言 嘟牛 165邮箱 工信部icp备案号 卡巴斯基免费试用 免费网页空间 超级服务器 空间租赁 vul 国外在线代理服务器 国外免费云空间 电信主机托管 葫芦机 更多