ElasticSearch系列文章:核心概念介绍

curl扩展  时间:2021-04-11  阅读:()
在《ElasticSearch系列文章:基本介绍》中主要介绍了ElasticSearch一些使用场景,本文将对Elasticsearch的核心概念进行介绍,这对后期使用ElasticSearch有着重要的影响.
1、NearRealtime(NRT):准实时Elasticsearch是一个准实时的搜索平台,这意味着当你索引一个文档(document)时,在细微的延迟(通常1s)之后,该文件才能被搜索到.
2、Cluster:集群一个集群是一个或多个nodes(servers)的集合,一起保存整个数据,并且提供从所有nodes上进行联合索引(federatedindexing)和搜索功能.
节点(node)是一个运行着的Elasticsearch实例.
集群(cluster)是一组具有相同cluster.
name的节点集合,他们协同工作,共享数据并提供故障转移和扩展功能,当然一个节点也可以组成一个集群.
你最好找一个合适的名字来替代cluster.
name(config/elasticsearch.
yml)的默认值,比如你自己的名字,这样可以防止一个新启动的节点加入到相同网络中的另一个同名的集群中.
比如你可以使用logging-dev,logging-stage和logging-prod来表示development,staging和production的集群环境.
3、Node:节点一个Node是Elasticsearch集群的一个服务器,用来存储数据并且参与到集群的索引和搜索功能中.
和集群的名称一样,一个Node也需要定义一个名字node.
name(config/elasticsearch.
yml),如果你不想使用默认,可以手工修改.
一个Node通过配置可以根据集群的名称cluster.
name加入一个指定的Elasticsearch集群.
4、Index:索引index是具有相似特征的文档(document)集合.
例如,你可以有顾客数据的index、商品种类的index和订单数据的index.
每个index都有唯一的名称(必须小写),当执行索引、搜索、更新和删除操作时都需要根据该名称找到对应的index.
一个cluster可以包含任意数量的index.
5、Type:类型在一个index中,可以定义一个或多个type.
type是index的逻辑分类.
通常,type拥有一组通用field的文档集合.
举例,你运行一个博客平台,把全部数据存储在一个index中.
在这个index中,你可以为用户数据定义一个type,为博客数据定义一个type,为评论数据定义一个type.
6、Document:文档document是索引的基本单元信息.
举例,你有一个客户的document、一个商品的documen1/3t和一个订单的document.
该document用JSON表示.
一个index/type中,可以包含任意多的document.
注意,虽然document物理上存在index中,document实际上必须被分配到index中的type上.
7、Shards和Replicas:分片和副本一个index可以存储数量超出硬件限制的数据.
举例,一个index包含10亿文档,占据1TB硬盘空间,就会导致无法放在单个节点硬盘上或者响应request太慢.
为了解决这个问题,Elasticsearch提供了将索引分片的技术,称为shard.
当创建一个index,可以指定shard的数量.
每个shard内部都是全功能而且相互独立的"index",可以放在cluster上的任意node上.
Sharding重要的两个主要原因:(1)允许横向扩展容量(2)分布式并行操作shard(可能在多个node上),因而提高性能分片是如何分布、文档是如何聚合回搜索结果的机制完全由Elasticsearch管理,对用户透明.
在网络/云环境中,故障是很常见的,比如一个shard/node宕了,因而容错机制非常有效,也是被推荐的.
为此,Elasticsearch允许创建index的shard的一个或多个副本,称为replica.
Replication重要的两个主要原因:(1)提供高可用性,以防shard/node失效.
注意,一个replicashard绝对不能分配到它原先所在node(即创建副本的原本所在的node);(2)允许扩展搜索容量,因为搜索可以并行在所有replica上执行总结每个index可以被分为多个shard.
一个index也可以被复制0份或者多份.
一旦复制过,每个index将有主shard(创建副本的原本所在的shard)和replicashard(主shard的副本).
shard和replica的数量可以在index创建的时候自定义.
index创建之后,你可以动态改变replica的数量,但是不能改变shard的数量.
在默认情况下,每个index被分配5个主shard和1个replica,这意味着,如果你在cluster中有至少两个节点,每个index将有10个shard,分别是5个主shard和另外5个replicashard(1个完整的replica).
需要注意的是,每个Elasticsearch的shard是一个Lucene的index.
在一个单独的Lucene的index中有最大数量的documents.
因为LUCENE-5843(https://issues.
apache.
org/jira/browse/LUCENE-5843)的原因,这个documents数量被限制为2,147,483,519(=Integer.
MAX_VALUE-128),你可以通过_cat/shards(curl10.
20.
18.
20:9200/_cat/shards)的api接口来监控shard的大小.
本博客文章除特别声明,全部都是原创!
2/3原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载.
本文链接:【】()PoweredbyTCPDF(www.
tcpdf.
org)3/3

江苏云服务器 2H2G 20M 79元/月 大宽带159元/月 高性能挂机宝6元/月 香港CN2 GIA、美国200G防御 CN2 GIA 折后18元/月 御速云

介绍:御速云成立于2021年的国人商家,深圳市御速信息技术有限公司旗下品牌,为您提供安全可靠的弹性计算服务,随着业务需求的变化,您可以实时扩展或缩减计算资源,使用弹性云计算可以极大降低您的软硬件采购成本,简化IT运维工作。主要从事VPS、虚拟主机、CDN等云计算产品业务,适合建站、新手上车的值得选择,拥有华东江苏、华东山东等国内优质云产品;香港三网直连(电信CN2GIA联通移动CN2直连);美国高...

618云上Go:腾讯云秒杀云服务器95元/年起,1C2G5M三年仅288元起

进入6月,各大网络平台都开启了618促销,腾讯云目前也正在开展618云上Go活动,上海/北京/广州/成都/香港/新加坡/硅谷等多个地区云服务器及轻量服务器秒杀,最低年付95元起,参与活动的产品还包括短信包、CDN流量包、MySQL数据库、云存储(标准存储)、直播/点播流量包等等,本轮秒杀活动每天5场,一直持续到7月中旬,感兴趣的朋友可以关注本页。活动页面:https://cloud.tencent...

v5server:香港+美国机房,优质CN2网络云服务器,7折优惠,低至35元/月

v5net当前对香港和美国机房的走优质BGP+CN2网络的云服务器进行7折终身优惠促销,每个客户进线使用优惠码一次,额外有不限使用次数的终身9折优惠一枚!V5.NET Server提供的都是高端网络线路的机器,特别优化接驳全世界骨干网络,适合远程办公、跨境贸易、网站建设等用途。 官方网站:https://v5.net/cloud.html 7折优惠码:new,仅限新客户,每人仅限使用一次 9...

curl扩展为你推荐
http500http 550错误新iphone也将禁售现在2017年iPhone6s还有多久会被淘汰360退出北京时间怎样让电脑时间与北京时间相同outlookexpress家里电脑老是弹出“outlook express”这个东西,怎么除去啊?cuteftp什么是 CuteFtp Flashfxp Leapftp FlashGet360邮箱免费注册360账号-电子邮箱怎么填写?特朗普吐槽iPhone华为余承东吐槽iPhone X,除了贵啥优点都没有ipad代理苹果官网购买ipad要几天温州商标注册温州代理注册个商标是怎么收费的?碧海银沙网怎样在碧海银沙网里发布图片?
购买域名和空间 greengeeks 韩国俄罗斯 mediafire 国外私服 好看的留言 服务器cpu性能排行 dropbox网盘 怎么测试下载速度 umax120 超级服务器 免费邮件服务器 国外在线代理服务器 镇江高防 阿里云邮箱个人版 hostease 小夜博客 tracker服务器 酷锐 windowsserver2008 更多