ElasticSearch系列文章:核心概念介绍

curl扩展  时间:2021-04-11  阅读:()
在《ElasticSearch系列文章:基本介绍》中主要介绍了ElasticSearch一些使用场景,本文将对Elasticsearch的核心概念进行介绍,这对后期使用ElasticSearch有着重要的影响.
1、NearRealtime(NRT):准实时Elasticsearch是一个准实时的搜索平台,这意味着当你索引一个文档(document)时,在细微的延迟(通常1s)之后,该文件才能被搜索到.
2、Cluster:集群一个集群是一个或多个nodes(servers)的集合,一起保存整个数据,并且提供从所有nodes上进行联合索引(federatedindexing)和搜索功能.
节点(node)是一个运行着的Elasticsearch实例.
集群(cluster)是一组具有相同cluster.
name的节点集合,他们协同工作,共享数据并提供故障转移和扩展功能,当然一个节点也可以组成一个集群.
你最好找一个合适的名字来替代cluster.
name(config/elasticsearch.
yml)的默认值,比如你自己的名字,这样可以防止一个新启动的节点加入到相同网络中的另一个同名的集群中.
比如你可以使用logging-dev,logging-stage和logging-prod来表示development,staging和production的集群环境.
3、Node:节点一个Node是Elasticsearch集群的一个服务器,用来存储数据并且参与到集群的索引和搜索功能中.
和集群的名称一样,一个Node也需要定义一个名字node.
name(config/elasticsearch.
yml),如果你不想使用默认,可以手工修改.
一个Node通过配置可以根据集群的名称cluster.
name加入一个指定的Elasticsearch集群.
4、Index:索引index是具有相似特征的文档(document)集合.
例如,你可以有顾客数据的index、商品种类的index和订单数据的index.
每个index都有唯一的名称(必须小写),当执行索引、搜索、更新和删除操作时都需要根据该名称找到对应的index.
一个cluster可以包含任意数量的index.
5、Type:类型在一个index中,可以定义一个或多个type.
type是index的逻辑分类.
通常,type拥有一组通用field的文档集合.
举例,你运行一个博客平台,把全部数据存储在一个index中.
在这个index中,你可以为用户数据定义一个type,为博客数据定义一个type,为评论数据定义一个type.
6、Document:文档document是索引的基本单元信息.
举例,你有一个客户的document、一个商品的documen1/3t和一个订单的document.
该document用JSON表示.
一个index/type中,可以包含任意多的document.
注意,虽然document物理上存在index中,document实际上必须被分配到index中的type上.
7、Shards和Replicas:分片和副本一个index可以存储数量超出硬件限制的数据.
举例,一个index包含10亿文档,占据1TB硬盘空间,就会导致无法放在单个节点硬盘上或者响应request太慢.
为了解决这个问题,Elasticsearch提供了将索引分片的技术,称为shard.
当创建一个index,可以指定shard的数量.
每个shard内部都是全功能而且相互独立的"index",可以放在cluster上的任意node上.
Sharding重要的两个主要原因:(1)允许横向扩展容量(2)分布式并行操作shard(可能在多个node上),因而提高性能分片是如何分布、文档是如何聚合回搜索结果的机制完全由Elasticsearch管理,对用户透明.
在网络/云环境中,故障是很常见的,比如一个shard/node宕了,因而容错机制非常有效,也是被推荐的.
为此,Elasticsearch允许创建index的shard的一个或多个副本,称为replica.
Replication重要的两个主要原因:(1)提供高可用性,以防shard/node失效.
注意,一个replicashard绝对不能分配到它原先所在node(即创建副本的原本所在的node);(2)允许扩展搜索容量,因为搜索可以并行在所有replica上执行总结每个index可以被分为多个shard.
一个index也可以被复制0份或者多份.
一旦复制过,每个index将有主shard(创建副本的原本所在的shard)和replicashard(主shard的副本).
shard和replica的数量可以在index创建的时候自定义.
index创建之后,你可以动态改变replica的数量,但是不能改变shard的数量.
在默认情况下,每个index被分配5个主shard和1个replica,这意味着,如果你在cluster中有至少两个节点,每个index将有10个shard,分别是5个主shard和另外5个replicashard(1个完整的replica).
需要注意的是,每个Elasticsearch的shard是一个Lucene的index.
在一个单独的Lucene的index中有最大数量的documents.
因为LUCENE-5843(https://issues.
apache.
org/jira/browse/LUCENE-5843)的原因,这个documents数量被限制为2,147,483,519(=Integer.
MAX_VALUE-128),你可以通过_cat/shards(curl10.
20.
18.
20:9200/_cat/shards)的api接口来监控shard的大小.
本博客文章除特别声明,全部都是原创!
2/3原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载.
本文链接:【】()PoweredbyTCPDF(www.
tcpdf.
org)3/3

41云,服务器8折优惠券,200G TCP防御

41云怎么样?41云是国人主机品牌,目前经营产品有国内外云服务器、CDN(高防CDN)和物理机,其中国内外云服务器又细分小类有香港限流量VPS、香港大带宽VPS、香港弹性自选VPS、香港不限流VPS、香港BGP线路VPS、香港Cera+大带宽机器、美国超防VPS、韩国原生VPS、仁川原生VPS、日本CN2 VPS、枣庄高防VPS和金华高防VPS;物理机有美国Cera服务器、香港单程CN2服务器、香...

香港云服务器最便宜价格是多少钱一个月、一年?

香港云服务器最便宜价格是多少钱一个月/一年?无论香港云服务器推出什么类型的配置和活动,价格都会一直吸引我们,那么就来说说香港最便宜的云服务器类型和香港最低的云服务器价格吧。香港云服务器最便宜最低价的价格是多少?香港云服务器只是服务器中最受欢迎的产品。香港云服务器有多种配置类型,如1核1G、2核2G、2核4G、8到16核32G等。这些配置可以满足大多数用户的需求,无论是电商站、视频还是游戏、小说等。...

华纳云E5处理器16G内存100Mbps688元/月

近日华纳云商家正式上线了美国服务器产品,这次美国机房上线的产品包括美国云服务器、美国独立服务器、美国高防御服务器以及美国高防云服务器等产品,新产品上线华纳云推出了史上优惠力度最高的特价优惠活动,美国云服务器低至3折,1核心1G内存5Mbps带宽低至24元/月,20G ddos高防御服务器低至688元/月,年付周期再送2个月、两年送4个月、三年送6个月,终身续费同价,有需要的朋友可以关注一下。华纳云...

curl扩展为你推荐
支付宝蜻蜓发布支付宝蜻蜓f4,可以让没有支付宝的人刷脸付款?重庆电信断网为什么电信宽带突然断网了波音737起飞爆胎美国737MAX又紧急迫降,为什么它还在飞?人人视频总部基地落户重庆渝洽会上的西部国际总部基地是做什么的?netshwinsockresetwin7系统我在输入netsh winsock reset后错误代码11003求大神解决上不了网flashfxp注册码求一个flashfxp v3.0.2的注册码大飞资讯新闻资讯包括什么内容?抢米网怎么样才能在小米官方网站抢到手机?zhuo爱大涿爱— 金鱼花火 、 歌词给我翻译过来。!温州都市报招聘温州哪里有招暑期工?怎么去?要什么条件?急......
linux虚拟主机 泛域名绑定 亚洲大于500m 私服服务器 cloudstack 监控宝 服务器怎么绑定域名 商务主机 浙江独立 河南服务器 免费cdn 四核服务器 域名与空间 宏讯 韩国代理ip 申请免费空间 免费网络空间 godaddy空间 乐视会员免费领取 北京主机托管 更多