ElasticSearch系列文章:核心概念介绍
curl扩展 时间:2021-04-11 阅读:(
)
在《ElasticSearch系列文章:基本介绍》中主要介绍了ElasticSearch一些使用场景,本文将对Elasticsearch的核心概念进行介绍,这对后期使用ElasticSearch有着重要的影响.
1、NearRealtime(NRT):准实时Elasticsearch是一个准实时的搜索平台,这意味着当你索引一个文档(document)时,在细微的延迟(通常1s)之后,该文件才能被搜索到.
2、Cluster:集群一个集群是一个或多个nodes(servers)的集合,一起保存整个数据,并且提供从所有nodes上进行联合索引(federatedindexing)和搜索功能.
节点(node)是一个运行着的Elasticsearch实例.
集群(cluster)是一组具有相同cluster.
name的节点集合,他们协同工作,共享数据并提供故障转移和扩展功能,当然一个节点也可以组成一个集群.
你最好找一个合适的名字来替代cluster.
name(config/elasticsearch.
yml)的默认值,比如你自己的名字,这样可以防止一个新启动的节点加入到相同网络中的另一个同名的集群中.
比如你可以使用logging-dev,logging-stage和logging-prod来表示development,staging和production的集群环境.
3、Node:节点一个Node是Elasticsearch集群的一个服务器,用来存储数据并且参与到集群的索引和搜索功能中.
和集群的名称一样,一个Node也需要定义一个名字node.
name(config/elasticsearch.
yml),如果你不想使用默认,可以手工修改.
一个Node通过配置可以根据集群的名称cluster.
name加入一个指定的Elasticsearch集群.
4、Index:索引index是具有相似特征的文档(document)集合.
例如,你可以有顾客数据的index、商品种类的index和订单数据的index.
每个index都有唯一的名称(必须小写),当执行索引、搜索、更新和删除操作时都需要根据该名称找到对应的index.
一个cluster可以包含任意数量的index.
5、Type:类型在一个index中,可以定义一个或多个type.
type是index的逻辑分类.
通常,type拥有一组通用field的文档集合.
举例,你运行一个博客平台,把全部数据存储在一个index中.
在这个index中,你可以为用户数据定义一个type,为博客数据定义一个type,为评论数据定义一个type.
6、Document:文档document是索引的基本单元信息.
举例,你有一个客户的document、一个商品的documen1/3t和一个订单的document.
该document用JSON表示.
一个index/type中,可以包含任意多的document.
注意,虽然document物理上存在index中,document实际上必须被分配到index中的type上.
7、Shards和Replicas:分片和副本一个index可以存储数量超出硬件限制的数据.
举例,一个index包含10亿文档,占据1TB硬盘空间,就会导致无法放在单个节点硬盘上或者响应request太慢.
为了解决这个问题,Elasticsearch提供了将索引分片的技术,称为shard.
当创建一个index,可以指定shard的数量.
每个shard内部都是全功能而且相互独立的"index",可以放在cluster上的任意node上.
Sharding重要的两个主要原因:(1)允许横向扩展容量(2)分布式并行操作shard(可能在多个node上),因而提高性能分片是如何分布、文档是如何聚合回搜索结果的机制完全由Elasticsearch管理,对用户透明.
在网络/云环境中,故障是很常见的,比如一个shard/node宕了,因而容错机制非常有效,也是被推荐的.
为此,Elasticsearch允许创建index的shard的一个或多个副本,称为replica.
Replication重要的两个主要原因:(1)提供高可用性,以防shard/node失效.
注意,一个replicashard绝对不能分配到它原先所在node(即创建副本的原本所在的node);(2)允许扩展搜索容量,因为搜索可以并行在所有replica上执行总结每个index可以被分为多个shard.
一个index也可以被复制0份或者多份.
一旦复制过,每个index将有主shard(创建副本的原本所在的shard)和replicashard(主shard的副本).
shard和replica的数量可以在index创建的时候自定义.
index创建之后,你可以动态改变replica的数量,但是不能改变shard的数量.
在默认情况下,每个index被分配5个主shard和1个replica,这意味着,如果你在cluster中有至少两个节点,每个index将有10个shard,分别是5个主shard和另外5个replicashard(1个完整的replica).
需要注意的是,每个Elasticsearch的shard是一个Lucene的index.
在一个单独的Lucene的index中有最大数量的documents.
因为LUCENE-5843(https://issues.
apache.
org/jira/browse/LUCENE-5843)的原因,这个documents数量被限制为2,147,483,519(=Integer.
MAX_VALUE-128),你可以通过_cat/shards(curl10.
20.
18.
20:9200/_cat/shards)的api接口来监控shard的大小.
本博客文章除特别声明,全部都是原创!
2/3原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载.
本文链接:【】()PoweredbyTCPDF(www.
tcpdf.
org)3/3
一年一度的黑色星期五和网络星期一活动陆续到来,看到各大服务商都有发布促销活动。同时RAKsmart商家我们也是比较熟悉的,这次是继双十一活动之后的促销活动。在活动产品中基本上沿袭双11的活动策略,比如有提供云服务器七折优惠,站群服务器首月半价、还有新人赠送红包等活动。如果我们有需要RAKsmart商家VPS、云服务器、独立服务器等产品的可以看看他们家的活动。这次活动截止到11月30日。第一、限时限...
#年终感恩活动#华纳云海外物理机688元/月,续费同价,50M CN2 GIA/100M国际大带宽可选,超800G 防御,不限流华纳云成立于2015年,隶属于香港联合通讯国际有限公司。拥有香港政府颁发的商业登记证明,作为APNIC 和 ARIN 会员单位,现有香港、美国等多个地区数据中心资源,百G丰富带宽接入,坚持为海内外用户提供自研顶级硬件防火墙服务,支持T B级超大防护带宽,单IP防护最大可达...
最近看到群里的不少网友在搭建大数据内容网站,内容量有百万篇幅,包括图片可能有超过50GB,如果一台服务器有需要多个站点的话,那肯定默认的服务器50GB存储空间是不够用的。如果单独在购买数据盘会成本提高不少。这里我们看到腾讯云促销活动中有2款带大数据盘的套餐还是比较实惠的,一台是400GB数据盘,一台是800GB数据盘,适合他们的大数据网站。 直达链接 - 腾讯云 大数据盘套餐服务器这里我们看到当前...
curl扩展为你推荐
企业邮局系统什么是企业邮局?wordpressWordPress 是什么?css加载失败网易邮箱登陆显示CSS加载失败,怎么办?急,在线等。全国企业信息查询想查一个企业的信息,哪个网站提供信息查询?支付宝调整还款日花呗还款日是什么时候呢重庆网站制作请问重庆那一家网站制作公司资信度比较好?技术实力雄厚呢?抢米网会知道怎样抢小米的请进来说一下。12306.com注册12306邮箱地址怎么写pintang深圳御品堂怎么才能保证他们卖的东西都是有机食品?tumblr上不去吃鸡更新完打不开,成这样了,怎么办在线等,挺急的
香港机房 mach 免费个人博客 阿里云浏览器 cn3 流媒体加速 吉林铁通 yundun 宏讯 smtp虚拟服务器 linode支付宝 东莞主机托管 中国linux 日本代理ip lamp是什么意思 主机返佣 广东服务器托管 博客域名 闪讯网 windows2008 更多