前言
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。ElasticSearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr,也是基于Lucene。

Elasticsearch 面试题
1、elasticsearch 了解多少,说说你们公司 es 的集群架构,索引数据大小,分片有多少,以及一些调优手段 。
2、elasticsearch 的倒排索引是什么
3、elasticsearch 索引数据多了怎么办,如何调优,部署
4、elasticsearch 是如何实现 master 选举的
5、详细描述一下 Elasticsearch 索引文档的过程
6、详细描述一下 Elasticsearch 搜索的过程?
7、Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法
8、lucence 内部结构是什么?
9、Elasticsearch 是如何实现 Master 选举的?
10、Elasticsearch 中的节点(比如共 20 个),其中的 10 个选了一个master,另外 10 个选了另一个 master,怎么办?
11、客户端在和集群连接时,如何选择特定的节点执行请求的?
12、详细描述一下 Elasticsearch 索引文档的过程。

1、elasticsearch 了解多少,说说你们公司 es 的集群架构,索引数据大小,分片有多少,以及一些调优手段 。
面试官:想了解应聘者之前公司接触的 ES 使用场景、规模,有没有做过比较大规模的索引设计、规划、调优。
解答:如实结合自己的实践场景回答即可。
比如:ES 集群架构 13 个节点,索引根据通道不同共 20+索引,根据日期,每日递增 20+,索引:10 分片,每日递增 1 亿+数据,每个通道每天索引大小控制:150GB 之内。
仅索引层面调优手段:
1.1、设计阶段调优
(1)根据业务增量需求,采取基于日期模板创建索引,通过 roll over API 滚动索引;
(2)使用别名进行索引管理;
(3)每天凌晨定时对索引做 force_merge 操作,以释放空间;
(4)采取冷热分离机制,热数据存储到 SSD,提高检索效率;冷数据定期进行

本文深入探讨Elasticsearch的工作原理,包括集群架构、倒排索引机制、索引与搜索过程、Master选举策略及运维调优技巧,为读者提供全面的技术指南。
1万+

被折叠的 条评论
为什么被折叠?



