Lucene学习总结之二：Lucene的总体架构

最新推荐文章于 2025-07-22 14:11:58 发布

原创

最新推荐文章于 2025-07-22 14:11:58 发布 · 1.7w 阅读

·

6

·

标签

#lucene #全文检索 #文档 #search #query

本文深入探讨了Lucene的总体架构，包括其作为全文检索库的角色、索引和搜索过程。Lucene使用Document表示被索引的文档，通过IndexWriter创建索引，使用Query代表查询，IndexSearcher进行搜索并计算得分。分析了索引过程中的Field、Analyzer和IndexWriter，以及搜索过程中的IndexReader、QueryParser和IndexSearcher。了解这些组件和模块有助于理解Lucene的源码实现。

Lucene总的来说是：

一个高效的，可扩展的，全文检索库。
全部用Java实现，无须配置。
仅支持纯文本文件的索引(Indexing)和搜索(Search)。
不负责由其他格式的文件抽取纯文本文件，或从网络中抓取文件的过程。

在Lucene in action中，Lucene 的构架和过程如下图，

[图]Lucene的构架和过程

说明Lucene 是有索引和搜索的两个过程，包含索引创建，索引，搜索三个要点。

让我们更细一些看Lucene的各组件：

[图]Lucene各组件

被索引的文档用Document对象 表示。
IndexWriter 通过函数addDocument 将文档添加到索引中，实现创建索引的过程。
Lucene 的索引是应用反向索引。

最低0.47元/天解锁文章

评论 12

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。