其实大学时期曾经研究过一段时间的lucene,但是那时候看的版本还是3.x,与现在最新版的4.9有着很大的差别。而且我也有很久没看这个也忘的差不多了,所以打算重新用4.9的版本学习一下。
Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻。在java开发环境里Lucene是一个成熟的免费开源工具。就其本身而言,Lucene是当前以及最近几年最受欢迎的免费Java信息检索程序库。人们经常提到信息检索程序库,虽然与搜索引擎有关,但不应该将信息检索程序库与搜索引擎相混淆。
总的来说,Lucene有以下几个特点:
1.高效、可扩展、开源的全文检索引擎工具包
2.Java实现,无须配置
3.仅支持纯文本文件的索引(Indexing)和搜索(Search)
4.不负责由其他格式的文件抽取纯文本文件,或从网络中抓取文件的过程。
Lucene官方网站:
Lucene4.9.0下载地址:
http://mirrors.hust.edu.cn/apache/lucene/java/4.9.0/
另外本文使用Lucene4.9.0版本开发,与您使用的版本不同可能会导致部分代码以及原理会有出入,请大家酌情参考。
最后说明一下,本系列所有示例代码都在github上,地址https://github.com/irfen/lucene-example
本文发表自赵伊凡BLOG
©原创文章,转载请注明来源: 赵伊凡's Blog
©本文链接地址: 1、Lucene4.9学习笔记——Lucene简介
“1、Lucene4.9学习笔记——Lucene简介”的35个回复