日期:2014-05-16  浏览次数:20716 次

solr学习笔记-linux下配置solr

本文地址:

http://zhoujianghai.iteye.com/blog/1540176

?

首先介绍一下solr:

Apache Solr (读音:?SOLer)?是一个开源、高性能、采用Java开发、基于Lucene的全文搜索服务器文档通过Http利用XML加到一个搜索集合中,查询该集合也是通过 http收到一个XML/JSON响应来实现。Solr 中存储的资源是以 Document 为对象进行存储的。每个文档由一系列的 Field 构成,每个 Field 表示资源的一个属性。Solr 中的每个 Document 需要有能唯一标识其自身的属性,默认情况下这个属性的名字是 id,在 Schema 配置文件(schema.xml)中使用:<uniqueKey>id</uniqueKey>进行描述。solr有两个核心文件,solrconfig.xml和schema.xml。solrconfig.xml是solr的基础文件,里面配置了各种web请求处理器、请求响应处理器、日志、缓存等;schema.xml配置映射了各种数据类型的索引方案,分词器的配置、索引文档中包含的字段也在此配置。

工作中主要用来分词和搜索,简单的工作原理是:利用分词器对数据源进行分词处理,然后根据分词结果建立索引库;查询的时候,利用分词器对查询语句进行分词,根据查询语句分词的结果在索引库中进行匹配,最后返回结果。


废话少说,下面开始solr之旅吧:

一.安装JDK和Tomcat

(1):安装jdk ?下载jdk安装包,解压到jdk-1.x目录

(2):安装tomcat,下载tomcat安装包,解压到apache-tomcat目录下

修改tomcat安装目录下的conf目录的server.xml

找到<Connector port="8080" .../>,加入URIEncoding="UTF-8",为了支持中文。

设置Java和tomcat环境变量


上面两步比较简单,这里就只简单描述一下,不明白的可以网上查资料。


二. 安装solr