WEB开发网
开发学院软件开发Java 利用SOLR搭建企业搜索平台 之九(solr的查询语法)... 阅读

利用SOLR搭建企业搜索平台 之九(solr的查询语法)

 2009-09-10 00:00:00 来源:WEB开发网   
核心提示:solr的一些查询语法 1. 首先假设我的数据里fields有:name, tel, address 预设的搜寻是name这个字段, 如果要搜寻的数据刚好就是 name 这个字段,就不需要指定搜寻字段名称. 2. 查询规则: 如欲查询特定字段(非预设字段),请在查询词前加上该字段名称加 “:”

solr的一些查询语法

1. 首先假设我的数据里fields有:name, tel, address 预设的搜寻是name这个字段, 如果要搜寻的数据刚好就是 name 这个字段,就不需要指定搜寻字段名称.

2. 查询规则:

如欲查询特定字段(非预设字段),请在查询词前加上该字段名称加 “:” (不包含”号) 符号,

例如: address:北京市海淀区上地软件园 tel:88xxxxx1

1>. q代表query input

2>. version代表solr版本(建议不要变动此变量)

3>. start代表显示结果从哪一笔结果资料开始,预设为0代表第一笔, rows是说要显示几笔数据,预设为10笔

(因为有时查询结果可能有几百笔,但不需要显示所有结果,所以预设是从第一笔开始到第十笔)

所以若要显示第10到30笔就改为:

http: //localhost:8080/solr/select/?indent=on&version=2.2&q=address:北京市海淀区上地软件园+tel:88xxxxx1&version=2.2&start=10&rows= 20&indent=on

(indent代表输出的xml要不要缩行.预设为开启 on)

3. 另外,要限定输出结果的内容可用 “fl=” 加上你要的字段名称,如以下这个范例:

http: //localhost:8080/solr/select/?indent=on&version=2.2&q=text:北京+ OR+text:亿度&start=0&rows=10&fl=name,address,tel

在fl=之后加上了name,adress,tel

所以结果会如下:

<result name=”response” numFound=”1340″ start=”0″>
<doc>
<str name=”name”>北京亿度</str>
<str name=”address”>北京市海淀区上地软件园</str>
<str name=”tel”>88xxxxxx1</str>
</doc>
<doc>
<str name=”name”>北京亿度</str>
<str name=”address”/>
<str name=”tel”>88xxxxxx1</str>
</doc>
</result>

5. 查询 name 或 address:直接输入查询词, 如: 亿度

送出的内容即为:

name:亿度 AND address:海淀

6. 若要搜寻联集结果,请在词与词间空格或加上大写 “OR” (不包含”号).

例如: text:海淀 OR text:亿度

text:海淀 OR 亿度 

海淀 亿度

name:亿度 OR tel:88xxxxxx1

name:亿度 tel:88xxxxxx1

5. 若要搜寻交集结果,请在词与词间加上大写 “AND” 或 “+” (不包含”号).

例如: text:海淀 AND 亿度 

+text:海淀 +text:亿度

name:亿度 AND tel:88xxxxxx1

name: ( +亿度 +海淀)

6. 排除查询

在要排除的词前加上 “-” (不包含”号) 号

例如: 海淀 -亿度

搜寻结果不会有包含亿度的词的结果在内

7. Group 搜寻

使用 “()” 来包含一个group

如希望搜寻在店名字段内同时有 “台北”(不包含”号) 及 “火车站”(不包含”号)

8. 增加权重: 如要搜寻 “北京 加油站”(不包含”号) 但因为回传太多笔资料内有 “中华”(不包含”号) 或 “加油站”(不包含”号) 的结果,

所以想要把有包含 “加油站”(不包含”号)的数据往前排,可使用 “^”(不包含”号)符号在后面加上愈增加的权重数,

像是 “2″,则可以这样做:

北京 加油站^2

会同时搜寻含有北京或加油站的结果,并把加油站这个词加权所以搜寻时会先判断加油站这一个词在

搜寻结果中的比重,甚至假设一笔数据内加油站出现过两次以上的就更加会有优先权.

查询时在查询词后加上 “^” (不包含”号) 再加上权重分数

例如: 亿度 AND “北京”^2

亿度^2 OR 北京

9. Wildcard 搜寻使用 “*” 符号; 如果输入 “中国*银” (不包含”号), 结果会有中国信托商业银行, 中国输出入银行图书阅览室, 中国商银证券

中国及银之间可夹任何长短字词.

Tags:利用 SOLR 搭建

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接