solr 3.4 问题小记 - 分享是最好的记忆 - ITeye博客

`

aswang

浏览: 838255 次
性别:
来自: 南京

最近访客更多访客>>

isniu

efutureone

河畔之许愿树

greemranqq

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

loveseed1989：您好，我用您的方法运行Cone.java,会给我报java.l ...
vtk学习笔记 --- 编译vtk库和java库
60love5： 60love5 写道首先谢谢你的解析，但你这个验证可见性的小程 ...
多线程中共享对象的可见性
60love5：首先谢谢你的解析，但你这个验证可见性的小程序是存在问题的，你的 ...
多线程中共享对象的可见性
Gamehu520： ...
java 中的Unsafe
shanpao1234560：这个list不是静态的第一种情况下也会有线程安全的问题么，求指 ...
一个看似线程安全的示例

solr 3.4 问题小记

博客分类：

搜索引擎
solr

阅读更多

1、索引PDF乱码

这种情况只发生在索引某些pdf文件，在网上找了很久，帖子都是很老的了，一时不知如何解决，于是到solr的contrib/extraction/lib目录下面找找看pdf使用的库：pdfbox-1.3.1.jar、fontbox-1.3.1.jar和jempbox-1.3.1.jar，再到官网上看看，发现最新的版本已经到1.6.0 了，索引下载回来替换掉原有的测试看看。在替换掉这三个jar包之后，重新索引之前乱码的文档，然后搜索，一切OK！

2、搜索时，某些字段返回值太大，影响使用。这个最后在stackoverflow上找到解答了，这里非常感谢作者：http://stackoverflow.com/questions/3452665/how-do-i-return-only-a-truncated-portion-of-a-field-in-solr。

具体操作如下：

添加搜索参数：

fl=id,name&

hl=true&

hl.fl=attr_content&

f.attr_content.hl.snippets=2&

f.attr_content.hl.alternateField=attr_content&

hl.maxAlternateFieldLength=300

第一行定义查询结果返回的字段，第二行定义使用高亮显示关键字，第三行定义需要高亮的字段，第四行我的理解是字段内容切片数，第五行第一高亮字段的可选字段，第六行是定义最大长度300.

3、在索引某些大文件时，会发生内存溢出，不过这个问题在第一个问题解决之后，暂时没有发生，后面还需要测试，以判断是否真正解决。

补充，通过仔细观察，发现如果PDF中使用了很多字体，这个时候会报错，内存溢出，针对这个的解决办法是设置tomcat启动参数，加大java虚拟机内存。

0
顶

0
踩

分享到：

好久没写博客了 | solr 3.4配置中文分词IKAnalyzer3.2.8

2011-11-21 23:36
浏览 2131
评论(0)
分类:Web前端
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

solr 3.4 中文分词配置问题: 博文链接：https://kinkabrain.iteye.com/blog/1236668

solr.war包solr.war包solr.war包solr.war包solr.war包: solr.warsolr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包...

Solr in Action(1.2.3.4.5.6.8.11章可用): Solr in Action version 6 PART 1:MEET SOLR 1 Introduction to Solr – FREE 2 Getting to know Solr – AVAILABLE 3 Key Solr concepts – AVAILABLE 4 Configuring Solr – AVAILABLE 5 Indexing – AVAILABLE 6...

解决solr启动404问题: 配置solr出现404，试过很多方法解决不了，这有配置好的现成的，在wen.xml中将solrhome路径改成你创建的solrhome的路径

solr服务器_solr_: solr

solr资料以及问题汇总: solr的一些资料,常见问题解决方法汇总,开发过程中收集的

SOLR的应用教程: 3.4 搜索引擎配置 34 3.4.1 Solr Schema 设计(如何定制索引的结构?) 34 3.5 如何进行索引操作？ 36 3.5.1 基本索引操作 36 3.5.2 批量索引操作 37 3.6 如何进行搜索 39 3.6.1 搜索语法 39 3.6.2 排序 42 3.6.3 字段...

solr文档solr文档: solr文档

solr: solr

solr乱码解决方法: solr乱码解决方法，excel文件，贴图说明。

Solr定时更新Solr定时更新: Solr定时更新Solr定时更新

solr技术文solr技术文: solr技术文solr技术文solr技术文

solr_solr_: solr manageschema 配置文件，增加了分词器后的配置文件

solr5.4.0完整包: Solr 依存于Lucene，因为Solr底层的核心技术是使用Lucene 来实现的，Solr和Lucene的本质区别有以下三点：搜索服务器，企业级和管理。Lucene本质上是搜索库，不是独立的应用程序，而Solr是。Lucene专注于搜索底层的...

solr4.7服务搭建: 如何使用solr搭建服务器

solr增量更新架包apache-solr-dataimportscheduler.jar: solr增量更新-

已编译版本solr-8.11.2.tgz: Solr 8.11.2是8.x系列的最后一个版本，新版本已经是9.0版本了。 1，什么是solr? Solr是一个独立的企业级搜索应用服务器，他对外提供类似于Web-service的API接口。用户可以通过http请求，向搜索引擎服务提供一定格式...

java进阶Solr从基础到实战: 在本套课程中，我们将全面的讲解Solr，从Solr基础到Solr高级，再到项目实战，基本上涵盖了Solr中所有的知识点。主讲内容章节一：Solr基础(上) 1. 环境搭建 2. 核心讲解 3. 数据导入 4. 各种中文分析器章节二：...

Solr可视化工具Explain.solr.pl.zip: Explain.solr.pl 是一个 Solr 的可视化工具，用来帮助你分析为什么一个文档会出现在搜索结果列表中。支持 Solr： 3.0 3.1 3.2 3.3 3.4 3.5 标签：Explain

solr-6.2.0源码: solr-6.2.0 强大的分布式搜索引擎，包含各种详细例子及源码解析

Global site tag (gtag.js) - Google Analytics