1、索引PDF乱码
这种情况只发生在索引某些pdf文件,在网上找了很久,帖子都是很老的了,一时不知如何解决,于是到solr的contrib/extraction/lib目录下面找找看pdf使用的库:pdfbox-1.3.1.jar、fontbox-1.3.1.jar和jempbox-1.3.1.jar,再到官网上看看,发现最新的版本已经到1.6.0 了,索引下载回来替换掉原有的测试看看。在替换掉这三个jar包之后,重新索引之前乱码的文档,然后搜索,一切OK!
2、搜索时,某些字段返回值太大,影响使用。这个最后在stackoverflow上找到解答了,这里非常感谢作者:http://stackoverflow.com/questions/3452665/how-do-i-return-only-a-truncated-portion-of-a-field-in-solr。
具体操作如下:
添加搜索参数:
fl=id,name&
hl=true&
hl.fl=attr_content&
f.attr_content.hl.snippets=2&
f.attr_content.hl.alternateField=attr_content&
hl.maxAlternateFieldLength=300
第一行定义查询结果返回的字段,第二行定义使用高亮显示关键字,第三行定义需要高亮的字段,第四行我的理解是字段内容切片数,第五行第一高亮字段的可选字段,第六行是定义最大长度300.
3、在索引某些大文件时,会发生内存溢出,不过这个问题在第一个问题解决之后,暂时没有发生,后面还需要测试,以判断是否真正解决。
补充,通过仔细观察,发现如果PDF中使用了很多字体,这个时候会报错,内存溢出,针对这个的解决办法是设置tomcat启动参数,加大java虚拟机内存。
分享到:
相关推荐
博文链接:https://kinkabrain.iteye.com/blog/1236668
solr.warsolr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包...
Solr in Action version 6 PART 1:MEET SOLR 1 Introduction to Solr – FREE 2 Getting to know Solr – AVAILABLE 3 Key Solr concepts – AVAILABLE 4 Configuring Solr – AVAILABLE 5 Indexing – AVAILABLE 6...
配置solr出现404,试过很多方法解决不了,这有配置好的现成的,在wen.xml中将solrhome路径改成你创建的solrhome的路径
solr
solr的一些资料,常见问题解决方法汇总,开发过程中收集的
3.4 搜索引擎配置 34 3.4.1 Solr Schema 设计(如何定制索引的结构?) 34 3.5 如何进行索引操作? 36 3.5.1 基本索引操作 36 3.5.2 批量索引操作 37 3.6 如何进行搜索 39 3.6.1 搜索语法 39 3.6.2 排序 42 3.6.3 字段...
solr文档
solr
solr乱码解决方法,excel文件,贴图说明。
Solr定时更新Solr定时更新
solr技术文solr技术文solr技术文
solr manageschema 配置文件,增加了分词器后的配置文件
Solr 依存于Lucene,因为Solr底层的核心技术是使用Lucene 来实现的,Solr和Lucene的本质区别有以下三点:搜索服务器,企业级和管理。Lucene本质上是搜索库,不是独立的应用程序,而Solr是。Lucene专注于搜索底层的...
如何使用solr搭建服务器
solr增量更新-
Solr 8.11.2是8.x系列的最后一个版本,新版本已经是9.0版本了。 1,什么是solr? Solr是一个独立的企业级搜索应用服务器,他对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务提供一定格式...
在本套课程中,我们将全面的讲解Solr,从Solr基础到Solr高级,再到项目实战,基本上涵盖了Solr中所有的知识点。 主讲内容 章节一:Solr基础(上) 1. 环境搭建 2. 核心讲解 3. 数据导入 4. 各种中文分析器 章节二:...
Explain.solr.pl 是一个 Solr 的可视化工具,用来帮助你分析为什么一个文档会出现在搜索结果列表中。 支持 Solr: 3.0 3.1 3.2 3.3 3.4 3.5 标签:Explain
solr-6.2.0 强大的分布式搜索引擎,包含各种详细例子及源码解析