`
damoqingquan
  • 浏览: 47814 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

solr搜索引擎特性

阅读更多

英语原文(官方)翻译

Solr 简介

Solr 是一个带有web界面的企业级搜索服务器。它通过http协议将xml格式的文件进行索引,通过http协议进行查询,返回结果为xml格式。

* 先进的全文搜索能力

* 优化的web流量

* 基于开放接口(xml&http)的标准

* 集成的HTML管理界面

* 可扩展性-与其它Solr 服务器的高效结合

* 通过xml配置实现的灵活性和适应性

* 可扩展的插件体系结构

Solr使用Lucene查询库并对其进行了扩展

* 带有动态Field(Dynamic  Field)和唯一键(Unique Key)的实数据模式

* lucene查询语言的强大扩展

* 支持动态层面浏览和过滤

* 高级可配置的文本分析

* 高度可配置和用户可扩展的缓存(Caching

* 性能优化

* 通过xml的外部配置

* 管理界面

* 日志功能

* 快速增加的更新和快照功能

细节特征

Schema(模式) ,在Solr里面的一个xml文件

* 定义可用的field类型和document中可以使用的field

* 驱动更加智能处理过程

* Lucene分析器的说明

* 动态Field(Dynamic Fields)使得field的增加更快速

* CopyField 功能对某单个的field进行多种方式的索引或者将多种field结合到某个field(目的是加快搜索的速度)

* 模糊类型(Explicit types)省略了对field类型的猜测

* 基于文件的停用词,同义词,保护词外部配置

查询(Query

* 带有返回格式可配置(XML/XSLT, JSON, Python, Ruby)的HTTP接口

* 高亮文本片段显示

* 基于field值和明晰查询的层面搜索(Faceted Searching

* 添加到查询语言中的排序说明

* 函数查询通过filed的数值和顺序值的函数影响得分

* 性能优化

* 前缀查询,得分范围查询

Core

* 可插入的查询处理器(query handlers)和可扩展的xml数据格式

* 基于单键值field(unique key field)的强制的document唯一性

* 批量更新和删除

* 用户可配置的索引改变触发命令

* 搜索并发控制

* 正确的数值类型处理,以支持排序和范围查询

* 对没有用于排序的 fielddocument的正确处理

* 查询结果的动态分组

缓存(Caching

* 可配置的查询结果、过滤器、Document缓存实例

* 可添加的缓存实现

* 后台缓存预热

当一个新的查询器打开,可配置的查询就开始运行,以避免首次查询返回结果较慢,预热期间,当前查询继续进行

* 后台自动预热

当前的搜索器的缓存中包含经常访问的元素,当新的搜索器建立时自动将其加入,以提高缓存的命中率

* 快速/小型过滤器的实现

* 使用自动预热的用户级缓存

复制(Replication

* 对通过同步传输改变的索引的高效异步处理

* “前拉策略使得搜索器的添加更加容易

* 可配置的分布间隔获得了缓存使用和时效性之间的平衡

管理界面(Admin Interface

* 全面的缓存使用,查询,更新统计

* 文本分析调试器,展示文本在分析器中每个阶段的结果

* Web查询接口/调试输出

1. 查询输出的分析细节

2. Lucene 计算文档评分细节

3. 显示查询范围外的文档评分,以调试为什么给定的文档没有获得较高的评分

分享到:
评论
2 楼 damoqingquan 2008-11-24  
基本没有,只能在网上拣拣
1 楼 xfish6016 2008-11-16  
有详细的教程么?

相关推荐

    ElasticSearch与Solr搜索引擎特性对比-new.pdf

    ElasticSearch与Solr搜索引擎特性对比-new

    solr 企业搜索引擎教程

    更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容。 通过对 Solr 进行适当的配置, 某些情况下可能需要进行编码,Solr 可以阅读和使用构建到其他 Lucene 应用程序中的索引。此 外,很多 Lucene 工具(如 Nutch、...

    solr搜索培训

    Solr是一个拥有象WebService一样接口的独立运行的搜索服务器。它是基于lucene搜索引擎的服务,你将能够通过HTTP...可伸缩性-能够有效地复制到另外一个Solr搜索服务器 使用XML配置达到灵活性和适配性 可扩展的插件体系

    相关性搜索 利用Solr与Elasticsearch创建智能应用

    本书揭开了相关性搜索的神秘面纱,告诉大家如何将Elasticsearch 或Solr 这样的搜索引擎作为可编程的相关性框架,从而表达业务排名规则。从这本书中你可学会如何结合各种外部数据源、分类方法以及文本分析手段对...

    已编译版本solr-8.11.2.tgz

    并对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置,可扩展并对查询性能进行了优化,提供了一个完善的功能管理页面,是一款非常优秀的全文搜索引擎。 3,solr工作方式 文档通过http利用xml加...

    SOLR的应用教程

    1.1 企业搜索引擎方案选型 4 1.2 Solr的特性 4 1.2.1 Solr使用Lucene并且进行了扩展 4 1.2.2 Schema(模式) 5 1.2.3 查询 5 1.2.4 核心 5 1.2.5 缓存 5 1.2.6 复制 6 1.2.7 管理接口 6 1.3 Solr服务原理 6 1.3.1 ...

    Nutch搜索引擎·Solr简介及安装(第2期)

    1.1 Solr 简介 1.1.1 Solr 的特性 1.1.2 Solr 的目录结构 1.1.3 Solr 与Lucene 关系 1.2 Solr 安装 1.2.1 环境介绍 1.2.2 安装Solr 1.2.3 结合Nutch

    solr部署技术文档

    solr是一个基于lucene的全文检索引擎。他包括了全文检索,命中高亮,准实时搜索,富文本检索等特性. Solr是用Java编写的,并作为一个独立的全文搜索服务器,比如tomcat容器内运行。Solr的全文索引和搜索其核心使用了...

    Solr学习实践总结.doc

    Solr 最初由 CNET Networks 开发,2006 年初,Apache Software Foundation 在 Lucene 顶级项目的支持下得到了 Solr。...Solr 现在是 Lucene(Apache 的基于 Java 的全文本搜索引擎库)的一个子项目。

    Solr全文搜索服务器-其他

    Apache Solr是一个开源的搜索服务器。Solr使用Java语言开发,主要基于HTTP和Apache Lucene实现。Apache Solr中存储的资源是以Document为对象进行存储的。每个文档由一系列的Field构成,每个Field表示资源的一个属性...

    Hbase 二级索引方案

    进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。 Solr 可以高亮显示搜索结果,通过索引复制来提高可用,性,提供一套强大 Data Schema 来定义字段,类型和设置文本分析,提供基于 ...

    海量数据引擎SF1R.zip

    SF1R的全称是Search Formula 1 Revolution,SF1R是iZENECloud团队给搜索引擎项目使用的内部代号。 SF1R的历史和特色 SF1R是一个存在多年的项目,完全基于C 语言开发,最新的master分支已经可以用 C 11编译...

    java开源包1

    AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...

    java开源包11

    AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...

    java开源包2

    AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...

    java开源包3

    AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...

    java开源包6

    AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...

    java开源包5

    AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...

Global site tag (gtag.js) - Google Analytics