| 书[0名0]: | Solr指南 上卷|6912853 |
| 图书定价: | 99元 |
| 图书作者: | 兰小伟 |
| 出版社: | 机械工业出版社 |
| 出版日期: | 2018/1/1 0:00:00 |
| ISBN号: | 9787111581727 |
| 开本: | 16开 |
| 页数: | 0 |
| 版次: | 1-1 |
| 目录 |
序言 [0第0]1章 初识Solr 1 1.1 Solr是什么 1 1.2 Solr的历[0史0] 2 1.3 为什么要选择Solr 2 1.4 Solr功能预览 3 1.5 Solr下载 3 1.6 Solr[0学0]习资源 5 1.7 Windows平台下部署Solr 7 1.7.1 部署Solr至Jetty 7 1.7.2 部署Solr至Tomcat 13 1.8 Linux平台下部署Solr 16 1.9 玩转 [p1o1s] t.jar 20 1.10 在Eclipse中编译Solr源码 25 1.11 本章总结 27 [0第0]2章 Solr基础 28 2.1 Solr Core 28 2.1.1 Solr Core简介 28 2.1.2 Core的基本管理 30 2.1.3 Core Http接口 35 2.1.4 添加索引至Core 36 2.2 Solr DIH 38 2.2.1 索引文件夹下的文本文件 38 2.2.2 索引JSON/XML/CSV文件 42 2.2.3 使用Tika索引Word/Excel/PDF 45 2.2.4 索引网络上的远程文件 52 2.2.5 索引XML文件 55 2.2.6 从数据库中导入数据至Solr 57 2.2.7 Solr DIH总结 62 2.3 Solr Full Import全量导入 78 2.4 Solr Delta-import增量导入 80 2.5 Solr索引 85 2.5.1 Lucene索引原理 85 2.5.2 Lucene中常见术语详解 87 2.5.3 创建Solr索引 98 2.5.4 Solr Cell 99 2.5.5 Solr索引去重检测 102 2.5.6 Solr更新请求处理链 104 2.5.7 Solr原子更新 105 2.5.8 使用Luke查看索引 107 2.6 本章总结 109 [0第0]3章 Solr配置 110 3.1 solr.xml配置详解 110 3.2 solrconfig.xml配置详解 112 3.3 schema.xml配置详解 139 3.3.1 Solr Schema设计思想 139 3.3.2 Solr眼里的世界 139 3.3.3 域分词 140 3.3.4 Solr的schema文件 140 3.3.5 Solr的域类型 141 3.3.6 Solr的域 153 3.3.7 Schema API 157 3.3.8 Schemaless Mode 165 3.4 data-config.xml配置详解 167 3.5 zoo.cfg配置详解 169 3.6 本章总结 169 [0第0]4章 Solr分词 170 4.1 分词的基本概念 170 4.1.1 理解Analyzer 170 4.1.2 理解Tokenizer 171 4.1.3 理解TokenFilter 172 4.2 Solr分词器 172 4.2.1 Analyzer 173 4.2.2 Tokenizer 174 4.2.3 TokenFilter 182 4.2.4 CharFilter 202 4.2.5 Solr自定义分词 206 4.3 中文分词器 217 4.3.1 IK分词器 217 4.3.2 Ansj分词器 223 4.3.3 MMSeg4J分词器 233 4.3.4 Paoding分词器 240 4.3.5 Jcseg分词器 245 4.3.6 Ictclas分词器 258 4.3.7 FudanNLP 259 4.3.8 HanLP 262 4.3.9 Jieba分词器 266 4.3.10 分词器使用建议 268 4.4 本章总结 270 [0第0]5章 Solr查询 271 5.1 Solr查询概述 271 5.2 Solr查询相关度简述 273 5.3 Solr的查询语[0法0]解析器 275 5.4 Lucene的基本查询语[0法0] 283 5.5 Solr的标准查询语[0法0]解析器 287 5.6 Solr DisMax 288 5.7 Solr eDisMax 291 5.8 Solr的其他查询语[0法0]解析器 298 5.9 Query VS Filter Query 305 5.9.1 fq VS q 306 5.9.2 Filter Query缓存 307 5.9.3 Filter Query执行顺序 308 5.9.4 Post Filter 308 5.10 Solr返回结果 309 5.10.1 设置响应输出格式 309 5.10.2 选择返回域 310 5.10.3 分页查询 312 5.11 Solr排序 313 5.11.1 根据域进行排序 313 5.11.2 缺失值处理 314 5.11.3 排序的内存占用 315 5.12 调试查询结果 315 5.12.1 返回调试信息 315 5.12.2 开启调试模式 316 5.13 本章总结 316 [0第0]6章 Solr Facet 317 6.1 理解Facet 317 6.2 Facet简单示例 319 6.3 Query Facet 326 6.4 Range Facet 328 6.5 FacetFilter 330 6.6 Multiselect Faceting 335 6.6.1 key 335 6.6.2 tag 336 6.7 本章总结 339 [0第0]7章 Solr高亮 340 7.1 什么是Solr高亮 340 7.2 Solr高亮的工作原理 342 7.2.1 Fragmenter 348 7.2.2 Scorer 349 7.2.3 Encoder & Formatter 349 7.3 Facet & Highlighting 350 7.4 高亮多值域 351 7.5 高亮参数 352 7.6 FastVectorHighlighter 355 7.7 PostingsHighlighter 356 7.8 本章总结 358 [0第0]8章 Solr Query Suggestion查询建议 360 8.1 Spell-Check 361 8.1.1 Spell-Check简单示例 361 8.1.2 Spell-Check查询组件 362 8.2 Autosuggest 366 8.3 基于N-Gram实现Autosuggest 369 8.4 基于用户行为实现Autosuggest 371 8.5 本章总结 375 [0第0]9章 Solr Group分组 376 9.1 Result grouping VS Field collapsing 377 9.2 按照指定域分组 377 9.3 每个分组返回多个文档 381 9.4 按照Function动态计算值分组 382 9.5 按照任意Query分组 383 9.6 Group的分页与排序 383 9.7 Group& Facet 384 9.8 Group分布式查询 387 9.9 Group缓存 388 9.10 使用Collapsing Query Parser实现高效的Field Collapsing 388 9.11 Solr Group VS SQL Group by 389 9.12 本章总结 390 [0第0]10章 Solr企业级应用 391 10.1 Solr源码编译与补丁应用 391 10.2 部署Solr 396 10.2.1 构建你自己的Solr发布版本 397 10.2.2 Embedded Solr 397 10.3 Solr硬件要求与系统配置 397 10.3.1 内存和SSD 397 10.3.2 JVM配置 398 10.3.3 思考Solr索引与查询性能 401 10.4 Solr数据批量导入 405 10.5 Solr Shard与Replication 406 10.5.1 Shard 406 10.5.2 Replicate 408 10.6 Core管理 410 10.7 Solr集群管理 412 10.7.1 Solr Ping健康检测 412 10.7.2 Solr配置文件管理 413 10.8 如何与Solr交互 414 10.8.1 使用REST API与Solr交互 415 10.8.2 使用SolrJ与Solr进行交互 415 10.9 监控你的Solr 418 10.9.1 Solr的性能统计 418 10.9.2 Solr的缓存性能 419 10.9.3 Solr JMX 419 10.9.4 Solr日志 424 10.9.5 Solr负载测试 424 10.10 Solr版本升级 428 10.11 本章总结 428 |
这本书的实操性非常强,作者在每一章都提供了大量的代码示例和操作指令,我几乎可以一边阅读一边跟着做,这种学习方式让我受益匪浅。比如在讲解Solr的聚合(faceting)功能时,作者首先介绍了最基础的字段值聚合,然后逐步深入到范围聚合(range facet)、日期聚合(date facet)和热点聚合(heatmap facet)。 尤其让我兴奋的是,他对热点聚合的讲解,通过一个旅游景点数据的例子,清晰地展示了如何在地图上找出用户聚集的区域。这让我立刻联想到我工作中遇到的一个场景,我一直苦于如何进行地理位置数据的热点分析,这本书提供的解决方案让我茅塞顿开。而且,作者还详细讲解了如何调整聚合的参数来控制返回结果的数量和粒度,这让我能够更好地根据业务需求来定制聚合查询。
评分这本书的结构安排也堪称一绝,每一章节都层层递进,从易到难,循序渐进。我尤其喜欢作者在讲解Solr的Schema设计时,引入了“字段类型”和“分析链”的概念。他没有仅仅停留在如何定义字段,而是深入剖析了字段类型背后是如何影响索引和查询的,比如text类型、string类型、int类型等等。 更值得称赞的是,作者在分析链的部分,详细介绍了各种分词器(tokenizer)和过滤器(filter)的作用,例如standard tokenizer、lowercase filter、stop word filter、porter stem filter等等。他用图示和代码示例说明了文本在经过分析链处理后是如何变成一个个词项的,这对于理解Solr如何进行文本匹配至关重要。我通过这个章节,学会了如何根据实际需求自定义分析链,以优化索引的准确性和查询的效率。
评分这本书的内容着实让人惊喜!我本来是抱着学习Solr基础知识的心态购入的,但作者在开篇就深入浅出地介绍了信息检索的基本原理,这对我这个技术背景稍弱的读者来说简直是福音。他没有一上来就丢一堆晦涩的概念,而是用生活化的例子,比如搜索引擎是如何找到我想要的商品、新闻的,来引出倒排索引、词项等核心概念。这一点做得非常棒,让整个学习过程变得轻松有趣。 更让我印象深刻的是,作者在讲解Solr的安装和配置时,提供了非常详尽的步骤,并且针对不同操作系统给出了不同的解决方案,我作为一个Windows用户,照着文档一步一步操作,几乎没有遇到任何阻碍就成功搭建起了自己的Solr环境。而且,他还详细解释了每个配置文件中关键参数的含义,不像有些书籍那样只是简单地复制粘贴配置,而是让你真正理解为什么这么配置。这对于后续进行性能调优和故障排查非常有帮助。
评分我花了相当一部分时间来钻研Solr的索引构建和查询。作者在这部分的内容设计得非常巧妙,先从最简单的单字段索引开始,逐步深入到多字段索引、同义词、停用词等复杂场景。尤其是在讲解全文检索时,他引入了IDF和TF-IDF的概念,并解释了它们在Solr中是如何实现的,这让我彻底理解了为什么Solr能够准确地对文本内容进行评分和排序。 在查询方面,作者也介绍了各种查询类型,包括布尔查询、短语查询、模糊查询等等,并且通过大量的实际例子演示了如何构建复杂的查询语句来满足不同的业务需求。让我印象深刻的是,他对“adjacent query”和“proximity query”的区分讲解得非常清晰,并且举出了“quick brown fox”和“fox quick brown”这两个例子,让我立刻就明白了它们之间的细微差别。这种细致入微的讲解,让我对Solr的查询能力有了更深的认识。
评分在学习Solr的分布式部署和集群管理方面,这本书的内容更是让我耳目一新。作者没有回避SolrCloud的复杂性,而是用清晰的逻辑和图示,一步一步地介绍了SolrCloud的架构,包括ZooKeeper的作用、Shard和Replica的概念,以及Collection和Core的区别。 我特别喜欢作者在讲解分片(sharding)和副本(replication)时,用生动的比喻来解释它们的作用。比如,他把分片比作把一个巨大的数据库分成几个小部分,让查询可以并行处理;把副本比作一个数据库的备份,保证了数据的可用性和容错性。这让我这个初次接触分布式系统的人,能够很快地理解其中的原理。而且,他对于如何进行SolrCloud的部署、监控和故障恢复也提供了非常实用的指导,这对于我未来在生产环境中部署Solr非常有价值。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有