| 書[0名0]: | Solr指南 上捲|6912853 |
| 圖書定價: | 99元 |
| 圖書作者: | 蘭小偉 |
| 齣版社: | 機械工業齣版社 |
| 齣版日期: | 2018/1/1 0:00:00 |
| ISBN號: | 9787111581727 |
| 開本: | 16開 |
| 頁數: | 0 |
| 版次: | 1-1 |
| 目錄 |
序言 [0第0]1章 初識Solr 1 1.1 Solr是什麼 1 1.2 Solr的曆[0史0] 2 1.3 為什麼要選擇Solr 2 1.4 Solr功能預覽 3 1.5 Solr下載 3 1.6 Solr[0學0]習資源 5 1.7 Windows平颱下部署Solr 7 1.7.1 部署Solr至Jetty 7 1.7.2 部署Solr至Tomcat 13 1.8 Linux平颱下部署Solr 16 1.9 玩轉 [p1o1s] t.jar 20 1.10 在Eclipse中編譯Solr源碼 25 1.11 本章總結 27 [0第0]2章 Solr基礎 28 2.1 Solr Core 28 2.1.1 Solr Core簡介 28 2.1.2 Core的基本管理 30 2.1.3 Core Http接口 35 2.1.4 添加索引至Core 36 2.2 Solr DIH 38 2.2.1 索引文件夾下的文本文件 38 2.2.2 索引JSON/XML/CSV文件 42 2.2.3 使用Tika索引Word/Excel/PDF 45 2.2.4 索引網絡上的遠程文件 52 2.2.5 索引XML文件 55 2.2.6 從數據庫中導入數據至Solr 57 2.2.7 Solr DIH總結 62 2.3 Solr Full Import全量導入 78 2.4 Solr Delta-import增量導入 80 2.5 Solr索引 85 2.5.1 Lucene索引原理 85 2.5.2 Lucene中常見術語詳解 87 2.5.3 創建Solr索引 98 2.5.4 Solr Cell 99 2.5.5 Solr索引去重檢測 102 2.5.6 Solr更新請求處理鏈 104 2.5.7 Solr原子更新 105 2.5.8 使用Luke查看索引 107 2.6 本章總結 109 [0第0]3章 Solr配置 110 3.1 solr.xml配置詳解 110 3.2 solrconfig.xml配置詳解 112 3.3 schema.xml配置詳解 139 3.3.1 Solr Schema設計思想 139 3.3.2 Solr眼裏的世界 139 3.3.3 域分詞 140 3.3.4 Solr的schema文件 140 3.3.5 Solr的域類型 141 3.3.6 Solr的域 153 3.3.7 Schema API 157 3.3.8 Schemaless Mode 165 3.4 data-config.xml配置詳解 167 3.5 zoo.cfg配置詳解 169 3.6 本章總結 169 [0第0]4章 Solr分詞 170 4.1 分詞的基本概念 170 4.1.1 理解Analyzer 170 4.1.2 理解Tokenizer 171 4.1.3 理解TokenFilter 172 4.2 Solr分詞器 172 4.2.1 Analyzer 173 4.2.2 Tokenizer 174 4.2.3 TokenFilter 182 4.2.4 CharFilter 202 4.2.5 Solr自定義分詞 206 4.3 中文分詞器 217 4.3.1 IK分詞器 217 4.3.2 Ansj分詞器 223 4.3.3 MMSeg4J分詞器 233 4.3.4 Paoding分詞器 240 4.3.5 Jcseg分詞器 245 4.3.6 Ictclas分詞器 258 4.3.7 FudanNLP 259 4.3.8 HanLP 262 4.3.9 Jieba分詞器 266 4.3.10 分詞器使用建議 268 4.4 本章總結 270 [0第0]5章 Solr查詢 271 5.1 Solr查詢概述 271 5.2 Solr查詢相關度簡述 273 5.3 Solr的查詢語[0法0]解析器 275 5.4 Lucene的基本查詢語[0法0] 283 5.5 Solr的標準查詢語[0法0]解析器 287 5.6 Solr DisMax 288 5.7 Solr eDisMax 291 5.8 Solr的其他查詢語[0法0]解析器 298 5.9 Query VS Filter Query 305 5.9.1 fq VS q 306 5.9.2 Filter Query緩存 307 5.9.3 Filter Query執行順序 308 5.9.4 Post Filter 308 5.10 Solr返迴結果 309 5.10.1 設置響應輸齣格式 309 5.10.2 選擇返迴域 310 5.10.3 分頁查詢 312 5.11 Solr排序 313 5.11.1 根據域進行排序 313 5.11.2 缺失值處理 314 5.11.3 排序的內存占用 315 5.12 調試查詢結果 315 5.12.1 返迴調試信息 315 5.12.2 開啓調試模式 316 5.13 本章總結 316 [0第0]6章 Solr Facet 317 6.1 理解Facet 317 6.2 Facet簡單示例 319 6.3 Query Facet 326 6.4 Range Facet 328 6.5 FacetFilter 330 6.6 Multiselect Faceting 335 6.6.1 key 335 6.6.2 tag 336 6.7 本章總結 339 [0第0]7章 Solr高亮 340 7.1 什麼是Solr高亮 340 7.2 Solr高亮的工作原理 342 7.2.1 Fragmenter 348 7.2.2 Scorer 349 7.2.3 Encoder & Formatter 349 7.3 Facet & Highlighting 350 7.4 高亮多值域 351 7.5 高亮參數 352 7.6 FastVectorHighlighter 355 7.7 PostingsHighlighter 356 7.8 本章總結 358 [0第0]8章 Solr Query Suggestion查詢建議 360 8.1 Spell-Check 361 8.1.1 Spell-Check簡單示例 361 8.1.2 Spell-Check查詢組件 362 8.2 Autosuggest 366 8.3 基於N-Gram實現Autosuggest 369 8.4 基於用戶行為實現Autosuggest 371 8.5 本章總結 375 [0第0]9章 Solr Group分組 376 9.1 Result grouping VS Field collapsing 377 9.2 按照指定域分組 377 9.3 每個分組返迴多個文檔 381 9.4 按照Function動態計算值分組 382 9.5 按照任意Query分組 383 9.6 Group的分頁與排序 383 9.7 Group& Facet 384 9.8 Group分布式查詢 387 9.9 Group緩存 388 9.10 使用Collapsing Query Parser實現高效的Field Collapsing 388 9.11 Solr Group VS SQL Group by 389 9.12 本章總結 390 [0第0]10章 Solr企業級應用 391 10.1 Solr源碼編譯與補丁應用 391 10.2 部署Solr 396 10.2.1 構建你自己的Solr發布版本 397 10.2.2 Embedded Solr 397 10.3 Solr硬件要求與係統配置 397 10.3.1 內存和SSD 397 10.3.2 JVM配置 398 10.3.3 思考Solr索引與查詢性能 401 10.4 Solr數據批量導入 405 10.5 Solr Shard與Replication 406 10.5.1 Shard 406 10.5.2 Replicate 408 10.6 Core管理 410 10.7 Solr集群管理 412 10.7.1 Solr Ping健康檢測 412 10.7.2 Solr配置文件管理 413 10.8 如何與Solr交互 414 10.8.1 使用REST API與Solr交互 415 10.8.2 使用SolrJ與Solr進行交互 415 10.9 監控你的Solr 418 10.9.1 Solr的性能統計 418 10.9.2 Solr的緩存性能 419 10.9.3 Solr JMX 419 10.9.4 Solr日誌 424 10.9.5 Solr負載測試 424 10.10 Solr版本升級 428 10.11 本章總結 428 |
這本書的結構安排也堪稱一絕,每一章節都層層遞進,從易到難,循序漸進。我尤其喜歡作者在講解Solr的Schema設計時,引入瞭“字段類型”和“分析鏈”的概念。他沒有僅僅停留在如何定義字段,而是深入剖析瞭字段類型背後是如何影響索引和查詢的,比如text類型、string類型、int類型等等。 更值得稱贊的是,作者在分析鏈的部分,詳細介紹瞭各種分詞器(tokenizer)和過濾器(filter)的作用,例如standard tokenizer、lowercase filter、stop word filter、porter stem filter等等。他用圖示和代碼示例說明瞭文本在經過分析鏈處理後是如何變成一個個詞項的,這對於理解Solr如何進行文本匹配至關重要。我通過這個章節,學會瞭如何根據實際需求自定義分析鏈,以優化索引的準確性和查詢的效率。
評分我花瞭相當一部分時間來鑽研Solr的索引構建和查詢。作者在這部分的內容設計得非常巧妙,先從最簡單的單字段索引開始,逐步深入到多字段索引、同義詞、停用詞等復雜場景。尤其是在講解全文檢索時,他引入瞭IDF和TF-IDF的概念,並解釋瞭它們在Solr中是如何實現的,這讓我徹底理解瞭為什麼Solr能夠準確地對文本內容進行評分和排序。 在查詢方麵,作者也介紹瞭各種查詢類型,包括布爾查詢、短語查詢、模糊查詢等等,並且通過大量的實際例子演示瞭如何構建復雜的查詢語句來滿足不同的業務需求。讓我印象深刻的是,他對“adjacent query”和“proximity query”的區分講解得非常清晰,並且舉齣瞭“quick brown fox”和“fox quick brown”這兩個例子,讓我立刻就明白瞭它們之間的細微差彆。這種細緻入微的講解,讓我對Solr的查詢能力有瞭更深的認識。
評分這本書的內容著實讓人驚喜!我本來是抱著學習Solr基礎知識的心態購入的,但作者在開篇就深入淺齣地介紹瞭信息檢索的基本原理,這對我這個技術背景稍弱的讀者來說簡直是福音。他沒有一上來就丟一堆晦澀的概念,而是用生活化的例子,比如搜索引擎是如何找到我想要的商品、新聞的,來引齣倒排索引、詞項等核心概念。這一點做得非常棒,讓整個學習過程變得輕鬆有趣。 更讓我印象深刻的是,作者在講解Solr的安裝和配置時,提供瞭非常詳盡的步驟,並且針對不同操作係統給齣瞭不同的解決方案,我作為一個Windows用戶,照著文檔一步一步操作,幾乎沒有遇到任何阻礙就成功搭建起瞭自己的Solr環境。而且,他還詳細解釋瞭每個配置文件中關鍵參數的含義,不像有些書籍那樣隻是簡單地復製粘貼配置,而是讓你真正理解為什麼這麼配置。這對於後續進行性能調優和故障排查非常有幫助。
評分在學習Solr的分布式部署和集群管理方麵,這本書的內容更是讓我耳目一新。作者沒有迴避SolrCloud的復雜性,而是用清晰的邏輯和圖示,一步一步地介紹瞭SolrCloud的架構,包括ZooKeeper的作用、Shard和Replica的概念,以及Collection和Core的區彆。 我特彆喜歡作者在講解分片(sharding)和副本(replication)時,用生動的比喻來解釋它們的作用。比如,他把分片比作把一個巨大的數據庫分成幾個小部分,讓查詢可以並行處理;把副本比作一個數據庫的備份,保證瞭數據的可用性和容錯性。這讓我這個初次接觸分布式係統的人,能夠很快地理解其中的原理。而且,他對於如何進行SolrCloud的部署、監控和故障恢復也提供瞭非常實用的指導,這對於我未來在生産環境中部署Solr非常有價值。
評分這本書的實操性非常強,作者在每一章都提供瞭大量的代碼示例和操作指令,我幾乎可以一邊閱讀一邊跟著做,這種學習方式讓我受益匪淺。比如在講解Solr的聚閤(faceting)功能時,作者首先介紹瞭最基礎的字段值聚閤,然後逐步深入到範圍聚閤(range facet)、日期聚閤(date facet)和熱點聚閤(heatmap facet)。 尤其讓我興奮的是,他對熱點聚閤的講解,通過一個旅遊景點數據的例子,清晰地展示瞭如何在地圖上找齣用戶聚集的區域。這讓我立刻聯想到我工作中遇到的一個場景,我一直苦於如何進行地理位置數據的熱點分析,這本書提供的解決方案讓我茅塞頓開。而且,作者還詳細講解瞭如何調整聚閤的參數來控製返迴結果的數量和粒度,這讓我能夠更好地根據業務需求來定製聚閤查詢。
本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.coffeedeals.club All Rights Reserved. 靜流書站 版權所有