计算机信息检索(第三版)

计算机信息检索(第三版) pdf epub mobi txt 电子书 下载 2025

刘俊熙 著
图书标签:
  • 信息检索
  • 计算机科学
  • 信息技术
  • 数据挖掘
  • 文本处理
  • 搜索引擎
  • 信息管理
  • 算法
  • 数据库
  • 机器学习
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店铺: 广影图书专营店
出版社: 电子工业出版社
ISBN:9787121176159
商品编码:29759397468
包装:平装
出版时间:2012-08-01

具体描述

基本信息

书名:计算机信息检索(第三版)

定价:31.50元

售价:23.0元,便宜8.5元,折扣73

作者:刘俊熙

出版社:电子工业出版社

出版日期:2012-08-01

ISBN:9787121176159

字数

页码

版次:1

装帧:平装

开本:16开

商品重量:0.400kg

编辑推荐


内容提要

信息检索是指将信息按一定的方式组织起来,并根据用户的需求找出有关信息的过程与技术。本书共分11章,内容包括计算机信息检索基础,信息检索技术实现,网络信息资源概述,搜索引擎,综合和专题数据库,国际联机检索,多媒体信息检索,学术论文撰写、答辩及发表,国内主要数据库检索方法汇集等。全书在上一版的基础上,增加了有关搜索引擎、人文社会科学信息检索与利用、中外文网络数据库的检索与利用等内容,内容丰富、新颖,信息量大。


目录

章 计算机信息检索基础1
1.1 学科基础——信息学1
1.1.1 信息概述1
1.1.2 信息需要和检索5
1.2 技术基础——信息技术11
1.2.1 信息技术概述11
1.2.2 信息检索的关键技术——数据库技术14
1.2.3 网络时代对信息存储与检索技术的挑战17
第2章 计算机信息检索概述20
2.1 计算机信息检索基本概念20
2.1.1 计算机信息检索的发展、条件和类型20
2.1.2 计算机信息检索的原理23
2.1.3 计算机信息检索系统24
2.2 计算机信息检索语言29
2.2.1 检索语言基础知识29
2.2.2 检索语言的类型31
2.3 计算机信息检索原理、步骤和检索效果35
2.3.1 计算机信息检索的步骤35
2.3.2 检索效果的评价指标38
2.3.3 检索策略41

第3章 计算机信息检索技术实现44
3.1 初级和高级检索技术44
3.1.1 初级检索技术44
3.1.2 高级检索技术47
3.1.3 智能推拉技术48
3.1.4 自然语言处理技术50
3.2 信息检索技术的延伸——数据挖掘52
3.2.1 数据挖掘基本概况52
3.2.2 数据挖掘常用的技术54
3.2.3 信息检索和数据挖掘的技术关联分析55
第4章 网络信息资源概述60
4.1 网络资源的基本概念60
4.1.1 Inter概况60
4.1.2 网络信息资源的类型62
4.2 网络信息资源的组织68
4.2.1 元数据概述68
4.2.2 元数据的主要代表:Dublin Core69

第5章 网络信息资源检索——搜索引擎(1)72
5.1 搜索引擎72
5.1.1 搜索引擎概述72
5.1.2 搜索引擎评价81
5.2 搜索引擎——Google(谷歌)83
5.2.1 关于Google83
5.2.2 PageRank算法解析89
5.3 搜索引擎——Baidu()90
5.3.1 关于Baidu91
5.3.2 Baidu的超链分析92
5.3.3 Baidu和Google主要内容比较分析94
5.4 搜索引擎的搜索策略和技巧97
5.4.1 利用搜索引擎学习网站97
5.4.2 搜索引擎的搜索步骤98
5.4.3 搜索引擎的搜索技巧100
5.4.4 常见问题的搜索方法105
5.4.5 搜索引擎的优化(SEO)109
第6章 网络信息资源检索——搜索引擎(2)114
6.1 国外常用的搜索引擎介绍114
6.2 元搜索引擎119
6.2.1 元搜索引擎概述119
6.2.2 元搜索引擎的优势、选择和评价121
6.2.3 常用元搜索引擎介绍123
6.3 垂直搜索引擎126
6.3.1 垂直搜索引擎概述126
6.3.2 垂直搜索引擎的技术分析128
6.3.3 垂直搜索引擎现状分析131
6.4 站内搜索引擎134
6.4.1 站内搜索引擎概述135
6.4.2 典型站内搜索引擎介绍136
6.4.3 垂直和通用搜索引擎的差别136
6.5 知识搜索和人肉搜索139
6.5.1 机器搜索的延伸——知识搜索139
6.5.2 知识搜索的变异——人肉搜索141
第7章 网络信息资源检索——综合和专题数据库146
7.1 综合数据库检索系统146
7.1.1 中国期刊网概况146
7.1.2 维普资讯数据库148
7.1.3 中国高等教育文献保障系统(CALIS)148
7.1.4 万方数据资源检索系统149
7.1.5 中文社科报刊篇名数据库150
7.1.6 SCI Expanded150
7.1.7 联机书目检索系统(OPAC)150
7.2 专题数据库检索系统151
7.2.1 网上信息检索152
7.2.2 网上学位论文信息检索检索155
7.2.3 网上学术会议信息检索156
7.2.4 网上科技报告信息检索158
7.2.5 网上标准资料信息检索159
7.2.6 网上参考工具书信息检索160
7.2.7 Google Earth检索161

第8章 网络信息资源检索——国际联机检索167
8.1 联机检索系统167
8.1.1 联机检索系统概述167
8.1.2 联机检索系统的选择及数据库选择168
8.2 国际联机检索:Dialog170
8.2.1 Dialog概述170
8.2.2 Dialog检索技术172
8.2.3 Dialog检索步骤、结果处理及操作实例175
8.3 国际联机检索:OCLC的First Search176
8.3.1 First Search概述176
8.3.2 First Search数据库177
8.3.3 First Search检索方法179
第9章 多媒体信息检索183
9.1 多媒体信息检索183
9.1.1 多媒体信息检索概述183
9.1.2 多媒体信息检索的关键技术184
9.2 多媒体信息检索——图像检索186
9.2.1 图像数据的检索原理、方法与技术186
9.2.2 基于图像内容的图像检索系统189
9.3 多媒体信息检索——视频检索194
9.3.1 视频检索概述194
9.3.2 视频检索关键技术197
9.4 多媒体信息检索——音频检索200
9.4.1 音频检索概述200
9.4.2 音频检索方法203
0章 学术论文撰写、答辩及发表205
10.1 学术论文205
10.1.1 学术论文概述205
10.1.2 学术论文的选题206
10.2 学术论文的撰写209
10.2.1 学术论文撰写的过程209
10.2.2 学术论文的具体要求216
10.3 学术论文的使用218
10.3.1 学术论文的讲解、答辩和发表218
10.3.2 利用信息资源进行论文写作的示例219
1章 国内主要数据库检索方法汇集221
11.1 中国期刊网检索方法221
11.2 中文科技期刊数据库检索方法229
11.3 万方数据资源检索系统检索方法236
11.4 其他数据库检索方法举例240
参考文献249


作者介绍


文摘


序言



探索知识的边界:现代信息检索技术与实践 在信息爆炸的时代,如何快速、精准地找到我们所需的知识,已成为一项至关重要的技能。本书并非关于“计算机信息检索(第三版)”这本书本身,而是聚焦于其背后所蕴含的、更为广阔且深刻的现代信息检索技术与实践。我们将深入探讨信息检索的理论基石,剖析支撑其运行的各类核心技术,并结合当今数字时代的现实需求,勾勒出信息检索未来的发展图景。 第一部分:信息检索的理论基石与发展脉络 信息检索并非凭空而生,其背后有着深厚的理论积淀和漫长的发展历程。我们将首先回顾信息检索的起源,从早期基于关键词匹配的简单模型,逐步深入到布尔模型、向量空间模型、概率模型等经典理论。这些模型不仅奠定了信息检索的基础,也揭示了信息与用户需求之间关系的复杂性。 早期模型回顾: 简要介绍布尔模型及其局限性,理解“与”、“或”、“非”逻辑在信息组织中的应用。 向量空间模型(VSM): 详细阐述VSM如何将文档和查询表示为高维向量,TF-IDF(词频-逆文档频率)作为重要权重计算方法的原理与应用。理解文档相似度的概念,如余弦相似度。 概率模型: 介绍BM25等基于概率的检索模型,理解其如何更精细地刻画词语在文档中的重要性,以及对用户查询意图的把握。 语言模型: 探讨基于语言模型的检索方法,分析其在理解查询语义和生成相关文档方面的优势。 本体与语义检索: 引入本体论的概念,理解如何通过构建知识图谱和利用语义网络,实现更深层次的语义理解和更精准的检索。 除了模型层面的理论,我们还会探讨信息检索系统设计的核心要素,包括: 索引的构建与优化: 深入研究倒排索引的原理,包括正排索引、倒排索引、词典、后缀数组等数据结构。分析索引构建的效率、空间占用以及如何通过各种技术(如压缩、合并)进行优化,以支撑海量数据的快速检索。 查询的理解与处理: 探讨查询词的处理技术,如分词、词干提取、同义词扩展、查询重写等。分析如何从用户的简短查询中推断出其真实的信息需求。 相关性度量: 深入研究如何量化文档与查询之间的相关性。除了传统的TF-IDF和BM25,还将探讨学习排序(Learning to Rank)等机器学习方法在相关性度量中的应用。 评估指标: 介绍信息检索系统评估的常用指标,如准确率(Precision)、召回率(Recall)、F1值、平均准确率(Average Precision, AP)、平均准确率均值(Mean Average Precision, MAP)、归一化折损累计增益(Normalized Discounted Cumulative Gain, NDCG)等,理解这些指标的含义及其在评估系统性能中的作用。 第二部分:现代信息检索的核心技术剖析 随着计算能力的飞跃和数据规模的指数级增长,信息检索技术也取得了长足的进步。本部分将聚焦于当下最前沿、最具影响力的信息检索技术,并深入剖析其工作原理与应用场景。 基于深度学习的信息检索: 词嵌入与句嵌入: 详细介绍Word2Vec、GloVe、FastText等词嵌入模型,以及BERT、GPT等预训练语言模型如何生成上下文相关的词向量和句向量。理解这些技术如何捕捉词语和句子之间的语义关系,为更智能的检索奠定基础。 语义匹配模型: 探讨利用深度学习模型进行端到端语义匹配的方法,如DSSM(Deep Structured Semantic Model)、CDSSM(Convolutional DSSM)、DRMM(Deep Rank-based Matching Model)等。理解这些模型如何学习文档与查询之间的深层语义相似度。 知识图谱增强检索: 分析如何利用知识图谱来丰富查询的语义信息,解决同义词、多义词问题,以及生成更具解释性的检索结果。 向量检索(Vector Search): 深入介绍基于向量相似度搜索的技术,如FAISS、Annoy、ScaNN等近似最近邻搜索(ANN)算法。理解如何在海量高维向量空间中实现快速高效的相似度搜索,这在图像检索、推荐系统等领域至关重要。 搜索引擎的内部机制: 爬虫(Crawler): 了解网络爬虫的工作原理,如何高效地抓取海量网页数据,并应对动态网页、JavaScript渲染等挑战。 索引构建与更新: 探讨搜索引擎如何处理PB级别数据的索引构建,以及如何实现索引的实时或近实时更新,保证检索结果的时效性。 查询处理与排序: 分析搜索引擎如何解析复杂的查询,并利用各种算法和模型进行排序,将最相关的结果呈现在用户面前。 反作弊与链接分析: 简要介绍搜索引擎如何通过链接分析(如PageRank)以及识别作弊行为来提升检索质量。 特定领域的检索技术: 多模态信息检索: 探讨如何处理和检索包含文本、图像、音频、视频等多种模态信息的混合数据。例如,图像搜索、视频内容检索等。 代码检索: 分析针对代码库的检索技术,如何理解代码的结构、语义和功能,实现代码片段的查找和复用。 问答系统(Question Answering, QA): 介绍不同类型的问答系统(抽取式、生成式),以及它们如何从海量文本中直接提取或生成答案。 第三部分:信息检索的实践应用与未来展望 信息检索技术已经渗透到我们生活的方方面面,从日常的搜索引擎使用,到专业的学术研究、商业决策,都离不开其支持。本部分将聚焦于信息检索的实际应用,并展望其未来的发展趋势。 信息检索在各行业的应用: 互联网搜索: 搜索引擎(Google, Baidu, Bing等)是信息检索最直观的应用,涵盖新闻、商品、信息等几乎所有领域。 企业内部搜索: 帮助企业员工快速找到内部文档、知识库、客户信息等,提升工作效率。 电商平台的商品检索: 用户如何通过搜索找到心仪的商品,以及平台如何优化检索结果以促进销售。 社交媒体信息发现: 如何在海量的社交媒体内容中发现感兴趣的话题、用户和信息。 学术文献检索: 帮助科研人员高效地查找和阅读相关的学术论文、专利等。 医疗健康信息检索: 患者或医生如何查找疾病信息、治疗方案、药物信息等。 法律文书检索: 律师如何快速查找相关的法律条文、案例和诉讼文件。 用户体验与人机交互: 个性化检索: 如何根据用户的历史行为、兴趣偏好等,提供更具针对性的检索结果。 对话式检索: 探讨如何将信息检索与对话系统结合,实现更自然、更智能的交互式信息获取。 可视化检索: 如何通过图表、地图等可视化方式呈现检索结果,帮助用户更直观地理解信息。 信息检索的伦理与挑战: 信息茧房(Filter Bubble)与回声室效应(Echo Chamber): 探讨个性化检索可能带来的信息过滤问题。 隐私保护: 在收集用户行为数据以优化检索的同时,如何保护用户的隐私。 偏见(Bias)问题: 分析信息检索系统可能存在的算法偏见,以及如何缓解和消除这些偏见。 虚假信息(Fake News)的识别与过滤: 信息检索系统在对抗虚假信息方面扮演的角色与挑战。 未来发展趋势: 更加智能的语义理解: 随着自然语言处理技术的不断发展,信息检索将能够更深入地理解用户意图和文本的深层含义。 跨模态融合检索: 更加无缝地整合和检索不同类型的数据。 主动式信息推荐: 系统能够主动预测用户的需求,并在用户提出之前就提供相关信息。 可解释性AI在检索中的应用: 提升检索结果的可信度,让用户理解为何某个结果被推荐。 “零搜索”时代: 终极目标是让信息能够以最自然、最直接的方式呈现在用户面前,甚至无需用户主动发起搜索。 本书将以严谨的学术态度,结合大量的实例和前沿研究成果,为读者提供一个全面、深入、系统的现代信息检索技术与实践的知识体系。无论您是信息科学领域的学生、研究者,还是希望提升自身信息获取能力的从业者,都能从中获得宝贵的启示和实用的指导,共同探索知识的边界,解锁信息的无限可能。

用户评价

评分

这本书的封面设计简约大气,黑底白字,书名醒目,散发着一股严谨的学术气息。我刚拿到手的时候,就被它的分量所震撼,厚厚的一本,感觉里面承载了海量的知识。作为一名刚刚接触信息检索领域的学生,我原本有些忐忑,担心内容过于晦涩难懂。然而,当我翻开第一章时,这种担忧便烟消云散了。作者的叙述方式非常清晰流畅,即便是复杂的理论概念,也能通过生动的例子和清晰的逻辑链条被娓娓道来。特别是对于一些基础概念的解释,简直是教科书级别的典范,让人有种茅塞顿开的感觉。我特别欣赏书中对于逻辑代数和布尔检索的阐述,那种层层递进的讲解方式,让抽象的数学原理变得具体可感。这本书不仅仅是知识的堆砌,更像是一份精心绘制的路线图,为我们这些初学者指明了学习的方向。它让我对信息检索这门学科产生了浓厚的兴趣,迫不及待地想深入探索后面的章节,去了解那些更前沿、更复杂的模型和算法。

评分

这本书的排版和字体选择非常人性化,长时间阅读也不会让人感到视觉疲劳。书中的图表和示意图制作得极为精良,无论是关于倒排索引的结构图,还是不同检索模型(比如向量空间模型)的对比图,都做得非常直观、准确。我尤其喜欢它在每一章节末尾设置的“思考题与练习”,这些题目并非简单的知识点复述,而是深入到了对理论应用和实际问题的思考层面。做完这些练习,我感觉自己对理论知识的掌握程度得到了极大的巩固和提升。这本书的行文风格保持了一种恰到好处的平衡——既有深厚的学术底蕴,又不失通俗易懂的亲和力。它不像一些纯理论书籍那样高高在上,而是非常贴近读者的学习节奏,仿佛有一位经验丰富的导师在身边循循善诱。这种严谨与灵活并存的写作手法,使得学习过程变得高效而愉悦,每一次翻阅都是一次知识的吸收和思维的锻炼。

评分

这本书的参考资料和引文部分做得非常专业和详尽。在每一个关键理论点介绍完毕后,作者都会清晰地指出其思想的来源和重要的研究论文出处,这对于想要进一步深挖特定领域的研究生和专业人士来说,简直是宝藏。我曾经为了理解某个特定排序算法的某个细节,特意去查阅了参考文献列表中的一篇论文,发现正是这本书里提供的线索引导我找到了关键信息。这种对知识源头的尊重和指引,体现了编著者严谨的治学态度。整本书在装帧上选择的纸张质量也很好,翻页顺滑,油墨均匀,长时间阅读下来,眼睛也不会有灼烧感。它不只是一本学习资料,更像是一件值得珍藏的工具书,每一次翻阅都能带来新的启发和对信息世界更深层次的认识。我深信,这本书将陪伴我度过未来很长一段时间的学习和工作历程。

评分

我注意到这本书在内容更新上做得非常出色,即便是第三版,也紧跟时代步伐,引入了许多近年来信息检索领域的热点话题。虽然我主要聚焦于基础理论的学习,但偶尔瞥见其中关于Web搜索优化和用户行为分析的章节介绍,都能感受到编著者深厚的行业洞察力。这本书的覆盖面非常广,从最底层的文本表示方法,到高层的评估指标体系,几乎将信息检索的知识谱系描绘得一览无余。阅读的过程中,我经常会停下来,对比书中的经典理论与我日常使用搜索引擎的体验,这种理论与实践的碰撞,极大地增强了我对所学知识的理解深度。它提供了一个坚实的基础框架,让我能够以一种系统性的眼光去看待和分析信息检索的方方面面,而不是零散地获取知识点。对于希望构建完整知识体系的读者来说,这本书无疑是极佳的选择,它提供了深度和广度兼备的视角。

评分

这本书的语言组织非常有条理,逻辑链条清晰得让人佩服。作者在处理复杂概念时,习惯先给出宏观的背景介绍,再逐步深入到细节的公式推导和算法描述,这种“先撒网后收网”的讲解方式极大地降低了理解门槛。特别是在讲解概率论在信息检索中的应用时,我原本以为会遇到很大的困难,但书中对贝叶斯分类器和隐语义索引(LSI)的阐述,都采用了非常巧妙的比喻和结构化的步骤,使得原本复杂的数学模型变得相对直观可操作。阅读这本书,我最大的感受是“踏实”,它不是那种浮光掠影地介绍概念,而是扎扎实实地把每一个技术点都讲透彻,并且提供了必要的数学基础支撑。这对于想要进行后续研究或者深入开发工作的读者来说,是至关重要的,因为它保证了读者所掌握的知识是经过严格检验和深思熟虑的,而不是表面的花架子。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有