大数据与人工智能导论

大数据与人工智能导论 pdf epub mobi txt 电子书 下载 2025

姚海鹏,王露瑶,刘韵洁 著
图书标签:
  • 大数据
  • 人工智能
  • 机器学习
  • 数据科学
  • 算法
  • Python
  • 数据分析
  • 云计算
  • 深度学习
  • 行业应用
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 人民邮电出版社
ISBN:9787115466020
版次:1
商品编码:12241202
包装:平装
开本:16开
出版时间:2017-09-01
用纸:胶版纸
页数:180
正文语种:中文

具体描述

编辑推荐

针对如何快速把握大数据与人工智能的精髓、避免陷入过多的数学细节推导的问题,以及人工智能算法和大数据平台技术的结合问题,本书作者做出了不懈探索。一是选材上,不仅分别单独讲授人工智能和大数据,还突出两者相结合的内容。二是内容上,突出浅显易懂,繁杂的数学推导适当做减法,宏观的介绍和实战技能适当做加法。三是结构上,由浅入深,由宏观到比较围观,由基础知识到新技术,由理论到实践。本书主要突出优点如下。
1.知识点覆盖全。对大数据与人工智能领域的常用基础技术、算法、模型均有介绍,保障读者知识体系的完整性。而目前市场上相当同类书只涉及本领域其中的几个问题,使读者不能较好得从宏观角度来体会大数据和人工智能的技术。
2.知识点覆盖新。紧跟本领域zui新研究成果。尤其重点介绍了深度学习基础知识及其应用。深度学习是当前人工智能领域的潮流和趋势。目前市场上同类书对本领域新趋势的关注明显滞后。
3.知识点难易程度严格控制。有利于读者构建完整、清晰的知识体系,抓住主干,避免钻进个别牛角尖。许多同类书往往不能把做好难度控制,经常罗列大段生僻公式,使初学者丧失兴趣,也使初学者忽视了主干知识的学习。
4.理论与实战相结合。本书不仅介绍了理论知识,还注重问题建模、数据分析、算法实现、模型应用等实战技能。主流的同类图书基本以理论介绍为主,容易使读者眼高手低,不能真正把知识用于实践。
5.知识脉络构建有特色。市场上同类图书要么是只讲人工智能算法,要么只讲大数据工具平台。本书认为,当前人工智能取得重要进展的zui根本原因是大数据,绝不能把两者割裂开来。

内容简介

本书主要涉及数据工程、人工智能算法原理,大数据平台技术、人工智能算法在大数据平台上的实现、人工智能算法的应用于实践。
第1章是大数据与人工智能的历史、应用。第2章是数据工程。第三章是人工智能基础算法的原理介绍。第四章是大数据平台的介绍。第五章以第三章中的几种算法为例子,介绍了它们是如何在大数据平台上分布式实现的。第六章是当前热门的深度学习技术的介绍。第七章是实践。
本书针对1.对大数据和人工智能感兴趣、希望快速了解和入门本领域知识的在读本科生、研究生。2.希望从事大数据和人工智能岗位、需要快速提升理论基础和实战技能的求职者。3.计算机和互联网领域,对人工智算法感兴趣或工作中迫切需要一定本领域知识的工程师。

作者简介

姚海鹏,博士,北京邮电大学副教授,主要讲授网络大数据、物联网、人工智能等课程,主要研究方向为未来网络体系架构、网络大数据、物联网等。

目录

1
第一章 绪论 10
1.1日益增长的数据 10
1.1.1大数据基本概念 11
1.1.2大数据发展历程 11
1.1.3大数据的特征 12
1.1.4大数据的基本认识 13
1.2人工智能 14
1.2.1认识人工智能 14
1.2.2人工智能的派别与发展历史 14
1.2.3人工智能的现状与应用 14
1.2.3 当人工智能遇上大数据 15
1.3 大数据与人工智能的机遇与挑战 16
1.3.1大数据与人工智能面临的难题 16
1.3.2大数据与人工智能的前景 17
第二章 数据工程 18
2.1数据的多样性 18
2.1.1数据格式的多样性 18
2.1.2数据来源的多样性 19
2.1.3数据用途的多样性 20
2.2数据工程的一般流程 21
2.2.1 数据获取 21
2.2.2 数据存储 21
2.2.3 数据清洗 21
2.2.4 数据建模 21
2.2.5 数据处理 22
2.3数据的获取 22
2.3.1数据来源 23
2.3.2数据采集方法 23
2.3.3 大数据采集平台 25
2.4数据的存储与数据仓库 25
2.4.1数据存储 25
2.4.2数据仓库 26
2.5数据的预处理技术 27
2.5.1 为什么要进行数据预处理 27
2.5.2 数据清理 28
2.5.3 数据集成 29
2.5.4 数据变换 30
2.5.5 数据规约 30
2.6模型的构建与评估 31
2.6.1模型的构建 31
2.6.2评价指标 31
2.7数据的可视化 33
2.7.1 可视化的发展 34
2.7.2 可视化工具 34
第三章 机器学习算法 41
3-1机器学习绪论 41
3.1.1 机器学习基本概念 41
3.1.2评价标准 43
3.1.3 机器模型的数学基础 46
3-2决策树理论 50
3.2.1决策树模型 50
3.2.2 决策树的训练 53
3.2.3 本节总结 58
3.3 朴素贝叶斯理论 59
3.4线性回归 63
3.5逻辑斯蒂回归 66
3.5.1二分类逻辑回归模型 66
3.5.2 二分类逻辑斯蒂回归的训练 68
3.5.3 softmax分类器 71
3.5.4逻辑斯蒂回归和softmax的应用 72
3.5.5本节总结 72
3.6神经网络 73
3.6.1生物神经元和人工神经元 73
3.6.2感知机 75
3.6.3 BP神经网络 77
3.6.4 Sklearn中的神经网络 80
3.6.5本章小结 81
3.6.6 拓展阅读 81
3.7支持向量机 81
3.7.1 间隔 82
3.7.2 支持向量机的原始形式 84
3.7.3 支持向量机的对偶形式 86
3.7.4特征空间的隐式映射:核函数 87
3.7.5 支持向量机拓展 90
3.7.6 支持向量机的应用 90
3.8集成学习 91
3.8.1 基础概念 91
3.8.2 Boosting 94
3.8.3 Bagging 98
3.8.4 Stacking 99
3.9聚类 100
3.9.1聚类思想 100
3.9.2性能计算和距离计算 100
3.9.3原型聚类:K-means 101
3.9.4密度聚类:DBSCAN 103
3.9.5层次聚类 105
3.9.6 Sklearn中的聚类 105
3.9.7本章小结 106
3.9.8拓展阅读 106
3.10降维与特征选择 106
3.10.1维数爆炸与降维 106
3.10.2降维技术 107
3.10.3特征选择算法 109
3.10.4 Sklearn中的降维 112
3.10.5本章小结 112
第四章 大数据框架 113
4-1 Hadoop简介 113
4.1.1 Hadoop的由来 113
4.1.2 MapReduce和HDFS 114
4-2 Hadoop大数据处理框架 115
4.2.1 HDFS组件与运行机制 116
4.2.2 MapReduce组件与运行机制 120
4.2.3 Yarn框架和运行机制 122
4.2.4 Hadoop相关技术 123
4-3 Hadoop安装与部署 124
4.3.1 安装配置单机版Hadoop 124
4.3.2 单机版WordCount程序 128
4.3.3 安装配置伪分布式Hadoop 129
4-4 MapReduce编程 135
4.4.1 MapReduce综述 136
4.4.2 Map阶段 136
4.4.3 shuffle阶段 137
4.4.4 Reduce阶段 138
4-5 HBase、Hive和Pig和简介 138
4.5.1 HBase简介 139
4.5.2 Hive简介 139
4.5.3 Pig简介 141
4-6 Spark简介 141
4.6.1 spark概述 141
4.6.2 Spark基本概念 142
4.6.3 spark生态系统 143
4.6.4 spark组件与运行机制 144
4-7 Spark安装使用 145
4.7.1 JDK安装 146
4.7.2 Scala安装 148
4.7.3 Spark安装 148
4.7.4 Winutils安装 148
4.7.5 使用Spark Shell 149
4.7.6 Spark文件目录 151
4-8 Spark实例讲解 152
第五章 分布式数据挖掘算法 153
5-1 K-Means聚类方法 154
5.1.1 K-Means聚类算法简介 154
5.1.2 K-Means算法的分布式实现 154
5-2 朴素贝叶斯分类算法 160
5.2.1 朴素贝叶斯分类并行化设计思路 160
5.2.2 朴素贝叶斯分类并行化实现 161
5-3 频繁项集挖掘算法 166
5.3.1 Apriori频繁项集挖掘算法简介 167
5.3.2 Apriori频繁项集挖掘的并行化实现 167
5-4参考资料 172
第六章 深度学习简介 173
6-1从神经网络到深度神经网络 173
6.1.1深度学习应用 173
6.1.2 深度神经网络的困难 175
6-2卷积神经网络CNN 176
6.2.1卷积神经网络的生物学基础 176
6.2.2卷积神经网络结构 177
6-3循环神经网络RNN 182
6.3.1循环神经网络简介 182
6.3.2循环神经网络结构 182
第七章 数据分析实例 185
7-1 基本数据分析 185
7.1.1数据介绍 185
7.1.2数据导入与数据初识 185
7.1.3分类 189
7.1.4 聚类 191
7.1.5回归 192
7.1.6降维 194
7.2深度学习项目实战 195
7.2.1 Tensorflow与keras安装部署 196
7.2.2使用卷积神经网络进行手写数字识别 198
7.2.3使用LSTM进行文本情感分类 201
附 录 206
A 矩阵基础 206
B 梯度下降 209
牛顿法 210
C 拉格朗日对偶性 211
D python 语法知识 213
E Java语法基础介绍 228
《算法的魅影:从数理逻辑到深度学习的思考之旅》 在这信息洪流滚滚向前,数据量呈指数级增长的时代,我们常常惊叹于那些能够从海量数据中提炼出洞察,甚至预测未来的智能系统。它们似乎拥有某种不可思议的“魔法”,但在这份“魔法”之下,隐藏的是人类数个世纪以来对逻辑、计算和智能不懈探索的智慧结晶。本书并非要直接教授您如何构建一个深度学习模型,或者如何优化一个大数据存储集群。相反,它将带领您踏上一场别开生面的思考之旅,深入探究那些构建起现代智能大厦的基石——算法。 我们将从最古老、最纯粹的数理逻辑出发。在古希腊先哲们构建严谨推理体系的时代,他们已经为我们铺设了逻辑思维的轨道。亚里士多德的三段论、命题逻辑,以及后来集合论的出现,为我们理解“真”与“假”、“存在”与“不存在”奠定了基础。这些抽象的符号和规则,虽然看似遥远,却是所有计算和推理的源头。本书将追溯这些逻辑思想的演进,理解它们如何在数学的殿堂中熠熠生辉,以及它们如何悄然渗透到计算机科学的每一个角落。您将看到,一个简单的逻辑判断,是如何成为复杂算法的基础。 接着,我们将目光投向计算的诞生。图灵机,这个划时代的理论模型,以其简洁而强大的抽象能力,揭示了“可计算性”的本质。它不仅定义了计算的极限,也为通用计算机的设计提供了理论蓝图。在探讨图灵机的过程中,我们将理解什么是算法,什么是算法的优劣,以及为什么某些问题注定是“不可解”的。这不是对具体编程语言的介绍,而是对计算概念本身的一次深度剖析,让您体会到算法设计背后的哲学思辨。 之后,我们将进入算法分析的殿堂。为什么同一个问题,不同的算法可以带来天壤之别的效率?我们将会接触到诸如时间复杂度和空间复杂度这样的基本概念,理解“O(n)”、“O(n log n)”等符号背后的含义。您将学习到如何通过分析算法的执行步骤,来预测它在处理大规模数据时的表现。本书将通过生动的比喻和经典的算法例子,例如排序算法(如冒泡排序、快速排序)和搜索算法(如二分查找),来阐释这些抽象概念,让您领悟到算法效率的重要性,以及如何选择或设计更优的算法。 我们还将探讨一类特殊的算法——概率算法和随机化算法。在信息量巨大、信息不完全甚至存在噪声的情况下,确定性算法有时会显得笨拙。概率算法则巧妙地利用随机性,以极高的概率在可接受的时间内得到近似正确的结果。我们将会了解蒙特卡洛方法,以及它如何在各种模拟和优化问题中大放异彩。这并非是学习统计学,而是理解如何在不确定性中寻找确定的答案,如何用概率的语言描述和解决问题。 随后,本书将引领您进入图论的世界。许多现实世界的问题,都可以被抽象成图的结构,例如社交网络、交通路线、信息传播路径等。我们将学习图的基本概念,如图、边、节点、路径、连通性等,并探索一些经典的图算法,如最短路径算法(Dijkstra算法、Floyd-Warshall算法)、最小生成树算法(Prim算法、Kruskal算法)等。您将看到,如何用图的语言来建模和解决现实中的复杂问题,理解算法在网络分析、物流优化等领域的强大作用。 在数据处理方面,我们不会深入到具体的数据库技术,而是关注数据结构本身。数组、链表、栈、队列、树、哈希表等基本数据结构,是组织和管理数据的基石。本书将深入剖析这些数据结构的特性,理解它们在不同场景下的优势和劣势,以及它们如何影响算法的效率。例如,为什么在一个需要频繁插入和删除数据的场景下,链表比数组更合适?为什么哈希表能够提供近乎常数时间的查找效率?通过对数据结构的理解,您将能够更好地组织和访问数据,为后续的算法设计奠定坚实基础。 当我们将目光转向机器学习的早期思想时,我们将会看到,许多看似“智能”的算法,依然遵循着清晰的逻辑和数学原理。例如,决策树的构建过程,是通过一系列的“如果-那么”规则,将数据进行划分,这本质上是对逻辑判断的递归应用。而线性回归、逻辑回归等模型,则是在数学的框架下,寻找数据中的线性或非线性关系。本书将从算法的角度,审视这些机器学习方法是如何工作的,理解它们背后简单的数学模型,以及它们如何从数据中学习规律。 我们还将探讨计算的并行化和分布式处理的早期思想。随着数据量的不断增长,单个计算节点的处理能力逐渐成为瓶颈。如何在多个计算单元之间分配任务,如何协同工作以解决大规模问题,这些思想的萌芽,为后来的大数据处理技术奠定了基础。本书将从算法和计算模型的角度,浅谈并行计算和分布式计算的概念,让您理解为什么需要这些技术,以及它们如何改变我们处理信息的方式。 最后,我们将把目光聚焦于“学习”本身。但请注意,这里并非直接介绍深度学习的神经网络结构或反向传播算法。我们将从更宏观的角度,探讨“学习”的本质是什么?是模式的识别?是规律的归纳?还是对未知世界的预测?本书将从算法的演进和思想的碰撞中,提炼出关于“学习”的一些核心思考。我们将回顾那些早期尝试让机器“思考”和“学习”的努力,理解这些努力是如何为后来的机器学习和人工智能发展铺平道路的。例如,我们或许会触及一些关于推理、规划、问题求解等通用人工智能的早期探索,理解这些探索所面临的挑战以及它们所蕴含的智慧。 总而言之,《算法的魅影》是一本关于“思考”的书,关于用严谨的逻辑、精巧的计算、以及对世界规律的探索,去理解和构建智能的旅程。它不是一本操作手册,而是一次对现代智能技术背后深层逻辑和思想的梳理与回溯。通过这本书,您将不仅仅是了解“是什么”,更将深入理解“为什么”。您将学会如何用算法的思维去审视问题,如何用数学的语言去描述解决方案,如何用计算的视角去理解世界。当您下次再看到那些令人惊叹的智能应用时,您将不再仅仅是看到“魔法”,而是看到逻辑的严谨,计算的精妙,以及人类智慧的闪光。这是一场没有代码的算法探索,一次关于智能本质的深入思考,一次对塑造我们未来的思考工具的深刻理解。

用户评价

评分

拿到这本《大数据与人工智能导论》,我最初是抱着学习一些基础的统计学和概率论在数据科学中的应用的期望。没想到,书中关于数据可视化和解释性AI的部分,给我带来了意外的惊喜。作者强调,再强大的模型,如果不能被有效地理解和解释,其价值也会大打折扣。它详细介绍了各种可视化工具和技巧,比如使用 Matplotlib、Seaborn 绘制各种图表,以及如何利用 Plotly 进行交互式可视化,这对于我这种需要向非技术人员展示数据洞察的人来说,简直是及时雨。更让我印象深刻的是,书中对可解释性AI(Explainable AI, XAI)的探讨。它介绍了 LIME、SHAP 等模型解释方法,并结合实际案例,演示了如何理解复杂模型(如黑箱模型)的决策过程。这不仅能帮助我们诊断模型问题,还能建立用户对AI的信任。我一直觉得,AI的普及离不开对其“黑箱”的揭示,这本书在这方面提供了非常有价值的思路。它让我意识到,数据分析和AI应用,不应该仅仅停留在技术层面,更应该注重其沟通和信任的维度。

评分

初拿到这本书,我原本是抱着学习一些基础的机器学习算法的初衷,但翻阅之后,才发现它对人工智能的理解远不止于此。书中对深度学习的介绍,从神经网络的基本原理、反向传播算法,到卷积神经网络(CNN)和循环神经网络(RNN)的应用,都讲解得非常细致。作者没有回避那些复杂的数学公式,但同时又通过直观的图示和生动的比喻来解释,这对于我这种数学功底不太扎实的人来说,简直是福音。例如,在讲解反向传播时,它并没有直接甩出梯度下降的公式,而是先描绘了一个“猜数字”的游戏,让读者体验不断调整参数逼近目标的乐趣,再引入偏导数和链式法则,逻辑清晰,循序渐进。我尤其喜欢它在介绍不同模型时,会详细分析它们的适用场景和局限性,比如 CNN 在图像识别上的优势,RNN 在序列数据处理上的强大能力。书中还提到了强化学习的一些入门概念,虽然篇幅不多,但足以勾勒出其学习机制和应用方向,这让我对未来可能的研究领域产生了新的想法。整体而言,这本书在理论深度和易懂性之间找到了一个绝佳的平衡点。

评分

这本书的目录着实勾起了我的好奇心,特别是那几章关于数据采集、存储和处理的深度探讨。我一直对海量数据背后的价值充满兴趣,但苦于缺乏系统性的知识。本书从最基础的概念讲起,例如数据仓库、数据湖的区别,以及不同类型数据的存储格式(如 Parquet、ORC)的优劣势。对于像我这样从传统数据库背景转过来的读者,这些新概念的引入和类比非常有帮助,让我能迅速理解其核心思想。尤其是在分布式存储方面,它不仅仅是列举了 HDFS、S3 等技术,更深入地分析了它们在一致性、可用性、性能等方面的权衡,这对于理解大数据系统的健壮性至关重要。我还发现,作者在解释数据清洗和预处理时,用了很多实际的例子,比如如何处理缺失值、异常值,如何进行特征工程,这些都是实操中经常遇到的问题,读起来感觉很接地气。我特别期待书中关于流式处理的部分,比如 Kafka、Flink 这些工具的介绍,以及它们在实时数据分析中的应用场景,这对我目前的工作项目非常有启发性。总的来说,它为我构建了一个清晰的大数据技术栈图谱,让我对整个流程有了更宏观的认识。

评分

我一直对人工智能的伦理和社会影响感到好奇,这本书在“大数据与社会”这一章节中,对这个话题进行了深入的探讨,这正是我最想了解的。作者并没有回避那些敏感的问题,而是从数据隐私、算法偏见、信息茧房等多个角度,进行了详细的剖析。它引用了许多现实生活中的案例,比如招聘中的性别歧视、信贷审批中的种族歧视等,这些都让我深刻地认识到,即使是看似中立的技术,也可能在无意中加剧社会不公。书中还讨论了人工智能对就业市场的影响,以及我们应该如何应对可能出现的自动化浪潮。更重要的是,它提出了一些关于如何构建负责任的人工智能的思考,比如数据使用的透明化、算法的公平性审计等。这让我明白,技术的发展必须与人文关怀和社会责任并行。这本书的这一部分,与其说是一门技术课程,不如说是一次关于未来社会发展的深刻反思。它让我认识到,在拥抱大数据和人工智能带来的便利时,我们更应该警惕其潜在的风险,并积极寻求解决方案。

评分

坦白说,我购买这本书主要是因为对“智能推荐系统”这一章节的强烈兴趣。我的工作中经常需要分析用户行为数据,并为用户提供个性化的内容推荐,但现有的方法效果并不理想。本书在这部分的内容,可以说完全超出了我的预期。它不仅讲解了协同过滤(基于用户、基于物品)的基本原理,还深入探讨了矩阵分解、深度学习在推荐系统中的应用,比如利用 Embedding 技术来学习用户和物品的潜在表示。作者通过多个案例,详细阐述了如何构建一个有效的推荐模型,从数据预处理、特征选择,到模型训练、评估指标(如 Precision, Recall, NDCG),都提供了非常实用的指导。我尤其欣赏书中对于冷启动问题的解决方案,以及如何处理稀疏数据,这些都是实际应用中难以回避的挑战。此外,它还触及了 A/B 测试在优化推荐效果中的作用,这让我意识到,技术实现只是第一步,持续的迭代和验证才是关键。读完这部分,我感觉自己对如何设计和优化一个智能推荐系统,有了全新的视角和更坚实的理论基础。

评分

双十一搞活动买的,还没看。估计也看不懂。。。

评分

这书写得太差了,关键是价格还贵得吓人,抢钱啦!

评分

很好?

评分

很好?

评分

此用户未填写评价内容

评分

好书!忍不住一口气读完,值得推荐!

评分

速度很快,下单第二天就到了

评分

推荐一下吧,不错的书。

评分

很好?

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有