大数据——高级大数据人才培养丛书

大数据——高级大数据人才培养丛书 pdf epub mobi txt 电子书 下载 2025

刘鹏 著
图书标签:
  • 大数据
  • 数据分析
  • 数据挖掘
  • Hadoop
  • Spark
  • 机器学习
  • Python
  • 数据仓库
  • 云计算
  • 数据可视化
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 电子工业出版社
ISBN:9787121304309
版次:1
商品编码:12111724
包装:平装
丛书名: 高级大数据人才培养丛书
开本:16开
出版时间:2017-01-01
用纸:胶版纸
页数:344
字数:360000
正文语种:中文

具体描述

产品特色


内容简介

  本书是国内绝大多数高校采用的知名教材《云计算》(1-3版)的姊妹篇,是中国大数据专家委员会刘鹏教授联合国内多位专家历时两年的心血之作。大数据领域一直缺乏一本**教材,希望本书能够填补空白。本书系统地介绍了大数据的理论知识和实战应用,包括大数据采集与预处理、数据挖掘算法和工具和大数据可视化等,并深度剖析了大数据在互联网、商业和典型行业的应用。刘鹏教授创办的网站中国大数据(thebigdata.cn)、中国云计算(chinacloud.cn)和微信公众号刘鹏看未来(lpoutlook)将免费提供本书配套PPT和其他资料。本书配套的大数据实验体系已经在郑州大学等高校成功应用。

作者简介

  刘鹏,清华大学博士,解放军理工大学教授、学科带头人,中国云计算专家委员会委员。主要研究方向为信息网格和云计算,完成科研课题18项,发表论文70余篇,获部级科技进步奖6项。曾夺得国际计算机排序比赛冠军,并二次夺得全国高校科技比赛*高奖,获“全军十大学习成才标兵”、“南京十大杰出青年”和“清华大学学术新秀”等称号。2002年首倡的“网格计算池”和2003年研发的“反垃圾邮件网格”分别为云计算和云安全的前身。创办了知名的中国网格和中国云计算网站。

目录

第1章 大数据概念与应用
1.1 大数据之“大”
1.2 大数据的来源
1.3 大数据的技术支撑
1.4 大数据应用场景
1.5 如何开展大数据研发
习题
参考文献
第2章 数据采集与预处理
2.1 大数据采集架构
2.2 数据预处理原理
2.3 数据仓库与ETL工具
习题
参考文献
第3章 数据挖掘算法
3.1 数据挖掘概述
3.2 分类
3.3 聚类
3.4 关联规则
3.5 预测模型
3.6 数据挖掘算法综合应用
习题
参考文献
第4章 大数据挖掘工具
4.1 Mahout
4.2 Spark MLlib
4.3 其他数据挖掘工具
习题
参考文献
第5章 R语言
5.1 R语言简介
5.2 R与数据挖掘
5.3 SparkR
习题
参考文献
第6章 大数据可视化
6.1 数据可视化基础
6.2 大数据可视化方法
6.3 大数据可视化软件与工具
习题
参考文献
第7章 互联网大数据处理
7.1 互联网信息抓取
7.2 文本分词
7.3 倒排索引
7.4 网页排序算法
7.5 历史信息检索
习题
参考文献
第8章 大数据商业应用
8.1 用户画像与精准营销
8.2 广告推荐
8.3 互联网金融
习题
参考文献
第9章 行业大数据
9.1 地震大数据
9.2 交通大数据
9.3 环境大数据
9.4 警务大数据
习题
参考文献
附录:大数据实验一体机

前言/序言

  在未来5~10年,我国大数据市场规模年均增速将超过30%。未来5年,国内大数据人才缺口将突破150万。在BAT发布的招聘职位中,目前大数据岗位占比已经超过60%。现在业界有一种观点:即使把全国所有计算机专业都做成大数据专业,仍然无法满足国内对大数据人才的需求量。
  在快速膨胀的需求与国家扶植政策的推动下,全国高校、高职、高专院校纷纷启动大数据人才培养计划。然而,大数据专业建设却面临重重困难。首先,大数据是个新生事物,懂大数据的老师少之又少,院校缺“人”;其次,尚未形成完善的大数据人才培养和课程体系,院校缺“机制”;再次,大数据实验需要为每位学生提供集群计算机,院校缺“机器”;最后,院校不拥有海量数据,开展大数据教学科研工作缺“原材料”。
  其实,在2000年网格计算兴起时和2008年云计算兴起时,我国科技工作者都曾遇到过类似的挑战问题,我有幸参与了这些问题的解决过程:
  为了解决网格计算挑战问题,我在清华大学读博期间,于2001年创办了中国网格信息中转站(chinagrid.net)网站,每天花好几个小时收集和分享有价值的资料给学术界。于2002年与人合作出版了《网格计算》教材。并多次筹办和主持全国性的网格计算学术会议。
  为了解决云计算挑战问题,我于2008年创办了中国云计算(chinacloud.cn)网站,于2010年出版了《云计算(第一版)》、2011年出版了《云计算(第二版)》、2015年出版了《云计算(第三版)》,每一版都花费大量成本制作并免费分享对应的几十个教学PPT。这些PPT的下载总量达到了几百万次之多。早在2010年,我就在南京组织了全国高校云计算师资培训班,培养了国内第一批云计算老师。并通过与华为、中兴、360等知名企业合作,输出云计算技术,培养云计算研发人才。为社区做贡献,收获是沉甸甸的:我获得了大家的好评与认可,担任了一些全国性专家委员会的专家,《云计算》教材成了国内高校的首选教材,中国云计算网站成了国内排名第一的云计算网站。
  近几年,我用类似的办法来解决我们所面临的大数据挑战问题。为了解决大数据技术资料缺乏和存在交流障碍的问题,我于2013年创办了中国大数据(thebigdata.cn)网站,投入大量的人力每天维护,该网站已经在各大搜索引擎排名“大数据”关键词第一名;为了解决大数据师资匮乏的问题,我面向全国院校,陆续举办多期大数据教师培训班。最近在南京举办的全国高校/高职/中职大数据免费培训班,报名的老师已有400多位;为了解决缺乏权威大数据教材的问题,我所负责的南京大数据研究院,联合金陵科技学院、河南大学、南阳理工学院、南阳理工学院、云创大数据、许昌学院、安徽师范大学、才云科技、中国地震局、南京公安研究院等多家单位,历时两年,编著了《大数据》教材和《大数据库》教材。并计划为高职和中职院校专门编写大数据专业系列教材。我们将在中国大数据(thebigdata.cn)、中国云计算(chinacloud.cn)和刘鹏看未来(lpoutlook)微信公众号等陆续免费提供配套PPT和其他资料;为了解决大数据实验难以开展的问题,我带领云创大数据(www.cstor.cn)的科研人员,研发成功BDRack大数据实验一体机,它打破虚拟化技术的性能瓶颈,可以为每一位参加实验的人员虚拟出Hadoop集群、Spark集群、 MongoDB集群、Storm集群等,自带实验所需数据,并准备了详细的实验手册、PPT和视频,可以开展大数据管理、大数据挖掘等各类实验,并可进行精确营销、信用分析等多种实战演练。目前该平台已经在郑州大学等高校成功应用。我们还开放了免费的物联网大数据托管平台——万物云(wanwuyun.com)和环境大数据免费分享平台——环境云(envicloud.cn)
  在此,特别感谢我的硕士导师谢希仁教授和博士导师李三立院士。谢希仁教授出版的《计算机网络》已经更新到第6版,与时俱进且日臻完美,时时提醒学生要以这样的标准来写书。李三立院士是留苏博士,为我国计算机事业做出了杰出贡献,曾任国家攀登计划项目首席科学家。他的严谨治学带出了一大批杰出的学生。
  本书是集体智慧的结晶,在此谨向付出辛勤劳动的各位作者致敬!书中难免会有不当之处,务必读者不吝赐教。我的邮箱:gloud@126.com,微信公众号:刘鹏看未来(lpoutlook)。
  刘鹏 教授
  于南京大数据研究院
  2016年12月24日


大数据——高级大数据人才培养丛书 大数据时代的驾驭者,洞察数据洪流,驱动未来变革 我们正身处一个史无前例的数据时代。每一次点击、每一次交易、每一次交互,都在产生海量的数据。这些数据不再是冰冷孤立的数字,而是蕴藏着无穷价值的宝藏,是驱动商业决策、科学研究、社会进步的强大引擎。然而,如何从这汪洋大海般的数据中提取精华,将其转化为可执行的洞察,并最终转化为实际的价值,已成为当前亟需解决的关键问题。 《大数据——高级大数据人才培养丛书》应运而生,它并非一本简单的技术手册,而是一套系统性的、面向未来大数据领域专业人才的培养方案。本丛书旨在为那些渴望在这个飞速发展领域脱颖而出,成为数据科学的引领者、大数据应用的创新者、以及数据驱动战略的制定者的人们,提供坚实的基础、前沿的视野和实操的指导。 为何需要高级大数据人才? 大数据技术的发展已经进入深水区。最初的数据采集、存储、清洗阶段已逐渐成熟,但真正的挑战在于如何进行更深层次的分析、更精准的模型构建、更智能的应用落地。这需要掌握复杂算法、精通机器学习、熟悉深度学习、理解分布式系统、具备强大的数据建模能力、以及深刻的业务洞察力。更重要的是,高级大数据人才需要具备将技术能力与业务场景相结合的桥梁作用,能够理解业务痛点,设计出能够解决实际问题的技术方案,并能清晰地向非技术人员阐述其价值。 丛书内容概览(非完整章节列表,而是核心能力与主题的展现): 本丛书将深度剖析大数据领域的关键技术和核心能力,但绝不仅仅局限于理论。每一部分都将围绕“培养能够解决实际问题的高级人才”这一目标展开,注重理论与实践的结合,以期帮助读者构建扎实的知识体系,并锻造出色的实战能力。 一、 深化数据思维与统计基石: 在进入复杂算法和模型之前,扎实的统计学和概率论基础是必经之路。本丛书将回顾并深化那些对于理解数据分布、检验假设、评估模型性能至关重要的统计概念。您将学习到如何从数据的表象下挖掘其内在的统计规律,理解数据的偏差与方差,以及如何进行科学的假设检验。这将帮助您建立起严谨的数据分析思维,避免被表面现象所误导,为后续更高级的建模打下坚实基础。 二、 掌握核心数据处理与挖掘技术: 海量数据的处理能力是大数据时代的基础。本丛书将深入讲解如何在分布式环境下高效地处理和转换数据。您将不仅仅学习到SQL的进阶应用,更会接触到Spark、Hadoop等主流大数据处理框架的原理与实践。内容将涵盖数据清洗、特征工程、数据集成等关键环节,指导您如何从原始数据中提取出有价值的特征,为建模做好准备。同时,我们将深入讲解各种数据挖掘算法,包括但不限于聚类、分类、关联规则挖掘等,并分析它们在不同场景下的应用。 三、 深入探索机器学习与深度学习模型: 机器学习是大数据分析的核心驱动力。本丛书将从基础的线性模型、逻辑回归开始,逐步深入到决策树、随机森林、支持向量机等经典算法。更重要的是,我们将花费大量篇幅讲解深度学习的原理和应用。您将学习到神经网络的基本构建,卷积神经网络(CNN)在图像识别领域的突破,循环神经网络(RNN)和长短期记忆网络(LSTM)在序列数据处理中的优势,以及Transformer模型在自然语言处理领域的革命性影响。我们将探讨不同模型的适用场景、优缺点,以及如何进行模型选择、调优和评估。 四、 构建高性能的预测与推荐系统: 如何利用历史数据预测未来趋势,如何为用户提供个性化的推荐,是大数据技术在商业领域最直接的应用体现。本丛书将详细阐述构建预测模型的完整流程,包括时间序列分析、回归分析的进阶应用,以及如何利用机器学习模型进行准确的预测。在推荐系统方面,我们将深入讲解协同过滤、基于内容的推荐、混合推荐等主流算法,并探讨如何处理冷启动问题、冷门商品问题,以及如何平衡探索与利用,设计出能够提升用户体验和商业价值的推荐策略。 五、 实践先进的自然语言处理(NLP)与计算机视觉(CV)技术: 文本和图像是人类信息传递和感知世界的主要方式,也是大数据的重要组成部分。本丛书将带领您走进自然语言处理的殿堂,从词向量、文本表示技术出发,学习如何进行情感分析、主题建模、机器翻译、问答系统等。在计算机视觉领域,您将学习到图像处理的基础技术,深入理解卷积神经网络的强大能力,并掌握图像识别、目标检测、图像分割等核心技术。这些技术的掌握将使您能够从非结构化数据中提取有价值的信息,赋能更多创新应用。 六、 掌握分布式系统与云原生大数据平台: 随着数据量的爆炸式增长,单机处理能力已无法满足需求。本丛书将深入讲解分布式系统的原理,特别是Hadoop生态系统(HDFS, MapReduce, Hive, HBase等)和Spark等框架的工作机制。同时,我们将关注当前主流的云原生大数据平台,如AWS、Azure、GCP等提供的各项大数据服务,以及Kubernetes在容器化部署和管理大数据应用中的作用。您将学习到如何设计、部署和管理可扩展、高可用的分布式大数据解决方案。 七、 培养数据治理、安全与伦理意识: 大数据在带来巨大价值的同时,也伴随着数据治理、安全和伦理等方面的挑战。本丛书将重点强调这些关键议题。您将学习到数据质量管理、元数据管理、数据标准化的重要性,以及如何建立完善的数据治理体系。在数据安全方面,我们将探讨数据加密、访问控制、隐私保护等技术和策略。更重要的是,本丛书将引导您思考大数据应用中的伦理问题,如算法的公平性、偏见以及对社会可能产生的影响,培养负责任的大数据应用者的职业操守。 八、 商业智能(BI)与数据可视化: 再复杂的分析,最终也需要以清晰易懂的方式呈现给决策者。本丛书将讲解如何运用商业智能工具,构建数据仪表板(Dashboard),将复杂的分析结果转化为直观的图表和报告。您将学习到优秀的数据可视化原则,掌握Tableau、Power BI等工具的使用技巧,以及如何通过有效的可视化沟通,驱动业务决策和变革。 丛书特色: 循序渐进,层层深入: 从基础概念到前沿技术,结构清晰,逻辑严谨,适合不同基础的读者。 理论与实践并重: 每一部分都将结合实际案例和代码示例,帮助读者将理论知识转化为实践能力。 前沿技术与未来趋势: 紧跟大数据领域的最新发展,涵盖机器学习、深度学习、NLP、CV以及云原生技术等。 培养解决实际问题的能力: 强调数据分析的思维方式和解决问题的能力,而非仅仅罗列技术细节。 注重综合素养: 除了技术能力,还关注数据治理、安全、伦理等软实力。 目标读者: 希望系统学习大数据技术,进入该领域工作的在校学生或转行者。 已在大数据领域工作,寻求技术突破和能力提升的工程师、分析师。 渴望掌握数据驱动决策的业务领导者和产品经理。 对数据科学充满热情,希望成为行业内顶尖人才的探索者。 《大数据——高级大数据人才培养丛书》不仅仅是知识的集合,更是您在大数据时代乘风破浪的利器,是您成为数据时代驾驭者、洞察数据洪流、驱动未来变革的有力伙伴。它将帮助您构建起坚不可摧的技术壁垒,培养出敏锐的数据洞察力,并最终在蓬勃发展的大数据浪潮中,找到属于自己的广阔天地。

用户评价

评分

这本书的出版,对于正在大数据领域寻求职业发展的人来说,无疑是一份宝贵的礼物。它不仅仅是一本技术手册,更是一份培养思维的指南。作者在书中反复强调了“数据思维”的重要性,并结合多个真实的行业案例,阐述了如何通过数据来驱动业务决策和创新。我个人尤其欣赏书中对大数据分析方法论的系统介绍,从数据清洗、特征工程,到模型选择、评估,每一步都进行了细致的讲解和分析。这让我在进行数据分析项目时,能够更加有条理,避免走弯路。而且,书中还对大数据人才在不同岗位上的能力要求进行了深入分析,为我规划职业发展路径提供了重要的参考。这本书的语言风格非常接地气,没有过多的华丽辞藻,却充满了真诚和实用性,读起来让人倍感亲切。我强烈推荐这本书给所有对大数据感兴趣,或者希望在大数据领域有所建树的朋友们。

评分

这本书的价值,我认为更多体现在其“高级”二字上。它并非泛泛而谈,而是聚焦于培养真正的大数据人才。书中对于算法和模型构建的部分,分析得非常透彻,很多地方都引用了最新的研究成果和业界最佳实践。我尤其赞赏其中关于机器学习和深度学习在实际大数据应用中的案例分析,这些案例都非常贴合实际业务需求,能够帮助读者理解如何将理论知识转化为解决实际问题的能力。例如,书中对于推荐系统、欺骗检测等场景的讲解,不仅提供了技术方案,还详细阐述了背后的业务逻辑和数据驱动的决策过程。对于我们这些在大数据领域摸爬滚打多年的从业者来说,这样的深度解析非常有价值,能够帮助我们跳出技术的局限,从更高的维度去思考问题。作者在书中的语言风格也比较朴实,但字里行间又透露出深厚的功底,很少有空洞的理论,更多的是扎实的干货。这本书绝对是大数据从业者提升专业技能、拓展技术视野的必备参考书。

评分

最近有幸拜读了《大数据——高级大数据人才培养丛书》,这本书给我带来的震撼和启迪是难以言喻的。从封面设计上,就透露出一种专业、严谨的气质,让人对接下来的内容充满期待。翻开目录,我被书中涵盖的广度所惊艳,从基础概念的梳理,到核心技术的深入剖析,再到实际应用场景的案例分析,几乎囊括了大数据领域所有重要的知识点。作者在组织篇章时,逻辑性非常强,循序渐进,让初学者能够快速入门,也能让有一定基础的读者巩固和深化理解。书中对 Hadoop、Spark 等主流框架的讲解尤为细致,不仅介绍了其原理,还提供了大量的代码示例和操作指导,这对于想要动手实践的读者来说,无疑是宝贵的资源。我特别喜欢其中关于数据治理和数据安全部分的论述,这往往是很多技术书籍容易忽略的方面,但在这里却得到了充分的重视。整体而言,这本书为我打开了一扇通往大数据世界的大门,让我对其有了更全面、更深入的认识,为我未来的学习和工作指明了方向。

评分

我之前一直对大数据技术感到有些茫然,感觉知识点零散,不成体系。直到我看到了《大数据——高级大数据人才培养丛书》,才真正感受到了一种“拨云见日”的清晰感。这本书的结构设计非常精妙,从最基础的数据采集、存储,到中间的数据处理、分析,再到最后的数据可视化和应用,环环相扣,逻辑严谨。作者在讲述每个技术点时,都力求全面,既有理论的高度,也有实践的深度。让我特别惊喜的是,书中对云计算平台在大数据应用中的角色进行了详细的阐述,比如 AWS、Azure、GCP 等,这对于我们这些需要在云端部署和运维大数据系统的工程师来说,非常有指导意义。而且,书中还探讨了大数据伦理和隐私保护等重要议题,这反映了作者对行业发展的深刻洞察和责任感。这本书让我对大数据有了更宏观的认识,也为我系统性地学习和掌握大数据技术提供了坚实的基础。

评分

《大数据——高级大数据人才培养丛书》简直就是一本为大数据工程师量身打造的“武功秘籍”。它不像某些教材那样枯燥乏味,而是充满了实战的智慧。我印象最深刻的是书中关于分布式计算和数据存储技术的讲解,作者用非常生动的比喻和图示,将复杂的概念变得通俗易懂。比如,对于 MapReduce 的解释,我以前总觉得难以理解,但看了这本书的讲解后,豁然开朗。而且,书中提供的不仅仅是理论,还有大量的实操练习和挑战,让我有机会亲手去构建和优化大数据系统。这对于提升动手能力至关重要。此外,书中还提到了很多关于大数据生态系统中各个组件的协同工作原理,比如 Zookeeper、Kafka、Flume 等,这些都是在实际工作中必不可少的基础设施。阅读这本书的过程,就像是在跟一位经验丰富的老前辈学习,他不仅教你“是什么”,更教你“怎么做”,以及“为什么这么做”。

评分

纸质不错,内容全面,物流有慢

评分

很好很好的很好商品,推荐购买

评分

京东购书,一种习惯,质量保证,服务态度好,价格合理。收藏了全套。优惠力度比较大的。

评分

公司购买,同事说好用。

评分

写的全面,入门很有用。本来就没标准,各家看什么不同很好

评分

作为了解谷歌 亚马逊 微软云的窗口

评分

权威专家著作,无疑是这个领域最全面的教材

评分

包装严实。京东的快递也满意。。总的来说,一切都挺好的。喜欢喜欢喜欢。有需要还会来的。经常在京东买东西。马上618了,又到了剁手的时候。

评分

不错的书籍,帮忙非常大。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有