视觉大数据基础与应用

视觉大数据基础与应用 pdf epub mobi txt 电子书 下载 2025

谢剑斌 等 著
图书标签:
  • 视觉大数据
  • 数据可视化
  • 信息图表
  • 数据分析
  • 大数据应用
  • 数据科学
  • 图形设计
  • 信息设计
  • 商业智能
  • 数据呈现
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 清华大学出版社
ISBN:9787302391227
版次:1
商品编码:11666506
品牌:清华大学
包装:平装
开本:16开
出版时间:2015-01-01
用纸:胶版纸

具体描述

内容简介

  《视觉大数据基础与应用》是视频大数据处理领域的著作。为使读者全面了解海量视频分析与搜索的基础知识及应用方法,本书首先介绍海量视频概论、海量视频模型、海量视频管理和海量视频分析等相关基础知识,然后具体阐述面向大数据的大规模人脸搜索系统、面向高清卡口的车辆车牌与车标等信息搜索系统、暴力行为检测系统、可疑行为检测系统、海量视频摘要系统和海量视频管控平台等典型的海量视频分析与搜索实例,并将海量视频分析与搜索领域的新技术和新成果贯穿于全文的描述之中。
  《视觉大数据基础与应用》主要适用于从事海量视频分析与处理领域的应用开发和工程施工技术人员阅读。

目录

第1章 海量视频概述
1.1 视觉大数据
1.2 关键技术
1.3 应用领域
1.4 挑战与发展

第2章 海量视频模型
2.1 HSV颜色模型
2.2 肤色模型
2.3 形状模型
2.4 人体可变形模型
2.5 混合高斯模型
2.6 概率图模型
2.7 感兴趣区域模型(ROI)
2.8 视觉显著性模型
2.9 多分辨率模型
2.10 视觉词袋模型
2.11 视频语义模型

第3章 海量视频管理
3.1 视频数据库
3.1.1 海量视频数据
3.1.2 面向对象的海量视频数据库
3.2 集中式视频数据库
3.3 分布式视频数据库
3.3.1 基于Hadoop的视频数据库
3.3.2 MapReduce模型
3.4 博世视频管理系统
3.5 微博视频管理系统
3.6 VOD视频点播及管理系统

第4章 海量视频分析
4.1 Harris描述子
4.2 SIFT描述子
4.3 K均值聚类方法
4.4 K近邻法
4.5 SVM方法
4.6 BP网络
4.7 多感知器模型
4.8 卷积神经网络(CNN)
4.9 AdaBoost方法
4.10 模拟退火方法
4.11 遗传方法

第5章 大规模人脸搜索系统
5.1 概述
5.2 人脸检测
5.2.1 人脸检测方法分类
5.2.2 基于Adaboost的人脸检测
5.3 人脸特征提取
5.3.1 PCA方法
5.3.2 LDA方法
5.3.3 Kernel方法
5.4 人脸特征比对
5.4.1 典型的度量方法
5.4.2 典型的分类器
5.5 “大海捞针”人脸搜索系统
5.5.1 体系结构
5.5.2 关键技术
5.5.3 算法伪代码
5.5.4 性能评价
5.5.5 系统搜索效果

第6章 高清卡口车辆信息搜索系统
6.1 车辆信息搜索
6.2 车牌搜索子系统
6.2.1 车牌搜索概述
6.2.2 车牌区域定位
6.2.3 车牌字符分割
6.2.4 索车牌字符识别
6.3 车标搜索子系统
6.3.1 车标定位
6.3.2 车标搜索

第7章 暴力行为检测系统
7.1 暴力行为
7.2 暴力行为检测
7.2.1 系统框架
7.2.2 行为数据库
7.2.3 评价指标
7.3 基于对象层次的暴力行为检测系统
7.4 基于光流变化的暴力行为检测系统
7.5 基于运动着色的暴力行为检测系统

第8章 可疑行为检测系统
8.1 可疑行为
8.2 可疑行为检测
8.3 基于轨迹特征的可疑行为检测系统
8.3.1 系统结构
8.3.2 人体目标检测
8.3.3 轨迹建模
8.3.4 轨迹特征提取
8.3.5 轨迹特征分类
8.4 基于运动方向的可疑行为检测系统
8.4.1 系统流程
8.4.2 背景边缘模型
8.4.3 前景帧判断
8.4.4 行为特征描述
8.4.5 SVM分类
8.5 基于形状特征的可疑行为检测系统

第9章 海量视频摘要系统
9.1 视频摘要
9.2 视频摘要过程
9.3 特征提取和表示
9.3.1 颜色特征提取
9.3.2 纹理特征提取
9.3.3 形状特征提取
9.3.4 运动特征提取
9.3.5 音频特征提取
9.4 典型系统

第10章 海量视频管控平台
10.1 平台要求
10.2 平台架构
10.3 平台组成
10.4 平台服务器
10.5 平台功能
10.5.1 视频监控与回放
10.5.2 视图无缝融合功能
10.5.3 大规模人脸等目标监测
10.5.4 异常行为检测
10.5.5 海量视频摘要
10.5.6 高清卡口车辆信息搜索
10.6 平台应用

前言/序言


《数据挖掘原理与算法实践》 内容概述: 本书是一本深入探讨数据挖掘核心原理、关键算法及其在实际应用中部署的综合性著作。它旨在为读者提供一个全面而系统的知识体系,帮助理解如何从海量数据中提取有价值的洞察,从而驱动业务决策、优化流程并发现新的机遇。全书以理论联系实际为宗旨,在阐述算法原理的同时,辅以大量的实践案例和代码示例,让读者能够真正掌握数据挖掘的技术精髓。 核心章节解读: 第一部分:数据挖掘基础理论与预处理 数据与知识的本质: 章节伊始,本书便深入探讨了“数据”与“知识”之间的辩证关系。在信息爆炸的时代,海量原始数据本身并不能直接带来价值,真正的力量在于从中挖掘出隐藏的模式、趋势和关联,将其转化为可操作的知识。本章将分析不同类型数据的特点(结构化、半结构化、非结构化),以及数据在不同领域的应用场景,为后续的数据挖掘工作奠定理论基础。我们将讨论数据质量的重要性,并介绍数据采集、存储和初步理解的方法。 数据预处理:转型与增值的基石: 现实世界的数据往往是嘈杂、不完整且不一致的。本章将聚焦于数据预处理这一至关重要但常被忽视的环节。我们将详细介绍多种数据预处理技术,包括: 数据清洗: 处理缺失值(如均值填充、中位数填充、回归填充、插值法),异常值检测与处理(如箱线图法、Z-score法、IQR法、聚类分析法),以及处理噪声数据(如平滑技术、分组平滑、分段平滑)。 数据集成: 如何将来自不同源头的数据进行整合,解决模式冲突、实体识别等问题。 数据变换: 包括数据归一化(Min-Max归一化、Z-score归一化)、数据标准化、离散化(等宽离散化、等深离散化、聚类离散化)、特征编码(独热编码、标签编码)以及特征构建(如何从现有特征中创造新的、更有预测能力的特征)。 数据规约: 降低数据维度以提高算法效率和模型泛化能力,将介绍主成分分析(PCA)、因子分析、离散小波变换等降维技术。 数据采样: 在处理超大规模数据集时,如何进行有效的样本抽样,以代表整体数据分布,如随机抽样、分层抽样、系统抽样。 第二部分:核心数据挖掘算法详解 关联规则挖掘:发现“啤酒与尿布”的奥秘: 关联规则挖掘是数据挖掘中最经典的任务之一,旨在发现数据项之间的有趣关系。本章将深入剖析Apriori算法的原理,包括其支持度、置信度和提升度等度量指标,以及如何通过生成候选集和剪枝来提高效率。此外,我们还将介绍FP-Growth算法,它通过构建FP-Tree来避免生成冗余的候选集,从而在处理大规模数据集时表现更优。案例分析将涵盖购物篮分析、网络浏览路径分析等。 分类算法:预测未来的精准预测: 分类是数据挖掘中最常见的任务之一,其目标是构建模型来预测样本所属的类别。本章将系统介绍多种强大的分类算法: 决策树: 深入解析ID3、C4.5、CART等决策树算法的构建原理,包括信息增益、增益率、基尼指数等分裂准则,以及剪枝技术以避免过拟合。 贝叶斯分类器: 详细阐述朴素贝叶斯算法,理解其概率模型的构建和分类决策过程,并探讨其在文本分类、垃圾邮件过滤等领域的应用。 支持向量机(SVM): 讲解SVM的核心思想,包括最大间隔超平面、核函数(线性核、多项式核、径向基核RBF)以及软间隔与硬间隔的概念,并分析其在高维空间中的优势。 K近邻(KNN): 介绍KNN的原理,理解距离度量(欧氏距离、曼哈顿距离)和K值的选择对分类结果的影响。 集成学习方法: 重点介绍Bagging(如随机森林Random Forest)和Boosting(如AdaBoost, Gradient Boosting)的思想,如何通过组合多个弱学习器来提升整体模型的性能和鲁棒性。 回归算法:量化关系,预测数值: 回归算法用于预测连续数值型变量。本章将涵盖: 线性回归: 从简单线性回归到多元线性回归,讲解最小二乘法原理,理解模型系数的含义,并介绍评估指标(R²、Adjusted R²、RMSE)。 岭回归与Lasso回归: 讨论L1和L2正则化如何用于缓解多重共线性问题,以及它们在特征选择中的作用。 决策树回归与集成回归: 借鉴分类算法的思想,讲解如何利用决策树和集成方法进行回归预测。 聚类算法:发现隐藏的群体结构: 聚类是一种无监督学习方法,旨在将相似的数据点分组。本章将详细讲解: K-Means算法: 阐述K-Means的迭代过程,簇的定义,以及簇内平方和(WCSS)最小化目标,并讨论K值的选择问题(如肘部法则)。 层次聚类: 介绍凝聚型(Agglomerative)和分裂型(Divisive)层次聚类方法,以及各种连接准则(单链接、全链接、平均链接、Ward法)。 DBSCAN算法: 讲解基于密度的聚类方法,如何识别任意形状的簇,以及其在异常点检测中的应用。 模型聚类(如高斯混合模型): 引入期望最大化(EM)算法,用于拟合数据到一组高斯分布,实现软聚类。 异常检测(离群点检测):识别非凡的数据点: 异常检测旨在识别与大多数数据显著不同的数据点。本章将介绍多种技术,包括基于统计的方法(如Z-score、IQR)、基于距离的方法(如KNN)、基于密度的方法(如LOF)以及基于模型的方法(如One-Class SVM)。我们将讨论异常检测在欺诈检测、入侵检测、设备故障预警等领域的应用。 第三部分:高级数据挖掘技术与实践 序列模式挖掘:挖掘时间序列中的规律: 针对具有时间顺序的数据(如用户点击流、股票价格、生物序列),本章将介绍序列模式挖掘的概念,以及如GSP(Generalized Sequential Patterns)等算法,用于发现频繁出现的序列。 文本挖掘与自然语言处理(NLP)基础: 文本数据是现实世界中最普遍的非结构化数据类型。本章将介绍文本数据的预处理技术(分词、词干提取、词形还原、停用词去除),词向量表示(如TF-IDF, Word2Vec, GloVe),以及情感分析、主题模型(LDA)等文本挖掘任务。 推荐系统:个性化服务的核心: 推荐系统旨在预测用户对物品的偏好。本章将深入探讨协同过滤(基于用户、基于物品)、基于内容的过滤以及混合推荐策略。我们将分析推荐系统的评估指标(如准确率、召回率、NDCG)。 时间序列分析:理解和预测随时间变化的数据: 本章将介绍时间序列的基本概念(趋势、季节性、周期性、随机性),常用模型(如ARIMA、SARIMA),以及时间序列预测的常用方法。 数据挖掘项目的生命周期与模型评估: 成功的项目不仅仅在于算法的选择,更在于整个项目的管理和评估。本章将梳理数据挖掘项目的典型生命周期,包括问题定义、数据理解、数据准备、模型构建、模型评估和模型部署。我们将详细介绍各种模型评估指标(如准确率、精确率、召回率、F1-score、AUC-ROC曲线、混淆矩阵),以及交叉验证、留出法等模型选择和评估策略。 第四部分:实战应用与工具链 常用数据挖掘工具介绍: 本章将简要介绍业界流行的开源和商业数据挖掘工具,如Python(Scikit-learn, Pandas, NumPy, SciPy)、R语言(caret, dplyr, ggplot2)、Weka、RapidMiner等,并重点讲解如何在Python生态系统中进行数据挖掘实践。 案例研究: 本章将选取多个典型行业的数据挖掘应用案例,涵盖金融(信用评分、风险控制)、电商(用户画像、精准营销)、医疗(疾病预测、诊断辅助)、制造(故障预测、质量控制)等领域。通过这些案例,读者可以直观地看到数据挖掘技术是如何解决实际业务问题的,并理解不同算法在特定场景下的适用性。 模型部署与维护: 最后一章将探讨如何将训练好的数据挖掘模型部署到生产环境,以及模型的持续监控和更新,以确保模型的长期有效性和可靠性。 本书特色: 理论与实践并重: 每一项算法的讲解都力求清晰透彻,同时提供相应的代码实现和可视化分析,帮助读者从理论走向实践。 内容全面系统: 覆盖了从基础的数据预处理到核心的挖掘算法,再到高级应用与项目实践的完整流程。 案例丰富多样: 选取了多个行业内的真实应用案例,展示数据挖掘的实际价值。 代码示例友好: 提供易于理解和修改的Python代码示例,方便读者动手实践。 目标读者: 本书适合对数据挖掘感兴趣的初学者、希望系统学习数据挖掘技术的计算机科学、统计学、数学、工程学等相关专业学生,以及需要运用数据挖掘解决实际业务问题的从业人员,如数据分析师、数据科学家、产品经理、市场营销人员等。通过本书的学习,读者将能够掌握数据挖掘的核心技能,为解决复杂的数据问题打下坚实基础。

用户评价

评分

评价一 这本书着实让我眼前一亮,虽然我一直对数据分析和可视化有着浓厚的兴趣,但《视觉大数据基础与应用》这本书提供了一个完全不同的视角。它并没有停留在枯燥的算法和理论层面,而是将“视觉”二字发挥到了极致。从一开始,作者就强调了人类视觉系统在理解和处理海量信息时的强大能力,这一点我深以为然。在信息爆炸的时代,我们每天接触到的数据量呈指数级增长,传统的文字或表格呈现方式早已力不从心。这本书就像一位技艺精湛的向导,带领我穿梭于复杂的数据海洋,用直观、生动、富有表现力的方式揭示隐藏在数据背后的洞察。我特别喜欢书中关于如何选择恰当的可视化图表来表达不同类型数据的章节,这不仅仅是选择一个“好看”的图形,更是关于如何最大化信息传递效率和减少认知负荷的艺术。作者通过大量的实例,展示了如何将抽象的数据转化为具象的图像,例如地理信息系统(GIS)如何通过地图可视化来展现空间关系,时间序列分析如何通过动态图表来呈现趋势变化,以及社交网络分析如何用节点和连线来描绘复杂的社交结构。我之前一直觉得要理解一个庞大的数据集,需要花费大量的时间去阅读报告或者编写查询语句,但读了这本书后,我意识到很多关键信息,甚至是之前我从未注意到的模式和关联,竟然能够通过一副精心设计的图表瞬间捕捉到。这种“所见即所得”的学习体验,让我对数据分析的潜力有了全新的认识,也激发了我深入探索这个领域的决心。

评分

评价四 《视觉大数据基础与应用》这本书真的给我带来了一种“顿悟”的感觉。我一直认为自己对数据分析已经有了相当的了解,但这本书却让我看到了一个全新的维度。作者并没有拘泥于传统的统计学理论,而是从认知心理学的角度出发,深入浅出地阐述了视觉化在理解和处理大数据中的核心作用。我特别喜欢书中关于“数据叙事”的章节,它不仅仅是展示图表,更是教我如何通过视觉化的语言,将复杂的数据转化为引人入胜的故事,有效地传递信息,引发共鸣。这一点对于我目前从事的教育领域,尤其是在向学生解释抽象概念时,具有极大的指导意义。我尝试着将书中的一些可视化技巧应用到我的教学PPT中,结果发现学生们对内容的理解和记忆能力都有了明显的提升,那些曾经让他们望而生畏的科学原理,现在变得更加生动有趣。书中还介绍了许多不同类型的数据可视化工具,并且对它们的优缺点进行了详细的分析,这对于我这种对技术不太精通的人来说,无疑是一份宝贵的指南。最重要的是,这本书让我认识到,数据可视化不仅仅是一门技术,更是一种思维方式,它能够帮助我们更深入地理解世界,更有效地解决问题。读完这本书,我感觉自己对数据的掌控力更强了,也对未来的学习和工作充满了新的期待。

评分

评价二 我拿到《视觉大数据基础与应用》这本书时,本以为它会是一本偏向技术实现的书籍,没想到它更侧重于方法论和设计原则,这让我感到惊喜。作者的讲解非常细致,深入浅出,没有让我在复杂的概念面前感到困惑。他首先构建了一个清晰的理论框架,解释了为什么视觉化是处理大数据的关键,并详细阐述了信息可视化设计的基本原则,包括清晰度、准确性、效率和美观性。我尤其欣赏书中关于“叙事性可视化”的讨论,它强调了如何通过可视化来讲述一个引人入胜的数据故事,而不仅仅是展示数据点。这一点对于我目前工作中需要向非技术背景的领导层汇报数据的场景尤为重要。我尝试着将书中的一些设计理念应用到我最近的一个项目报告中,结果发现领导们对报告的接受度和理解度有了显著的提升,很多之前需要反复解释的指标,现在都能通过一张简洁的图表清晰地传达。书中还提供了不少关于不同可视化工具的介绍和使用技巧,虽然我不是一个技术专家,但这些内容让我对市面上可用的工具有了初步的了解,也为我后续的学习指明了方向。最令我印象深刻的是,作者在书中反复强调了“以人为本”的设计理念,即在设计可视化时,必须始终考虑目标用户的认知能力、信息需求和使用场景。这种人文关怀的视角,让整本书的阅读体验更加温暖和人性化,也让我意识到,数据可视化不仅仅是一门技术,更是一门与人沟通的艺术。

评分

评价五 这本书的标题《视觉大数据基础与应用》让我最初以为它会是一本偏向于学术理论的书籍,但实际上,它却以一种非常接地气的方式,将前沿的视觉大数据技术呈现在我面前。作者的写作风格非常流畅,没有使用过于生涩的专业术语,使得即使是对大数据领域不太熟悉的读者,也能轻松理解。我尤其欣赏书中关于“大数据可视化挑战与对策”的章节,作者深刻地剖析了在处理海量、高维度、多类型数据时所面临的各种挑战,并提出了切实可行的解决方案。这一点对于我目前工作中遇到的数据处理瓶颈非常有启发。我之前一直为如何有效地呈现和分析我们收集到的海量用户行为数据而苦恼,很多时候,数据量的庞大会让传统的分析方法显得力不从心。这本书为我提供了一个全新的思路,让我认识到利用先进的可视化技术,可以更有效地发现隐藏在数据中的规律和趋势。书中还详细介绍了如何利用交互式可视化来增强用户体验,从而让用户能够更深入地探索数据,获得更丰富的洞察。这一点在产品设计和用户研究领域具有重要的应用价值。总而言之,这本书不仅为我提供了扎实的基础知识,更重要的是,它激发了我对视觉大数据应用的无限想象,让我看到了数据驱动决策的巨大潜力。

评分

评价三 对于我这样一个在商业分析领域摸爬滚打多年的老兵来说,《视觉大数据基础与应用》这本书提供了一种令人耳目一新的启发。过去,我们习惯于依赖电子表格和传统的统计报告来分析业务数据,虽然也能得出一些结论,但总感觉少了些什么,难以触及数据的深层含义。这本书彻底改变了我的看法。它不仅仅是介绍如何制作图表,更重要的是,它教会我如何“看”数据,如何从视觉的呈现中发现那些隐藏在数字背后的商业洞察。我特别着迷于书中关于“探索性数据分析”(EDA)的章节,作者通过各种生动直观的图示,展示了如何利用可视化手段快速地识别数据中的异常值、趋势、模式和潜在的相关性。这对于我们这些需要快速响应市场变化、做出决策的业务人员来说,简直是雪中送炭。我尝试着运用书中的方法来分析我负责的销售数据,之前一些难以察觉的区域性销售差异,以及不同产品线之间的关联性,竟然通过几幅简单的散点图、热力图和地理分布图就一目了然。这种高效的洞察力,让我对数据分析的价值有了全新的认识,也为我后续的业务决策提供了更加坚实的基础。这本书让我意识到,优秀的数据可视化不仅仅是为了美观,更是为了更有效地沟通和决策,它将抽象的数字世界变得触手可及,让商业智能的获取过程变得更加高效和富有成效。

评分

太贵。

评分

太贵。

评分

讲的视频分析算法和数据挖掘等方面的内容,翻翻还不错。

评分

大数据的东西,买来好好学学

评分

这是本不错的书籍,专业必备

评分

好好好好好好好好好好好好好好好好好好

评分

买来给实验室的孩子们看的,希望不错

评分

9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而来的9B6A3C赚分而

评分

编的很专业。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有