内容简介
面向大数据,《地球观测与导航技术丛书:空间数据挖掘理论与应用(第2版)》提出数据场、云模型、地学粗空间和空间数据挖掘视角,构建空间数据挖掘金字塔,给出挖掘机理,介绍概念格,总结空间数据源,导出清理空间观测数据的选权迭代法。面向地理信息系统数据研究空间的关联规则、分布规则、概化规则和聚类规则的挖掘,从图像中发现指导图像分类、特征提取、表情识别的空间知识,以及时空分布的视频数据挖掘。这些理论,在滑坡监测、车轮形变、银行选址、土地利用、人脸识别、公共安全等实际领域,获得了有价值的应用成果,自主研制了空间数据挖掘原型系统GISDB Miner和RSImage Miner。
《地球观测与导航技术丛书:空间数据挖掘理论与应用(第2版)》可供空间数据挖掘、计算机科学、地球空间信息科学、地理信息系统、遥感、全球定位系统、数据分析、人工智能、认知科学、空间资源规划、土地科学、灾害防治、管理科学与工程和决策支持等领域的研究人员和开发人员使用,亦可作为高等学校相关专业本科生和研究生的参考用书。
作者简介
李德仁,德国斯图加特大学博士,瑞士苏黎世联邦理工大学名誉博士,摄影测量与遥感学家,武汉大学教授,博士生导师,中国科学院地学部院士,中国工程院电子信息学部院士,国际欧亚科学院院士,第九届全国政协委员,武汉大学学术委员会主任,测绘遥感信息工程国家重点实验室学术委员会主任,中国测绘学会副理事长,武汉“中国光谷”首席科学家,国际摄影测量与遥感学会名誉会员。历任全球对地观测卫星委员会中国副主席和一体化全球观测战略伙伴关系联合主席之一,亚洲地理信息学会创会会长,国家有突出贡献的中青年专家,国家973计划专家顾问组成员,国务院学位委员会评议组成员,国家自然科学基金委员会学科评议组成员,中国测绘学会理事长,国际摄影测量与遥感学会第Ⅲ委员会主席(1988~1992年)和第Ⅵ委员会主席(1992~1996年),测绘遥感信息工程国家重点实验室主任,原武汉测绘科技大学校长。1982年,他提出的选权迭代法,被国际测量学界称为“李德仁方法”;1985年,他提出可靠性理论,科学地“解决了测量学上一个百年来的问题”:20世纪90年代,他提出地球空间信息学的概念和理论体系;1994年,他提出并奠定空间数据挖掘的基础,;21世纪以来,他又提出广义和狭义空间信息网格,推进数字地球与智慧地球建设。他在多方面的独到建树,直接推动了技术进步和产业发展,其成果相继获得德国“汉莎航空测量奖”、国家科技进步二等奖等10余项奖励。已发表论文650余篇,出版专著11本:培养硕士研究生80多名,博士研究生130多名,5篇博士学位论文被评为全国优秀博士学位论文。
王树良,第十一届全国青联委员,教育部新世纪优秀人才,教育部软件工程专业教学指导委员会委员,北京理工大学教授、博士生导师、软件学院副院长。提出了空间数据挖掘视角,获得IGI Global的the Fifth Annual InfoSci-Journals Excellencei in Research Awards、全国优秀博士学位论文、第十一届教育部霍英东青年教师二等奖等。兼任IJGCRSIS等编委、内蒙古自治区数据挖掘与知识工程重点实验室主任。已获得国家发明专利授权2项,发表论文30余篇,出版专著3本。
李德毅,计算机工程和人工智能专家,中国工程院院士,国际欧亚科学院院士,现任中国指挥与控制学会名誉理事长,中国人工智能学会理事长,国家信息化专家咨询委员会委员,总参信息化部研究员,少将军衔,博士生导师,清华大学、国防大学兼职教授。在国际上最早提出“控制流一数据流”图对理论.1985年被国际IEE总部授予计算机和控制类年度期刊很好学术成果奖;1999年攻克世界难题“三级倒立摆动平衡”问题,获得世界自动控制联合会杰出论文奖;长期从事云模型、云计算、数据挖掘、复杂网络、智能驾驶等研究,已出版英文专著3本,获得国家发明专利10项,国家和军队级科技进步奖18项,发表学术论文180余篇,主编技术丛书7本,培养博士、硕士研究生百余名。被国家授予有突出贡献的回国留学人员,享受政府特殊津贴,国家有突出贡献的中青年专家,获得何梁何利奖和军队专业技术重大贡献奖。
内页插图
目录
《地球观测与导航技术丛书》出版说明
序一
序二
序三
第二版前言
第一版前言
第1章 绪论
1.1 空间数据挖掘的由来
1.2 空间数据挖掘的价值
1.3 空间数据挖掘的难点
1.4 本书的内容和组织结构
第2章 空间数据挖掘基础
2.1 基本概念
2.2 空间数据挖掘视角
2.3 空间数据挖掘金字塔
2.4 空间粒度和空间尺度
2.5 空间数据挖掘的知识类型
2.6 空间知识的表达
2.7 空间数据挖掘与相关学科的关系
2.8 空间数据挖掘系统
2.9 小结
第3章 空间数据挖掘的数据源
3.1 空间数据的内容和特性
3.2 空间数据获取
3.3 空间数据结构
3.4 空间数据模型
3.5 空间数据的组织和管理
3.6 国家空间数据基础设施
3.7 中国国家空间数据基础设施
3.8 从空间数据基础设施到大数据
3.9 小结
第4章 空间数据清理
4.1 空间数据的污染问题
4.2 空间数据清理的基本内容
4.3 空间观测数据的清理
4.4 空间图形图像的清理
4.5 基于DHP法的空间数据选择
4.6 小结
第5章 空间数据挖掘可用的理论方法
5.1 确定集合论
5.2 扩展集合论
5.3 仿生学
5.4 可视化
5.5 决策树
5.6 小结
第6章 数据场
6.1 空间数据辐射
6.2 数据场的概念和性质
6.3 数据场的场强和势
6.4 小结
第7章 云模型
7.1 随机性和模糊性
7.2 云模型的概念
7.3 云模型的类型
7.4 云发生器
7.5 云变换
7.6 基于云模型的不确定推理
7.7 小结
第8章 地学粗空间
8.1 粗集的局限
8.2 地学粗空间的概念
8.3 地学粗空间的组成
8.4 基于向量的属性简化
8.5 在地球空间信息学中的应用
8.6 小结
第9章 概念格
9.1 概念的形成
9.2 概念格理论
9.3 概念格的构建和Hasse图的绘制
9.4 小结
第10章 宝塔滑坡的监测数据挖掘
10.1 宝塔滑坡
……
第11章 GIS数据挖掘
第12章 遥感图像挖掘
精彩书摘
2.4空间粒度和空间尺度
空间粒度和空间尺度是空间数据挖掘的一对孪生指标。不同空间尺度下有不同的空间粒度含义,空间尺度反映概念粒度的缩放程度,如概念“武汉到北京1100km”,在全球尺度考虑是一个较近距离的粒度,而在湖北省尺度考虑则是一个很远距离的粒度。不同空间粒度的概念应在特定的空间尺度下定义。而且,遥感针对不同对象和不同应用目的,以不同精度的传感器获取客观世界的测量数据,获取过程也带有一定的空间粒度和空间尺度。
2.4.1空间粒度
人类的创造活动和认识活动虽然有所差别,但有一个共同的特点,就是具有粗细、层次和角度上的不同。为了把这个重要的特点反映在空间数据挖掘的过程中,有必要引入空间粒度的概念。
空间粒度在空间数据挖掘中度量空间数据的精细度,以及空间信息和空间知识的抽象度。粒度在物理学中本指微粒或颗粒大小的平均度量,它在空间数据挖掘中可看作像素的大小、计算程序单元的分割程度、空间数据的认识层次等。空间粒度有宏观、中观或微观之分,基于空间粒度的知识也可以区分为高抽象层的概化知识、多个抽象层的多层知识、原始数据层的原始层知识等。
人类智能能够从极不相同的粒度世界上观察和分析同一问题,而且往返自如,各有各的用处。与此相似,空间数据挖掘也是分别从不同层次上透彻分析数据、信息或概念,通过粒度上卷(Roll Up)统览概括,以及粒度下钻(Drill Down)细剖微细,挖掘不同层次的知识,满足不同的需要。粒度上卷是从较细的粒度世界(Finer Granularity)跃升到较粗的粒度世界(Coarser Granularity),而粒度下钻是从较粗的粒度世界沉降到较细的粒度世界。应该说,究竟在多大的粒度上从空间数据中挖掘知识,并无永恒的最优观察距离,而是取决于要研究和发现的问题。例如,空间数据仓库的空间粒度是多重的。抽象的结果还能保持多少细粒度世界的全部性质?在粗粒度世界中无解的问题,可不可以在细粒度世界有解?是值得研究的课题。一般而言,粒度反映空间对象在粗细、层次和角度上的不同。粗略的对象,高层次的问题,全角度的考察都是粒度大的表现;反之,细微的对象、低层次的问题、独特角度的考察都是粒度小的表现。在处理空间信息时,可把粒度与空间信息的共同处理单元相联系。若处理这些单元需要较强的功能,则称其为大粒度的;反之称其为小粒度的。
……
前言/序言
空间数据挖掘旨在解决“空间数据海量而知识贫乏”的瓶颈问题。长期以来,人们基本上是套用数据挖掘的策略研究空间数据挖掘,没有充分顾及到空间数据和普通事务数据的不同特点。现有的空间数据挖掘书籍或涉及空间数据挖掘的某些章节的作者,其学科背景在很大程度上是来自于计算机领域。虽然计算机科学与地球空间信息科学在方法上有所渗透,但是两者的学科基础和思维方法还是非常不同的,这决定了空间数据挖掘和数据挖掘的差异。作者深感传统研究方法的局限性,并在自己的研究和应用过程中努力突破其束缚。
1994年,在加拿大渥太华举行的GIS国际学术会议上,李德仁首次提出了从GIS数据库中发现知识(KDG)的概念,认为它能够把GIS有限的数据变成无限的知识,精练和更新GIS数据,使GIS成为智能化的信息系统,率先从GIS空间数据中发现了用于指导GIS空间分析的知识。后来,他组建了自己的研究团体,指导他们把KDG进一步发展为空间数据挖掘,系统研究或提出了可用的理论、技术和方法,并取得了可喜的创新性成果,从而敲响了武汉大学在地球空间信息学中进行空间数据挖掘的战鼓。
作者指导的研究团队,由数十名教授、副教授、博士后、博士生和硕士生组成老、中、青相结合的梯队,地球空间信息科学和计算机科学等学科交叉,优势互补。先后申请并完成了有关空间数据挖掘的国家自然科学基金优秀重点实验室项目、国家重大基础研究计划(973)、国家高技术研究发展计划(863)、国家自然科学基金重点项目、国家自然科学基金面上项目、香港特别行政区政府基金项目、国家教育部博士点基金项目、测绘遥感信息工程国家重点实验室基金项目、软件工程国家重点实验室基金项目、中国博士后基金项目和武汉大学科研基金项目等10余项课题。同时,理论研究成果也被成功地应用于国民经济建设,如长江三峡宝塔滑坡监测数据挖掘、火车车轮的变形识别等,都直接关系到人民的生命财产的安全。先后培养了3名博士后、6名博士和20名硕士。在国内外公开发表了相关的学术论文50余篇,其中,被SCI、EI、ISTP等三大检索机构收录30余篇。
丛书总序:探索未知,洞察未来——现代测绘科学与信息技术的深度融合 随着科技的飞速发展,人类对地球及其周围空间环境的认知正以前所未有的广度和深度拓展。从宏观的气候变化监测,到微观的城市基础设施管理,再到精准的全球定位服务,测绘科学与信息技术已成为支撑现代社会高效运转和可持续发展的基石。 本丛书旨在系统、深入地梳理当前测绘地理信息领域最前沿、最核心的技术体系、理论框架与典型应用,聚焦于 空间数据获取、处理、分析、可视化及应用服务 的关键环节。我们力求打造一套集理论深度、技术前沿性与工程实践性于一体的专业参考书系,为广大从事测绘工程、地理信息科学(GIS)、遥感科学、全球导航卫星系统(GNSS)等领域的科研人员、高校师生及工程技术人员提供坚实的知识支撑和启发性的研究视角。 本丛书将涵盖以下几个关键方向,力求全面覆盖现代地球观测与导航技术体系的精髓: --- 第一分册:高精度空间数据获取与处理基础 本分册聚焦于如何高效、准确地获取地球表面的几何和物理信息。它深入探讨了现代测绘系统中数据采集的核心技术,并着重于基础数据的预处理和质量控制。 核心内容涵盖: 1. 新型传感器技术: 详细介绍新一代光学遥感器、激光雷达(LiDAR)系统、合成孔径雷达(SAR)的成像原理、数据特性及其在不同环境(如森林、城市、水体)下的优势与局限。特别是对高光谱与高分辨率多光谱数据的融合处理进行了深入剖析。 2. 精密定位与导航理论: 全面阐述GNSS(包括北斗、GPS、Galileo等)的信号传播模型、精密定位技术(如PPP、RTK/VRS)的数学基础与误差源分析。重点讨论了惯性导航系统(INS)与GNSS的紧密耦合(GNSS/INS Integrated Systems)技术,以实现全天候、高动态下的连续高精度定位。 3. 三维重建与建模: 阐述基于航空影像、无人机摄影测量(UAV Photogrammetry)以及地面激光扫描(TLS)数据的三维点云生成、配准与精化技术。详细介绍倾斜摄影测量数据到实景三维模型(Digital Surface Model, DSM / Digital Terrain Model, DTM)的转化流程,以及三维GIS数据模型的构建与管理标准。 4. 空间数据质量控制与校正: 探讨几何校正、辐射定标、正射纠正等关键预处理步骤。引入基于不确定性理论的空间数据质量评估体系,确保后续分析结果的可靠性。 --- 第二分册:空间信息融合、组织与管理 获取海量、多源、异构的空间数据是当今测绘领域的常态。本分册侧重于如何有效地整合这些信息,并构建高效的管理与服务平台。 核心内容涵盖: 1. 多源异构数据融合策略: 深入研究如何将不同尺度、不同分辨率、不同时间获取的遥感影像、地形数据、属性信息进行空间对齐与信息互补。探讨语义级别的多源数据融合方法,超越简单的几何叠加。 2. 时空数据库理论与实践: 阐述传统关系型数据库在处理动态、随时间变化的地理信息方面的不足,引入面向对象的空间数据库设计范式。重点介绍时态地理信息模型(Temporal GIS)的构建原理,以及如何支持历史情景的回溯与未来趋势的预测。 3. 大规模空间数据基础设施(SDI)构建: 详细介绍构建国家级或区域级空间数据基础设施所需的关键技术栈,包括元数据标准、数据交换协议(如OGC标准)、数据服务接口(WMS, WFS, WMTS)的实现与优化。 4. 云计算与边缘计算在测绘中的应用: 分析云计算平台如何支撑TB级乃至PB级空间数据的存储、并行处理与分发。探讨边缘计算在应对应急响应、快速制图等场景中,实现低延迟、就近处理的技术优势。 --- 第三分册:先进空间分析与建模技术 空间分析是测绘科学的核心价值所在,它将原始数据转化为可指导决策的知识。本分册致力于介绍支撑复杂地理过程理解与模拟的前沿分析技术。 核心内容涵盖: 1. 几何拓扑与网络分析的深化: 不仅停留在基础的缓冲区、叠加分析,更深入探讨复杂网络(如交通、水文网络)中的路径优化、最短/最快/最经济路径算法的改进,以及在大规模城市路网分析中的高性能实现。 2. 空间统计学与地球统计学: 全面梳理描述性统计、空间自相关分析(Moran's I, Geary's C)、空间回归模型(如GWR,地理加权回归)等工具。重点讨论如何利用空间变异函数对区域现象进行插值和不确定性评估。 3. 环境与资源过程模拟: 介绍基于地理模型(如水文模型、大气扩散模型)的耦合模拟技术。结合遥感监测数据,探讨地表能量平衡、植被生长动态及污染物迁移扩散的定量模拟方法。 4. 空间决策支持系统(SDSS)的设计原则: 阐述如何将多层次的分析结果集成到一个面向特定决策目标(如选址、风险评估)的交互式支持系统中,强调人机交互在决策过程中的关键作用。 --- 第四分册:前沿应用与智能化趋势 随着人工智能浪潮席卷各行各业,测绘地理信息领域正迎来深刻的变革。本分册将目光投向未来,探讨数据挖掘、深度学习等智能技术在空间信息服务中的最新突破与应用前景。 核心内容涵盖: 1. 深度学习在遥感影像解译中的突破: 系统介绍卷积神经网络(CNN)、循环神经网络(RNN)及Transformer模型在高精度地物分类、变化检测、目标识别与场景理解中的应用范式。探讨如何利用少量标注数据实现有效的迁移学习。 2. 时空数据挖掘的理论与方法(注:此部分侧重于数据挖掘的通用方法论及其在时空数据上的特殊处理): 聚焦于从海量历史轨迹、传感器记录中发现潜在的时空模式、关联规则和异常事件的算法设计。讨论如何处理轨迹数据的时间稀疏性和空间不规则性。 3. 增强现实(AR)与沉浸式地理可视化: 探讨如何将高精度定位和三维模型无缝叠加到现实场景中,实现现场级的空间信息叠加与交互。介绍基于WebGL、Unity/Unreal引擎的地理信息可视化技术。 4. 自主智能系统与未来导航: 展望完全自主的无人机测绘系统、水下和室内定位技术的发展方向。讨论传感器融合与路径规划的强化学习方法,以期实现测绘作业的自动化与智能化迭代升级。 --- 结语: 本丛书的编写团队汇集了国内在测绘、遥感、GIS、导航等领域具有深厚造诣和丰富实践经验的专家学者。我们相信,通过对这些核心技术和理论的系统梳理,读者能够站在新的高度,把握学科发展的脉络,为推动我国地球观测与导航技术的创新发展贡献力量。愿此丛书成为您探索地球科学奥秘、助力工程实践的得力助手。