内容简介
《空间数据分析理论与实践》对空间数据分析领域进行了广泛的论述。《空间数据分析理论与实践》综述了空间数据分析和位置(地点、背景和空间)在科学以及决策相关研究方面的重要性。涵盖了人们所关注的最新的探索性空间数据分析和空间建模方法,以及如何表达在地理空间中的属性的基本问题。引领读者进入支撑空间数据分析的关键领域,为读者了解和领会这个领域的诸多关键问题提供了一个平台。此书部分内容适合大学本科生和硕士研究生,还包含了让从事空间分析领域研究的地理、社会、经济、环境和统计等学科的科学工作者感兴趣的、具有足够挑战性的内容。
内页插图
目录
前言
致谢
版权说明
引言
0.1 关于本书
0.2 什么是空间数据分析?
0.3 本书的写作动机
0.4 本书的组织结构
0.5 空间数据矩阵
第一部分 空间数据分析的背景
第1章 空间数据分析:科学和决策背景
1.1 科学领域的空间数据分析
1.1.1 科学解释领域中地点、背景和空间的一般性问题
1.1.2 空间过程
1.2 科学解释特定领域中的地点和空间
1.2.1 空间分支科学的定义
1.2.2 举例:选择的研究领域
1.2.3 问题求解中的空间数据分析
1.3 决策领域的空间数据分析
1.4 空间数据分析中产生的问题举例
1.4.1 描述和地图解释
1.4.2 信息冗余
1.4.3 建模
1.5 小结
第2章 空间数据的性质
2.1 空间数据矩阵:概念化和表达问题
2.1.1 地理空间:对象、空间域和地理几何表达
2.1.2 地理空间:属性值的空间相关性
2.1.3 变量
2.1.4 样本还是样本总体?
2.2 空间数据矩阵:它的形式
2.3 空间数据矩阵:它的质量
2.3.1 模型质量
2.3.2 数据质量
2.4 空间相关性的量化
2.5 小结
第二部分 空间数据:数据获取及质量问题
第3章 通过采样获取空间数据
3.1 空间数据源
3.2 空间采样
3.2.1 空间采样的目的和方法
3.2.2 基于模型和设计的空间采样方法
3.2.3 采样方案
3.2.4 选择采样方法的问题
3.3 模拟制图
第4章 数据质量:对空间数据分析的影响
4.1 数据和空间数据分析中的误差
4.1.1 测量误差模型
4.1.2 粗差
4.1.3 误差传播
4.2 数据分辨率与空间数据分析
4.2.1 变量的精度和显著性检验
4.2.2 支持改变问题
4.2.3 使用聚合数据分析关系
4.3 数据一致性和空间数据分析
4.4 数据完整性与空间数据分析
4.4.1 缺失数据问题
4.4.2 空间插值和空间预测
4.4.3 边界、权重矩阵和数据完整性
4.5 小结
第三部分 探索性空间数据分析
第5章 探索性空间数据分析:概念模型
5.1 探索性数据分析和探索性空间数据分析
5.2 空间变化的概念模型
第6章 探索性空间数据分析:可视化方法
6.1 数据可视化和探索性数据分析
6.1.1 数据可视化:方法和任务
6.1.2 数据可视化:通过计算机的发展
6.1.3 数据可视化:选择的技术
6.2 空间数据可视化
6.2.1 聚合数据的数据准备问题:变量值
6.2.2 聚合数据的数据准备问题:空间框架
6.2.3 空间可视化的特殊问题
6.3 数据可视化和探索性空间数据分析
6.3.1 空间数据可视化:为单变量数据选择的技术
6.3.2 空间数据可视化:为双变量或多变量选择的技术
6.3.3 谢菲尔德地区乳腺癌筛查数据的摄取
6.4 小结
第7章 探索性空间数据分析:数值方法
7.1 平滑方法
7.1.1 图形绘图的约束平滑
7.1.2 空间相关性的约束描述
7.1.3 地图平滑
7.2 全局地图特性的探索性识别:整体聚类
7.2.1 区域数据的聚类
7.2.2 标记点模式的聚类
7.3 局部地图特性的探索性识别
7.3.1 聚类探测
7.3.2 焦点检验
7.4 地图比较
第四部分 假设检验和空间自相关
第8章 存在空间相关性的假设检验
8.1 空间自相关和空间数据集均值检验
8.2 空间自相关和二元关联检验
8.2.1 皮尔森积矩相关系数
8.2.2 列联表的卡方检验
第五部分 空间数据建模
第9章 空间数据统计分析模型
9.1 描述性模型
9.1.1 大尺度空间变化模型
9.1.2 小尺度空间变化模型
9.1.3 空间变化的多尺度数据模型
9.1.4 层次贝叶斯模型
9.2 解释性模型
9.2.1 连续取值响应变量模型:正态回归模型
9.2.2 离散取值区域数据模型:广义线性模型
9.2.3 层次模型
第10章 空间变化统计建模:描述性建模
10.1 表达空间变化的模型
10.1.1 连续取值变量模型
10.1.2 离散取值变量模型
10.2 空间变化建模中若干一般性问题
10.3 层次贝叶斯模型
第11章 空间变化统计模型:解释性建模
11.1 空间数据建模的方法
11.1.1 经典方法
11.1.2 计量经济学方法
11.1.3 数据驱动方法
11.2 空间数据线性建模的一些应用
11.2.1 地区收入收敛检验
11.2.2 二元响应模型
11.2.3 多级模型建模
11.2.4 谢菲尔德入室盗窃的贝叶斯建模
11.2.5 被开除学生的贝叶斯建模
11.3 小结
附录Ⅰ 软件
附录Ⅱ 剑桥郡肺癌数据
附录Ⅲ 谢菲尔德盗窃数据
附录Ⅳ 谢菲尔德被开除的学生数据
参考文献
精彩书摘
资源的战略和战术部署之间的差别对方法论具有重要性。战术部署通常集中在非常窄的和特定的一组目标方面。也许包括处理在一个城市的某个区域突发的街头抢劫,或在健康部门的一个特定的区域的突发的疾病传播,或非正常发生事故的区域识别。战术响应形成的基本数据集通常是短时间周期的。或许需要快速地采集数据并伴随相关的数据处理,或许是“热点”分析,以支持正在发生并在竞争需求之间优先的一些非正常发生的事件(Craglia等,2000)。
在疾病背景中,“由发现针对疾病的报告明显超过一个地方发起的聚类调查,经常被公众关注所需求,但很难以解释……在产生没有批准的公众关注和尽早识别真实的健康危险之间需要选择一个平衡”(Wilkinson,1998,第185页)。在健康的背景中,争议也许在一个聚类是否是统计显著的以及它是否真的表明了某种实质的显著性,需要进行特殊调查或干预,特别是当多数事例很小,没有原因能被确定的时候。在这种情况下,可能并不清楚应当采取什么行动。Wilkinson采取了这样的观点,利用地理“监视”技术,基于GIS系统来计算疾病率和应用统计检验来寻找聚类,但“对它们输出结果的解释……需要专家判断,还得相当谨慎”(第186页)。
资源的战略部署基于长期的数据序列和已经被认可的分析结果,若不是,那么至少在诸如与社会经济和环境属性、犯罪、疾病或不健康之间具有强烈关联。健康和警务情形的战略部署可能与任务的(重新)定位有关,这个任务是一个与优先事项有关系的,当前的表现水平被认为是与欠佳的事项相关的任务。从这一点来看,或许后续的实现决策会导致战略资源目标定位的新的地理格局,这或许需要区分是由于成分影响的空间变化元素,还是由于区域层面的背景影响的元素。Achson(1998)的《不平等健康调查》中的评论是,“在英国不平等健康的证据……作为对政府的健康战略发展的贡献,确实可能减少这些不平等的政策发展的区域”(第xi页)。其建议之一是“数据审查需要用于监测在健康方面的不平等性和他们在国家和地方水平上的决策”(第120页)。新近完善的ESRC健康变化项目重点是理解在英国健康变化的不同方面,包括地理变化和地点的重要性(ESRC,2001)。
前言/序言
《空间数据分析:理论与实践》(Spatial Data Analysis:Theory and Practice)对空间数据分析领域进行了广泛的论述。该书综述了空间数据分析和位置(地点、背景和空间)在科学以及决策相关研究方面的重要性。涵盖了人们所关注的最新的探索性空间数据分析和空间建模方法,以及如何表达在地理空间中的属性的基本问题。引领读者进入支撑空间数据分析的关键领域,为读者了解和领会这个领域的诸多关键问题提供了一个平台。此书部分内容适合大学本科生和硕士研究生,还包含了让从事空间分析领域研究的地理、社会、经济、环境和统计等学科的科学工作者感兴趣的、具有足够挑战性的内容。
罗伯特·海宁(Robert Haining)是剑桥大学人文地理学教授。他在空间数据分析领域著述广泛,尤其是在经济地理学、医学地理学和犯罪地理学领域的应用方面。他之前的著作《社会和环境科学中的空间数据分析》(Spatial Data Analysis in the Social and Environmental Science)(剑桥大学出版社,1993)得到了好评,并广为引用。
《地理计算导论:数字地球的基石》 第一章:引言——认识我们生活的空间 我们生活在一个三维、动态且信息爆炸的时代。从日常的出行导航,到全球气候变化监测,再到城市规划和资源管理,空间信息无处不在,深刻地影响着我们的生活和决策。然而,海量的地理信息如同一片未被驯服的汪洋,如何有效地理解、分析和利用这些信息,成为了一个至关重要的课题。 《地理计算导论:数字地球的基石》应运而生,旨在为读者构建一个坚实的地理计算理论框架,并引领大家踏上探索数字地球奥秘的实践之旅。本书并非孤立地讲解某一个技术或工具,而是从宏观视角出发,深入剖析地理计算的核心概念、基本原理以及其在各个领域的广泛应用。我们相信,只有理解了“为何”和“是什么”,我们才能更好地掌握“如何做”。 本书的独特之处在于,它将地理计算置于“数字地球”的宏大愿景之下。数字地球并非仅仅是地图的集合,而是对地球系统进行全面、精细、动态模拟和分析的集成系统。地理计算正是实现这一愿景的关键驱动力,它提供了处理、分析和可视化海量空间数据的理论基础和技术手段。通过本书的学习,您将不再仅仅是一个地理信息的被动使用者,而将成为数字地球的积极构建者和探索者。 第二章:地理数据的本质——理解空间信息的语言 地理计算的首要任务是处理和理解地理数据。那么,什么是地理数据?简单来说,地理数据就是描述地球表面及其上事物的空间位置和属性的信息。这些信息包罗万象,既可以是静态的,如一座山的高度、一条河流的走向、一个城市的边界;也可以是动态的,如风的流向、人口的迁移、交通的拥堵。 本书将深入探讨地理数据的多种表达形式。我们会首先介绍地理数据最基础的组成单元——坐标系统。从我们熟悉的经纬度,到更精确的国家大地坐标系,再到全球通用的WGS84,理解不同的坐标系统及其转换原理,是进行准确空间分析的前提。接着,我们将区分两种最主要的地理数据模型:矢量模型和栅格模型。 矢量模型将地理要素表示为点、线、面等几何图形,并与属性信息关联。例如,一个城市可以用一个多边形表示,其属性可以包含城市名称、人口数量、经济指标等。矢量数据在表示离散的、边界清晰的地理对象方面具有优势,非常适合用于地图绘制、网络分析等。我们将详细介绍矢量数据的存储结构,如Shapefile、GeoJSON等,以及它们在实际应用中的特点。 栅格模型则将地理空间划分为规则的网格单元(像素),每个单元记录着该位置的属性值。例如,一张高程地图就可以用栅格模型表示,每个像素的值代表该地点的海拔高度。栅格数据在表示连续变化的地理现象,如温度、降水、地表覆盖等,以及进行空间叠加、缓冲区分析等方面具有独特优势。本书将深入探讨栅格数据的存储格式(如GeoTIFF、NetCDF等)及其处理方法。 除了这两种核心模型,我们还将介绍地理数据的其他重要组成部分,如地理标识符(GEOID),它将地理空间位置与社会经济统计区域进行关联,是进行区域分析和统计的重要工具。此外,对时空数据的理解也将是本书的重要组成部分。随着传感器技术的发展,越来越多的地理数据包含时间维度,如何处理和分析这些随时间变化的地理现象,将是下一代地理信息科学面临的挑战。 第三章:地理空间分析——揭示隐藏在数据中的模式与关系 掌握了地理数据的语言,我们便可以开始进行更深层次的探索——地理空间分析。地理空间分析是地理计算的核心,它利用一系列技术和方法,从空间数据中提取有价值的信息、发现潜在的模式、揭示事物之间的空间关系,并为决策提供科学依据。 本书将系统地介绍地理空间分析的常用方法。我们将从最基础的空间查询开始,学习如何根据位置或属性条件来提取感兴趣的地理要素。例如,查找某个区域内所有的学校,或者查询与某条河流距离不超过500米的所有村庄。 接着,我们将进入更复杂的分析技术。空间统计是揭示地理现象空间分布规律的重要手段。我们会介绍点模式分析,例如判断学校的分布是聚集、分散还是随机。区域统计则关注地理属性在不同区域内的差异和空间自相关性,例如分析不同区域的房价是否存在空间集聚现象。回归分析将把地理数据与其他因素结合起来,探究它们之间的空间关系,例如分析影响城市空气质量的空间因素。 空间叠加分析是栅格数据分析的强大工具,它通过将不同图层的栅格数据进行运算,生成新的图层,从而实现多图层信息的综合分析。例如,将土地利用图层、地形图层和交通图层进行叠加,可以分析哪些区域更适合发展旅游业。 缓冲区分析则用于分析某一对象周围特定范围内的空间信息。例如,为医院建立一个1公里半径的缓冲区,可以分析该区域内的居民数量、人口密度等,为医疗资源配置提供参考。 网络分析是针对线性地理要素(如道路、河流)进行的分析,它利用图论的原理,解决路径查找、服务区分析、最优路线规划等问题。例如,规划从A点到B点的最短驾车路线,或者分析某个消防站的服务范围。 此外,我们还将探讨地形分析,如坡度、坡向、汇水区分析等,它们在水文、地质、环境监测等领域具有广泛应用。遥感影像分析作为一种重要的空间数据获取和分析手段,也将得到重点介绍,包括影像的预处理、分类、变化检测等。 第四章:可视化与交互——让数字地球“说话” 再强大的分析也需要清晰地呈现,才能被人们理解和利用。地理可视化是将分析结果以直观、易懂的方式展示出来的过程,它让复杂的空间信息“说话”。而交互性则允许用户深入探索数据,进行个性化的分析和发现。 本书将重点介绍现代地理可视化技术。我们会探讨地图制作的基本原则,如何选择合适的地图投影、符号系统和配色方案,以清晰有效地传达空间信息。从传统的专题地图,到日益普及的网络地图服务(WMS/WMS-T),再到地理信息系统(GIS)软件中的地图绘制功能,都将得到深入浅出的讲解。 地理信息系统(GIS)是实现地理可视化和空间分析的核心平台。本书将介绍GIS的基本概念、功能模块以及其在各个领域的应用。您将了解如何使用GIS软件进行数据管理、空间分析和地图制作。 近年来,三维地理可视化和虚拟地理环境(VGE)技术发展迅速,它们能够更真实地模拟地球表面的三维景象,为城市规划、灾害模拟、虚拟旅游等提供了前所未有的体验。本书将介绍这些新兴技术的发展趋势和应用前景。 交互式地图和数据驱动的地理叙事将是可视化领域的重要方向。通过鼠标点击、缩放、漫游等交互操作,用户可以自由探索地图上的信息。而将分析结果与故事、文本、多媒体相结合,则能更生动地讲述地理现象背后的故事,增强信息的传播力和影响力。 第五章:地理计算的实践——从理论到应用 理论的魅力在于指导实践,而实践的价值则在于验证和发展理论。本书的最后一部分将聚焦于地理计算的实际应用,帮助读者将所学知识转化为解决实际问题的能力。 我们将选取多个典型的应用案例,涵盖智慧城市、环境保护、自然资源管理、农业信息化、公共卫生、灾害预警等领域。在每个案例中,我们将深入剖析如何运用地理计算的理论和技术,解决具体的空间问题。 例如,在智慧城市的章节,我们将探讨如何利用GIS和空间分析技术,优化交通流量、规划公共设施、提升城市应急响应能力。在环境保护领域,我们将学习如何利用遥感和GIS技术,监测森林火灾、评估污染扩散、制定生态修复方案。在自然资源管理中,我们将介绍如何利用地理空间技术,进行矿产资源勘探、土地利用规划、水资源分配。 本书还将探讨开源GIS软件的应用,如QGIS、GRASS GIS等。这些免费且功能强大的工具,为地理计算的学习和实践提供了便利。我们将提供一些基础的实践指导,帮助读者快速上手。 此外,我们还将展望地理计算的未来发展方向,包括大数据在地理计算中的应用、人工智能(AI)与GIS的融合、物联网(IoT)与空间信息的结合,以及云计算在地理空间数据处理和分析中的作用。 结语 《地理计算导论:数字地球的基石》并非一本枯燥的技术手册,而是一扇通往数字地球大门。我们希望通过本书,激发读者对空间科学的兴趣,培养其分析和解决空间问题的能力。无论您是学生、研究人员,还是行业从业者,本书都将为您提供一个坚实的起点,助您在数字地球的浪潮中,乘风破浪,有所作为。让我们一起,用地理计算的视角,重新认识我们赖以生存的这个星球。