内容简介
《面向未来的交通出版工程·政策与规划系列 基于手机定位数据的个体出行行为特征分析技术研究:方法与实证》着重聚焦于个体出行数据高质量的精细化提取技术与方法研究,利用个体智能手机传感器数据(智能手机内置多种传感器,研发手机APP应用软件可导出所记录数据,包括手机GPS位置点位坐标、速度、加速度、卫星数量与精度、Wi-Fi接入数据等),在此基础上同时探索融合3G/4G-LTE新一代移动通信网络信令事件数据(切换、位置区更新、视频、短信、微信QQ等上网),这些新型手机数据能够反映手机用户的时空位置变化和运动状态变化特征,综合运用小波分析、随机森林、聚类分析等模式识别的数据挖掘算法,力争实现精细化追踪提取个体出行活动特征,包括出行OD、出行方式、换乘点时刻和位置、各出行方式段的出行时间、各驻留地停留时间等一系列详细的个体出行活动“体检报告”,为交通理论模型优化重构、城市和交通发展规划与管理决策提供坚实基础。
内页插图
目录
总序
前言
1 研究概述
1.1 背景与意义
1.1.1 个体交通出行活动分析技术缺陷
1.1.2 手机传感器调查技术优势
1.1.3 数据瓶颈制约交通需求分析与交通模型发展
1.1.4 “大数据”时代交通调查技术发展新机遇
1.2 研究目标
1.2.1 学术理论目标
1.2.2 技术应用目标
1.3 应用前景
1.4 主要内容
1.4.1 个体出行手机传感器数据来源采集和解析
1.4.2 基于手机传感器数据的个体交通出行特征精细化提取
1.4.3 融合交通一通信集成仿真的个体出行活动仿真平台构建
1.4.4 个体出行精细化数据在交通规划管理中的应用探究
1.5 关键问题
1.6 技术路线
1.7 研究特色与创新
2 基于手机定位的个体出行特征分析技术综述
2.1 手机数据分析技术类型与特征
2.1.1 手机传感器数据分析技术及特征
2.1.2 手机信令数据分析技术
2.1.3 手机社交网络数据分析技术
2.2 基于手机位置数据的交通分析技术发展总结
2.3 基于手机信令数据的个体活动规律分析
2.3.1 居民活动规律动态监测
2.3.2 区域及断面客流分析
2.4 基于GPS定位数据的个体出行行为特征分析
2.4.1 出行链信息精细化提取
2.4.2 基于GPS轨迹数据的居民出行调查实地应用
2.5 基于手机Wi-Fi数据的活动强度分析
2.6 基于社交网络数据的居民出行特征分析
2.6.1 居民出行特征
2.6.2 OD估计
2.6.3 职住空间特征
2.7 研究总结与发展趋势
参考文献
3 基于手机传感器数据的挖掘算法理论与应用方法
3.1 个体出行链信息精细化提取技术思路
3.2 基于空间聚类算法的出行端点识别
3.3 基于小波变换模极大值算法的交通方式换乘点识别
3.4 基于机器学习算法的个体出行方式识别
3.4.1 基于神经网络算法的个体出行方式识别
3.4.2 基于支持向量机算法的个体出行方式识别
3.4.3 基于贝叶斯网络算法的个体出行方式识别
3.4.4 基于随机森林算法的个体出行方式识别
3.5 基于GIS地图匹配的个体出行链信息提取结果优化
3.6 本章小结
参考文献
4 手机传感器数据采集APP开发与数据解析
4.1 数据采集APP开发
4.1.1 APP详细功能
4.1.2 APP操作界面
4.2 网络数据库管理系统构建
4.3 数据安全措施
4.4 手机传感器数据内容与基础特征分析
4.4.1 GPS模块定位精度与质量
4.4.2 个体出行时空停留特征与OD特征分析
4.4.3 个体出行移动轨迹点密度特征分析
4.4.4 个体出行瞬时速度数据特征分析
4.4.5 个体出行瞬时加速度数据特征分析
4.5 本章小结
5 “行人—交通流—通信”集成仿真平台构建
5.1 仿真平台建设框架与思路
5.2 交通环境与个体交通出行仿真
5.2.1 交通仿真
5.2.2 交通仿真模块构建实例——以成都市为例
5.3 无线通信场景与通信仿真
5.3.1 无线通信事件说明及仿真
5.3.2 移动通信信号传播理论模型
5.3.3 移动通信环境及仿真实例——以成都市为例
5.4 手机传感器数据仿真
5.4.1 手机传感器数据扰动加载方法
5.4.2 数据加扰实例与效果评估
5.5 本章小结
参考文献
6 基于手机传感器数据的精细化出行参数提取实证研究
6.1 手机传感器数据采集实地试验
6.1.1 不同出行目的的出行方案设计
6.1.2 多方式组合出行方案设计
6.1.3 不同交通状态的数据采集方案设计
6.1.4 出行日志采集工作
6.2 基于空间聚类算法的出行端点识别实证分析
6.2.1 算法参数配置
6.2.2 个体出行端点识别与出行轨迹切割
6.2.3 个体出行端点识别结果与误差分析
6.3 基于小波变换模极大值算法的交通方式换乘点识别实证分析
6.3.1 算法参数配置
6.3.2 多交通方式组合出行换乘点识别实例
6.3.3 交通方式换乘点识别结果与误差分析
6.4 基于神经网络算法的交通方式识别实证分析
6.4.1 算法参数配置
6.4.2 交通方式识别实例
6.4.3 交通方式识别结果与误差分析
6.5 基于GIS地图匹配的出行链信息识别结果优化实证分析
6.5.1 基于GIS地图匹配算法参数配置
6.5.2 公交车与小汽车的出行方式区分识别实证
6.5.3 结果分析
6.6 本章小结
7 不同影响因素及敏感性分析
7.1 关键参数及其对技术精度的影响机理
7.2 不同条件实地试验机数据特征分析
7.2.1 数据采集
7.2.2 数据特征分析
7.3 交通方式识别效果敏感性分析
7.3.1 算法的选择与影响
7.3.2 数据采样频率设置与影响
7.3.3 交通状态与影响
7.4 交通方式换乘时间点识别效果敏感性分析
7.4.1 算法的选择与影响
7.4.2 数据采样频率设置与影响
7.4.3 交通状态与影响
7.5 基于仿真数据的出行链信息识别效果敏感性分析
7.5.1 基于仿真数据的交通方式识别效果敏感性分析
7.5.2 基于仿真数据的换乘时间点识别效果敏感性分析
7.6 本章小结
8 精细化数据提取对交通规划与管理的改善应用思考
8.1 精细化数据提升传统四阶段模型精度
8.2 精细化数据优化公交站点与线网布局
8.3 构建基于精细化个体活动的交通模型
8.4 精细化个体出行数据的其他应用
9 研究展望
9.1 完善基于手机传感器数据的个体出行链采集体系
9.2 大数据环境下多元异构数据融合提升技术应用效果
9.3 探索基于精细化交通调查大数据的交通规划理论与方法
附录A
前言/序言
席卷全球的大数据时代到来,通过海量数据的挖掘与分析将提供更有价值的信息辅助决策,成了国内外各行各业的研究热点前沿,其中,交通大数据环境构建与挖掘应用是大数据潮流发展的重要内容之一。以手机定位数据为主导的位置数据必然是交通大数据的重要核心基础,庞大的手机用户群体、广泛的通信覆盖网络、通信事件活动产生海量的位置数据是一项十分宝贵的资源,深入挖掘有望推断和揭示出交通活动的本源机理、深层次特征,进而为解析我国交通与城市发展演化的关系、特征与规律提供重要基础,意义深远。
交通出行需求识别包含人、车两大方面的基础数据,本源是人的出行。过去十多年,国内外对机动车的交通需求数据采集积累具备了很好的技术手段,例如GPS浮动车、环形线圈、视频检测、雷达探测、RFID等技术,并在许多城市还构建了道路交通车辆的信息采集与发布系统,但对反映交通出行本源特征的个体“人”的出行活动追踪分析一直缺少十分有效的技术手段。交通流参数仅仅是交通需求在道路网上呈现的结果,而个体行为特征、演化模式和变化规律才是与交通需求本源直接相关的决定因素之一。传统的居民出行问卷调查数据存在的缺陷已经让交通工程同行抱怨不已,其中的问题包括主观回忆的数据错误、组织实施难度较大、成本较高等。目前,尽管国内外开展了一些新技术的研究和实证应用,但还存在较多不足,尤其是还未研究出较为成熟可以应用的个体出行活动数据精细化、客观准确的提取分析技术。随着3G/4G-LTE新一代移动互联网技术的迅猛发展,智能手机用户日益庞大,为追踪分析个体出行活动特征提供了载体和机遇,这可能给传统的交通行业发展模式带来巨大的冲击影响。
对于个人出行活动分析,手机位置大数据的应用目前主要在基于手机信令数据方面开展了较多应用实践,通过追踪挖掘手机用户在发生通信事件(通话、短信、上网等)与基站小区的信息交互“暴露”其所在的基站覆盖范围模糊位置轨迹,推演该手机个体在城市中的活动特征,再进行计集统计结果。相关应用包括职住平衡、来外与流动人口活动分布特征、交通大区OD、典型断面道路交通流等中宏观层面分析,大多用于城市规划、交通战略方面的管理决策支持。但是,由于基于手机信令数据的分析结果缺乏统计意义上的可靠性,存在较多数据结果精度方面的质疑和担忧;同时,其位置数据精度较粗,无法提供精细的出行链特征,不能支撑交通建模对交通数据的定量需求。
本书着重聚焦于个体出行数据高质量的精细化提取技术与方法研究,利用个体智能手机传感器数据(智能手机内置多种传感器,研发手机APP应用软件可导出所记录数据,包括手机GPS位置点位坐标、速度、加速度、卫星数量与精度、Wi-Fi接入数据等),在此基础上同时探索融合3G/4G-LTE新一代移动通信网络信令事件数据(切换、位置区更新、视频、短信、微信QQ等上网),这些新型手机数据能够反映手机用户的时空位置变化和运动状态变化特征,综合运用小波分析、随机森林、聚类分析等模式识别的数据挖掘算法,力争实现精细化追踪提取个体出行活动特征,包括出行OD、出行方式、换乘点时刻和位置、各出行方式段的出行时间、各驻留地停留时间等一系列详细的个体出行活动“体检报告”,为交通理论模型优化重构、城市和交通发展规划与管理决策提供坚实基础。
另一方面,尽管大数据研究很热,但我们更需要沉下来深入思考数据的具体用途和作用,泡沫和浮躁终究一事无成,所以,不能仅仅停留在大数据资源可能带来的美好“肥皂泡”的欣喜,而更需要针对性深入挖掘以投入应用产生实际价值。鉴于此,本书也对个体出行活动精细化数据的应用研究进行了思考和展望,如何支撑理论模型方面开展精细标定与优化,包括对传统四阶段交通模型的校核标定提升精度;公交OD反推模型评估优化,以及对基于活动的新一代交通需求分析模型实证标定等。目前,由于传统交通出行调查无法提供活动模型标定所需要的详细出行链数据,在国际上还未能广泛通过实证标定活动模型进行交通需求分析。
《面向未来的交通出版工程·政策与规划系列》—— 《基于手机定位数据的个体出行行为特征分析技术研究:方法与实证》 一、 引言:理解出行,洞察未来 在我们日益互联互通的世界中,个体的出行行为构成了城市运转的脉络,也是理解社会经济发展、资源配置乃至环境保护的关键。从短途通勤到长途旅行,每一次位移都承载着信息,蕴含着规律,反映着我们的生活方式、消费习惯和决策模式。然而,传统的出行行为数据采集方式,如问卷调查、传感器布设等,往往存在成本高昂、时效性差、覆盖面有限等弊端,难以全面、精细地捕捉个体出行行为的动态变化和深层特征。 在这样的背景下,随着移动通信技术的飞速发展和智能手机的普及,海量的手机定位数据应运而生。这些数据以其前所未有的时空粒度、海量的信息量和低成本的获取方式,为我们研究个体出行行为提供了革命性的机遇。本研究聚焦于如何充分挖掘和利用手机定位数据,深入分析个体出行行为的特征,并在此基础上探索其在交通规划、政策制定和城市管理等领域的应用潜力。本书旨在为交通领域的研究者、规划师、政策制定者以及相关技术开发者提供一套系统性的方法论和实践指导,共同推动交通系统的智能化、可持续化和人性化发展,迎接面向未来的交通挑战。 二、 研究背景与意义:数据驱动的交通变革 长期以来,交通规划和政策的制定很大程度上依赖于宏观统计数据和有限的抽样调查。这种模式难以捕捉个体层面行为的异质性、时空动态性和相互关联性。例如,传统的交通模型在预测交通需求、评估政策效果时,往往面临“黑箱”问题,对个体出行决策机制的理解深度不足。 手机定位数据,包括GPS、Wi-Fi定位、基站定位等,能够实时、连续地记录个体的移动轨迹。这些轨迹数据包含了出行起点、终点、路径、时长、频率、目的等丰富信息,极大地拓展了我们认识出行行为的维度。通过对这些数据的科学分析,我们可以: 精细刻画个体出行模式: 识别出不同的出行模式(如通勤、购物、休闲、访友等),分析出行链的构成,理解个体出行的一致性与变化性。 洞察出行行为的驱动因素: 探索年龄、性别、职业、收入、居住地、就业地、交通设施可达性等因素对出行行为的影响。 量化交通政策的影响: 评估不同交通政策(如限行、拥堵收费、公共交通优化等)对个体出行选择的实际效果。 预测未来交通需求: 基于对个体行为规律的理解,构建更精准的交通需求预测模型。 优化城市空间布局: 理解城市居民的活动空间和出行需求,为城市规划、公共服务设施布局提供依据。 促进智慧交通发展: 为智能交通诱导、个性化出行服务、交通拥堵治理提供数据支撑。 因此,研究基于手机定位数据的个体出行行为特征分析技术,不仅是交通领域研究的前沿方向,更是推动交通系统向更加高效、智能、可持续方向发展的关键驱动力。本书的出版,正是为了系统性地梳理和总结这一领域的最新研究成果和技术方法,为相关从业者提供宝贵的参考。 三、 研究内容概览:方法与实证的深度融合 本书以“方法”与“实证”为双核,力求理论创新与实践应用相结合,为读者呈现一个全面、深入的研究图景。 (一) 方法论:构建分析的技术框架 在方法论层面,本书将系统性地探讨如何处理和分析庞大而复杂的手机定位数据,以提取个体出行行为的有效信息。这包括: 1. 数据预处理与质量控制: 原始数据采集与格式: 介绍不同来源的手机定位数据(GPS、Wi-Fi、基站)的特点、数据格式以及采集时的注意事项。 噪声过滤与异常值检测: 针对定位误差、数据缺失、无效轨迹等问题,介绍有效的过滤算法和去噪技术,确保数据的准确性。 轨迹数据清洗: 如何识别和去除短时停留、原地徘徊等非出行行为,以及如何处理数据中断后的轨迹重构。 数据融合与标准化: 当整合来自不同来源和不同时间段的数据时,如何进行统一和标准化处理。 2. 个体出行行为特征提取: 出行点与停留区域识别: 如何根据停留时间和空间连续性,准确地识别个体的出发地、目的地以及重要的活动区域(如家、工作单位、购物中心等)。 出行链构建: 如何将一系列连续的移动片段连接起来,形成完整的出行链,识别出行链的起止点、中转点和活动类型。 出行模式分类: 基于出行链的特征(如时间、频率、距离、目的地的类型),应用聚类、分类等机器学习算法,识别并定义不同的出行模式(如单次出行、往返出行、多点出行等)。 行为模式量化: 针对个体出行行为,量化关键指标,如出行频率、日均出行距离、通勤时间、活动半径、出行目的分布、出行时段偏好等。 时空行为分析: 分析个体在不同时段(一天、一周、一年)和不同空间尺度上的活动规律,揭示其行为的时空动态性。 3. 模型构建与算法选择: 统计建模方法: 引入回归分析、概率模型等统计学方法,探究影响出行行为的因素。 机器学习算法应用: 聚类算法: 如K-means, DBSCAN,用于识别相似的出行行为模式和活动区域。 分类算法: 如决策树、支持向量机、随机森林,用于预测出行目的、识别出行模式。 序列模型: 如隐马尔可夫模型(HMM)、循环神经网络(RNN)及其变体(LSTM, GRU),用于分析和预测连续的出行轨迹和行为序列。 图神经网络(GNN): 用于分析个体出行网络结构以及个体之间的相互影响。 深度学习前沿技术: 探索卷积神经网络(CNN)在轨迹特征提取中的应用,以及注意力机制在理解出行序列中的作用。 时空数据挖掘技术: 结合时空地理信息系统(GIS)和数据挖掘技术,进行更深层次的行为模式挖掘。 (二) 实证研究:理论在实践中的检验与应用 本书的另一核心在于通过大量的实际案例,验证所提出的方法论的有效性,并展示其在不同场景下的应用价值。 1. 典型城市案例分析: 数据来源与案例选取: 详细介绍研究中使用的手机定位数据来源(如运营商数据、第三方APP数据等),以及选择分析的典型城市案例,解释选择理由。 案例一:城市通勤行为特征分析: 利用手机定位数据,识别城市居民的居住地和工作地点,分析通勤模式、通勤距离、通勤时间、通勤方式选择(如私家车、公共交通、步行/骑行)及其时空分布特征。 结合人口密度、交通基础设施、土地利用等数据,探究影响通勤行为的关键因素,并为城市交通拥堵治理和公共交通规划提供建议。 案例二:城市居民消费出行行为研究: 识别居民在商业区、娱乐场所、餐饮场所等地的停留行为,分析消费性出行的频率、时段、地点选择等特征。 结合人口社会经济属性,研究不同人群的消费出行模式差异,为商业布局、营销策略制定提供参考。 案例三:突发事件影响下的出行行为变化: 通过分析特定时期(如节假日、大型活动、疫情封锁等)的出行数据,研究个体出行行为的适应性与变化规律。 评估交通管制、出行限制等政策对个体出行选择的实时影响,为应急管理和政策调整提供数据支持。 案例四:共享出行模式行为分析: 利用共享单车、网约车等出行平台产生的定位数据,分析用户的骑行/乘车习惯、热点区域、供需匹配情况等,为平台优化运营和服务提供洞察。 2. 技术应用与政策启示: 交通需求预测模型的改进: 如何将个体出行行为分析的结果,融入传统的交通需求预测模型,提高模型的精度和可解释性。 交通拥堵治理策略优化: 基于对拥堵成因的个体行为层面分析,提出更具针对性和实效性的拥堵缓解措施,如交通信号优化、动态定价、出行引导等。 公共交通服务优化: 分析乘客的出行OD、出行频率、出行时段,优化公交线路、站点设置、发车频率,提升公共交通的吸引力和服务水平。 智慧城市与城市规划: 如何将个体出行行为数据应用于城市交通系统规划、土地利用规划、公共设施布局、绿色出行推广等领域,构建更宜居、高效的城市。 隐私保护与伦理考量: 在大规模数据应用的同时,重点探讨手机定位数据的使用所涉及的隐私保护问题,以及相关的伦理规范和技术解决方案。 四、 总结与展望:面向未来的交通智能 本书系统地阐述了基于手机定位数据的个体出行行为特征分析技术,涵盖了从数据预处理、特征提取到模型构建及实证应用的完整链条。通过深入的方法论探讨和多维度的实证案例分析,本书不仅展现了手机定位数据在揭示个体出行行为奥秘方面的巨大潜力,也为交通领域的研究者和实践者提供了宝贵的工具和启示。 展望未来,随着技术的发展和数据的丰富,基于手机定位数据的个体出行行为研究将更加深入和广泛。例如,可以将个体出行行为与社交网络、消费行为、健康数据等进行多源异构数据融合,从而构建更全面、更立体的个体画像,实现更精细化的城市管理和个性化服务。同时,对出行行为的预测能力将进一步提升,为交通系统的智能化、自主化和动态化管理奠定基础。 然而,在享受数据红利的同时,我们也必须高度关注数据安全和个人隐私的保护。未来研究应持续探索更加安全、合乎伦理的数据处理和应用模式。 本书的出版,期望能激发更多对这一领域的兴趣和研究,为建设更智能、更绿色、更可持续的未来交通体系贡献力量。