轨迹数据分类

轨迹数据分类 轨迹数据是对移动对象的运动过程采样得到的数据,通常包含采样位置、时间、运动速度等属性信息。将采样点按照一定时间尺度排序便形成了移动对象的轨迹[1]。根据采样方式和驱动因素的不同,将轨迹数据分为以下3类:①基于时间采样的轨迹数据,即按等时间间隔对移动对象进行采样形成的轨迹;②基于位置采样的轨迹数据,即移动对象位置发生变化即被记录而形成的轨迹;③基于事件触发的轨迹数据,即移动对象触发传感器事件后而被记录下来形成的轨迹[2]。

基于时间采样的轨迹数据

基于时间采样的轨迹数据基于时间采样的轨迹是等时间间隔记录移动对象的信息,或扫描全局通过反演移动对象位置而获得的数据,前者如车载GPS 数据、动物迁徙数据,后者如飓风数据、涡旋数据等。

基于时间采样的轨迹可用以下模型表达,即以等长的时间间隔记录移动个体的位置[3]。

Tr 代表一条时空轨迹,St 代表起始时间,∆T 代表时间记录间隔,序列中(X n ,Y n ,St +(n-1)*∆T )代表在St +(n-1)*∆T 时刻,轨迹对象在二维时空的位置为(X n ,Y n )。 基于时间采样的轨迹数据具有数据量大、覆盖范围广的特点。但未考虑数据的代表性,会造成数据冗余、数据遗漏,如车载GPS 在车辆状态没有发生变化时仍然收集数据,传输过程中往往出现传感器信号丢失以致数据遗漏,且轨迹数据依赖局限于交通路网[2]。 绝大多数的轨迹研究都立足于此,他们从大量轨迹数据中提取出行模式和交通状况。他们或将访问地点按频率排序可以用来提取个体用户的出行模式[4],或从集体轨迹信息入手,推测城市活动的热点规律模式。Wu (2013)等认为在轨迹数据中寻找的热点的动态模式可以用来揭示历史事件和预测未来活动热点,这也许对交通和公共安全很有价值。将活动热点

按时序排列,整理成库。可以显示了城市热点在时空上是如何形成,消失等过程。还探索了地区工作日与休息日的模式区别,并建立数据库用来预测将来地区模式[5]。 基于位置采样的轨迹数据。

基于位置采样的轨迹是当采样对象位置发生变化时记录其位置、时间、属性信息而获得的数据,如居民出行调查、人口迁徙统计数据等。基于位置变化采样的轨迹可由移动对象位置变化的节点序列表示[3],模型表达如式(2),即以离散位置变化节点记录移动个体的轨迹信息。

其中X n ≠X n +1,Y n ≠Y n +1,且T 1≠T n ;Tr 代表时空轨迹,该序列中的(X n ,Y n ,T n )代表在时刻T n ,轨迹对象在二维空间的位置为(X n ,Y n )。

基于位置采样的轨迹数据以移动对象的位置变化为关注重点,具有属性信息丰富、轨迹位置变化详细等特点。但这类数据收集主要依靠人工操作,缺乏自动采集装置,导致数据整理过程耗时耗力、调查范围有限、更新周期长、空间位置需要二次匹配等一系列问题[2]。

这类轨迹数据最为典型的就是OD 流。OD(Origin—Destination) 流指轨迹中起点到终点 的流动性特征,其中0表示出行起点,D 表示出行终点。OD 流从统计的角度反映移动对象的活动和群体轨迹的动态特征。利用

OD 流可以发现上车点和下车点密度的空间分布,从而可以识别出城市某些特定位置(如火车站、飞机场等)[6]。当然也可以对人口迁移进行分析,对他们的主要来源地与主要迁移地进行统计分析与可视化显示,可以得到人口迁移的规律,发现暗含其中的社区结构[7]。Zhang 等(2012)对出租车数据进行OD 流聚类分析,找出聚类中心,添加起始点语义信息,发现OD 流的语义,如车站一车站、商场一车站等[8]。 基于事件触发采样的轨迹数据

基于事件触发采样的轨迹是移动对象触发传感器事件后,移动对象的位置、时间及其他属性信息被记录下来的数据,如手机通话,手机连接wifi 热点,公交卡、银行卡等智能卡刷卡,用户签到等事件。若移动对象未触发传感器事件,其移动轨迹则不能被记录。虽然移动对象的时空轨迹是连续的,但只有移动对象触发传感器事件发生时,位置、时间信息才有记录,因此此类时空轨迹可以由一组离散的时空记录点序列表示,如式(3)所示:

其中T 1≠T n ,(X n ,Y n )与(X n +1,Y n +1)有可能相等,Tr 代表时空轨迹,该序列中的(X n ,Y n ,T n )代表在时刻T n ,轨迹对象在二维空间的位置为(X n ,Y n )。 基于事件触发采样的轨迹数据具有数据量大、覆盖范围广、更新周期短、采样对象具有代表性等特点。但此类轨迹数据记录的位置不一定是移动对象的真实位置,导致轨迹数据的空间分辨率不高。如手机通话事件的位置是用基站服务范围(以基站为标识点的Voronoi 多边形) 近似表示,位置精度取决于基站的密集程度,且只有传感器事件被触发时才记录移动对象的相关信息,无法勾勒移动对象详尽的轨迹信息,只是人类行为活动中的快照[2]。

位置签到数据是利用待遇GPS 的智能终端记录某一时刻所处位置而产生的具有空间性,实践性和社会化的属性信息的数据,他记录生活轨迹,反映人的日常生活行为,是一种重要的众源地理数据。[9]

Hu 等(2014)在文章中提出了利用位置签到数据探索城市热点与商圈研究。为及时、 准确探测城市热点和客观高效分析商圈,提出一种基于社交网络众源位置签到数据的城市热点探测与商圈挖掘方法。位置签到数据是具有空间坐标和用户属性的离散 GIS 点对象, 首先对离散签到数据进行格网化处理, 将大数据量、离散签到位置点转化成具有空间连续性与邻接性并能够更好地反映签到事件集聚密度的格网数据。其次, 运用探索性空间数据分析( exploratory spati al data anal ysi s, ESDA) 度量签到数据的空间相关性, 量算其空间结构和全局分布模式, 以确定热点探测和商圈聚类的最佳模式。再次, 采用聚类分析识别出具有统计显著性的热点、冷点和空间异常值位置。最后, 通过度量聚类分析结果的地理空间分布, 得到具有统计显著性的聚类地理要素的空间特征::包括商圈范围、 中心变化趋势和方向发展趋势。

[1]Li, X., Han, J., Kim, S., & Gonzalez, H. (2007). Roam: rule- and motif-based anomaly detection in massive moving object data sets..Proceedings of Siam International Conference on Data Mining.

[2]李婷, 裴韬, 袁烨城, 宋辞, 王维一, & 杨格格. (2014). 人类活动轨迹的分类、模式和应用研究综述. 地理科学进展, 33, 7.

[3]Nanni M.2002.Clustering methods for spatio—temporal data.Pisa ,Italy :University of Pisa. [4]Alvares, L. O., Fernandes, J. A., Macedo, D., Bogorny, V., Moelans, B., & Kuijpers, B., et al. (2007). A model for enriching trajectories with semantic geographical information. in ‘ACM-GIS’, ACM.

[5] Lu, R. W. S. Y. (2014). Detection of dynamic activity patterns at a collective level from large-volume trajectory data. International Journal of Geographical Information Science, volume 28, 5, 946-963.

[6]Veloso M, Phiyhakkitinukoon S, Bento C. (2011). Urban mobility study using taxi traces .2011. Intemational workshop on trajectory data mining and analysis.Beijing ,China : September 18,2011.

[7] Guo, D. (2009). Flow mapping and multivariate visualization of large spatial interaction data. Visualization & Computer Graphics IEEE Transactions on, 15, 6, 1041-1048.

[8 Zhang, W, Li ,S, Pan ,G(2012) Mining the Semantics of Origin-Destination Flows Using Taxi Traces. In Proceedings of the 2012 ACM Conference on Ubiquitous Computing Pp. 943–949.

[9] 胡庆武, 王明, & 李清泉. (2014). 利用位置签到数据探索城市热点与商圈. 测绘学报, 3.

轨迹数据分类 轨迹数据是对移动对象的运动过程采样得到的数据,通常包含采样位置、时间、运动速度等属性信息。将采样点按照一定时间尺度排序便形成了移动对象的轨迹[1]。根据采样方式和驱动因素的不同,将轨迹数据分为以下3类:①基于时间采样的轨迹数据,即按等时间间隔对移动对象进行采样形成的轨迹;②基于位置采样的轨迹数据,即移动对象位置发生变化即被记录而形成的轨迹;③基于事件触发的轨迹数据,即移动对象触发传感器事件后而被记录下来形成的轨迹[2]。

基于时间采样的轨迹数据

基于时间采样的轨迹数据基于时间采样的轨迹是等时间间隔记录移动对象的信息,或扫描全局通过反演移动对象位置而获得的数据,前者如车载GPS 数据、动物迁徙数据,后者如飓风数据、涡旋数据等。

基于时间采样的轨迹可用以下模型表达,即以等长的时间间隔记录移动个体的位置[3]。

Tr 代表一条时空轨迹,St 代表起始时间,∆T 代表时间记录间隔,序列中(X n ,Y n ,St +(n-1)*∆T )代表在St +(n-1)*∆T 时刻,轨迹对象在二维时空的位置为(X n ,Y n )。 基于时间采样的轨迹数据具有数据量大、覆盖范围广的特点。但未考虑数据的代表性,会造成数据冗余、数据遗漏,如车载GPS 在车辆状态没有发生变化时仍然收集数据,传输过程中往往出现传感器信号丢失以致数据遗漏,且轨迹数据依赖局限于交通路网[2]。 绝大多数的轨迹研究都立足于此,他们从大量轨迹数据中提取出行模式和交通状况。他们或将访问地点按频率排序可以用来提取个体用户的出行模式[4],或从集体轨迹信息入手,推测城市活动的热点规律模式。Wu (2013)等认为在轨迹数据中寻找的热点的动态模式可以用来揭示历史事件和预测未来活动热点,这也许对交通和公共安全很有价值。将活动热点

按时序排列,整理成库。可以显示了城市热点在时空上是如何形成,消失等过程。还探索了地区工作日与休息日的模式区别,并建立数据库用来预测将来地区模式[5]。 基于位置采样的轨迹数据。

基于位置采样的轨迹是当采样对象位置发生变化时记录其位置、时间、属性信息而获得的数据,如居民出行调查、人口迁徙统计数据等。基于位置变化采样的轨迹可由移动对象位置变化的节点序列表示[3],模型表达如式(2),即以离散位置变化节点记录移动个体的轨迹信息。

其中X n ≠X n +1,Y n ≠Y n +1,且T 1≠T n ;Tr 代表时空轨迹,该序列中的(X n ,Y n ,T n )代表在时刻T n ,轨迹对象在二维空间的位置为(X n ,Y n )。

基于位置采样的轨迹数据以移动对象的位置变化为关注重点,具有属性信息丰富、轨迹位置变化详细等特点。但这类数据收集主要依靠人工操作,缺乏自动采集装置,导致数据整理过程耗时耗力、调查范围有限、更新周期长、空间位置需要二次匹配等一系列问题[2]。

这类轨迹数据最为典型的就是OD 流。OD(Origin—Destination) 流指轨迹中起点到终点 的流动性特征,其中0表示出行起点,D 表示出行终点。OD 流从统计的角度反映移动对象的活动和群体轨迹的动态特征。利用

OD 流可以发现上车点和下车点密度的空间分布,从而可以识别出城市某些特定位置(如火车站、飞机场等)[6]。当然也可以对人口迁移进行分析,对他们的主要来源地与主要迁移地进行统计分析与可视化显示,可以得到人口迁移的规律,发现暗含其中的社区结构[7]。Zhang 等(2012)对出租车数据进行OD 流聚类分析,找出聚类中心,添加起始点语义信息,发现OD 流的语义,如车站一车站、商场一车站等[8]。 基于事件触发采样的轨迹数据

基于事件触发采样的轨迹是移动对象触发传感器事件后,移动对象的位置、时间及其他属性信息被记录下来的数据,如手机通话,手机连接wifi 热点,公交卡、银行卡等智能卡刷卡,用户签到等事件。若移动对象未触发传感器事件,其移动轨迹则不能被记录。虽然移动对象的时空轨迹是连续的,但只有移动对象触发传感器事件发生时,位置、时间信息才有记录,因此此类时空轨迹可以由一组离散的时空记录点序列表示,如式(3)所示:

其中T 1≠T n ,(X n ,Y n )与(X n +1,Y n +1)有可能相等,Tr 代表时空轨迹,该序列中的(X n ,Y n ,T n )代表在时刻T n ,轨迹对象在二维空间的位置为(X n ,Y n )。 基于事件触发采样的轨迹数据具有数据量大、覆盖范围广、更新周期短、采样对象具有代表性等特点。但此类轨迹数据记录的位置不一定是移动对象的真实位置,导致轨迹数据的空间分辨率不高。如手机通话事件的位置是用基站服务范围(以基站为标识点的Voronoi 多边形) 近似表示,位置精度取决于基站的密集程度,且只有传感器事件被触发时才记录移动对象的相关信息,无法勾勒移动对象详尽的轨迹信息,只是人类行为活动中的快照[2]。

位置签到数据是利用待遇GPS 的智能终端记录某一时刻所处位置而产生的具有空间性,实践性和社会化的属性信息的数据,他记录生活轨迹,反映人的日常生活行为,是一种重要的众源地理数据。[9]

Hu 等(2014)在文章中提出了利用位置签到数据探索城市热点与商圈研究。为及时、 准确探测城市热点和客观高效分析商圈,提出一种基于社交网络众源位置签到数据的城市热点探测与商圈挖掘方法。位置签到数据是具有空间坐标和用户属性的离散 GIS 点对象, 首先对离散签到数据进行格网化处理, 将大数据量、离散签到位置点转化成具有空间连续性与邻接性并能够更好地反映签到事件集聚密度的格网数据。其次, 运用探索性空间数据分析( exploratory spati al data anal ysi s, ESDA) 度量签到数据的空间相关性, 量算其空间结构和全局分布模式, 以确定热点探测和商圈聚类的最佳模式。再次, 采用聚类分析识别出具有统计显著性的热点、冷点和空间异常值位置。最后, 通过度量聚类分析结果的地理空间分布, 得到具有统计显著性的聚类地理要素的空间特征::包括商圈范围、 中心变化趋势和方向发展趋势。

[1]Li, X., Han, J., Kim, S., & Gonzalez, H. (2007). Roam: rule- and motif-based anomaly detection in massive moving object data sets..Proceedings of Siam International Conference on Data Mining.

[2]李婷, 裴韬, 袁烨城, 宋辞, 王维一, & 杨格格. (2014). 人类活动轨迹的分类、模式和应用研究综述. 地理科学进展, 33, 7.

[3]Nanni M.2002.Clustering methods for spatio—temporal data.Pisa ,Italy :University of Pisa. [4]Alvares, L. O., Fernandes, J. A., Macedo, D., Bogorny, V., Moelans, B., & Kuijpers, B., et al. (2007). A model for enriching trajectories with semantic geographical information. in ‘ACM-GIS’, ACM.

[5] Lu, R. W. S. Y. (2014). Detection of dynamic activity patterns at a collective level from large-volume trajectory data. International Journal of Geographical Information Science, volume 28, 5, 946-963.

[6]Veloso M, Phiyhakkitinukoon S, Bento C. (2011). Urban mobility study using taxi traces .2011. Intemational workshop on trajectory data mining and analysis.Beijing ,China : September 18,2011.

[7] Guo, D. (2009). Flow mapping and multivariate visualization of large spatial interaction data. Visualization & Computer Graphics IEEE Transactions on, 15, 6, 1041-1048.

[8 Zhang, W, Li ,S, Pan ,G(2012) Mining the Semantics of Origin-Destination Flows Using Taxi Traces. In Proceedings of the 2012 ACM Conference on Ubiquitous Computing Pp. 943–949.

[9] 胡庆武, 王明, & 李清泉. (2014). 利用位置签到数据探索城市热点与商圈. 测绘学报, 3.


相关文章

  • 机械原理课程设计项目
  • 机械原理课程设计题目 题目1 健身球检验分类机 1.1设计题目 设计健身球自动检验分类机,将不同直径尺寸的健身球(石料)按直径分类.检测后送入各自指定位置,整个工作过程(包括进料.送料.检测.接料)自动完成. 健身球直径范围为ф40-ф46 ...查看


  • 智慧交通系统关键技术研究
  • 第36卷增刊测绘与空间地理信息 GEOMATICS &SPATIAL INFORMATIONTECHNOLOGY Vol.36,Supp.智慧交通系统关键技术研究 1,2 王少华,卢 1 浩,黄 1,2 骞,曹 嘉 1 (1.北京超 ...查看


  • 粒子群算法及应用
  • 本书简介 粒子群算法是一种新的模仿鸟类群体行为的智能优化算法,现已成为进化算法的一个新的重要分支.全书共分为八章,分别论述了基本粒子群算法和改进粒子群算法的原理,并且详细介绍了粒子群算法在函数优化.图像压缩和基因聚类中的应用,最后给出了粒子 ...查看


  • 潞安集团公司煤矿井下作业人员管理系统联网
  • 技术部分 1 一. 技术设计及项目实施方案 1.1. 系统设计.安装.使用和质量检验验收执行和引用标 准 系统联网项目的设计.安装.验收应执行最新版国家标准(GB )和行业标准: <AQ1048-2007煤矿井下作业人员管理系统使用与 ...查看


  • 模式识别答案
  • 模式识别试题二 答案 问答第1题 答:在模式识别学科中,就"模式"与"模式类"而言,模式类是一类事物的代表,概念或典型,而"模式"则是某一事物的具体体现,如"老头&quo ...查看


  • 如何描述发展趋势的差异:潜变量混合增长模型
  • 心理科学进展 2007,15(3):539~544 Advances in Psychological Science 如何描述发展趋势的差异:潜变量混合增长模型 刘红云 (北京师范大学心理学院,北京 100875) 摘 要 在追踪研究中, ...查看


  • 半挂汽车列车弯路行驶轨迹分析
  • 第31卷第l期 2008/93月 长春理工大学学报(自然科学版) JournalofChangchunUniversityofScience Vol・31No・1 andTefhnology{NaturalSciaaeeEdition) M ...查看


  • 舆情解决方案
  • 侧系统需求 侧系统功能共分为六大块:资源管理.信息安全管理.监测处臵管理.网络安全管理.网站分类管理.舆情分析.省内其他政府监管部门预留用户接口. 一.资源管理 (一)基础资源管理 基础资源管理用于管理各接入服务单位上报的基础数据,基础数据 ...查看


  • 数控技术复习汇总l答案
  • 数控技术复习纲要 第1章 绪论 1. 数控加工的特点及主要加工对象 数控加工的特点: 1)可以加工具有复杂型面的工件 2)加工精度高,质量稳定 3)生产率高 4)改善劳动条件 5)有利于生产管理现代化 数控加工的主要对象: 1)多品种.单件 ...查看


热门内容