大数据时空分析的新方法:在首尔地铁交通数据中的应用
目录
译文及原稿 34
大数据时空分析的新方法:在首尔地铁交通数据中的应用 1
1首尔国立大学地球与环境科学学院 1
关键词:CSEOF分析;时空分析;大数据分析 1
引言 1
数据 2
方法 3
讨论 3
地铁一周2号线。图3从上到下显示了登机的CSLVS 3
结论 9
参考文献 10
方法
在本研究中,我们特别感兴趣的是识别地铁乘客数据的时空特征函数,即地铁乘客随地铁站和一周时间变化的不同模式。由于地铁乘客数据的统计特性(均值和协方差)几乎是周期性的,具有明显的周周期,我们假设这些数据属于循环平稳随机变量的范畴。因此,一种称为循环平稳经验正交函数( CSEOF )分析的时空分析技术被用来识别地铁乘客数据的特征函数。
讨论
首尔是一个拥有1000万人口和1.7万人口密度的大都市。此外,许多人从首尔郊区通勤到首尔。地铁线路2,也称为绿线,是9大城市中最繁忙的线路之一。
首尔地铁线路和4条特殊地铁线路(见图2)。每日总次数2号线旅客超过200万人次,占地铁旅客总数的31%。在汉城,图2显示了地铁2号线及其50个车站和所有连接地铁。Tere是乘客数据中一个重要的每周周期。在工作日,大首尔使用地铁上下班的人数。在周末,乘客人数明显减少。基于公共模式,我们设置嵌套本研究周为1周(168小时)。图3显示了50个车站每小时乘客的frst cseof模式
地铁一周2号线。图3从上到下显示了登机的CSLVS
乘客(图_3a)、下车乘客(图_3b)、所有车站增加的乘客(图3c)和相应的PC时间序列(图3d)。TIS模式解释了总的变异性。上下客总量分别呈现出两个明显的高峰与工作日的通勤时间相对应(图3c);上午高峰在上午7-8点左右,晚高峰6-7点左右,早高峰更大对于下车的乘客,而对于登机的乘客,晚高峰更大。早上7点到点车站附近有大量乘客上地铁。230(Shilim)。下午6点左右,附近也有大量的登机乘客
222号站(Kangnam)。早上(早上7点到8点),222号站附近有大量下车的乘客。然而,在晚上,降落模式没有显示任何明显拥挤的车站。大批量生产并不奇怪因为其他地铁线路,早上在230站附近登机的乘客,除2外,不方便进入,因为有一个很大的社区这个地区人口密度很高。219–222号站位于业务范围内。市中心有许多公司。注意邦当线(如图2所示为B)新的邦当线(图_2中的NB)在220号站与地铁2号线相连。分别是222号站和222号站。从外滩线下车的乘客经常使用出口站220和222。图四,在这些车站在早上。周末,乘客人数减少,早晚高峰不见。期间每日乘客总数为300-320万。工作日,周六减少至240万(78%)和170万(54%),以及
分别是星期日(表1)。图4显示了下车和登机乘客之间的数量差异。很明显,这种差异在早晨比在傍晚。当平均24小时以上时,在221-223站上下客人数的不平衡最为明显;下客人数超过平日旅客登机人数(另见表1)。原因分析这种不平衡不明显。一个合理的解释是,当通勤时间分布更广时,不同的交通方式在晚上很容易得到比早
上好。
相应的PC时间序列表明,地铁2号线的乘客数量没有明显的趋势(图3d)。周周期的te振幅约为~ 1.0的平均值,标准差为0.094。TE直方图高度倾斜,长尾巴朝向低端(图5)。特瑞有几次每年乘客数量的显著减少。减少日期见表2。农历新年,在农历的早期,和楚seok或9月或10月的中秋节是韩国的两个主要节日。泰伊每次持续3-4天,大都会地区的人,尤其是在首尔探访他们住在农村的家庭。特雷是一个普遍的数字下降新年前后的乘客数量。图6显示了每周PC时间序列的月平均振幅。在记录期间内循环。月平均振幅一般变化较小。10%以上,2010年9月除外。月平均乘客数3月达到高峰,11月达到较小程度。平均而言,九月份乘客人数下降最为显著,八月份和二月份的下降幅度较小。9月份的乘客减少明显与Chuseok有关。