绑定完请刷新页面
取消
刷新

分享好友

×
取消 复制
JUST技术:探查城市中的异常事件
2021-02-22 00:00:00

城市在正常运行的过程中,也伴随着一些异常事件的发生,例如某一路段突发的交通拥堵,这些异常事件往往会对我们带来负面影响。2014年12月31日,30多万人涌入上海外滩观看除夕灯光秀,人群的数量远远超出了组织者的预期。过度拥挤导致了一场悲惨的踩踏事件(图1),最终造成36人死亡,49人受伤。

1 2014年外滩踩踏事件

对城市中异常事件的及时感知甚至提前预测,能够帮助政府或是相关机构及时应对突发异常,将其带来的负面影响降到最低。如果能够提前预测即将发生拥堵的路段,通过对车流的提前疏导能够避免拥堵的进一步扩散。2014年的外滩事件中,如果能及早感知到人群聚集,及时对人群进行限流,悲剧可能就不会发生。对于不同类型的异常事件,提前感知从而及时处理都是至关重要的。

随着智能设备的普及以及城市传感器的大量部署,大量不同类型的城市数据被收集、管理与挖掘。这些数据具有实时、大量、多源等特点,且一般具有时空属性,包含了丰富的居民出行、城市治安等信息,例如出租车上传的实时地理位置数据、市民在社交软件分享的打卡数据。充分利用这些数据为我们进行城市异常事件的检测与预测提供了很好的机会。本文基于香港科技大学2020年的一篇综述:Urban Anomaly Analytics: Description, Detection, andPrediction[1],介绍利用时空数据检测不同类型的城市异常事件的工作,并在一些重要部分进行补充,同时介绍JUST系统在城市异常事件检测中的应用。

数据驱动的城市异常检测的主要逻辑如图2,城市中发生的异常事件会影响到正常的城市运行动态,这些异常的变化信息会被遍布在城市的智能设备与传感器采集到。数据驱动的城市异常检测即是利用这些数据描述的城市动态信息,找出其中发生的异常事件。城市异常事件可以根据其发生的主体分为交通异常、人群流量异常、环境异常和个体异常。下面将分别对这几种异常进行介绍。

2数据驱动的城市异常检测

一、交通异常

交通出行影响到城市中的每个人。交通异常的产生主要有两个原因。第一个是交通挤塞,通常是由交通事故或交通超载引起的。交通挤塞会导致特定道路的车速减慢或交通量增加,但这些影响只会持续很短的时间,如几分钟或几个小时。另一个是道路管理,例如维修或封闭道路,这通常会导致交通量大幅下降,而且其影响会持续更长时间。

交通异常检测主要基于交通流量分析,交通流量数据往往采集与部署在道路的传感器。交通流量异常分析的工作可以分为两类:局部流量异常分析和群体流量异常分析。第一类工作将路网视为独立路段的组合,并检测或预测每个路段的异常,这些方法首先会提取路段的特征信息例如道路上车辆的平均速度,然后通过基于统计的方法[2][3]或是最近邻计算的方法[4]进行异常识别,由于这些工作的假设中将路段之间看作是独立的关系,会忽视实际路网上重要的流量传播关系。群体流量异常分析则主要解决这一问题,他们往往将路网用图结构表示,交通异常的预测可以看作是在图上发现异常子图的过程,这些方法可以找到一些有异常的路段集合[5]。同时交通流量异常往往也可以在人们的社交媒体中呈现,[5]中还对异常发生的同一时段的社交媒体信息进行简单挖掘,探究交通流量异常的更多信息。然而,很多时候无法得到大量的实时交通数据支撑上述交通异常检测的应用。也有工作借鉴交通工程领域利用稀疏数据建立正常的交通流量特征[6]。除了及时的异常检测,对交通异常的原因分析可能更加能够帮助到城市规划者。[7]中作者为检测到交通异常的时空属性建立因果关系树结构,其中的频繁子结构能够显示出不同异常的相互影响与潜在的路网设计缺陷。

二、人群流量异常

人群流量异常指的是在短时间内城市中某一区域突然聚集大量人群的事件,是公共安全的主要威胁之一。2014年外滩事件最终造成36人死亡,49人受伤。如果在早期阶段检测到或预测到人群聚集,这类事故是可以被预防的。另一方面,一个地区人口密度的增加通常可以被很多城市数据所感知,例如该地区周围基站的蜂窝用户数量突然增加,附近地铁站的出境乘客数量意外上升[8]

然而,不同种类的人群流量异常的现象往往与多个数据源相关,为了能够充分利用多个数据源,[9]作者建模时考虑到了多源数据融合的需求。另一方面,人群流量的异常一般从区域粒度进行检测,区域之间的时空关联一般较为复杂,而图结构能够较好地描述这种关联,很多工作借鉴了图表示网络的成果,例如基于图嵌入[10]或者图卷积[11]的方式增强对时空关系的抽取。

检测或预测意外人群的另一个难点是记录的事件数量有限,这给评估不同检测和预测算法的有效性带来了困难。为了丰富数据驱动的模型的标签,现有的工作通常将节日庆典、流行音乐会、体育比赛作为非正常事件。这些事件与潜在的城市异常事件有着相似性,都会导致城市动态与正常状态的差异。

三、环境异常

城市环境异常主要指城市中基础设置与城市环境出现的异常事件,与公众安全高度相关。例如,城市中的火灾是一种对人民生命财产的严重威胁。水系污染可能影响到相当大区域内居民的正常生活甚至健康。因此,城市环境异常的检测同样十分重要。

环境异常检测主要基于部署在相关基础设置与环境中传感器采集的数据。与其他类型的城市异常不同,环境异常主要是由环境变化引起的,而不是由大规模的人类活动引起的,通常在发生之前没有明显的迹象。因此,目前的环境异常工作并不是直接对城市异常进行检测和预警,而是侧重于风险评估或原因追踪。例如,[12]根据建筑物的状况信息预测一栋建筑是否有着火的风险,[13]根据水样检抽测的结果探索了居民区水污染的原因。

四、个体异常

个体异常主要指城市中个体违法违规行为导致的异常。例如出租车司机的故意绕路行为,车辆在非机动车道的非法停放。个体异常一般影响的人群范围较小。但是由于一些个体工作的特殊性,也会产生较大的危害,这些异常需要能够被及时检测。例如危化品司机将危化品运输到非法小化工,这些小化工普遍存在的对危化品不规范处置行为会对造成极大的安全隐患。时空个体异常检测的另一个特点是,每一种异常检测任务之间较为独立,不同的异常检测模型设计的出发点差异较大。

个体异常检测的数据主要来自于安置于个体设备上的传感器,如出租车或是危化品车辆上的GPS采集器。出租车绕路的异常检测是较早被研究的一种时空异常,模型设计主要是对起点终点间正常的行驶模式分布进行建模。由于实际路网形态较为复杂,很多方法会选择对轨迹进行网格化表征[14][15][16][17],然后计算从起点到终点期间走到某一网格的异常程度,所有网格累计的异常值作为判定标准。在一些实际应用对绕路检测算法往往有实时性的需求,例如网约车公司会希望当车辆有绕路倾向时就及时发出警报,一些实时算法被提出[16][18],其中,[18]主要通过一种启发式的思想计算当前位置到起点的距离和行驶时间与距离的比例是否正常,利用广义线性模型来对两种比例的分布进行建模。为了有更好的表征空间,基于深度学习的模型也被尝试用于绕路检测[17],作者考虑到一组起点终点间有多种可能的路段选择,用高斯混合模型结合变分自编码器的方式将原始轨迹映射到高维空间,不同蔟代表着不同的合理路段选择,表征离蔟中心较远的轨迹被认为是异常。

然而上述方法如果要投入实际应用仍有困难,由于不同起点终点间可能的正常路线选择较为多样,上述方法往往需要对于每个起点终点都训练一个模型,这会有两个问题,首先对于一些历史稀疏的路段,这种方法难以有较好的效果,第二如果要实际部署这种模型,需要对城市内所有起点终点都训练一个模型,消耗的资源较大。

相对于出租车,危险化学品运载车辆的异常行为往往会产生更大的危害,因而这些车辆的行驶路线与行为都受到严格的管控,其行驶轨迹数据被实时上传。然而仍然有少数司机会选择铤而走险,将危化品送到一些小化工进行非法存储销售。为此基于京东城市时空数据引擎JUST设计了危化品车辆轨迹特征和地点上游工厂信息检测非法小化工地点的模型。部署在江苏南通的危化品监管系统在两个月的试运行期间检测出了296个危化品异常驻留点,和南通市此前花大力气排查出的91家要求整改的“小化工”成功匹配64个,匹配覆盖度达到70%

另外,即使是有正常危化品需求的地点,过量存储危化品仍然会有很大安全隐患。在[19]中,作者寻找城市中危化品事故高危区域,他利用货车轨迹数据计算所有区域危化品车辆停放密度分布,通过运营商数据计算人流密度分布,如果某一区域某一时段同时有较多的危化品车辆分布和人流分布则被判定为危险区域,其成果被应用到北京多个地区的天然气整改中。

利用轨迹数据,还能检测车辆停放的异常行为。JUST团队的工作[20]中,我们利用自行车轨迹数据检测停留在非机动车道的车辆,由于自行车在经过有车辆停放的道路时一定会绕行,从大量自行车的轨迹分布可以明显检测出这种特征。

五、总结

以上就是本次关于利用时空数据探查城市异常事件的分享,主要从四个分类介绍了当前城市中异常事件检测的进展以及JUST系统中城市异常事件检测的应用。未来JUST系统还将集成更多城市异常检测算法,助力城市的安全发展。

参考文献

[1].   Zhang, Mingyang,et al. "Urban Anomaly Analytics: Description, Detection andPrediction." IEEE Transactions on Big Data (2020).

[2].   Dong, Yuxiao, etal. "Inferring unusual crowd events from mobile phone call detailrecords." Joint European conference on machine learning andknowledge discovery in databases. Springer, Cham, 2015.

[3].   Wang, Youcheng,et al. "A feature-based method for traffic anomaly detection." Proceedingsof the 2Nd ACM SIGSPATIAL Workshop on Smart Cities and Urban Analytics.2016.

[4].   Djenouri,Youcef, et al. "Adapted k-nearest neighbors for detecting anomalies onspatio–temporal traffic flow." IEEE Access 7 (2019):10015-10027.

[5].   Pan, Bei, et al."Crowd sensing of traffic anomalies based on human mobility and socialmedia." Proceedings of the 21st ACM SIGSPATIAL internationalconference on advances in geographic information systems. 2013.

[6].   Han, Xiaolin, etal. "Traffic Incident Detection: A Trajectory-based Approach." 2020IEEE 36th International Conference on Data Engineering (ICDE). IEEE, 2020.

[7].   Liu, Wei, et al."Discovering spatio-temporal causal interactions in traffic datastreams." Proceedings of the 17th ACM SIGKDD internationalconference on Knowledge discovery and data mining. 2011.

[8].   Ceapa, Irina,Chris Smith, and Licia Capra. "Avoiding the crowds: understanding tubestation congestion patterns from trip data." Proceedings of theACM SIGKDD international workshop on urban computing. 2012.

[9].   Zheng, Yu,Huichu Zhang, and Yong Yu. "Detecting collective anomalies from multiplespatio-temporal datasets across different domains." Proceedings ofthe 23rd SIGSPATIAL international conference on advances in geographicinformation systems. 2015.

[10].Zhang, Mingyang, et al. "A Decomposition Approach forUrban Anomaly Detection Across Spatiotemporal Data." IJCAI.2019.

[11].Zheng, Li, et al. "AddGraph: Anomaly Detection in Dynamic GraphUsing Attention-based Temporal GCN." IJCAI. 2019.

[12].Madaio, Michael, et al. "Firebird: Predicting fire riskand prioritizing fire inspections in Atlanta." Proceedings of the22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.2016.

[13].Chojnacki, Alex, et al. "A data science approach to understandingresidential water contamination in flint." Proceedings of the 23rdACM SIGKDD International Conference on Knowledge Discovery and Data Mining.2017.

[14].Ge, Yong, et al. "A taxi driving fraud detectionsystem." 2011 IEEE 11th International Conference on Data Mining.IEEE, 2011.

[15].Zhang, Daqing, et al. "iBAT: detecting anomalous taxitrajectories from GPS traces." Proceedings of the 13thinternational conference on Ubiquitous computing. 2011.

[16].Chen, Chao, et al. "iBOAT: Isolation-based onlineanomalous trajectory detection." IEEE Transactions on IntelligentTransportation Systems 14.2 (2013): 806-818.

[17].Liu, Yiding, et al. "Online anomalous trajectorydetection with deep generative sequence modeling." 2020 IEEE 36thInternational Conference on Data Engineering (ICDE). IEEE, 2020.

[18].Cheng, Bin, et al. "STL: online detection of taxitrajectory anomaly based on spatial-temporal laws." InternationalConference on Database Systems for Advanced Applications. Springer, Cham,2019.

[19].Wang, Jingyuan, et al. "No longer sleeping with a bomb:a duet system for protecting urban safety from dangerous goods." Proceedingsof the 23rd ACM SIGKDD International Conference on Knowledge Discovery and DataMining. 2017.

[20].He, Tianfu, et al. "Detecting Vehicle Illegal ParkingEvents using Sharing Bikes' Trajectories." KDD. 2018.

分享好友

分享这个小栈给你的朋友们,一起进步吧。

康瑞部落
创建时间:2020-05-21 17:48:23
本小栈的内容主要包括以下几个方面: 1、有关计算机项目开发的个人心得 2、有关算法与数据结构方面的研究 3、其他计算机相关知识 4、读书笔记与书摘 5、个人兴趣的交流 6、生活琐事的记录 7、转载的美文
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

栈主、嘉宾

查看更多
  • Ruiyuan Li
    栈主

小栈成员

查看更多
  • 栈栈
  • 一号管理员
  • gaokeke123
  • chengxuwei
戳我,来吐槽~