广州外地车出行分析—— 大数据应用的案例与思考 - ITS文库 - 智慧交通网 ITS114.COM|中国智能交通领先的门户网站
  • 首页 > ITS百科 > ITS文库 > 正文

    广州外地车出行分析—— 大数据应用的案例与思考

    2015-11-26 15:34:03 来源:www.ladysslipper.com 评论:
    分享到:

      由中国智能交通协会主办,公安部交通管理科学研究所、国家道路交通管理工程技术研究中心、国家智能交通产业技术创新战略联盟、道路交通安全公安部重点实验室、无锡市滨湖区人民政府承办的“2015’第十届中国智能交通年会”于11月4日在无锡召开。

      本届年会主题为“新技术背景下的智能交通创新与提升”,中山大学余志教授在“交通大数据应用论坛”上发表题为《广州外地车出行分析——大数据应用的案例与思考》的演讲,本文为其演讲速记,未经演讲者本人审定。特此感谢中国智能交通协会提供演讲速记。

      余志:很高兴有机会跟大家交流汇报大数据。我印象中第一次讲大数据是在2012年,现在这么多人来听我讲大数据,我有点发怵。这次想分享一下两个案例,如何用大数据技术,然后再反过来思考大数据怎么样,我想应该是一个反复的过程。

      今天分享分三个部分,第一是广州外地车车运行情况案例分析;第二是交通大数据分析技术探讨;第三是大数据背景下智能交通发展的几点认识。

      广州外地车运行情况分析案例

      现在各个限牌的城市都面临这个问题,北京有进京车辆许可证,上海限路限时,深圳限时,广州也到了快没有办法的时候了。2013-2015年,一广州本地车辆由202万增至226万,年均6%;行驶的外地车由239万增至455万,年均45%,广州也吃不消了。一个普遍的观点是,广州必须要限外了,但广州跟北上深相比有一个不同的地方,是省会城市,广州不可以限外。政府也都没办法了,叫做病急乱投医,也找过我们这些不能治病的郎中,包括省领导的批示也提到请我们帮帮忙。郎中不能治病,但有些时候能给人家瞎掰一下。在这件事情上我们发现数据确实管用,广州市500个左右卡口,每天将近200万条、一个月5600万条的数据,以及6万辆营运车辆、日均2.5亿的轨迹数据,还有广东全省2300万机动车和6100万驾驶员信息,把这三个数据放在一块,可以分析出一些很有意思的问题。

      首先看一下这些卡口分布(PPT),分为两个圈,一个外围、一个内圈,内部有308个,外部200个左右。我以前讲过,交通数据分析里最核心的东西,不是根据交通模型来应用数据,而是根据交通问题和数据来构造行为模型,这是最核心的工作。这样,我们把这些车辆行为分成三个部分,就是本地化使用车辆(划分本地化使用的阈值:每月出行5个工作日)、过境使用车辆和外围过境车辆,这样分析以后就发现情况没我们想象的严重。

      这是2013年的结果,分完以后,我们发现不到7万辆车对广州交通有实质性影响。到了2015年情况不同了,所有车的使用的情况,这是一个月中,把21个工作日拿出来,看所有刚才讲500万外地车和220万本地车使用的情况。其实广州本地车也好、外地车也好,大部分是一个月开一天,在北京有40万辆车平均一个月开一天,有23万辆一个月只有两天出行,本地车有10万辆左右天天用,但是外地车,用得不是特别多的,平均下来挂广州车牌的车辆平均出行5.2个工作日,这样的车有30万辆,所以450万辆外地车,其实不用关注了,要关注它对广州交通的影响,你就关注这30万辆本地化使用的车。为什么呢?这些本地化使用的车只占所有外地车的6.6%,但它对广州本地出行量的影响,这6.6%的外地车在中心城区出行量占全体外地车67.5%,这是数据分析给带来最有意思的一个结论,就是关注小众,不用关注大众,如果以此把所有外地车限了,就等于30万个人犯错,400人跟着吃药,所以我们不能够简单处理这个事情。

      对比一下,本地化与"本地化"外地车对广州交通影响,一辆本地化相当于2.2辆本地化,相当于26辆过境车。在"本地化"外地车的30万辆车里,9万佛山车牌、深圳7万、东莞2万、惠州近1万;然后这30万辆"本地化"外地车中,有15万辆是2011年之前上牌,今年上半年上牌的是3万辆,2014年是5万辆,在迅速增加。这些"本地化"外地车,在广州每天行驶距离大概60公里,但本地车只有不到50公里,使用频率远比广州车牌车辆高,而出租车每天大概载客20多次,一天大概200多公里,这个数字是在下降的,广州出租车司机收入下降大概20%。

      为什么要限外牌呢?广州去年拥堵指数晚高峰由5变成8,举一个具体例子,东风路一段,道路通行能力设计为大概每小时3300辆,在2013年、2014年都是低于这个数据,到2015年的时候,就超了大概10%,通行速度一下子下来了,从32公里时速降到了22公里,在这里面,本地车的通行量增长约为8%,而外地车增长了162%。如果考虑限外牌,21个工作日里允许外牌车走4天、5天、6天、7天,如果设定每月工作日限5天,21天里会有16天畅通,如果只限4天,基本上能保证畅通。所以也有记者找,领导问,东风路通行能力饱和就真的是外地车搞的吗,我说也不是。什么意思呢?这30万辆"本地化"外地车相当于广州新增本地车66万辆,因为一辆车相当于2.2辆实际使用量,这样一来,广州每年限12万辆车,所以不堵也不可能了。

      这就是数据分析的好处。能够根据数据分析,限牌几天,限谁,限到什么程度,交通流的辩护能有一个大致的预估数据,但是现在广州没有做这个实验,我不敢说这个药方一定对的,至少现在找不出太大毛病。也有人问这个数据可靠吗?我们发现在计算车辆出行率和使用天数,广州已有500个卡口足够可靠,即便拿掉10%,仍然保证百分之九十几的检测能力,只要80%的卡口正常工作,就能保证95%的信息。拿到这个数据特别高兴,就是第一次能表明卡口的建设,在一个大城市里是不是可以优化?

      交通大数据分析技术探讨

      看完这个案例可以稍微讨论一下。这并不是就数据做数据,从感知到信息成网、挖掘、评估,我们相信未来会更多,大家正在做这个事情。实际上我们觉得实现这样的数据分析要有三个基础条件,第一个是数据了,第二个具备逻辑运算能力的地理信息平台,第三个面向问题的数据驱动型交通分析模型。通过图片信息可以分析车辆信息,然后得到车辆的一些特征,然后通过卡口得到断面的信息,通过若干断面信息得到交通参数,然后通过多层级等得到其他更多的信息。但是在这里头很多关键技术有很多约束,比如车牌识别,我们测试了5个公司,测到最好的识别率是92%。这还不是最重要的,还有功能,根据国家规定,一个车牌识别系统15个车辆类型的识别功能,但是我们测下来没有一家完全达到的。

      在GIS-T数据平台的建设方面,平台应该支撑复杂交通系统数字化建模、支撑动静态数据关联,形成交通信息网络、支撑交通逻辑分析计算等等。我们用路网系统加上这套数据系统可以构建一套体系,比如用出租车路径体系可以映射到路网系统,方法就不再继续介绍了,因为时间关系,比较简短。

      对大数据背景下智能交通几点认识

      谈一点感慨,不是有数据就能解决问题,经常有人给领导忽悠,只要给我数据就能解决问题,我已经讲过多次,凡有人这么跟你讲的,千万不要相信,反过来,解决问题的人,手上一定有数据。数据带来信息,也带来陷阱,数据通常是不完善,不全面的,没有用过小数据来解决问题的人,是不可能有大数据的。

      建立大数据思维,又有人忽悠你要有大数据思维,也不是这样。所以我觉得大数据很重要,但也不要迷信有了大数据思维能思维出大数据。当然还有一个重要的,根据数据建立模型比套用模型应用数据还重要,多种数据解决一个问题以及一种数据解决多个问题;构建针对交通系统的数据关系网络;基于交通问题驱动的数据需求与数据价值评估;从相关性出发深入挖掘精细化、个性化的因果性。

      我想讨论一下科学研究的第四范式,我们最早实验、形成理论、计算、然后到数据,我们认为进入了数据时代,但这个时代有可能回归到实验数据,就是数据到计算、再产生理论,然后再实验,是一个总体的进步。

      大数据的应用是一个过程,不是一个工程,应该是自上而下和自下而上反复交替完成的,从局部到整体,所以千万也不要迷信只有提供了一个大数据框架和理论体系,才可以解决问题,所以我们觉得大数据的问题驱动是核心,不断完善,才能建立大数据模型,回到交通的问题,核心的拥堵、污染、安全。行政手段与商业手段互相结合,提升交通大数据效能,政产学研用紧密合作,可持续推动交通大数据发展,要开放,如果我们紧紧抱住那点快要被淘汰的数据也会有问题。

      最后,欢迎加入以大数据为核心建立新一代智能交通系统科学研究与技术应用为核心的OpenITS研究计划,谢谢!

      网站www.openits.cn微信公众号:OPENITS

      本文为智能交通世界网原创,转载请注明出处,更多内容请访问智能交通世界网(www.ladysslipper.com

  • 关键字: 广州 大数据 外地车
  •    责任编辑:its114
  • 每周新闻精选

  • 关于我们
  • 联系我们
  • 广告赞助