数据与稽查

随着高速公路的联网收费,跨省行驶车辆增多,通行情况变的复杂,部分司机在利益诱惑下开始偷逃通行费,阻碍了通行费的依法征收。稽查工作作为收费工作中的关键一环,要如何在新环境下开展,以适应新的收费模式,尝试把稽查与数据相结合,会是一条可行之法。
每辆在道路上通行的车辆都会产生不同的信息流,数据稽查就是把信息流转化为电脑可识别的数据代码,利用电脑模拟人脑的思考方式,去辨识正常车辆与非正常车辆的关键数据节点,以达到车辆筛选的目的。相比传统稽查方式,数据稽查的效率会高很多,它主要通过以下三个步骤来实施。
一、利用数字无限叠加的特性完成信息数据化。车辆信息流包含很多内容,单纯靠“文字+数字”的描述模式,是无法被计算机深度处理的。我们要将信息流中的各类信息,按照既定的规则进行代替和转换,把不同类型的数据信息转化为统一标准的数组或数列,再将它们叠加组合起来,组成具有唯一性的车辆数据条,形成预处理数据源。这一步通常是针对车辆信息中无法被计算机处理的文本类信息进行转换。
二、利用数字分类排序的特性进行数据分类比对。在计算机系统中数字是可以被排序和按规则分类的。利用这个特性,根据信息数据源的特征,将每条信息数据源划分为两个或两个以上有联系的区域,例如A区域和B区域。然后设定当A为某值时,B区域会存在或只能存在一个区间阈值。如果B值超过区间阈值,那本条数据的存在就不符合实际标准,需重新核对本条数据的真实内容。也可以利用排序功能将多条数据源的同一个区域进行排序,观察这些数据源的连续性是否符合实际运行规律,区分那些错误的数据源。本方法多用于将数据源进行大范围的分类后,对各分类区域中的单条数据源进行归属性辨别,筛选不属于各分类指标的数据源。
三、利用数字可被计算的特性进行数据关系分析。数字最大优点是能相互运算。利用这个特性,当一条数据源的各个数据间存在因果关系时,可通过公式运算得到一个数值,这个数值代表数据间关系的契合程度。在正常情况下契合程度也会存在一个区间阈值,大部分的数值都会在这个区间阈值之内。而对于数值超过区间阈值的数据源,就需要重新核对它的真实内容,确保无异常情况。还可以将每条数据源中的对应数据节点进行直接比较,观察它们间的区间差值是否属于期望值,或与一个固定值对比,判断其波动是否在正常范围内,用以衡量车辆的产生数据是否正常。本方法主要用于单条车辆数据源中,各个数据节点间的关系分析,需要熟悉车辆行驶过程中各类数据产生的因果联系。
我们在传统的稽查工作中,仅针在对出口产生特情的车辆进行审核,从而发现逃费行为,这是把每件逃费案例当做一个单独的事件来处理。而数据稽查则是站在“把逃费当做一种行为”的基础上,对车辆开展数据筛查,利用阈值、概率、规律等手段剖析车辆疑点,结合信息数据化和计算机的大数据处理能力,扩大外部稽查车辆的范围,使得我们更容易发现嫌疑车辆。同时也把稽查工作由“守株待兔”的方式推进到“主动出击”,更有利于我们发现逃费行为,展开针对性的稽查工作。
目前高速公路的智能化建设步伐在不断加快,数据必将成为未来的主要资源。数据稽查可以作为大数据分析的一个切入点,帮助我们了解和分析车辆的通行过程,将高速公路的数据源采集从站口提升到道路路面,从分析结果提高到分析过程。同时利用数据稽查过程中提炼的各类算法,结合硬件设备带来的大数据处理能力,逐步实现信息的实时处理与分析反馈,这样数据稽查工作也成为高速公路智能化建设的一块基石。

···

作者:湖北交投集团襄阳运营公司 金涛


您的点赞和评论是我们更新的动力

(0)

相关推荐