百度地图如何生产业界最权威、准确的数据?
国内第一家采用全景实采工艺进行电子眼数据自动识别处理,国内第一家采用全景实采工艺做路口放大图……百度地图的数据生产力迎来了跨越式的发展,用户对百度地图的权威、准确感知也愈发强烈。
实际上,为了这一天的到来,百度地图已经默默地酝酿、储备了很久。驱动百度地图数据生产力几何爆发式提高的关键,就是人工智能技术。
对于百度地图而言,基于长期不遗余力的积累,包括不断升级采集装备,投入相当的人力、物力自建数据中心,已经彻底颠覆了传统的数据采集模式。该模式将五大采集黑科技,包括全景采集车、采集自行车、全景采集背包、室内图采集背包、无人机进行多维组合,协同作战,结合“1+0”单人采集模式、Lidar点云系统全景采集等核心技术,采集人员可根据香格里拉丰富多样的地貌特征,包括山峰、河流、原野、道路、室内等,配备不同的装备和技术进行采集操作,立体式覆盖、一网采集所有类型数据。
用于道路采集的采集车是百度地图数据采集的主力军,之所以能够单人“驾车+采集”,除了因为可语音交互提高了采集人员的效率以外,还基于所搭载“GNSS+IMU”、成像系统、Lidar点云系统等核心设备,全面实现了采集自动化和集成化。“GNSS+IMU”主要采集定位信息,确保地图的精度;成像系统主要供采集影像和后期自动化识别POI使用;Lidar点云系统主要为高精道路使用,采集ADAS、HDMAP相关数据。在室内采集方面,百度地图在国内同样处于一骑绝尘的地位:自主研发了点云系统全景采集设备和内业制作平台,从而彻底摆脱了以往通过制图软件进行人工采集处理的方式,采集员只需要背着采集设备行进,即可自然而然地生成3D模型和平面图。
在数据处理环节,对应外业“多栖组合”采集模式,百度地图创造性提出了多组合数据制作模式。该模式利用图像识别、深度学习等人工智能技术打造出数据处理“三大刀锋工艺”:图像深度学习自动筛选功能,从采集的影像中快速自动识别道路特征、提取轮廓并绘制形状,补充车采盲区部分数据;全景图像自动识别技术,机器精准识别目前人工可目视的道路图形标牌、地面车标以及文字标牌;多源数据自动识别差分融合工艺,将外业实采的不同形式数据与合作数据等多源数据实现程序的自动识别差分、属性自动融合,从而减少人工工作量。同时,数据质量控制、全流程多工序数据自动化流转等方面的平台化创新,也大幅提高了数据生产作业的自动化比例,使整体生产效率达到业界先进水平。
技术是生产力的核心要素之一。依托先进的外业“多栖组合”采集模式与内业“多源融合”数据制作模式,百度地图数据采集处理效率实现了十余倍的提升,数据更新也日新月异:道路阻断或者修路信息等要素实现了分钟级上线,新开通道路实现了每天上线更新,重要城市每周更新。
今天,百度地图已实现底层数据完全自采,数据资产位居全行业第一。更重要的是,这一组数据每时每刻都在以突飞猛进的速度不断增长。