【本期看点】
我们常常听说人工智能可以代替人们做一些工作量大,重复、机械的工作,但我们对于它的工作原理却了解甚少,而至于其工作过程的精准度也不太清楚。
最近,麻省理工学院和卡塔尔计算机研究所(QCRI)的研究人员发明了一个模型,即RoadTagger。该模型可以基于卫星图像,标记数字地图中的道路特征,并进行有效推测,来改进GPS导航地图。这个模型的图像处理类似于人的大脑,在相应的测试中它对道路类型推断的准确度为93%。
如此高精确度的人工智能推断究竟是如何完成的?以下内容为你解答!


▲ 图片来源于网络
制作详细的地图是一个昂贵且耗时的项目,因此主要由大型公司完成,比如谷歌,这些公司将摄像头绑在车辆的引擎盖上,在行车过程中拍摄一个地区道路的视频和图像,再与其他数据结合创建准确、最新的地图。然而,由于这一过程代价高昂,因此世界上某些不发达地区就被忽视了。

解决这一问题的一种方案是,在卫星图像上发布机器学习模型,以便自动标记道路特征,这样有利于定期获取并及时更新。但这也存在问题,因为道路可能会被树木和建筑物遮挡。在人工智能促进协会会议中,麻省理工学院(MIT)和QCRI研究人员发表了一篇描述了“ RoadTagger”的论文,它使用神经网络结构组合来自动预测障碍物后面的车道数和道路类型。
论文下载:https://arxiv.org/abs/1912.12408
研究人员利用美国20个城市的数字地图测试RoadTagger,发现该模型对车道数量计算的准确度为77%,对道路类型推断的准确度为93%。同时,研究人员正在计划使RoadTagger预测其他路线特征,例如停车位和自行车道。
萨姆·马登(Sam Madden)是该论文的作者之一,现任电机工程和计算机科学系(EECS)的教授以及计算机科学与人工智能实验室(CSAIL)的研究员。他说:“大型公司大多只会更新他们最关心的地方的数字地图,因此在他们不太关心的地方,数字地图的质量较差。我们的目标是使高质量的数字地图生成过程自动化,以便任何国家或者地区的使用。
该论文的共同作者有CSAIL的教授Mohammad Alizadeh和Hari Balakrishnan,研究生Songtao He、Favyen Bastani和Edward Park,EECS的本科生Sattat Jagwani,以及QCRI的研究人员Sanjay Chawla、Sofiane Abbar和Mohammad Amin Sadeghi。

马登说,QCRI的基地卡塔尔就“不是建造数字地图的大型公司的优先选项”。然而,它正在不断地建设新的道路,并改善旧的道路,特别是为主办2022年的FIFA世界杯做准备。
他还提到:“在访问卡塔尔期间,我们有过这样的经历:我们的Uber司机不知道如何到达目的地,因为地图太模糊了。如果导航应用程序不能提供正确的信息,例如车道合并,这可能会带来糟糕的后果。”
RoadTagger是用于图像处理的卷积神经网络(CNN)和图神经网络(GNN)的新组合。GNN能够对图形中节点之间的依赖关系进行建模,并已成为分析社交网络和分子动力学等的常用方法。该模型属于“端到端”的深度学习,这意味着它仅提供原始数据并自动产生输出,而无需人工干预。
▲ 图片来源于网络
CNN以目标道路的原始卫星图像为输入,GNN将道路分为大约20米的路段(或“图块”)。每个图块都是图形中的一个节点,沿道路的线为连线将其相互连接。对于每个节点,CNN都会提取道路特征,并与其有直接连线的节点共享该信息。道路信息会沿着整个图形传播,每个节点都会收到其他节点有关道路属性的信息。如果图像中遮挡了某个图块,RoadTagger将使用道路上所有图块的信息来预测遮挡的内容。
研究人员说,这种组合结构类似于人类的直觉。假设树木遮挡了四车道的一部分,某些图块仅显示两条车道。人们可以轻易地推测出树木背后隐藏着两条车道,而传统的机器学习模型仅提取单个图块特征,比如仅使用CNN,最有可能预测被遮挡的图块是一条两车道道路。

▲ 图片来源于网络

期待合作

更多服务




原文始发于微信公众号(城市数据派):准确度93%!人工智能如何完成高精度的地图特征推测?丨城市数据派