触景无限 | 前端智能感知全球引领者

Menu

新闻资讯 > 新闻详情

无人机避障技术解析:双目视觉有多大的应用前景

在5月4日开幕的2017中国(北京)国际无人机系统产业博览会上,宇辰网记者注意到一家专注双目视觉技术的公司,触景无限科技(北京)有限公司(以下简称触景无限)。其带来的视觉卡系列产品不仅仅是软件或硬件的单一作用,而是融合了深度学习、3D感知、计算机视觉、SLAM、多传感器融合等技术于一体的嵌入式智能感知模组。

无人机避障已不是新鲜事

2016年,随着昊翔Yuneec Typhoon H使用Intel的Real Sense技术在CES上亮相,紧接着大疆发布了采用双目测距法避障的拳头产品精灵4,“避障”遂成2016年的无人机关键词。

避障示意图/图 来源网络

避障技术的出现不是偶然,智能硬件产品的“智能”之处即在于感知周围环境,经过快速运算做出决策。双目视觉技术就是模拟人眼,日常信息有80%以上是通过视觉获取得,视觉不仅仅是识别或分类,还包括颜色、光照、形状、移动、距离等细节的感知,当人眼第一时间接触到物体的前150毫秒内,人类的这五个神经系统就会同时作用,但作为模仿者,人工智能是否能做到感知同步,对摄像机等其他传感器收集到的数据进行实时反馈与处理呢?

计算机视觉是机器认知世界的基础,机器视觉不同于简单的图像识别,这需要强大的运算能力。和人类比一下就会发现,人之所以看到物体,是因为光线通过人眼抵达大脑皮层的视觉神经部分,大脑才知道人看见的物体。因此,机器视觉对外界信息进行处理并作出反馈执行,计算机视觉也是“看”与“思考”缺一不可。

到底什么是双目立体视觉呢?触景无限副总裁常清璞解释,所谓双目立体视觉,是利用两个视觉的图像传感器,固定之间的距离,测量物体与传感器之间的夹角,将物体与根据三角测距定理,已知两传感器之间的距离和物体与两传感器之间的夹角,能够计算出物体与无人机之间的距离。

双目立体视觉示意图/图 来源网络

简单来说双目视觉就是利用两个摄像头仿制出人眼双目的效果,通过相关算法在计算机中描绘出大脑处理后的画面。我们能够通过这个技术,得到与所测目标之间的距离,得到目标的三维信息。

在常清璞看来,对运动物体(包括动物和人体形体)测量中,双目立体视觉系统是计算机视觉的关键技术之一,获取空间三维场景的距离信息也是计算机视觉研究中最基础的内容,而这些基础技术应用非常广泛。

触景无限的第一代产品V102是安防摄像头专用,移除了不需要的运动惯性等相关传感器,主要体现视觉部分。安防行业视频监控普遍采用的是前端视频采集—后台存储—智能分析—后台存储的复杂回路,而触景无限视觉卡要解决的正是前端视频采集+智能化分析—后台存储的“前端智能化”行业痛点。

利用“视觉卡”模组,摄像头厂商即可将产品升级智能化,同时节省甚至免去对服务器资源的调用,在终端层面即可实现进行人脸识别。当然,产品本身可以感知更复杂的环境参数,应用方向也不仅是安防摄像头,还包括机器人、无人机、AR眼镜等等。据悉,视觉卡的嵌入式特性不仅能满足大多数安防监控对硬件的需求,还提供世界领先的算法支持。

而二代产品则采用了英特尔Movidius系列芯片,其特征是尽管架构个性化较强,为开发本身加强了难度,但拥有更好的功耗控制,更适合对续航要求较高的,例如无人机设备来使用。

感知不应该只有一种方式,多手段结合是趋势

常清璞是学习图像处理的,他在团队里主要负责硬件平台的研发,从1991年参加工作后,就进入到图像处理领域,到目前为止已经有二十多年的经验。在加入触景无限之前,他曾就职于某知名单片机供应商。

常清璞介绍,为了使产品更加适配无人机产品,他们对视觉卡做了不少改进,触景视觉卡从V1系列到V2系列,体积缩小了10倍,功耗从15W降低到了2W,运算能力从300G提高到1TFLPS。

双目立体视觉模块/图 来源宇辰网

以双目立体视觉技术为主的视觉卡V203,基于英特尔-Movidius公司芯片研发,不仅体积小(平方厘米,相当于1元硬币)、速度快(处理速度达到20FPS)、抗环境光干扰(环境光照10-10000流明),并且多向运动(3个方向双目6个摄像头)、图像全局快门不变形,避障范围达到0.8-15米。搭载两个支持多向运动的视觉卡V203,就能基本实现五向避障。

另外,与其他深度感知技术(如结构光、TOF)相比,不受光照、复杂背景等环境因素影响。

触景无限在展会上也展出了其TOF模块。TOF 是Time of flight的简写,直译为飞行时间的意思。所谓飞行时间法3D成像,是通过给目标连续发送光脉冲,然后用传感器接收从物体返回的光,通过探测光脉冲的飞行(往返)时间来得到目标物距离。这种方式更精准,但价格比较昂贵。

触景无限展出的TOF模块效果/图 来源宇辰网

红外或激光测距是目前应用最为广泛的无人机探测技术,但是由于它在逆光时会受到强太阳光的干扰,用于自动避障的功能并不是很合适;而双目视觉技术则不会收到太大的外界干扰,因此虽然该技术的难度较高,但是已经开始逐渐应用到无人机避障技术中来。

宇辰网记者就双目立体视觉和TOF之间的优劣进行了比较,常清璞表示,双目立体视觉技术与TOF的应用常场景不一样,前者在室内室外都可以使用,TOF则更多的应用于室内,在室外如果受到强烈光线的干扰,会影响其效果。总的来说TOF的感知距离较双目立体视觉稍微近一些,大概5米左右,但精度比双目立体视觉要高一些。

常清璞认为,要想达到较好的避障效果,最好是把多种感知避障方式结合起来,TOF与双目立体视觉甚至再加上超声避障。

目前植保无人机大多配备了避障模块,但在实际作业中,避障在复杂环境下的表现不尽如人意,对于细小如电线的物体,并不能完全准确识别。那现在触景的视觉卡能识别出电线粗细的障碍物吗?

常清璞如实回答,也不太准确。宇辰网记者拿笔试验了一下,在距离视觉卡摄像头1.4米的位置,基本能识别该障碍物,但更远就略显吃力。

目前,无人机避障的实现是通过将探测所得结果数据导入到自身避障模块,经过计算机的运算,得出避障飞行的指令。在避障模块相同的情况下,得到的信息多寡就对避障效果起到了决定性的影响。双目立体视觉测量方法具有效率高、精度合适、系统结构简单、成本低等优点,非常适合于制造现场的在线、非接触产品检测和质量控制。只有高精度的、易于处理的信息,才能在无人机避障上广泛应用。

前景广阔,应用场景丰富

从产品的发力点也可以看出,触景无限的市场主要放在了摄像头和无人机方向。目前已经有十几个安防摄像头厂商在与其展开合作,其中不乏这一领域的上市公司。无人机方面,适配度更高的二代产品正式推出时间是3月中旬,目前在于几家无人机公司商讨合作。

未来,嵌入式智能感知产品的发展趋势,必然向着小型化、低功耗、强运算能力发展。未来的V3系列会更小功耗更低。此外,深度学习在嵌入式视觉感知中同样存在模型参数大、实时要求高、运算能力弱等挑战,触景则针对不同行业提供可定制化的版本,从而使得多传感器的数据融合达到最佳。

常清璞表示,“无视觉”给机器造成的困扰数不胜数:无人机撞上楼宇、树木等障碍物;扫地机器人反复清扫同一片区域,并撞坏新买的沙发、床脚……一旦机器拥有了视觉感知,就能更好地理解人类,并提供相应的支持,推动人工智能从弱AI向强AI迈进一大步。

常清璞认为,视觉感知在未来将会发挥更大的作用,也能应用于更广阔的领域。比如,未来视觉卡可用于盲人辅具,帮助盲人“看见”和“理解”身边的环境与事物,有人或物体朝他运动的时候,他能及时作出避让反应;另外,还可以用于家庭安防监控,准确识别来者为主人还是窃贼,并作出报警等行为,这对于独居的老人或单独在家的儿童起到保护作用;用于工业巡检或仓储机器人,规划巡检路线,实时跟踪定位、自动避障等。

触景无限要做的不仅是在产品层面的创新,更是要引领人工智能的发展方向。据悉,以“感知”为重要特点的视觉卡,集软件算法、嵌入式芯片与双目摄像头等硬件于一体,能实现四大智能感知:一、能在复杂背景中和高动态光照条件下完成对目标图像的提取;二、识别和分类;三、实时感知摄像头、目标物体、周边环境的空间关系;四、分析与理解实际的场景,以完成智能设备特定的功能。

 

来源:搜狐科技、宇辰网