深度3D视觉AI技术将开启扫地机人机交互新时代
3D视觉感知火热,应用迎来「超级周期」
得益于摩尔定律的演进发展,图像处理器芯片技术不断精进,推动了3D成像技术逐渐走向成熟期,越来越多的研究界利用更丰富维度的3D数据解决计算机视觉领域问题,3D视觉作为智能机器人的“眼睛”,将真正使机器人智能化成为现实,迎来人工智能领域的新热点、新风口。就消费级市场来说,3D视觉近距离可作人脸识别,典型的应用于苹果的最新iPhone 11 系列的Face ID上,远距离可辅助汽车作自动驾驶,比如特斯拉的无人驾驶系统Autopilot。伴随人口结构老龄化、中产阶层扩大,懒人经济兴起,消费升级驱动,智能家居产品呈现爆发式增长,扫地机器人经历了多年的市场试炼,可以预测,3D视觉会在这个蕴含百亿万美金的“消费级市场”爆发出无数应用领域和商业机会。
扫地机器人渗透率稳步提升,技术亟待升级
全球著名市场研究公司IDC发布的《IDC中国智能家居设备市场季度跟踪报告》指出,2019年,全球智能家居设备市场的出货量预计将同比增长26.9%,达到8.327亿。另据德国GFK统计表明,中国沿海地区的家务机器人渗透率为4%-5%,内陆地区只有0.4%左右,与目前家用吸尘器30%-40%的渗透率相比,未来增长空间广阔。
不过在这样的爆发式增长之下,扫地机器人面临竞争激烈,价格战,产品同质化严重等问题,众多玩家通过低端产品打入市场,但实际清扫中,存在无规划清扫、清扫死角、缠绕电线、毛发,破坏家具等问题,导致体验不佳,从未来消费者需求来看,对扫地机器人的要求会越来越严苛,需要更智能,这也就进一步要求业内厂商开始用更多智能化技术来给扫地机赋能。
图 iRobot 扫地机器人
扫地机器人的技术主要分为扫地拖地、避障、建图、人机交互四项。
•扫地拖地通过传统基件结构来实现,目前部分产品只具备扫地的功能,但一些同时具备扫地和拖地的扫拖一体机也开始逐渐出现在市场中。
•避障则需要扫地机器人对所处环境进行主动认知,避开家具、电线甚至宠物粪便等障碍,技术方面已经从传统的超声避障、红外线避障发展到通过深度学习完成的2D避障、3D避障。
•建图则经历了从随机打扫、惯性导航、激光导航、单目视觉导航、双目建图导航多个阶段,让扫地机器人逐渐学会在清扫过程中构建环境地图,知道哪些地方可以通过,哪些地方有障碍阻挡,墙和门又在哪里。
•人机交互则是通过语音、视觉、手势等方式实现对扫地机器人的指令。
这其中的关键核心技术部分:避障和建图,也就是就是我们常说的 SLAM(Simultaneous Localization And Mapping): 即时定位与地图构建,指的是机器人在自身位置不确定的条件下,在完全未知环境中创建地图,同时利用地图进行自主定位和导航。也就是说,扫地机器人需要在未知环境中从一个未知的位置开始移动,在移动过程中根据位置估计和传感器数据进行自身定位,同时建造增量式地图。
图 SLAM 技术最早应用于太空航天
我们目前常见的扫地机器人多采用激光 SLAM,部分高端线产品采用激光 SLAM 和单目视觉 SLAM 融合的方式。激光 SLAM在实际清扫过程中容易受到环境,实时动态变化的影响,影响整体地图的规划,也就是我们在生活中遇到的扫地机器人出现的盲扫、反复清扫、漏扫的情况,单目视觉技术主要通过加入可见光摄像头进行辅助定位,使扫地机器人移动过程中可以对图像进行连续跟踪,进行相机姿态和物体之间相对位置变化的估算,但单个摄像头进行估算时,缺少深度信息,容易存在误差,在建图、路径规划和导航以及避障能力上较弱。无论是激光 SLAM 还是单目 SLAM,在避障时主要是通过接触式的碰撞来实现,很容易卡在沙发底下,碰坏家具,对于有孩子的家庭来说更存在安全隐患。
国内市场占有率第一的扫地机器人企业科沃斯相关负责人表示,从行业角度来看,扫地机器人肯定会从2D导航向3D导航发展,一个好的产品在扫地拖地、避障、建图、人机交互四个维度上都要向前走,需要不断做技术沉淀来将每个纬度做到最好,这对扫地机器人提出了更高的三维视觉感知要求。
在扫地机器人领域,双目视觉属性在3D避障方面有着天然的优势
市面上三维视觉感知的方案主要有三种:单目结构光(如PrimeSense的Kinect一代),双目可见光(如LeapMotion)和飞行时间法(ToF,如微软的Kinect二代)。对于扫地机这种消费级产品来说,BOM成本是关键,ToF相对来说成本偏高,结构光更适合近距离的应用场景。双目视觉通过三角测量原理使用两个摄像头来对目标点的三维空间位置进行定位,双目视觉传感器在成本优势明显的同时,可以捕获更为丰富的环境信息,同时用于感知,这让基于视觉的SLAM在未来有了更广阔的想象空间,高效实现3D避障,不破坏家具和伤及小孩,在完成三维建图后,可以完成更完整的 SLAM 功能,从而实现断点续扫,归位充电等功能,结合vSLAM算法可以做深度学习/识别,在精准避障的同时,还能够实现障碍物的识别,对于接入智能音箱的扫地机器人,用户还可以通过语音交互控制其功能。
想象一下,扫地机器人拥有了视觉认知能力后,它可能可以看到你的宠物留下的「爱你的痕迹」,并在你的语音交互指令下第一时间进行清理?
如此一来,3D避障和深度学习两者的结合将大幅降低避障的误判率和错判率,显著提升用户扫地机的使用体验。可以预见,双目视觉方案将会逐渐成为扫地机器人主流导航定位方案,据知情人士透露,国内已有多家扫地机方案商及厂商正在布局,笔者通过企查查专利搜索到一家名为小觅智能的公司近日公布了多项关于双目视觉扫地机器人的专利,包括障碍物检测及避障方法,另据公开资料显示,小觅智能是旷视物流机器人的双目视觉提供商,可见扫地机领域已经进入了双目3D传感器头部企业的视野。笔者大胆设想一下,一款扫地机器人从原型到量产销售一般需要16-20个月,如今有了小觅智能等相关企业的入局和量产经验加持,用双目“看世界”的扫地机器人很有可能在2020末至2021年初进入大众的视野,让我们拭目以待。
3D导航+AI技术+人机交互,开启全新扫地机器验
科沃斯在2019半年报提到:基于机器视觉的新一代传感模组、SLAM算法和人工智能应用将在不远的将来取代现有基于LDS和VSLAM的传统2D服务机器人定位导航和规划技术,带领家用服务机器人产品在智能、交互、数据、互联等方面跃上一个新的台阶,不仅提高现有扫地机器人产品的性能表现,同时扩展全新的基于数据和服务的功能,带给用户更高的价值。
如果说 3D 将改变传统的 2D 平面世界认知方式,让机器建立起对现实世界全面深刻的三维信息感知和理解能力,那么 「3D + AI + 人机交互」,将前所未有地改变我们使用扫地机器人的体验,未来的扫地机器人应该是这样的:它不仅能看的更远、更立体,更精准,同时,它具备自我学习能力,不断优化自身性能,还将联动其他智能家居成为智能家居网络,重新定义家庭场景,通过感知环境、持续学习和人机交互,从本质上提升用户智慧家庭体验。