从场景依赖到强化学习 专家支招如何让服务机器人“更聪明”

文章出处:化粪池       发表时间: 2024-08-18 11:15:02

  人工智能技术的突破、核心零部件成本的下降,加速了服务机器人在各领域的渗透。近五年,中国服务机器人行业增速高于全球平均增速,市场规模占全球比例超,同时在产业链、产业环境等方面都具备全球竞争优势,在疫情催化之下以及数年的持续快速地增长基础上,中国服务机器人产业未来仍将迅速扩张且潜力巨大。

  但专家们也普遍表示,目前的服务机器人在智能化水平、尤其是自主交互方面还相当于婴幼儿,这既是机器人产业化的障碍,也是未来应该主要发力的地方。

  王田苗例举了未来机器人和人工智能可能集中落地的场景:如客户服务,机器人代理等直接应用的场景,养老、手术机器人、智能假肢等医疗健康领域,安防、消防、环保等智慧城市领域,以及物流、无人驾驶、金融科技等等,“大量应用AI的机器人将支撑高效丰富的物质生产和生产要素的重构。在这种背景下,我们再来讨论AI和机器人未来发展的格局是什么。”

  王田苗表示,在传统领域,对质量发展要求比较高、速度比较快的机器人基本被西方把持,但在非标和新兴领域,中国是绝对有发展机会的。

  “机器人最大的优点是可以做一些重复性、危险性的或者人类厌恶的工作,比如安防工作,人不愿意在晚上巡逻或者值班,这些工作和岗位就是服务机器人去替代的一个部分。所以不能说服务机器人是完全来跟人类竞争的,更多的是对人类工作的补强、增强。”韩子天说。据他介绍,服务机器人是应用于服务领域的,针对不同的服务内容或者根据不同的岗位研发出的由机器人替代或补全某个岗位的工作。

  在王田苗看来,服务机器人能替代的工作标准在于“环境是固定的,作业流程可以标准化,同时又比较繁重、单调、枯燥”;而在幼儿教育和护理、老人的护理等方面,服务机器人还“爱莫能助”。

  但是,目前服务机器人的智能水平距理想状况还相去甚远,“大家听说过很多人工智能的理论,但是很少听AI和机器人的结合,这是怎么回事?”荷兰代尔夫特理工大学副教授Jens Kober开门见山地提出问题。在他看来,机器人利用人工智能能做的事情,主要与认知和高级推理有关,但是,实际的运动和与环境的交互还要进一步发展。

  韩子天同样表示,机器人目前并没有思想,也没有自主意识,它所有的行为还仅限于一种智能设备,由人类定义。它能够直接进行视觉感知、语音感知等,借此进行很好的交互。但是归根结底,目前的机器人没有自主思想,也没有很好的方法进行很好的自主行为,没有思想和知识体系,不能和人类很好地交互。

  “服务机器人就像刚出生的婴儿,在很多新的技术比如视觉技术、语言技术发展很成熟的时候,才会有比较好的服务机器人。”韩子天说,这几年服务机器人的发展有一个趋势:通用的服务机器人目前是很难做到的。

  “所以,服务机器人的发展,到目前为止,主要是场景依赖。这和工业机器人很像,工业机器人在生产流程定义清楚的情况下才能用,服务机器人是相同,也要把它的服务场景定义清楚,做一个工作规划,投入工作的场景里面去使用。”韩子天说。

  他强调,这就是服务机器人的“场景依赖”。在场景依赖下,人把场景定义清楚,把机器人的行为定义清楚,才能做比较有用的服务机器人。

  旷视科技副总裁王银学举了AI堆垛机的例子:“立体仓库里,货码得再整齐,也不可避免会掉下来,往往会把货压碎。而通过在堆垛机上装一个摄像头,摄像头不仅仅能把它拍下来,能够判断有货物掉下来,还能够最终靠运行轨迹反算出是从啥地方掉下来的。在有货掉下来的时候,马上拍照片上传,同时给设备一个指令,让它停下来,不至于把东西压坏。”立体仓库当中的无人区里有消防喷头,消防喷头的玻璃泡破裂的温度是68度,一旦着火,温度超过68度就会喷水,而发生火灾往往是电器的原因,电器电缆已经有温升了,因此,堆垛机上不仅装了摄像头,还装了远红外探测,随时巡逻,如果局部温升超过某些特定的程度就会报警,提前预防。此类固定场景、固定模式的AI机器应用,效果立竿见影。

  “机器人更重要的跟智能设备区分的是它有行为,甚至希望它有自主行为。”韩子天表示,“我们讲场景依赖,比如养老的场景、车载场景,或者说医疗场景、安防场景等等,这些场景相当于机器人服务的边界,更重要的是它在这个服务边界里面有什么行为。”

  “过往的很多设计里面,机器人都是很被动的,用语音问询机器人一些情况,或者问机器人一些特定场景的问答,机器人有问有答。现在机器人社交方面的功能也慢慢变得多,有一些搜索场景比如养老院,或者儿童机器人,主动交互成为一种新的热点。”Jens Kober介绍说,所谓主动交互,是希望机器人该讲话就讲话,该不讲话就不讲话,做“一个懂你的机器人”,主动交互的设计因此成为一个很重要的内容。

  “机器人是拟人化的设备,它的社交性、搜索属性很重要,机器人跟机器人之间是不需要语音的,但是跟人的交互是需要语音的,语音的交互或者说行为的主动交互,它的边界在哪里,它的适度在哪里,都是近几年在业界比较关注的。”Jens Kober表示。

  而难点也在于此。“是什么导致机器人很难学习任务?很大一部分原因主要在于复杂的动力学,机器人如何与周围的环境交互。物体、环境和任务中会出现很多不确定性和变化,若机器人要与人类交互,情况可能会更糟。”Jens Kober说。

  那么机器人怎么学会新技巧、新的运动方式呢?Jens Kober表示,通常来说,有两种不同但互补的方式。第一种是模仿学习,即老师示范一项技巧,然后学生试着模仿,这样的形式适用于简单的学习,但对于更复杂的任务,机器人也需要学习,也就是强化学习,人类学习中有这样的经验,学习过程中师生持续互动,老师不仅提供最初的示范和指导,也提供额外的示范和其它反馈,但是,这是目前机器学习中缺少的一个方面。Jens Kober强调,强化学习能让我们加快学习过程,从而能完成更复杂的任务,对人类来说,通过这一种方式进行教学也相当直观。这也是未来机器人加强学习和交互能力的可行路径。



相关文章