据美国全国广播公司新闻网NBC News 12月7日报道,美国加州大学伯克利分校机器人学习实验室的研究小组研发出一款名为达尔文(Darwin)的机器人,该机器人的一举一动都由数个拟神经系统的网络控制着。通过使用增强学习技术,达尔文能够模仿人类儿童大脑的学习方式对不同情况作出不一样的反应。
据报道,在加大伯克利分校的实验室中,达尔文像蹒跚学步的儿童一样,摇摇晃晃,不断跌倒,又不断爬起,直到可以走得平稳。这来源于研究人员用于达尔文的增强学习技术,通过这种技术,达尔文的神经网络能够像人类儿童的大脑一样运转试错过程。 “想象一下学一项新技能,比如学骑自行车,一开始你会一直摔倒,但经过一些练习,你就能慢慢掌握窍门。”,机器人研究小组成员约翰•舒曼(John Schulman)如是说。 机器人在平坦的地面行走没有任何问题,但当任一变量(如台阶或斜坡)出现时,它们就不知如何应对了。在今年的DARPA机器人挑战赛中,一些最顶尖的机器人要通过模拟真实世界灾难场景的障碍物,然而几乎所有参与挑战的机器人都没能成功。 为了能使机器人在复杂的环境中灵活应变,加大伯克利分校的研究小组在达尔文上使用了通用型神经网络,这些网络实际上就是模仿人类大脑进行学习的算法。研究小组的另一位科学家塞吉•莱文(Sergey Levine)说道:“这些算法中几乎没有具体动作的算法指令。实际上,这些算法从一开始就被设计成通用型的,它们不是具体的单一的走、握或洗碗动作,而是能适用于所有这些动作的算法。” 同时,如果机器人能够自我学习,那么它运行所需的硬件控制的人力投入就会减少,这样就可以降低机器人的制造成本。 加州大学伯克利分校的科学家们希望能将拥有完全自主意识的机器人变成现实,使机器人能够灵活地执行很多只有人类才能执行的任务。赫伯特说,现在的机器人在很多情况下依然需要远程控制,例如在精确度要求非常高的任务执行中。但最近的研究显示机器人研发正从预先编程向不断提高机器人的个例归纳能力转变。 达尔文研发小组的负责人彼得•阿布比尔(Pieter Abbeel)教授表示要将这种转变从模拟实验转为实际应用还要做大量工作,但它将对机器人研究产生重大影响。舒曼认为:“这有可能使《星球大战》中的人形机器人C-3PO变成现实。”
|