公众号:钛氪星云
翻译:郝敏
人类的智慧在很大程度上依赖于从其他人那里获取知识--这些知识是随着时间的推移而积累起来的,是我们文化进化的一部分。
这种类型的社会学习在文献中被称为文化传播,它使我们能够实时模仿动作和行为。
但是,人工智能也能以同样的方式发展社会学习技能吗?
长期以来,模仿学习一直是人工智能的一种训练方法,它指示算法观察人类完成任务,然后尝试模仿。
但通常情况下,人工智能工具需要多个例子和大量数据才能成功模仿训练者。
现在,DeepMind 研究人员的一项突破性研究声称,人工智能代理也可以实时展示社交学习技能,"不使用任何预先收集的人类数据",在新颖的情境中模仿人类。
这一突破可在人工智能的发展中 "发挥算法作用。
具体来说,该团队重点研究了一种特殊的文化传播形式,即所谓的观察学习或(少量)模仿,指的是对肢体动作的模仿。
DeepMind在一个名为GoalCycle3D的模拟环境中进行了实验,这是一个虚拟世界,其中有不平坦的地形、人行道和障碍物,人工智能代理必须在其中穿行。
为了帮助人工智能学习,研究人员使用了强化学习技术。
对于那些不熟悉巴甫洛夫在这一领域工作的人来说,这种方法的基础是为每一个促进学习和达到预期结果的行为提供奖励--在本例中,就是找到正确的路线。
在下一阶段,研究小组添加了专家代理(硬编码或人为控制),这些代理已经知道如何在模拟环境中运行。
人工智能代理很快就明白,到达目的地的最佳方式就是向专家学习。
研究人员的观察有两个方面。首先,他们发现人工智能不仅在模仿专家时学习得更快,而且还能将学到的知识应用于其他虚拟路径。
其次,DeepMind 发现,即使在专家不在场的情况下,人工智能代理仍然可以使用它们的新技能。
虽然作者指出还需要更多的研究,但他们相信,他们的方法可以为 "文化进化在人工通用智能发展中发挥算法作用 "铺平道路。
他们还期待着人工智能和文化进化心理学领域进一步开展跨学科合作。
尽管还处于早期阶段,DeepMind 的突破可能会对人工智能行业产生重大影响。
这种进步有可能减少传统的、资源密集型的算法训练,同时提高算法解决问题的能力。
它还提出了一个问题:人工智能能否学会获取人类思维中的社会和文化元素。
研究报告全文发表在《自然-通讯》(Nature Communications)杂志上。
公众号:钛氪星云
钛氪星云是一家专注科技创业、创新、创投媒体和企业服务的科技公司,关注新能源、人工智能、元宇宙、新材料、生物医药、半导体等行业动态,研究行业发展规律,为创业、创投、创新的落地应用与成长赋能,关注创业团队成长与发展。
29篇原创内容
© THE END
转载请联系本公众号获得授权,侵删
投稿或寻求报道:anna_haosky@163.com
评论留言