一、摘要
简要介绍facebook关于“涌现”的最新文章。
二、涌现
两个月前听说谷歌在研究涌现,并没有放在心上,也不知道这究竟是什么,直到前两天看到facebook的这个论文《Emergence of Compositional Language with Deep Generational Transmission》。
简单来说,涌现是机器人和机器人之间进行信息传递的文化基础,今天时间不够,把文章的简单翻译放在下面。
语言的文化传播发生在一组代理人将他们的语言传递给另一组代理人时,例如教孩子说话的父母。
在许多使人类语言独特的设计特征中,文化传播是非常重要的,因为它允许语言本身通过文化进化随着时间而改变[2-4]。
这有助于解释像英语这样的现代语言是如何从一些原始语言(一种“几乎是语言”的前身,缺乏现代语言的功能)演变而来的。
构成是语言的一个重要结构,语言学家和机器学习研究者对此都很感兴趣,进化语言学家通过文化传播来解释[5]。
在这部作品中,构成语言是一种通过结合更简单的元素来表达概念的语言,每个元素都有自己的含义。
这种结构帮助人类语言能够使用有限的元素表达无限多个概念,并以明显正确的方式进行概括,尽管缺乏训练实例[6]。
例如,理解蓝色正方形和紫色三角形的agent也应该理解紫色正方形,而不是直接体验它;我们用这种泛化来衡量构成。
现有的工作已经调查了在简单环境中,神经代理之间产生合成语言的条件[7],但它只研究语言如何在一代人的时间内发生变化。
模拟文化传播,迭代学习模型[7]通过模拟实验[8]和人体实验[9]发现,代际动态导致合成语言的出现。
在这个模型中,语言直接而不完全地传递(传授)给上一代的代理。
因为学习是不完整的和有偏见的,学生的语言可能不同于教师的语言。
有了正确的学习和传播机制,一种非组合语言经过许多代人就会变成组合语言。
这是表达性和可压缩性之间的权衡,语言必须具有足够的表达能力来区分所有可能的含义(例如,对象)和足够的可压缩性来学习[10]。
这个解释是如此的突出,以至于当最近发现其他因素可以造成足够的压缩压力,使构成语言在没有世代传递的情况下出现时,多少有些令人惊讶[11]。
在人工智能领域,涌现工作旨在影响构建智能代理的努力,这些智能代理可以相互沟通,尤其是使用语言与人类沟通。
在完全监督的范围内,agent已经在以下场景下被训练来模拟人类的话语:
机器翻译
图像字幕
视觉问题回答
视觉对话
除了需要大量的数据,这些系统还不能很好地概括我们想要的,而且很难评估,因为自然语言是开放的,有很强的先验,模糊了真正的理解。
其他方法使用较少的监督,将多个代理放置在精心设计的环境中,并为它们提供需要通信的目标。
如果环境中的一些代理已经知道像英语这样的语言,那么其他代理就可以间接地学习这种语言。
但即使这样也很昂贵,因为它需要一些已经知道一种语言的代理。
另一方面,与我们最为相关的一些研究发现,语言的出现将使以沟通为中心的任务得以解决,而无需直接或甚至间接的语言监督。
与训练代理人学习现有语言的体制不同,在这种环境中出现的语言对人类来说未必容易理解。
即使尝试将这些出现的语言翻译给其他代理也不是完全成功的,这可能是因为目标语言不能表达与源语言相同的概念。
这种对结构的渴望激发了前面提到的关于神经代理中合成语言出现的研究。
在这篇论文中,我们研究了以下问题——是什么条件导致了构成语言的出现?我们的关键发现是有证据表明,文化传播在深层强化学习主体中导致更多的构成语言,就像在进化语言学中一样。
我们研究的出发点是Kottur等人最近的工作[12],他们使用两个agent之间的合作参考博弈来研究构成。
在整个培训过程中,我们不使用相同的代理集,而是定期替换(重新初始化)其中的一些子集。
由此产生的知识差距使新代理更容易向旧代理学习,而不是创建一种新语言。
通过这种方式,我们的方法引入了文化传播,从而产生了压缩压力,从而产生了组合性。
我们的方法与其他应用于深度学习的进化方法的一个区别是我们模仿文化进化而不是生物进化。
在生物进化过程中,agent一代又一代的变化,而在文化进化过程中,agent本身也在进化,所以同一agent可以在不同的时间拥有不同的语言。
代理人可以在其一生中直接受益于进化创新,而不是仅仅在开始阶段。
我们的方法也不同于迭代学习,因为我们的文化传播版本是隐式的,而不是显式的。
语言只有在有助于实现这一目标的程度上才能共享,而不是由老师确切地告诉学生如何指代这个世界。
四、参考文献
[1] Cogswell, M., Lu, J., Lee, S., Parikh, D., & Batra, D. (2019). Emergence of Compositional Language with Deep Generational Transmission. ArXiv:1904.09067 [Cs, Stat]. Retrieved from http://arxiv.org/abs/1904.09067
[2] Tomasello, Michael. The cultural origins of human cognition. Harvard university press, 1999.
[3] Christiansen, Morten H. and Kirby, Simon. Language evolution: consensus and controversies. Trends in cognitive sciences, 7 7:300–307, 2003b.
[4] Christiansen, Morten H and Kirby, Simon. Language evolution. OUP Oxford, 2003a.
[5] Kirby, Simon, Griffiths, Tom, and Smith, Kenny. Iterated learning and the evolution of language. Current Opinion in Neurobiology, 28:108–114, 2014.
[6] Lake, Brenden M. and Baroni, Marco. Generalization without systematicity: On the compositional skills of sequence-to-sequence recurrent networks. In ICML, 2018.
[7] Mordatch, Igor and Abbeel, Pieter. Emergence of grounded compositional language in multi-agent populations. In AAAI, 2018.
[8] Kirby, Simon. Spontaneous evolution of linguistic structurean iterated learning model of the emergence of regularity and irregularity. IEEE Trans. Evolutionary Computation, 5:102–110, 2001.
[9] Kirby, Simon. Natural language from artificial life. In Artificial Life, 2002.
[10] Kirby, Simon, Tamariz, Monica, Cornish, Hannah, and Smith, Kenny. Compression and communication in the cultural evolution of linguistic structure. Cognition, 141: 87–102, 2015.
[11] Raviv, Limor, Meyer, Antje, and Lev-Ari, Shiri. Compositional structure can emerge without generational transmission. Cognition, 182:151–164, 2018.
[12] Kottur, Satwik, Moura, Jose M. F., Lee, Stefan, and Batra, Dhruv. Natural language does not emerge ’naturally’ in multi-agent dialog. In EMNLP, 2017.