首发于超智能体
学习观14:26亿年前灭了所有地球生命的家伙告诉你什么是学习

学习观14:26亿年前灭了所有地球生命的家伙告诉你什么是学习

前言

学习观前13期都有理论支持,而该期属于假说。

但不要认为假说就是假的,假说只是没有验证的内容。

因为历史更多是已发生的事实(信息),无法用实验验证,只能靠证据+知识推理,所以缺少证据的很多历史内容永远都会是假说。

单纯的相信或不相信该期视频的内容就太小孩子了。

重要的是批判的看待,自己去调查。感兴趣的请务必自己查阅相关资料,你将会发现里面有非常丰富的故事:

  • LUCA原型
  • RNA世界
  • 大氧化事件
  • 雪球地球
  • 寒武爆发
  • 有性生殖
  • 神经网

上面任何一个都用一本书来讨论。但视频涉及的假说都是当前最被接受的假说,只不过是从机器学习视角下对这些最被接受的假说进行分析,确实也能推出相同结论。

参考资料

目录

  • RNA世界假说
  • 演化之矢
  • 反馈循环
  • 两难困境
  • 一线曙光
  • 第二套学习系统

视频

寒武爆发https://www.zhihu.com/video/1085935588019982336

正文

本期涉及众多学界难题,仅为信息角度的假说

上期视频提到的“全知便可永恒”并不是忽略物理减熵,而是由于热力学熵和信息熵二者可相互转换。 这也是为什么软件等“虚拟经济”可以创造价值,因为允许我们生存(减熵)的不是能量,而是能量的转移(做功),所以可制造能量差的信息就能够创造价值(负熵)。


一、RNA世界假说

虽然上期视频从信息减熵的角度重新理解了生命演化,但有一个问题:

蛋白质的功能需要 DNA 代码来控制,而 DNA 代码的复制又需要蛋白质来实现。 若两者都必不可少,那先有鸡还是先有蛋?

以人们猜测地球上现存所有生命的始祖可能是同时具有二者功能的 RNA 聚合体, 并给了它一个名字:LUCA(Last Universal Common Ancestor)

LUCA 应该是从能累积高浓度核苷酸的海底热泉喷发口处形成, 最初和病毒一样只会自我复制,而能量由喷发口所提供。 慢慢演化成由 DNA 存储模型,由蛋白质实现模型功能,且可独立获取能量的原核细菌和古细菌后,逃离喷发口。

但既然 LUCA 已经可以不断复制自我,又为什么会牺牲复制速度,转而向更复杂的 DNA + 蛋白质的形式演化呢?


二、演化之矢

环境的熵或许就可以告诉我们答案。

熵增定律表明了,若把整个宇宙视为一个孤立系统,熵会不断增大。 而生命靠减熵来维持状态,但代价却是不断增加环境的总熵。

比如我们收拾完房间后反而会排除更多的废物+热量。 若想在加速熵增的环境中继续维持状态,就要更强的减熵能力,也就无法原地踏步。

所以局部的生命演化可能没有方向,但若把所有生命整体视为一个复杂系统,它也会向不断增大智能的方向演化。

而增大智能的方式除了增强每个个体外,还有将若干个体组织成一个新个体的方式。 实现模型功能的最小单位是蛋白质,虽然单个蛋白质能实现的功能只相当于开关门那么简单, 但大量蛋白质有组织并行工作就有了质变(相变 phase transition),

由量变引起质变的现象就是:涌现 emergence。

涌现可以跃进式的增强智能,但涌现的形成是有条件的。 只有稳定的智能体之间有规则的相互作用才能形成更高层级的智能体。

类比:想象用砖块来筑墙,若每块砖都可随时变形,墙很容易坍塌,而没有规则的堆砌,墙也会坍塌。

DNA 的优势就在于它的稳定性。

若 RNA 上的代码受损,则会发生突变,虽然增加了个体的演化速度,但这种不稳定性却无法允许更高层级智能体的形成。 而 DNA 拥有两条链,即使单链受损也可用另一条来修复(编译出错时也有源代码来纠错),相对稳定的 DNA 允许了更高层级智能体的形成。 这也是为什么我们只发现低等病毒用 RNA 存储模型,而所有的高等生命都是用 DNA 来存储模型。


三、反馈循环

LUCA 的后代在很长一段时期内都是厌氧菌,因为当时大气成分的氧含量非常稀少。

但约在 26 亿年前,有一类叫做蓝绿菌的分支演化出了光合作用 Photosynthesis。 可用太阳能将二氧化碳和水转化成养料的同时排除氧气。

1.正反馈

这种等同于有无限能源的优势使得蓝绿菌的数量爆炸式增长,地球大气氧含量迅速增加,被地质学家称为大氧化事件 Great Oxygenation Event 。

这些额外的氧气不断消耗给地球保温的甲烷,发生了最严重且持续时间最长的一次冰河时期 (休伦冰期),而氧气对当时的生命属毒气,这使得地球上的生命包括蓝绿菌近乎全部灭绝。相当于被排泄物淹没致死。

可见若一个物种的个体可以永生,一旦演化出某个优势模型时,无限加速繁殖的个体会让环境也加速熵增,该物种反而会因为演化的减熵速度无法跟进环境的熵增速度而灭绝。

2.负反馈

这就需要某种平衡机制,在控制论中被叫做负反馈。

刚好在休伦冰期的 3 亿年后,部分幸存的细菌演化出了与光合作用反全相反的呼吸作用,彼此制约的双方最终将大气氧含量平衡到了 21% 左右。

随后某些好氧菌被大细菌整体吞噬后,形成内共生关系 endosymbiotic,变为了专门提供能量的线粒体。 而蓝绿菌被大细胞吞噬后变成了叶绿体。这些大细胞又慢慢演化成了真核细胞。

但在这之后的很长一段时间内,不知道为什么,生命几乎没什么变化,因此也被称为“无聊的十亿年”。


交配移动困境

一直到距今 5.4 亿年前的寒武纪,生命就像触发了某个按钮似的,在短时期内迅速演化,被称为寒武纪生命大爆发 Cambrian Explosion。

这让达尔文非常困惑,因为达尔文主张的演化是渐进式的,为什么会有大爆发现象。 然而从减熵的角度来看,维持生命的关键并非演化本身,而是演化所提供的信息。

演化是史上第一个允许生命构建模型来获取信息的机制,但却不是唯一的机制,寒武爆发的关键就在于第二套建模系统的完善。

1. 整体稳定困境:

在那无聊的十亿年中,虽然低等生物有涌现成高等生物的趋势,但却都遇到了一个瓶颈: 那就是随机突变的单细胞无法达到涌现成复杂多细胞生物所需要的稳定性。

高层级的差异性机制 需要一个能将多细胞生物作为整体来增加差异性的机制,而有性生殖刚好最满足这个特性。这也解释了为什么高等生物都采用有性生殖,同时抑制单个细胞变异, 并非仅仅为了增加演化的差异性,而是在稳定整体的基础上增加差异性。

2. 移动信息困境:

但是不能大范围移动的多细胞生物只能和相近的个体交配,会因无法提供足够的差异性导致演化速率过低而灭绝。

可当多细胞生物大范围移动后,环境也会随移动而改变,又会因之前演化出模型无法预测新环境的信息而死亡。

处于这种两难困境的低等生物始终无法形成更复杂的生命系统。


四、一线曙光

直到寒武纪之前的埃迪卡拉纪,演化出了神经细胞。

1.神经演化

众多神经细胞形成的神经网 nerve net 就可以配合演化机制 Neuro-evolution 加快学习环境模型的速率, 出现了不少如水母一样的刺胞动物 Cnidaria。

2.实时感官

而到了寒武纪初期,眼睛等高级感官系统相继产生,比如当时的顶级捕食者奇虾 Anomalocaris 就有一对很大的复眼,这使得实时观测信息成为了可能。

增加了实时感官能力的神经网络就允许个体在新环境中,学习用上一时刻信息(输入)来预测下一时刻信息(输出)的模型, 比如我们可以躲避车辆就是因为曾经看过上下时刻都发生了什么,可用神经网络构建出模型。

当再看车辆迎面而来(输入信息)时便可及时预测车辆下一时刻的位置(输出信息)进而躲避。

3.反馈循环

这种实时预测信息的能力也让捕食者与被捕食者之间形成了更激烈的军备竞赛关系, 比如没有演化出眼睛的被捕食者就靠甲壳和伪装来增加存活率,而这就让捕食者演化出了更坚硬的利牙与更高分辨率的眼睛。 但不管任何一方都会受到制约。靠太阳获能的细菌会被其他小生物吃掉,小生物又会被大生物吃掉, 而到了食物链顶端的捕食者又会因为吃光小生物而饿死。

这种制约关系抑制了某优势物种过分加快环境变化导致像当初大氧化一样的生物灭绝事件。 不过支持这种高强度军备竞赛的恰好是当初大氧化生物灭绝事件所带来的氧气。

4.新层级演化

而这一切都是由于第二套建模系统的不断完善(至少经历了两个阶段),个体才能更容易在被危险杀死之前找到配偶,解决了多细胞生物大范围移动后的信息问题,生命才能以高级形式继续演化。

五、第二套建模系统

以上仅是从减熵的角度对寒武爆发的猜测,我们无法知道当时究竟发生了什么。 但可以体会到,学习能力来的并不容易。从演化这个第一套学习系统开始至少经历了 20 亿年的不断试错才出现了神经网络这个第二套学习系统。

而神经网络在此之后依然不断完善,如今已经发展成人类大脑,可以允许我们在个体生命周期内学习知识来预测信息。 近几年非常火的人工智能也正是受神经网络的启发,用深度学习算法使语音、图像等识别达到了人类水平。

这也给人类的未来工作带来了巨大的挑战,因为知识是我们获得信息的源泉。 计算机已经可以根据信息来归纳知识,但很多人却还像计算机一样去记忆信息,天真的认为人脑的容量是无限的。

不过讽刺的是,我们教会了计算机如何学习,却从来没有教过学生如何使用演化出的大脑。

下期视频我们将深入到细胞层级来探究生物神经网络究竟是如何允许个体学习的,以及人工神经网络和它有什么关系。 随后你将明白为什么人脑的记忆需要不断重复,而好不容易记住后却又为什么会遗忘。


视频下载

公号回复:学习观14

预告

《学习观》08:既然人类无法感知真实,又为什么要努力学习科学

《学习观》09:以为只有你会用食物诱骗小猫,网上这些招数一直在把你当小猫诱骗和洗脑

《学习观》12:理论上人类可以永生,那导致现实死亡的原因是?

《学习观》13:为什么知识不是信息,学习不是记忆

编辑于 2019-03-06 10:53