话说那是2月20日,美国《科学日报》有篇文章,叫《科学家揭示人类语言为何不同于计算机代码》。咱们平时说话跟电脑用0和1代码比起来,确实显得乱点,效率好像也差点。不过脑子好像更偏爱这种方式。 德国语言学家迈克尔·哈恩,还有美国加州大学欧文分校的理查德·富特雷尔,他们俩一起弄了个模型,专门解释人咋就这么说话。现在全世界大约还有7000种语言在使,有些就几个人会说,像汉语、英语这些更是好多亿人在用。咱们就是把词凑成短语,再串成句子来说事儿。这一套下来挺复杂,毕竟自然界老想着要省钱。 哈恩觉得理论上把声音编成0和1的序列应该更省地儿,压缩得更紧。但其实走这条更复杂的路子反而是对脑子最友好的。虽然自然语言没有那么紧俏地压缩,但它给脑子的负担没那么重。因为大脑在处理词的时候一直在跟咱们已知的现实打交道。那种干巴巴的数字代码虽然传得快,可那是脱离了日常体验的。 哈恩拿通勤打比方说:“咱们对平时上班的路太熟了,开车跟自动驾驶似的,大脑知道下一步啥样,特轻松。换一条不那么熟的捷径反而会让人觉得累,因为新路线得一直全神贯注地开。” 说白了,把话变成二进制代码让说话的和听的都费劲。 因为咱们每天几十年如一日地使母语,那些模式都扎根了,交流起来就顺溜多了。哈恩跟富特雷尔用数学证明了这一点。 他们的研究发现,人类语言优先考虑的是减轻脑子的负担而不是为了压缩到极致。 这也能帮着改进现在的AI大模型吧。只要多理解点大脑咋处理语言的道理,说不定就能设计出更符合人说话习惯的AI系统了。