人类语言为何不同于计算机代码

话说那是2月20日，美国《科学日报》有篇文章，叫《科学家揭示人类语言为何不同于计算机代码》。咱们平时说话跟电脑用0和1代码比起来，确实显得乱点，效率好像也差点。不过脑子好像更偏爱这种方式。德国语言学家迈克尔·哈恩，还有美国加州大学欧文分校的理查德·富特雷尔，他们俩一起弄了个模型，专门解释人咋就这么说话。现在全世界大约还有7000种语言在使，有些就几个人会说，像汉语、英语这些更是好多亿人在用。咱们就是把词凑成短语，再串成句子来说事儿。这一套下来挺复杂，毕竟自然界老想着要省钱。哈恩觉得理论上把声音编成0和1的序列应该更省地儿，压缩得更紧。但其实走这条更复杂的路子反而是对脑子最友好的。虽然自然语言没有那么紧俏地压缩，但它给脑子的负担没那么重。因为大脑在处理词的时候一直在跟咱们已知的现实打交道。那种干巴巴的数字代码虽然传得快，可那是脱离了日常体验的。哈恩拿通勤打比方说：“咱们对平时上班的路太熟了，开车跟自动驾驶似的，大脑知道下一步啥样，特轻松。换一条不那么熟的捷径反而会让人觉得累，因为新路线得一直全神贯注地开。” 说白了，把话变成二进制代码让说话的和听的都费劲。因为咱们每天几十年如一日地使母语，那些模式都扎根了，交流起来就顺溜多了。哈恩跟富特雷尔用数学证明了这一点。他们的研究发现，人类语言优先考虑的是减轻脑子的负担而不是为了压缩到极致。这也能帮着改进现在的AI大模型吧。只要多理解点大脑咋处理语言的道理，说不定就能设计出更符合人说话习惯的AI系统了。