- Title题目 生命演化和语言模型中的“算法信息”
- Speaker报告人 刘宇/Yu Liu (北京师范大学珠海校区)
- Date日期 2025年12月9日 14:00
- Venue地点 南楼6520
算法信息论为刻画对象X的复杂性提供了理论基础,其核心思想是:在所有能够生成X的程序中,最短程序的长度可定义为其复杂度(即柯氏复杂度)。尽管该量本身不可计算,但可通过压缩等方式加以近似,如常用的gzip算法。近年来,我们提出了一种新的复杂度近似方法——梯径(Ladderpath),并先后发表于Science Advances与Entropy。该方法通过迭代识别对象中的重复子结构,重建其内部的复用与嵌套层次,从而生成反映层级关系的图。基于此层级结构,我们进一步定义了梯径复杂度,作为柯氏复杂度的有效可计算近似。更重要的是,这一层级结构本身刻画了对象X所蕴含的核心算法信息。
在既往研究中,我们已应用梯径方法于多类复杂系统:揭示蛋白质序列的层级信息与物种进化关系(Physical Review Research,2024)、辅助设计多肽药物(Journal of Chemical Information and Modeling,2024)、以及阐释神经网络的构效对应机制(npj Complexity,2024)。值得注意的是,近年来Google DeepMind与OpenAI的研究进一步强调了语言模型与压缩、算法信息论及所罗门诺夫归纳之间的深刻联系。受此启发,我们正探索将梯径框架与大语言模型相结合,在自然语言、化学分子序列、蛋白质序列等系统中展开应用与验证,为揭示不同信息载体中的算法结构与语义生成机制提供新视角和路径。
Biography
刘宇,北京师范大学珠海校区系统科学系副教授。毕业于瑞典Uppsala大学,获应用数学与统计学博士学位。曾在荷兰Groningen大学系统生物学系、瑞典Mittag-Leffler数学研究院、英国Glasgow大学化学系开展研究工作,并在Mittag-Leffler数学研究院独立主持科研项目。多次受邀在国内外学术会议及研究机构(包括德国马普所、国家天元数学中心等)作报告,并接受英国皇家化学学会Chemistry World等媒体的采访。研究兴趣主要集中在算法信息论与复杂系统科学,包括语言和生命系统的演化机制,以及算法信息论在人工智能与AI4Science中的理论与方法探索。以第一或通讯作者在Science Advances,J. Chemical Information and Modeling,J. Biological Chemistry,Physical Review Research,npj Complexity等期刊发表论文20余篇。微信公众号 ecsLab,主页 www.ecslab.live
Inviter: 周海军研究员