蛋白质基座的GPT时代来了?!
清华大学智能产业研究院(AIR)周浩副教授课题组与上海人工智能实验室联合发布了AMix-1,首次以系统化方法论构建蛋白质基座模型。这一方法结合了Scaling Law、Emergent Ability、In-Context Learning和Test-time Scaling,为蛋白质研究开启了类似NLP领域GPT的新时代。
AMix-1基于贝叶斯流网络(Bayesian Flow Networks, BFNs),具备四大“超能力”:
1. Pretraining Scaling Law:明确参数、数据量和计算资源的权衡,最大化模型性能。
2. Emergent Ability:随着训练深入,模型能自动理解蛋白质的空间结构。
3. In-Context Learning:无需微调,通过上下文学习设计新蛋白。
4. Test-time Scaling:验证预算增加时,模型表现持续提升。
研究表明,AMix-1的性能随参数规模和计算量增加而规律提升,科学家可精准规划资源。其“顿悟”能力让模型从识别序列跃升至理解结构,并在设计任务中表现出色。例如,仅需几个例子,AMix-1就能生成符合功能需求的新蛋白,甚至优化酶活性。实验显示,AMix-1设计的一种转录调控因子活性提升了50倍,超越现有方法。
此外,AMix-1支持测试时扩展(EvoAMix-1),通过迭代优化不断提升设计效果。它还支撑了一个虚拟生物实验室,将复杂耗时的蛋白质改造变得像与ChatGPT对话般简单。
所有代码、模型权重和技术细节已公开,推动蛋白质研究迈向通用智能新阶段。
项目主页:https://gensi-thuair.github.io/AMix-1/
虚拟生物实验室:https://virtualbiolab.intern-ai.org.cn/
.png)

-
2025-08-11 11:04:47
-
2025-08-11 11:03:52
-
2025-08-11 11:03:43