在人工智能领域,一个激动人心的里程碑已经达成。由Chris Lu、Cong Lu、Robert Tjarko Lange等人领衔的研究团队在论文《The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery》中,提出了一个全面的框架,使得前沿的大型语言模型(LLMs)能够独立进行科学研究并传达它们的发现。这项研究标志着我们向自动化科学发现迈出了重要一步。
AI科学家项目的核心是一个能够产生新颖研究想法、编写代码、执行实验、可视化结果、撰写完整科学论文,并进行模拟审查过程的系统。这一过程不仅能够迭代地开发想法,而且能够以开放的方式不断增长知识档案,模仿人类科学界的行为。研究团队通过将这一方法应用于机器学习的三个不同子领域——扩散建模、基于变换器的语言建模和学习动态——展示了该方法的多样性。每个想法都被实现并发展成完整的论文,并且每篇论文的成本微不足道,不足15美元,展示了该框架在民主化研究和显著加速科学进步方面的潜力。

为了评估生成的论文,研究团队设计并验证了一个自动化审稿人,该审稿人的表现接近人类水平,在评估论文得分方面表现出色。AI科学家能够产生的论文在顶级机器学习会议上的接受阈值超过了我们的自动化审稿人的判断。这种方法预示着机器学习科学发现的新时代:将AI代理的变革性好处带给AI研究过程本身,并使我们更接近一个世界,在这个世界上,无尽的、负担得起的创造力和创新可以被释放到世界上最具挑战性的问题上。
该研究的代码已经开源,供有兴趣的研究人员进一步探索和利用。这项工作不仅展示了AI在科学研究中的潜力,也为未来的研究提供了新的方向和工具。随着AI技术的不断进步,我们期待AI科学家在未来能够解决更多复杂的问题,并为人类社会带来更多的创新和突破。



