西湖大学 DeepScientist:AI 科学家的突破性进展

近日,西湖大学推出的 AI 科学家 DeepScientist 在科研领域取得了令人瞩目的成果。该系统在短时间内完成了大量科研工作,并在多个前沿任务中打破了人类的最新科研纪录,展现出强大的自主学习和创新能力,为人工智能在科学研究中的应用开辟了新的道路。

一、DeepScientist 的强大能力

DeepScientist 在 AI 文本检测任务中,仅用两周时间就自主完成了相当于人类科学家三年的进展。它自主生成了 2472 个独特的研究想法,并对其中 600 个具有科学价值的假设进行了代码实现和实验验证。最终,在 RAID 数据集上取得了 7.9% 的 AUROC 提升,同时将推理延迟降低了 190%,展示出超越现有人类 SOTA 的卓越性能。西湖大学 Deepscientist:ai 科学家的突破性进展

二、创新方法与突破

在“智能体失败归因”这一高度复杂的任务上,DeepScientist 自主构想并提出了名为 A2P(Abduction-Action-Prediction)的全新方法。该方法将失败归因从简单的模式识别提升到了结构化的因果推理层面,最终在 Who&When 基准测试的“算法生成”任务中取得了 47.46 分,性能相较于人类专家的 SoTA 基线大幅提升了 183.7%。西湖大学 Deepscientist:ai 科学家的突破性进展

三、工作流程与优势

DeepScientist 的工作流程被设计成一个三阶段的循环:首先是生成新想法的阶段,系统会从庞大的记忆库中提取信息,并为新想法打分;接下来,系统会使用“上置信界”算法来决定验证哪一个想法,选择得分最高的想法进行实验;最后,在成功验证的基础上,系统会撰写详细的研究报告,形成闭环。这种闭环、迭代的流程使其能够自主运行数月之久,在浩瀚的可能性空间中持续寻找突破口,不断推动科学发现的进程。西湖大学 Deepscientist:ai 科学家的突破性进展

四、未来展望与开源计划

DeepScientist 的突破性进展标志着 AI 科学家在科研领域的潜力得到了进一步验证,未来可能会在更广泛的科学探索中发挥重要作用。为了促进该领域的进一步研究,研究人员计划将所有实验日志和系统代码开源。西湖大学 Deepscientist:ai 科学家的突破性进展

AD:精心整理了2000+好用的AI工具!点此获取

相关推荐

1 1

免费AI工具合集,点击进入

AI对话

玉米AI助手