
DeepScientist 是西湖大学打造的能自主提出假设、实验、写作并超越人类 SOTA 的闭环科研智能体。
1.1 主要功能
-
自主科研闭环:战略假设→实验验证→报告撰写全流程自动化
-
创新方法生成:提出 A2P 等全新因果推理算法,性能提升 183.7%
-
多任务超越:两周内完成三项前沿 AI 任务并刷新 SOTA
-
论文自写作:已自动生成 5 篇论文,AI+人类双盲审接受率 60%
-
记忆驱动优化:用分层贝叶斯优化在巨大假设空间中高效搜索
1.2 技术原理
-
分层贝叶斯优化:平衡“利用旧知”与“探索未知”,在 10⁹ 级假设空间智能采样
-
三阶段循环:
① 战略假设:LLM 代理从开放知识库与失败记忆库生成假设并打分
② 实施验证:编码代理在沙盒内运行实验,采用上置信界算法动态调度
③ 分析报告:仅对超基线结果深度验证,合成代理生成可复现论文 -
失败归因机制:将失败案例结构化入库,用于下一轮因果级假设改进
-
多代理协作:审稿人/编码/合成代理分工,形成“自监督”学术生态
1.3 应用场景
-
基础科研:AI 文本检测、算法生成、故障归因等前沿方向
-
跨学科探索:数学、材料、生物等需要大规模假设筛选的领域
-
快速验证:两周完成人类 3 年工作量的创新方案迭代
-
学术写作:自动生成可直接投稿的 LaTeX 论文与可复现代码
-
教学示范:作为“AI 科学家”案例,用于科研方法论课程
1.4 使用方法
-
本地部署:获取开源代码与 Docker 镜像,配置 GPU 与 Python 环境
-
任务定义:在 YAML 中填写任务描述、基线算法、评价指标与数据集路径
-
启动循环:运行 python main.py --task xxx,系统自动进入三阶段循环
-
监控进度:Web 面板实时查看假设得分、实验曲线与中间论文草稿
-
结果复现:一键导出超参数、日志与可执行脚本,支持第三方复现
1.5 适用人群
-
科研工作者:需要快速突破 SOTA 的实验室与高校团队
-
企业研发:算法、医药、新材料等依赖大量实验的行业
-
政策资助方:希望降低探索成本、提高资金利用率的机构
-
AI 研究者:关注自动机器学习、科学发现代理的学者与工程师
1.6 优缺点介绍
优点
优点
-
完全自主:无需人工给想法,可 7×24 小时持续科研
-
性能跃升:在 RAID 数据集 AUROC 提升 7.9%,推理速度翻倍
-
开源可扩展:代码与模型逐步开源,支持自定义任务与代理
-
双盲验证:AI+人类双重评审,保证产出质量与学术规范
缺点
-
算力消耗高:完整闭环需多卡 A100 运行数天,个人用户门槛高
-
领域局限:当前主要面向 AI 方向,跨学科迁移需额外知识库
-
评审争议:AI 评审可能存在偏好,人类复审仍不可或缺
-
伦理风险:自主生成论文可能引发署名、版权与可解释性争议
AI科学家、科研自动化、贝叶斯优化、自主代理、学术写作

ScholAI 是一个基于模型上下文协议(MCP)的服务器,旨在增强学术研究工作流程。它提供了用于发现、分析和管理学术出版物的工具,具有 CCF 排名集成和语义查询分析等功能。