阿里通义实验室开源预训练框架MaskSearch

AI开放平台

阿里通义实验室开源的全新预训练框架，能够让AI学会“主动搜索+多步推理”，从而更准确、更智能地回答复杂问题。

链接直达手机查看

MaskSearch是阿里通义实验室开源的全新预训练框架，能够让AI学会“主动搜索+多步推理”，从而更准确、更智能地回答复杂问题。

一、主要功能

MaskSearch的核心功能是通过检索增强掩码预测（RAMP）任务，训练AI模型在面对不完整信息时，主动调用搜索引擎查找缺失内容，并结合已有信息进行推理。它能够让AI在多跳问答任务中表现优异，显著提升小模型的推理能力。

二、技术原理

MaskSearch采用检索增强掩码预测（RAMP）机制，通过模拟“填空题”的方式，让模型在预训练阶段学习通用的任务分解、推理等智能体策略。它还结合了多智能体协同、强化学习及课程学习策略，通过构建由规划器、重写器、观察器组成的多智能体系统，自动生成高质量推理轨迹。此外，MaskSearch采用DAPO算法，结合格式奖励与回答奖励，打造高效强化学习流程。

三、应用场景

MaskSearch主要应用于开放域问答、知识密集型任务等场景，能够显著提升AI在复杂问题解决中的表现。例如，在Bamboogle、HotpotQA等数据集上，经过MaskSearch预训练的模型表现优异。

四、使用方法

开发者可以通过访问MaskSearch的开源代码，将其集成到现有的AI项目中。在使用时，可以根据具体需求选择监督微调（SFT）或强化学习（RL）两种训练方法。

五、适用人群

MaskSearch适用于需要提升AI推理和搜索能力的开发者和研究人员，尤其是那些希望在开放域问答和知识密集型任务中获得更好表现的团队。

六、优缺点介绍

优点：
- 能够显著提升AI的推理能力和搜索能力。
- 小模型经过预训练后也能取得优异表现。
- 兼容监督微调和强化学习两种训练方法。
缺点：
- 对于大模型，性能提升的幅度相对较小。
- 需要一定的技术基础和计算资源来实现和优化。

分类标签：人工智能、预训练框架、自然语言处理

相关导航

MiniMax 发布 OctoCodingBench 基准测试,编程智能体的新标准！

OctoCodingBench 是 MiniMax 开源的首个面向编程智能体（Coding Agent）的系统性基准测试，聚焦代码仓库场景下智能体对多源指令的遵循能力，填补了现有评测仅关注任务完成度、忽略规则合规性的空白。

ModelScope 魔搭社区 AIGC专区：一站式 AI 模型创作与应用平台

集创意生成、模型训练、资源分享于一体的 AI 平台，为用户提供从图片生成到视频创作等多种功能，助力个性化模型的快速实现。

值得买集团AI能力：助力消费决策的智能平台

值得买集团AI能力平台通过大模型、商品库与内容库以及AI引擎等技术，为用户提供精准的消费意图理解、商品推荐和内容生成服务，提升消费决策效率。

美图AI开放平台

美图AI开放平台专注于人脸技术、人体技术、图像识别、图像处理、图像生成等核心领域,为客户提供经市场验证的专业AI算法服务和解决方案。平台提供人脸技术、人体技术、图像识别、图像处理、图像生成等多种图像AI服务,支持Web API、Mobile SDK等多种接入方式,可应用于企业服务、美妆门店、医疗美容、智能硬件等多个行业场景,帮助企业快速进行图像AI能力打通和应用。

免责声明：本站为个人资讯、工具类学习博客，所发布的一切形式的内容，包括但不限于文字、链接、工具、图片、视频、软件等，仅限用于学习和研究目的，不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，如有侵权请联系本站删除下架，您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。访问和下载本站内容，说明您已同意上述条款。本站为非盈利性站点，本站不贩卖软件，所有内容不作为商业行为，点击、使用相关工具时请注意甄别，谨防上当受骗。咨询联系：yumiok88@gmail.com.