书生·浦语2.5：AI领域新突破，超轻量级模型引领智能推理

在2024年7月4日的WAIC科学前沿主论坛上，上海人工智能实验室发布了书生·浦语系列模型的全新版本——InternLM2.5。这一版本在复杂场景下的推理能力得到了全面增强，支持1M超长上下文，并且能够自主进行互联网搜索，从众多网页中完成信息整合。

书生·浦语2.5系列模型包括1.8B、20B参数版本，以及轻量级InternLM2.5-7B，现已全部开源。其中，1.8B版本以其超轻量级特性和高适应性受到青睐；而20B版本则以其综合性能强劲，有效支持复杂实用场景而备受瞩目。

核心亮点
InternLM2.5通过采用多种数据合成技术，经过多轮迭代，实现了复杂场景下模型推理能力的显著提升。特别是在数学评测集MATH上，20B模型的准确率提升近一倍，达到了64.7%。

技术革新
为了应对长文档理解和复杂的智能体交互，InternLM2.5在预训练阶段进行了256K Token长度的高效训练，将上下文长度从200K提升至1M，极大地释放了模型在超长文本应用上的潜力。

推理能力
InternLM2.5系列模型在多个推理能力权威评测集上实现了性能的大幅提升。基于司南OpenCompass开源评测框架，20B参数模型在MATH评测集上的成绩尤为突出，以64.7%的准确率，展现了其在同量级开源模型中的竞争力。

应用体验
InternLM2.5系列模型在多步复杂推理、多轮对话意图精准理解、灵活的格式控制和操作、遵循复杂指令等方面表现出色，为用户提供了卓越的应用体验。

快速上手
InternLM2.5系列模型与下游推理和微调框架实现了无缝对接，涵盖了上海人工智能实验室自主研发的高性能大语言模型微调框架XTuner、推理框架LMDeploy，以及社区广泛使用的vLLM、Ollama和llama.cpp等。通过提供的代码示例，用户可以快速上手微调和搭建模型服务。