Grok 1.5:马斯克的AI大模型再升级,推理与长上下文理解能力显著提升

Grok 1.5:马斯克的ai大模型再升级,推理与长上下文理解能力显著提升
在人工智能领域,埃隆·马斯克旗下的xAI公司再次引领潮流,推出了Grok大模型的最新迭代版本——Grok-1.5。这一新版本的发布距离Grok-1的开源仅过去10天,显示了马斯克在AI领域的迅速进展和雄心壮志。

Grok-1.5的推出,标志着xAI在人工智能技术上的又一重大突破。新模型在长上下文理解和高级推理能力方面实现了显著提升,预计将在未来几天内向早期测试人员和X平台(前Twitter)上的现有Grok用户开放。

Grok-1.5的最显著改进之一体现在其对代码和数学相关任务的处理能力上。在MATH和GSM8K两大数学基准测试中,Grok-1.5分别取得了50.6%和90%的成绩,这两个基准覆盖了从小学到高中的广泛数学问题。此外,在评估代码生成和问题解决能力的HumanEval基准测试中,Grok-1.5得分为74.1%,显示出其在技术领域的强大应用潜力。

Grok-1.5的另一项重要升级是其能够处理长达128K token的上下文,这是之前版本的16倍。这一进步使得Grok-1.5能够利用更长的文档信息,处理更复杂数的提示,并在扩展的上下文窗口中保持出色的指令跟踪能力。在大海捞针(NIAH)评估中,Grok-1.5展现了其卓越的检索能力,能够在庞大的上下文中实现精准检索。

为了支持Grok-1.5的训练,xAI采用了基于JAX、Rust和Kubernetes的自定义分布式训练框架。这一训练堆栈的开发,旨在提高训练作业的可靠性和正常运行时间,同时最小化构建原型和大规模训练新架构所需的努力。

展望未来,Grok-1.5的推出是马斯克寻求在AI领域与微软支持的OpenAI和Google大模型竞争的重要一步。去年12月,xAI为X的Premium+订阅者推出了Grok。随着Grok-1.5的即将开放测试,xAI团队表示将继续对Grok进行改进,未来几天内,公众将见证X平台上大模型的一系列新功能推出。

AD:精心整理了1000+好用的AI工具!点此获取

相关推荐