近日,埃隆·马斯克旗下的xAI公司正式推出Grok 4.1及其增强推理变体Grok 4.1 Thinking。这两款模型不仅在生成内容的准确性上大幅提升,还显著降低了“幻觉”现象的发生概率。Grok 4.1系列模型的发布,标志着xAI在人工智能领域的又一次重要突破。
1. 模型性能显著提升
Grok 4.1在多个关键性能指标上取得了显著进步。其幻觉率从12.09%降至4.22%,FActScore从9.89%降至2.97%,这意味着模型在生成内容时的准确性和可靠性大幅提升。此外,Grok 4.1的响应速度也明显加快,用户能够获得更流畅的交互体验。
2. 强化推理能力的Grok 4.1 Thinking
Grok 4.1 Thinking是Grok 4.1的增强推理版本,通过引入“思考令牌”进行链式推理,能够更好地处理复杂问题。在LMArena的Text Leaderboard中,Grok 4.1 Thinking以1483的Elo评分位居榜首,领先于其他所有公开模型。即使在不启用思考链的情况下,Grok 4.1本身也以1465的Elo评分位列第二。
3. 免费开放与多平台支持
Grok 4.1系列模型对所有用户免费开放,用户可以通过Grok官网、X平台以及iOS和Android应用直接使用。这种广泛的可访问性使得更多用户能够体验到最新AI技术带来的便利。Grok 4.1系列的发布在行业内引起了广泛关注。许多用户对其表现给予了高度评价,认为其在对话智能、情感理解和创意写作等方面均有显著提升。然而,也有观点指出,尽管Grok 4.1在多个领域表现出色,但在生成代码等特定任务上仍存在一定的提升空间。
尽管Grok 4.1系列在当前的测试中表现优异,但其竞争对手如谷歌的Gemini 3.0等也在紧锣密鼓地开发中。未来,AI模型之间的竞争将更加激烈,各公司将继续在性能、功能和用户体验等方面展开角逐。


