马斯克的 xAI 推出 Grok 4，同时提供每月 300 美元的订阅服务

埃隆·马斯克的 AI 公司 xAI 于周三晚些时候发布了其最新的旗舰 AI 模型 Grok 4，并推出了一项每月 300 美元的新 AI 订阅计划 SuperGrok Heavy。

最近几个月，Grok 已更深入地集成到马斯克的社交网络 X 中，该网络最近被 xAI 收购。然而，这也使得 Grok 的不当行为在数百万用户面前暴露无遗。

人们对 Grok 4 寄予厚望。xAI 的最新 AI 模型将与 OpenAI 即将推出的 AI 模型 GPT-5 展开竞争，后者预计将于今年夏天晚些时候推出。

埃隆·马斯克在周三晚上的直播中表示：“在学术问题方面，Grok 4 在所有科目上都达到了博士水平，无一例外。”他补充说：“有时，它可能缺乏常识，也尚未发明新技术或发现新物理学，但这只是时间问题。”

Grok 4 的发布正值埃隆·马斯克公司动荡不安的一周。周三早些时候，琳达·亚卡里诺（Linda Yaccarino）在 X 公司任职约两年后辞去了首席执行官一职。X 尚未宣布她的继任者。

亚卡里诺的离职发生在前几天，Grok 的官方自动化 X 账户回应用户时发表了批评好莱坞“犹太高管”并赞扬希特勒的反犹言论。xAI 不得不暂时限制 Grok 的账户并删除冒犯性帖子。为了应对这一事件，xAI 似乎已经从 Grok 的公共系统提示中删除了最近添加的一个部分，该部分是指导 AI 聊天机器人遵循的指令列表，其中告诉它不要回避发表“政治不正确”的言论。

马斯克和 xAI 的领导层大多避免讨论这一事件，而是专注于 Grok 4 的性能和功能。

周三，xAI 推出了两款模型：Grok 4 和 Grok 4 Heavy，后者是该公司的“多智能体版本”，可提供更高的性能。马斯克声称 Grok 4 Heavy 会生成多个智能体同时处理一个问题，然后它们会“像学习小组一样”比较它们的工作，以找到最佳答案。

该公司声称 Grok 4 在多项基准测试中表现出前沿水平，其中包括“人类的最后一次考试”，一项衡量 AI 回答数千个众包问题（涵盖数学、人文科学和自然科学等科目）能力的挑战性测试。根据 xAI 的说法，Grok 4 在“人类的最后一次考试”中未借助“工具”的情况下获得了 25.4% 的分数，超越了谷歌的 Gemini 2.5 Pro（21.6%）和 OpenAI 的 o3 (high)（21%）。

xAI 声称 Grok 4 Heavy 在借助“工具”的情况下，能够获得 44.4% 的分数，超越了借助工具的 Gemini 2.5 Pro（26.9%）。

非营利组织 Arc Prize 表示，Grok 在其 ARC-AGI-2 测试中取得了新的最先进分数——这是另一项由谜题式问题组成的困难基准测试，AI 必须识别视觉模式——获得了 16.2% 的分数。这几乎是下一个最佳商业 AI 模型 Claude Opus 4 的两倍。

除了 Grok 4 和 Grok 4 Heavy，xAI 还推出了迄今为止最昂贵的 AI 订阅计划，即每月 300 美元的 SuperGrok Heavy 订阅。该计划的订阅者将获得 Grok 4 Heavy 的早期预览，以及新功能的早期访问权限。该计划类似于 OpenAI、谷歌和 Anthropic 提供的超高级订阅层级，但 xAI 现在提供了主要 AI 提供商中最昂贵的订阅服务。

SuperGrok Heavy 订阅者可能会提前获得 xAI 计划在未来几个月推出的新产品。该公司周三表示，AI 编码模型将于 8 月推出，多模态智能体将于 9 月推出，视频生成模型将于 10 月推出。

xAI 正在通过其 API 发布 Grok 4，以期吸引开发者使用该模型构建应用程序。该公司指出，xAI 的企业部门才成立两个月；然而，它计划与超大规模云服务商合作，通过他们的云平台提供 Grok。

尽管 Grok 在基准测试中表现出前沿水平的性能，但 xAI 在试图向企业推销 Grok 作为 ChatGPT、Claude 和 Gemini 的真正竞争对手时，可能很难摆脱最近的失误。企业是否准备好接受 Grok，包括其缺陷，仍有待观察。