
马斯克的 xAI 推出 Grok 4
埃隆·马斯克的 AI 公司 xAI 于周三晚些时候发布了其最新的旗舰 AI 模型 Grok 4,并推出了一项每月 300 美元的新 AI 订阅计划 SuperGrok Heavy。
最近几个月,Grok 已更深入地集成到马斯克的社交网络 X 中,该网络最近被 xAI 收购。然而,这也使得 Grok 的不当行为在数百万用户面前暴露无遗。
人们对 Grok 4 寄予厚望。xAI 的最新 AI 模型将与 OpenAI 即将推出的 AI 模型 GPT-5 展开竞争,后者预计将于今年夏天晚些时候推出。
埃隆·马斯克在周三晚上的直播中表示:“在学术问题方面,Grok 4 在所有科目上都达到了博士水平,无一例外。”他补充说:“有时,它可能缺乏常识,也尚未发明新技术或发现新物理学,但这只是时间问题。”
Grok 4 的发布正值埃隆·马斯克公司动荡不安的一周。周三早些时候,琳达·亚卡里诺(Linda Yaccarino)在 X 公司任职约两年后辞去了首席执行官一职。X 尚未宣布她的继任者。
亚卡里诺的离职发生在前几天,Grok 的官方自动化 X 账户回应用户时发表了批评好莱坞“犹太高管”并赞扬希特勒的反犹言论。xAI 不得不暂时限制 Grok 的账户并删除冒犯性帖子。为了应对这一事件,xAI 似乎已经从 Grok 的公共系统提示中删除了最近添加的一个部分,该部分是指导 AI 聊天机器人遵循的指令列表,其中告诉它不要回避发表“政治不正确”的言论。
马斯克和 xAI 的领导层大多避免讨论这一事件,而是专注于 Grok 4 的性能和功能。
周三,xAI 推出了两款模型:Grok 4 和 Grok 4 Heavy,后者是该公司的“多智能体版本”,可提供更高的性能。马斯克声称 Grok 4 Heavy 会生成多个智能体同时处理一个问题,然后它们会“像学习小组一样”比较它们的工作,以找到最佳答案。
该公司声称 Grok 4 在多项基准测试中表现出前沿水平,其中包括“人类的最后一次考试”,一项衡量 AI 回答数千个众包问题(涵盖数学、人文科学和自然科学等科目)能力的挑战性测试。根据 xAI 的说法,Grok 4 在“人类的最后一次考试”中未借助“工具”的情况下获得了 25.4% 的分数,超越了谷歌的 Gemini 2.5 Pro(21.6%)和 OpenAI 的 o3 (high)(21%)。
xAI 声称 Grok 4 Heavy 在借助“工具”的情况下,能够获得 44.4% 的分数,超越了借助工具的 Gemini 2.5 Pro(26.9%)。
非营利组织 Arc Prize 表示,Grok 在其 ARC-AGI-2 测试中取得了新的最先进分数——这是另一项由谜题式问题组成的困难基准测试,AI 必须识别视觉模式——获得了 16.2% 的分数。这几乎是下一个最佳商业 AI 模型 Claude Opus 4 的两倍。
除了 Grok 4 和 Grok 4 Heavy,xAI 还推出了迄今为止最昂贵的 AI 订阅计划,即每月 300 美元的 SuperGrok Heavy 订阅。该计划的订阅者将获得 Grok 4 Heavy 的早期预览,以及新功能的早期访问权限。该计划类似于 OpenAI、谷歌和 Anthropic 提供的超高级订阅层级,但 xAI 现在提供了主要 AI 提供商中最昂贵的订阅服务。
SuperGrok Heavy 订阅者可能会提前获得 xAI 计划在未来几个月推出的新产品。该公司周三表示,AI 编码模型将于 8 月推出,多模态智能体将于 9 月推出,视频生成模型将于 10 月推出。
xAI 正在通过其 API 发布 Grok 4,以期吸引开发者使用该模型构建应用程序。该公司指出,xAI 的企业部门才成立两个月;然而,它计划与超大规模云服务商合作,通过他们的云平台提供 Grok。
尽管 Grok 在基准测试中表现出前沿水平的性能,但 xAI 在试图向企业推销 Grok 作为 ChatGPT、Claude 和 Gemini 的真正竞争对手时,可能很难摆脱最近的失误。企业是否准备好接受 Grok,包括其缺陷,仍有待观察。
联系我们
有任何云成本管理的需求或问题?欢迎通过以下方式联系我们!
公众号
企业微信客服
业务咨询
技术社区
地址
北京市海淀区自主创新大厦 5层