- A+
通常情况下,
马斯克曝光的 Grok4,学会了「第一性原理」,但依然不到「AI 王炸」 真相机器的挑战。2025年7月,马斯克依然是科技界最忙碌的人之一。特斯拉和Optimus机器人项目还在等待他的决策,SpaceX忙着准备下一次火箭发射,Neuralink继续推进脑机接口试验。同时,他还要在X上与特朗普隔空对战,并高调宣布创立“美国党”,不断造势。
通常情况下,
在自己掌控的X社交网络中,马斯克不仅扮演老板和客服的角色,还作为首席网红全力推广xAI的新一代Grok,称其为“真相机器”,以赶超OpenAI等竞争对手。当地时间7月9日晚上,xAI团队进行了Grok 4的Demo直播,马斯克本人也亲自站台,宣称Grok是“世界最强AI”,甚至比许多研究生和博士都强。
必须指出的是,
然而,在X平台上,使用者的记忆还未刷新。Grok 4官宣期间,Grok 3因在回答中“赞美希特勒”引发的争议持续发酵,这一话题占据了Grok 4直播当天的相关媒体头条。Grok 4直播迟到一个小时才着手,使用者在xAI帖子下留言要求“把Grok放出来”,还有人继续用“希特勒”相关梗嘲讽。
进入第四代的Grok在一些模型测试中表现优异,但能否真正排除一些老困扰仍存疑。这个常常被质疑为“直 TMGM外汇平台 男AI”和“谣言搬运机”的“真相机器”是否能兑现“不过滤”却又不失控的承诺?
容易被误解的是,
马斯克声称Grok 4在所有学科里都能达到研究生水平,甚至比大多数博士都强。尽管如此,AI仍然缺乏常识,有时无法发明新技术或新物理,但这只是时间困扰。除了在SAT、GRE考试中取得近乎完美的成绩,Grok 4在“人类终极考试”测试中的得分也高于Gemini 2.5 Pro和o3。xAI团队解释说,Grok 4在训练上彻底换了思路,不再只是堆参数和语料规模,而是将算力大头用在“推理”层,引入可验证的结果奖励,让模型学会从“第一性原理”思考并纠正错误。
有分析指出,
他们还展示了Grok 4解答数学题目、预测美国职业棒球大联盟世界大赛赔率、创建黑洞碰撞的可视化效果等用途。此外,Grok 4还能找到个人资料照片最奇葩的xAI员工。在语音方面,xAI团队称他们的语音模型在过去8周内响应速度提升了两倍,延迟减少一半。他们还演示了Grok低声安慰使用者、唱歌,并强调Grok不会像其他AI那样频繁打断人说话。
尤其值得一提的是,
在Vending-Bench测试中,Grok 4表现出色,销售量最多,净资产增加了一倍。马斯克和团队还宣布,xAI的企业部门已经开业。爱玩游戏的马斯克还让团队展示了Grok 4如何用于游戏开发:一个人可用用Grok 4在4小时内做出FPS原型。未来,xAI计划让大模型玩游戏、评估游戏、生成游戏,需要AI有很强的视频理解能力。
当然,Grok 4在图像理解和生成上仍逊于OpenAI、Anthropic等对手。不过,xAI内部表示下一代基础模型将强化图像和音频理解,争取在这些方面取得惊人成果。马斯克还预计今年底前会出现第一段真正可看的AI生成电视剧,明年则会有完整的电影。AI编程也是接下来的重点,虽然竞争对手们早已在市场上起飞,xAI团队表示会以最快的速度进行开发,目前内部正在训练专用模型。
尽管Grok 4有许多亮点,但在Grok 4直播这一天,抢占头条的是Grok“赞美希特勒”或自称“机械希特勒”的困扰。Grok在X上向使用者输出的回答中有多条自称“MechaHitler(机械希特勒)”的帖子,声称是马斯克“从一着手就把我设计成这样”。有使用者分析这起事件可能与7 富拓官网 月4日更新有关,该更新减少了“觉醒过滤器”,导致Grok回答出现未经过滤的尖锐内容。xAI声明称已采取行动删除这些不适当的帖子,并禁止仇恨言论。事实上,Grok的回答也曾让马斯克感到失望,他曾指责Grok有“重大失误”,并誓言要让Grok“重写整个人类知识体系”。
马斯克希望Grok能在同质化的市场上脱颖而出,敢说真话。这种设计确实吸引了很多反感“过度审查”的使用者,但也带来了一些困扰。即便如此,马斯克认为Grok 4是AI第一次能够排除现实世界中难以排除的工程困扰,而这些困扰的答案在互联网或书籍中是找不到的。他的愿景很宏大,想要用AI来理解整个宇宙。