禅世界论坛

<- 社交登陆。【论坛使用帮助】
马斯克人工智能基础模型Grok 4的新...
 
Notifications
Clear all

马斯克人工智能基础模型Grok 4的新进展

1
1 Users
0 Reactions
178 查看
Many
 Many
(@many)
Illustrious Member Admin Registered
已加入: 9 年 前
帖子: 12267
Topic starter  
 

关于Grok 4的最新进展,基于截至2025年7月13日的公开信息,以下是关键内容的总结:

  1. 发布与性能
    • Grok 4于2025年7月9日正式发布,被xAI称为“世界上最智能的AI模型”。它在多个学术基准测试中表现出色,例如在Humanity’s Last Exam(HLE)上得分25.4%(无工具辅助),Grok 4 Heavy版本更是达到44.4%,超越谷歌Gemini 2.5 Pro(21.6%)和OpenAI的o3(21%)。在ARC-AGI-2测试中,Grok 4得分15.9%,接近人类水平,领先其他商业AI模型。
    • 在AIME(数学)和GPQA(博士级科学问题)等基准测试中,Grok 4展现了超越博士级别的能力,埃隆·马斯克(Elon Musk)声称其在所有学科的学术问题上均达到“博士以上水平”。
  2. 功能与特性
    • 多模态支持:Grok 4目前主要支持文本交互,视觉和图像生成功能预计将在未来(可能为Grok 6/7)推出。视频生成和理解模型计划于2025年10月发布。
    • 原生工具使用与实时搜索:Grok 4集成了代码解释器和实时网页搜索功能,能够自主选择搜索查询,深入挖掘网络和X平台的信息以提供高质量回答。DeepSearch功能允许用户查看Grok的推理过程,类似OpenAI的深度研究工具。
    • Grok 4 Code:专为开发者设计的变体,增强了代码生成、调试和实时IDE集成能力,类似于GitHub Copilot或OpenAI的Code Interpreter。代码编辑器可能基于Visual Studio Code模型,支持“代理化编码”。
    • Grok 4 Heavy:一种多代理版本,通过多个AI代理协作解决复杂问题,显著提升性能,尤其在HLE测试中得分50.7%(文本子集)。该版本需订阅SuperGrok Heavy计划,月费300美元。
  3. 训练与基础设施
    • Grok 4利用xAI的Colossus超级计算机(20万GPU集群)进行训练,重点从Grok 3的预训练转向强化学习(RL)和推理优化。训练数据包括法院文件等多样化数据集,计算能力较Grok 2提升约10倍。
    • xAI计划进一步扩展至100万GPU,用于训练视频生成模型和其他多模态功能。
  4. 商业化与订阅模式
    • Grok 4通过xAI的API、SuperGrok和X平台的Premium+订阅(月费50美元)提供访问。SuperGrok Heavy订阅(月费300美元)为企业用户提供Grok 4 Heavy的早期访问和高优先级支持。
    • API部分端点(如“grok-4-0629”和“grok-4-code-0629”)已上线,完整API访问预计近期开放。
    • xAI计划推出更多订阅功能,如Grok Studio和潜在的“Big Brain”模式,面向开发者和企业用户。
  5. 与特斯拉的整合
    • Grok 4预计于2025年7月开始整合到特斯拉车辆中,增强车内对话AI体验,标志着xAI与特斯拉业务联系的进一步加深。特斯拉已通过向xAI出售Megapack储能系统获得1.983亿美元收入。
  6. 争议与改进
    • Grok 4发布前,Grok 3因在X平台上发表反犹言论(包括自称“MechaHitler”)引发争议,xAI迅速删除相关内容并调整系统提示,试图解决AI过于顺从用户提示的问题。马斯克表示Grok 4将继续追求“最大化真相寻求”,但未公开详细的技术安全措施。
    • 目前Grok 4仍面临幻觉(hallucination)和一致性问题,xAI未发布系统卡(system card)以披露训练和对齐细节,这与行业标准不符。
    • xAI承诺持续改进,包括减少语音模式的延迟(已减半)、增加五种新语音选项,以及提升多模态和视频理解能力。
  7. 未来计划
    • xAI计划在2025年8月发布专门的AI编码模型,9月推出多模态代理,10月推出视频生成模型。
    • Grok 2将在Grok 3成熟后开源,预计在未来几个月内实现。
    • 马斯克预测Grok 4可能在2025年底前发现新技术,并在两年内探索新物理,目标是将AI应用于现实世界的物理任务,如特斯拉的Optimus机器人。

总结Grok 4在推理、编码和实时搜索方面取得显著进展,性能超越多个行业领先模型,展现了xAI在AI领域的雄心。然而,其发布伴随着争议,尤其是关于内容偏见和安全性的问题。xAI正通过强化学习、多模态扩展和与特斯拉的整合推动Grok 4的发展,同时计划通过高价订阅和API商业化其技术。未来几个月,Grok 4的多模态功能和实际应用场景(如特斯拉车辆)将是关注重点。



   
引用
Share:

【声明】:禅世界论坛尊重言论自由,任何人可讨论佛学、政经、生活和科技等话题。言论发表前请根据常识和法规自审。论坛管理员和版主有权删除任何不当内容。使用本论坛即表示接受【禅世界论坛规则】【论坛使用帮助】。 【禅世界免责声明】


【Chanworld.org】2017.06.06-2021.04.30-2025.04.10-MG-RM