3月29日消息,上午,埃隆·马斯克旗下的人工智能初创公司 xAI 宣布正式推出 Grok-1.5。官方发布了推文,直接附上了链接,主打一个“字少事大”。

Grok-1.5 的升级主要集中在两个方面:

1. **长上下文理解**

Grok-1.5 将上下文窗口直接提升到之前的 16 倍,从 8192 增长到 128k,与 GPT-4 并列。

这意味着 Grok-1.5 能够处理更长、更复杂的提示,同时保持其遵循指令的能力。

在大海捞针(NIAH)评估中,Grok-1.5 展示了强大的检索功能,可以在长度达 128K 的上下文中检索嵌入的文本,获得完美的检索结果。

2. **能力和推理**

Grok-1.5 最大的改进之一是处理编程和数学相关任务的能力大幅提升,全面超越 Grok-1、Mistral Large、Claude 2。

– 数学方面,Grok-1.5 在 MATH 基准测试上得分为 50.6%,超越中杯 Claude 3 Sonnet;在 GSM8K 上得分为 90%。
– 编程方面,Grok-1.5 在 HumanEval 基准测试上得分为 74.1%,超越中杯 Claude 3 Sonnet、Gemini Pro1.5、GPT-4,仅次于大杯 Claude 3 Opus。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。