Gate 广场「创作者认证激励计划」优质创作者持续招募中!
立即加入,发布优质内容,参与活动即可瓜分月度 $10,000+ 创作奖励!
认证申请步骤:
1️⃣ 打开 App 首页底部【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】,提交申请等待审核
立即报名:https://www.gate.com/questionnaire/7159
豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000 丰厚奖励等你拿!
活动详情:https://www.gate.com/announcements/article/47889
Grok 性能里程碑已达成
最新的基准评估显示在多个AI评估框架中取得了显著成就。该模型现已在OpenRouter排行榜中名列前茅,处理了大约4890亿个tokens,类别占比达31.2%,在语言特定基准测试中处理了1160亿个tokens。
这些结果不仅仅体现在一般排名上——该系统还在Kilo Code和Roo Code排行榜上夺得第一名,这两个环境专门用于评估代码生成和推理能力。EQ-Bench3评估进一步确认了其先进的性能指标,展示了在多样的技术评估方法中持续的卓越表现。
累计数据表明模型在效率、tokens处理优化和跨领域能力开发方面取得了实质性提升。这些进步对于将AI解决方案集成到区块链应用和去中心化系统的开发者尤为重要,因为计算的可靠性和性能一致性直接影响用户体验和平台的可扩展性。