2025-12-27 21:20:12

Grok 性能里程碑已达成

最新的基准评估显示在多个AI评估框架中取得了显著成就。该模型现已在OpenRouter排行榜中名列前茅，处理了大约4890亿个tokens，类别占比达31.2%，在语言特定基准测试中处理了1160亿个tokens。

这些结果不仅仅体现在一般排名上——该系统还在Kilo Code和Roo Code排行榜上夺得第一名，这两个环境专门用于评估代码生成和推理能力。EQ-Bench3评估进一步确认了其先进的性能指标，展示了在多样的技术评估方法中持续的卓越表现。

累计数据表明模型在效率、tokens处理优化和跨领域能力开发方面取得了实质性提升。这些进步对于将AI解决方案集成到区块链应用和去中心化系统的开发者尤为重要，因为计算的可靠性和性能一致性直接影响用户体验和平台的可扩展性。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

13人点赞了这条动态

赞赏
13
5
转发
分享

0/400

链上小透明

· 2025-12-30 06:18

grok这成绩是真不错啊，不过排行榜这东西说实话得看它啥时候翻车，之前那些号称第一的模型后来怎么样了啦

NFTRegretter

· 2025-12-27 21:45

又被Grok的benchmark吊打了，这数字真的绷不住了

WalletDetective

· 2025-12-27 21:40

grok又卷起来了，这数据看着倒是唬人...489B tokens什么的，反正我是看不懂，但排名第一这事儿还是值得留意的

智能合约捉虫人

· 2025-12-27 21:40

grok又在刷榜啊...489B tokens这数字听着就离谱，真的假的？

热门话题
查看更多
#
GateAI正式上线
3906 热度
#
比特币六连涨
1.63万热度
#
Meme币板块回暖
1.17万热度
#
美司法部抛售比特币
5880 热度
#
我的2026第一条帖
9.45万热度

热门 Gate Fun
查看更多

1
1767
1767
市值:$3603.44持有人数:1
0.00%
2
BTR
BTCHTrump
市值:$3628.16持有人数:2
0.00%
3
FAD
FADEM
市值:$3864.96持有人数:2
1.15%
4
FAD
Fadem
市值:$3617.67持有人数:2
0.00%
5
QTUM
QTUM
市值:$3648.27持有人数:1
0.00%

Grok 性能里程碑已达成

热门话题

GateAI正式上线

比特币六连涨

Meme币板块回暖

美司法部抛售比特币

我的2026第一条帖

热门 Gate Fun

1767

1767

BTR

BTCHTrump

FAD

FADEM

FAD

Fadem

QTUM

QTUM

置顶