关闭广告

Artificial Analysis评测新鲜出炉:Kimi K2 thinking位居世界第二,开源第一

AI寒武纪2620人阅读


根据著名AI分析机构Artificial Analysis的评估,Kimi K2 Thinking在智能体(agentic)相关任务中表现非常突出,但在完成评测时生成了所有模型中最多的token,表现出非常“话痨”的特性

以下是其核心要点:

智能指数67分,登顶开源榜首

Kimi K2 Thinking在Artificial Analysis智能指数中获得67分。

这一成绩使其明确领先于所有其他开源权重模型,包括最近发布的MiniMax-M2(61分)和DeepSeek-V3.2-Exp(57分),在所有模型中仅次于GPT-5

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

全球最大容器镜像库Docker Hub安全调查:10000+镜像泄露敏感密钥

IT之家 浏览 2129

港媒:中美达成共识后,荷兰在接管安世问题上进退两难

环球时报国际 浏览 2729

媒体:马克龙戴墨镜出席达沃斯 说的话不给特朗普面子

新民周刊 浏览 18986

前安永合伙人,因酒吧斗殴被解雇,早前涉嫌勾引已婚女合伙人被警告

财通社 浏览 2609

今日起,数字人民币开始计息,这些变化影响你的钱包

红星资本局 浏览 1829

长城魏牌汽车,到底被谁“逼急”了?丨正经深度

正经社 浏览 1729

长城汽车10月销售新车14.31万辆 同比增长22.5%

网易汽车 浏览 2605

法尔克:作为升班马,对阵曼联时拿到一分始终是个不错的结果

懂球帝 浏览 1860

多家银行关停旗下App,银行App关闭潮意味着什么?

江瀚视野 浏览 2909

北约下周军演 将模拟可能动用核武器场景

界面新闻 浏览 2846

微软CEO纳德拉:能源成本将决定哪些国家能在人工智能竞赛中胜出

IT之家 浏览 1642

汽车行业杂耍式营销何时休?

道哥说车 浏览 1746

主要针对能源企业,仍然保留对话空间,俄称已对美欧制裁形成“免疫力”

环球网资讯 浏览 2705

杨振宁逝世:改变了中国人觉得不如人的心理/库克:苹果AI正努力入华/GPT-5攻克「百年数学难题」遭反转|Hunt Good周报

爱范儿 浏览 2840

《红舞鞋》官微删除道歉信,司机还挑衅网友:猫也没人疼戏照样拍

萌神木木 浏览 2701

歼-10又发威!巴铁击落印度战机并俘虏飞行员

浏览 6838

中国车在俄份额跌破50%,新一轮洗牌开启

汽车公社 浏览 2157

配激光雷达+磁悬浮底盘,深蓝L06将于11月18日上市

隔壁说车老王 浏览 2509

巩俐的前夫是圈外高级打工人,75岁在新加坡养老

白面书誏 浏览 2726

联合国认定以色列在加沙犯下种族灭绝罪行 外交部回应

外交部网站 浏览 3435

或引入吉利雷神,韩国现代接触中国的插混方案

路咖汽车 浏览 2061
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1