开云sports AI界也有“扫地僧”? 阿联酋刚发了个狠, 700亿参数全敞开

开云sports AI界也有“扫地僧”? 阿联酋刚发了个狠, 700亿参数全敞开

在2026年1月28号这天,阿联酋那处的G42、Cerebras这些顶级团队,加上一所叫穆罕默德·本·扎耶德的东说念主工智能大学(名字挺长,咱就管它叫“中东AI名校”),联手抛出了一个“深水炸弹”——K2 Think V2。

这名字听着有点像登山,其实它是一个有着700亿参数的推理模子。你可能会说,参数多算啥?目下几千亿的都有。但这个模子最硬核的场合在于:它不光是才能高,况兼是开源的。

啥叫开源?简便说,即是这群科学家把这台“超等电脑”的每一个零件、每一溜代码、以致它是奈何被教出来的“教科书”,完全摊在阳光下给全世界看。这在我们这种粗拙用户看来,可能即是多了一个免费好用的器用;但在行内东说念主眼里,这几乎即是给AI界立了一个新的“江湖步调”。

咱先聊聊,为啥我们需要这种“爱念念考”的AI?

你浅近用AI写个周报、问个菜谱,目下的模子基本都能惩办。但若是你让它解一说念复杂的奥数题,或者写一段异常狰狞的门径,它巧合候就开动“一册谨慎地瞎掰八说念”。这即是我们常说的“幻觉”。

K2 Think V2此次最牛的场合,即是把“幻觉”率给打下来了。有个有益搞测试的第三方机构叫Artificial Analysis,他们测完之后吓一跳:比拟前代,这个新模子的幻觉率从89%径直降到了52%。固然还没到100%准确,但这率先就像是从一个满嘴跑火车的“小混混”,酿成了一个懂点逻辑、知说念先想后说的“靠谱后生”。

它是奈何作念到的呢?其实逻辑很简便,即是让AI学会“慢念念考”。

{jz:field.toptypename/}

我们东说念主遭遇艰辛,第一反馈可能是蒙,但好坏的东说念主会拿张纸,在上头写写画画,分步拆解。K2 Think V2就内置了这种“念念维链”。它不再是反射性地蹦出谜底,而是像个老学究相通,在后台先把逻辑理了了。

数据方面,它然而个“大胃王”。它基于一个叫K2-V2的基础模子,用了冒昧12万亿个token的数据进行西宾。你可以调治为,它把全世界能找到的高质料竹帛、代码、论文番来覆去读了多数遍。更好坏的是,它阿谁“挂牵力”几乎惊东说念主。

咱浅近写著述,若是写个几千字,AI可能就忘了开首写的啥。但这哥们儿因循512,000个token的高下文,这意味着你把一整本厚厚的长篇演义扔给它,它不仅能重新读到尾,还能准确地告诉你第30页和第400页之间逻辑是不是对得上。

这就很有益念念了。以往这种顶级才略,大多被关在那些科技巨头的“围墙”里,你想用?得交钱,还得看东说念主家情势。阿联酋此次的作念法,其实即是在本领独处上狠狠地推了一把。他们用的数据集全是我方全心挑选的,不依赖别东说念主,主打一个“我的大脑我作念主”。

我们再来望望它的实战收成单,这数据不骗东说念主。

{jz:field.toptypename/}

在那些探究生水平的科学基准测试,开云体育官方网站比如GPQA Diamond里,它的得分是72.98。而在最难的数学竞赛AIME 2025上,得分达到了90.42。这是啥倡导?这就好比一个学生,不光能考上清华北大的探究生,还能在宇宙顶尖的数学奥赛里拿高分。

况兼,这个模子在“东说念主类临了一场测验”(Humanity's Last Exam)这种变态难度的测试里,也有可以的阐明。说白了,它即是为了解决那些最硬、最难的问题而生的。

不外,我们行为创作家或者粗拙用户,最暄和的可能如故:这玩意儿我能用上吗?

谜底是:能,况兼很便捷。

他们不仅发布了代码,还径直作念好了iOS和安卓的APP,网页版也能径直上。这种“保姆级”的管事,在开源界的确未几见。曩昔我们想用个开源模子,还得我方租管事器、配环境,折腾半天还不一定跑得通。目下好了,径直下载个APP,就能体验中东“脑王”的管事。

写到这儿,我其实挺感叹的。你看,目下的AI发展一经不是某一个场合的“独角戏”了。从好意思国硅谷到中国,再到目下的阿联酋,全世界的贤慧脑瓜都在往一块儿用力。

中东AI大学

阿联酋此次出的招儿,如实让许多老牌强队感到了压力。因为它不仅强,还鲁莽。这就好比全球都在藏着掖着我方的独家秘方,效果有一个东说念主站出来说:“来,这是我的配方,全球都拿去用,我们一都把蛋糕作念大。”

这种派头,如实值得咱点个赞。

天然,我们也得客不雅地看。固然幻觉率缩短了,但AI毕竟如故AI,它还没到能完全替代东说念主类判断的地步。它更像是一个常识富庶、但偶尔也会犯莽撞的超等助手。我们用它,是为了帮我们从简搜索和拆解问题的时分,而不是把大脑完全交给它。

就像我写这篇著述,固然查了许多辛苦,也用了AI去调治那些高深的参数,但临了的遣意造句、这些带着温度的话,如故得咱我方一个字一个字敲出来。因为笔墨背后的方式和念念考,才是我们东说念主类最无可替代的。

临了,我想问问全球:若是以后AI的确能像东说念主相通逻辑严实、不撒谎,你最想让它帮你解决生涯中的什么艰辛?是指令孩子那让东说念主头疼的奥数题,如故帮你分析那乱如麻的痛快报表?接待在评述区里聊聊你的看法,全球一块儿畅想一下。