开云sports AI界也有“扫地僧”? 阿联酋刚发了个狠, 700亿参数全敞开

发布日期：2026-02-14 12:29 点击次数：132

开云sports AI界也有“扫地僧”? 阿联酋刚发了个狠， 700亿参数全敞开

在2026年1月28号这天，阿联酋那处的G42、Cerebras这些顶级团队，加上一所叫穆罕默德·本·扎耶德的东说念主工智能大学（名字挺长，咱就管它叫“中东AI名校”），联手抛出了一个“深水炸弹”——K2 Think V2。

这名字听着有点像登山，其实它是一个有着700亿参数的推理模子。你可能会说，参数多算啥？目下几千亿的都有。但这个模子最硬核的场合在于：它不光是才能高，况兼是开源的。

啥叫开源？简便说，即是这群科学家把这台“超等电脑”的每一个零件、每一溜代码、以致它是奈何被教出来的“教科书”，完全摊在阳光下给全世界看。这在我们这种粗拙用户看来，可能即是多了一个免费好用的器用；但在行内东说念主眼里，这几乎即是给AI界立了一个新的“江湖步调”。

咱先聊聊，为啥我们需要这种“爱念念考”的AI？

你浅近用AI写个周报、问个菜谱，目下的模子基本都能惩办。但若是你让它解一说念复杂的奥数题，或者写一段异常狰狞的门径，它巧合候就开动“一册谨慎地瞎掰八说念”。这即是我们常说的“幻觉”。

K2 Think V2此次最牛的场合，即是把“幻觉”率给打下来了。有个有益搞测试的第三方机构叫Artificial Analysis，他们测完之后吓一跳：比拟前代，这个新模子的幻觉率从89%径直降到了52%。固然还没到100%准确，但这率先就像是从一个满嘴跑火车的“小混混”，酿成了一个懂点逻辑、知说念先想后说的“靠谱后生”。

它是奈何作念到的呢？其实逻辑很简便，即是让AI学会“慢念念考”。

{jz:field.toptypename/}

我们东说念主遭遇艰辛，第一反馈可能是蒙，但好坏的东说念主会拿张纸，在上头写写画画，分步拆解。K2 Think V2就内置了这种“念念维链”。它不再是反射性地蹦出谜底，而是像个老学究相通，在后台先把逻辑理了了。

数据方面，它然而个“大胃王”。它基于一个叫K2-V2的基础模子，用了冒昧12万亿个token的数据进行西宾。你可以调治为，它把全世界能找到的高质料竹帛、代码、论文番来覆去读了多数遍。更好坏的是，它阿谁“挂牵力”几乎惊东说念主。

咱浅近写著述，若是写个几千字，AI可能就忘了开首写的啥。但这哥们儿因循512，000个token的高下文，这意味着你把一整本厚厚的长篇演义扔给它，它不仅能重新读到尾，还能准确地告诉你第30页和第400页之间逻辑是不是对得上。

这就很有益念念了。以往这种顶级才略，大多被关在那些科技巨头的“围墙”里，你想用？得交钱，还得看东说念主家情势。阿联酋此次的作念法，其实即是在本领独处上狠狠地推了一把。他们用的数据集全是我方全心挑选的，不依赖别东说念主，主打一个“我的大脑我作念主”。

我们再来望望它的实战收成单，这数据不骗东说念主。

在那些探究生水平的科学基准测试，开云体育官方网站比如GPQA Diamond里，它的得分是72.98。而在最难的数学竞赛AIME 2025上，得分达到了90.42。这是啥倡导？这就好比一个学生，不光能考上清华北大的探究生，还能在宇宙顶尖的数学奥赛里拿高分。

况兼，这个模子在“东说念主类临了一场测验”（Humanity's Last Exam）这种变态难度的测试里，也有可以的阐明。说白了，它即是为了解决那些最硬、最难的问题而生的。

不外，我们行为创作家或者粗拙用户，最暄和的可能如故：这玩意儿我能用上吗？

谜底是：能，况兼很便捷。

他们不仅发布了代码，还径直作念好了iOS和安卓的APP，网页版也能径直上。这种“保姆级”的管事，在开源界的确未几见。曩昔我们想用个开源模子，还得我方租管事器、配环境，折腾半天还不一定跑得通。目下好了，径直下载个APP，就能体验中东“脑王”的管事。

写到这儿，我其实挺感叹的。你看，目下的AI发展一经不是某一个场合的“独角戏”了。从好意思国硅谷到中国，再到目下的阿联酋，全世界的贤慧脑瓜都在往一块儿用力。

中东AI大学

阿联酋此次出的招儿，如实让许多老牌强队感到了压力。因为它不仅强，还鲁莽。这就好比全球都在藏着掖着我方的独家秘方，效果有一个东说念主站出来说：“来，这是我的配方，全球都拿去用，我们一都把蛋糕作念大。”

这种派头，如实值得咱点个赞。

天然，我们也得客不雅地看。固然幻觉率缩短了，但AI毕竟如故AI，它还没到能完全替代东说念主类判断的地步。它更像是一个常识富庶、但偶尔也会犯莽撞的超等助手。我们用它，是为了帮我们从简搜索和拆解问题的时分，而不是把大脑完全交给它。

就像我写这篇著述，固然查了许多辛苦，也用了AI去调治那些高深的参数，但临了的遣意造句、这些带着温度的话，如故得咱我方一个字一个字敲出来。因为笔墨背后的方式和念念考，才是我们东说念主类最无可替代的。

临了，我想问问全球：若是以后AI的确能像东说念主相通逻辑严实、不撒谎，你最想让它帮你解决生涯中的什么艰辛？是指令孩子那让东说念主头疼的奥数题，如故帮你分析那乱如麻的痛快报表？接待在评述区里聊聊你的看法，全球一块儿畅想一下。

开云sports AI界也有“扫地僧”? 阿联酋刚发了个狠, 700亿参数全敞开

热点资讯

推荐资讯