DeepSeek和李飞飞之后,英伟达也看上阿里千问?

花花2025-05-14科普教程4

李飞飞阿里巴巴__阿里李飞飞个人简历

要说全球开源大模型生态圈里,谁最让人“魂牵梦绕”?

阿里,当仁不让。

就在上周,继DeepSeek和“AI教母”李飞飞之后,英伟达也相中阿里了。除了在最新的“混合推理模型”千问3宣布开源当日,火速官宣接入适配后,5月9日,英伟达还

开源了全新的代码推理模型Open Code Reasoning(后续简称:OCR),包括7B、14B、32B三种尺寸,基础模型用的都是通义千问。

李飞飞阿里巴巴_阿里李飞飞个人简历_

在LiveCodeBench 评测中,成功超越Open AI 公司o3-mini和o1模型的英伟达OCR-Qwen-32B-Instruct模型,正是基于Qwen2.5-32B微调形成的。

在通义千问已经迭代至3.0版本,模型性能再度突破的当下,英伟达居然还基于上一代千问模型做出了比肩全球一流水平的模型,让人不禁想问,千问到底还有多少隐藏潜力待各方解锁?

DeepSeek、李飞飞后,英伟达也相中了“通义千问”

目前,英伟达开源的OCR系列模型的代码及数据集,已公开分享至全球最大AI开源社区Hugging Face平台上,供开发者们免费浏览学习。

其中,英伟达OCR-Qwen-32B-Instruct在LiveCodeBench的pass@1测试中获得了61.8%的成绩,超过了OpenAI的O3-Mini-2025-01-31(Low)和 O1-2024-12-17(Low )。要知道,后面这两位可是闭源模型的代表之一。很长时间里,大家一提到开源模型和闭源模型,总觉得论能力,闭源肯定是遥遥领先于开源的。

可英伟达此次开源的OCR模型,恰巧反驳了这点。只要你的底座模型足够好,哪怕不是最新版本的开源模型,在经过高质量训练和优化后,也能超越闭源模型。

这就让人不由得想起,此前被业界称为“AI教母”的斯坦福大学人工智能研究院院长李飞飞团队,也曾基于阿里通义千问Qwen2.5-32B-Instruct,训练出与OpenAI o1、DeepSeek R1等尖端推理模型数学及编码能力相当的s1-32B模型。

今年4月,李飞飞团队最新研究报告《2025 AI 指数报告》还显示:中美两国模型性能差距已经由2023年的17.5%大幅缩至0.3%,近乎持平。阿里6大模型入选报告,论模型贡献度,仅次于OpenAI和Google,排名全球第三、中国第一。

更早之前,DeepSeek官方也曾透露,曾将DeepSeek-R1的推理能力蒸馏6个模型开源给社区,其中4个来自千问,且在多项能力上实现了对标OpenAI o1-mini的效果。

不少学者指出,千问是所有开源模型中“隐藏惊喜”最大的。滑铁卢大学陈文虎教授直言,用同样的方法训练和微调别的模型都不管用,只有千问才有效果,“千问系列模型一定有一些魔力!”

衍生模型超10万,通义千问被青睐的“三大原因”

事实上在开源大模型领域,被千问“迷之魅力”吸引来的,远不止英伟达、DeepSeek、李飞飞团队这些顶级公司和大佬。更多的,还是日常在频繁使用大模型的普通开发者们。

据公开数据显示,截至当前,千问全球下载量超3亿;在HuggingFace社区2024年全球模型下载量中,占比超30%,稳居全球第一。千问衍生模型数量已突破10万,超越美国Llama模型,是全球第一AI开源模型。在2025年2月的Huggingface全球开源大模型榜单(Open LLM Leaderboard)中,排名前十的开源模型全部都是基于千问Qwen二次开发的衍生模型。

一个来自中国的大模型,为何在全球AI社区引发狂潮?在商天信息网科技看来,以下三方面起到了关键作用。

一是性能强劲,成本更低。

每次千问的新发布,几乎都刷新了开源模型的上限,款款SOTA(最佳性能)。

比如最近的千问3,实现了对DeepSeek R1、OpenAI-o1等全球顶尖模型的超越。在奥数水平的AIME25测评里,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越OpenAI-o1及DeepSeek-R1。

阿里李飞飞个人简历_李飞飞阿里巴巴_

这样顶尖的千问3模型,部署成本只有性能相近模型的1/3,而推理成本按照吴恩达的Artifical Analysis 最新报告看,不到DeepSeek-R1的三成,是Claude3.7的二十分之一。

_阿里李飞飞个人简历_李飞飞阿里巴巴

性能最强,成本更低,免费商用,这样的千问模型谁不喜欢呢?

其次,千问提供了丰沛的开源选项。

通常,决定一家模型厂商边界有多宽的,除了模型的”高度“,还有它的“广度”。对于全球数以万计的开发者而言,”好用“永远是摆在第一位的。

此前,媒体报道称,苹果牵手阿里千问,业界一致的共识,除了阿里大厂背书、服务有保障以外,和千问本身囊括了所有模型种类和尺寸不无关系。

阿里通义团队截至目前共开源200多款模型,从文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等“全模态”模型,到0.5B、1.5B、3B、7B、14B、32B、72B、110B、235B等“全尺寸”模型,几乎是世界上开源层次最丰富、布局最饱满的模型家族。

合作方想要的,掏掏通义千问的口袋,它几乎都有。

这就很好了。

Manus的联合创始人张涛也在最近的一次直播中提到:千问3提供的119种语言支持,将给予全球开发者重要帮助。特别是在一些小语种地区,比如中东的沙特、阿联酋,当地用户虽然对AI能力非常渴求,但鲜有产品能照顾到他们的需求。千问3此举,于这些地区的开发者而言,是一次极大的利好。

事实证明,自千问3开源后,海外关于国产AI模型的讨论声浪愈发壮大。甚至还有诸如匈牙利、泰国、印度、越南等诸多小语种国家的开发者,自发为千问3当起了“推广大使”,赞赏千问模型让他们第一次拥有了最顶级的本国语言模型。

第三,千问拥有最广泛的“朋友圈”,围绕千问打造了极强的开源生态。

“从来没有一个模型的发布能像千问3这样,得到这么多生态的支持。”

在千问3开源当天,技术大拿Simon Willis在围观了模型发布全程后发出如此感慨。

在博客标题中,他甚至将千问3视为是模型发布的一大“范本”。

国际开源社区对Qwen3的支持是所有模型中最丰富的,覆盖了主流的开源机构和平台,比如主流推理架构平台SGLang、vLLM、苹果的MXL,以及Ollama、Unsloth AI、Kaggle、openRouter等主流的模型部署工具平台、量化服务、模型服务与推理平台等等。

这意味着,千问3一开源,所有开发者和机构就可直接上手体验,不需要等各种配套,有时这种配套需要数周甚至数月来实现。

在产业界,同样一大批产业链上下游企业宣布适配及接入,除了英伟达,还有英特尔、高通、联发科等多家头部芯片厂商, 北上津杭等十余地算力平台,以及华为昇腾、百度千帆、中科曙光等多家AI公司和大模型服务平台,都在连夜接入和适配千问3。

某种程度上说,千问就是目前大模型开源领域的事实上的“标准”,围绕千问自然发展成型的开源生态,最终成为了千问击败所有对手的最重要的“护城河”。

以模型为支点,阿里未来还有什么大招?

千问是全球开源社区的扛把子,也是阿里最重要的AI战略支点。

今年2月,阿里巴巴集团CEO吴泳铭曾公开宣布,未来三年将投入超过3800亿元,用于建设云和人工智能硬件基础设施,总额超过去十年总和。有统计显示,这是中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模投资。

在近日举办的阿里日亲友见面会上,阿里巴巴董事长蔡崇信也再次强调:“阿里要把AI融入每一块业务、每一个环节,未来三到五年,所有业务都应以AI为驱动。”

如此大额度的投资计划,放在当下,无疑是对阿里坚定AI战略的强力证明,并且对于AI的未来,阿里准备好了。

比如,全新开源的千问3, 在Agent能力树方面点到了顶级:在评估模型Agent能力的BFCL评测中,千问3创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型,将大幅降低Agent调用工具的门槛。同时,千问3原生支持MCP协议,并具备强大的工具调用(function calling)能力,结合封装了工具调用模板和工具调用解析器的Qwen-Agent框架,将大大降低编码复杂性,实现高效的手机及电脑Agent操作等任务。

阿里云百炼上线业界首个全生命周期MCP服务,可满足不同场景的Agent应用开发需求。 阿里云牵头的中国第一AI开源社区魔搭(ModelScope),也推出了全新的MCP广场,旨在通过开源开放的方式加速Agent及AI应用的创新和落地。同时,阿里云还预告了AI Agent Store的愿景,通过Agent Store 这种创新模式,把阿里巴巴集团和生态伙伴的Agent向外开放,让各行各业的人都可以拥有自己专属的助理。

肉眼可见,一个以通义系列模型为核心的布局逐渐清晰。更不必说,阿里旗下淘宝、天猫、闲鱼、夸克、高德、钉钉等业务,也正为通义系列模型的发展提供了更为直接的锻炼场所。

以通义系列大模型为支点,阿里正撬动起一个更为广泛的AI落地新未来。

花花编辑

相关文章

联合国警告:人工智能可能影响40%就业岗位,加剧国家间贫富差距

联合国警告:人工智能可能影响40%就业岗位,加剧国家间贫富差距

要点 联合国贸易和发展机构在一份报告中称,到 2033 年,人工智能的市场价值预计将达到 4.8 万亿美元,大致相当于德国的经济规模。 然而,该机构也表达了担忧,认为人工智能可能会影响全球 40% 的...

净值曲线“大俯冲”,但斌“接飞刀”?

净值曲线“大俯冲”,但斌“接飞刀”?

文|翠鸟资本 当前,全球资本市场的风云变幻,权益投资领域的不确定性和风险被不断放大。 知名基金经理但斌近期的操作却引发了市场的广泛争议,因为他出现了一种“散户型”风格! 这位去年中国私募冠军的产品净...

全球首个人形机器人半程马拉松北京亦庄开跑

全球首个人形机器人半程马拉松北京亦庄开跑

专题:2025北京亦庄半程马拉松暨人形机器人半程马拉松 4月19日7点30分,20支人形机器人赛队与人类跑者共同站在北京亦庄全程21.0975公里的赛道上。随着一声枪响,全球首场“人机共跑”半程马拉松...

新一期LPR公布,为何“维持不变”?

新一期LPR公布,为何“维持不变”?

业内普遍认为,本月LPR保持不变,符合市场预期。一方面,7天期逆回购利率保持稳定,作为LPR报价的定价基础,其稳定很大程度上预示LPR会保持不变;另一方面,银行净息差仍处在低位,缺乏下调LPR报价加点...

对等关税引发连环暴跌 特朗普的“良药”毒杀全球投资者

对等关税引发连环暴跌 特朗普的“良药”毒杀全球投资者

当地时间4月6日,美国总统唐纳德·特朗普在乘坐总统专机“空军一号”时与记者谈到全面关税措施对美国经济的影响。 在被问及美股暴跌一事时,特朗普表示,自己并非故意策划股市抛售。特朗普说:“我不希望任何股...

美媒:马斯克不再在白宫办公后,特朗普最新演讲出人意料“挖苦”他

美媒:马斯克不再在白宫办公后,特朗普最新演讲出人意料“挖苦”他

【环球网报道】据美国《野兽日报》《华盛顿邮报》等媒体报道,美国总统特朗普当地时间5月1日在亚拉巴马大学毕业典礼上面向毕业生发表演讲时,出人意料地“挖苦”埃隆·马斯克。美媒此前传出,马斯克目前已不再在白...