DeepSeek和李飞飞之后，英伟达也看上阿里千问？

花花2025-05-14科普教程230

要说全球开源大模型生态圈里，谁最让人“魂牵梦绕”？

阿里，当仁不让。

就在上周，继DeepSeek和“AI教母”李飞飞之后，英伟达也相中阿里了。除了在最新的“混合推理模型”千问3宣布开源当日，火速官宣接入适配后，5月9日，英伟达还

开源了全新的代码推理模型Open Code Reasoning（后续简称：OCR），包括7B、14B、32B三种尺寸，基础模型用的都是通义千问。

在LiveCodeBench 评测中，成功超越Open AI 公司o3-mini和o1模型的英伟达OCR-Qwen-32B-Instruct模型，正是基于Qwen2.5-32B微调形成的。

在通义千问已经迭代至3.0版本，模型性能再度突破的当下，英伟达居然还基于上一代千问模型做出了比肩全球一流水平的模型，让人不禁想问，千问到底还有多少隐藏潜力待各方解锁？

DeepSeek、李飞飞后，英伟达也相中了“通义千问”

目前，英伟达开源的OCR系列模型的代码及数据集，已公开分享至全球最大AI开源社区Hugging Face平台上，供开发者们免费浏览学习。

其中，英伟达OCR-Qwen-32B-Instruct在LiveCodeBench的pass@1测试中获得了61.8%的成绩，超过了OpenAI的O3-Mini-2025-01-31（Low）和 O1-2024-12-17（Low ）。要知道，后面这两位可是闭源模型的代表之一。很长时间里，大家一提到开源模型和闭源模型，总觉得论能力，闭源肯定是遥遥领先于开源的。

可英伟达此次开源的OCR模型，恰巧反驳了这点。只要你的底座模型足够好，哪怕不是最新版本的开源模型，在经过高质量训练和优化后，也能超越闭源模型。

这就让人不由得想起，此前被业界称为“AI教母”的斯坦福大学人工智能研究院院长李飞飞团队，也曾基于阿里通义千问Qwen2.5-32B-Instruct，训练出与OpenAI o1、DeepSeek R1等尖端推理模型数学及编码能力相当的s1-32B模型。

今年4月，李飞飞团队最新研究报告《2025 AI 指数报告》还显示：中美两国模型性能差距已经由2023年的17.5%大幅缩至0.3%，近乎持平。阿里6大模型入选报告，论模型贡献度，仅次于OpenAI和Google，排名全球第三、中国第一。

更早之前，DeepSeek官方也曾透露，曾将DeepSeek-R1的推理能力蒸馏6个模型开源给社区，其中4个来自千问，且在多项能力上实现了对标OpenAI o1-mini的效果。

不少学者指出，千问是所有开源模型中“隐藏惊喜”最大的。滑铁卢大学陈文虎教授直言，用同样的方法训练和微调别的模型都不管用，只有千问才有效果，“千问系列模型一定有一些魔力！”

衍生模型超10万，通义千问被青睐的“三大原因”

事实上在开源大模型领域，被千问“迷之魅力”吸引来的，远不止英伟达、DeepSeek、李飞飞团队这些顶级公司和大佬。更多的，还是日常在频繁使用大模型的普通开发者们。

据公开数据显示，截至当前，千问全球下载量超3亿；在HuggingFace社区2024年全球模型下载量中，占比超30%，稳居全球第一。千问衍生模型数量已突破10万，超越美国Llama模型，是全球第一AI开源模型。在2025年2月的Huggingface全球开源大模型榜单（Open LLM Leaderboard）中，排名前十的开源模型全部都是基于千问Qwen二次开发的衍生模型。

一个来自中国的大模型，为何在全球AI社区引发狂潮？在商天信息网科技看来，以下三方面起到了关键作用。

一是性能强劲，成本更低。

每次千问的新发布，几乎都刷新了开源模型的上限，款款SOTA（最佳性能）。

比如最近的千问3，实现了对DeepSeek R1、OpenAI-o1等全球顶尖模型的超越。在奥数水平的AIME25测评里，千问3斩获81.5分，刷新开源纪录；在考察代码能力的LiveCodeBench评测中，千问3突破70分大关，表现甚至超过Grok3；在评估模型人类偏好对齐的ArenaHard测评中，千问3以95.6分超越OpenAI-o1及DeepSeek-R1。

这样顶尖的千问3模型，部署成本只有性能相近模型的1/3，而推理成本按照吴恩达的Artifical Analysis 最新报告看，不到DeepSeek-R1的三成，是Claude3.7的二十分之一。

性能最强，成本更低，免费商用，这样的千问模型谁不喜欢呢？

其次，千问提供了丰沛的开源选项。

通常，决定一家模型厂商边界有多宽的，除了模型的”高度“，还有它的“广度”。对于全球数以万计的开发者而言，”好用“永远是摆在第一位的。

此前，媒体报道称，苹果牵手阿里千问，业界一致的共识，除了阿里大厂背书、服务有保障以外，和千问本身囊括了所有模型种类和尺寸不无关系。

阿里通义团队截至目前共开源200多款模型，从文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等“全模态”模型，到0.5B、1.5B、3B、7B、14B、32B、72B、110B、235B等“全尺寸”模型，几乎是世界上开源层次最丰富、布局最饱满的模型家族。

合作方想要的，掏掏通义千问的口袋，它几乎都有。

这就很好了。

Manus的联合创始人张涛也在最近的一次直播中提到：千问3提供的119种语言支持，将给予全球开发者重要帮助。特别是在一些小语种地区，比如中东的沙特、阿联酋，当地用户虽然对AI能力非常渴求，但鲜有产品能照顾到他们的需求。千问3此举，于这些地区的开发者而言，是一次极大的利好。

事实证明，自千问3开源后，海外关于国产AI模型的讨论声浪愈发壮大。甚至还有诸如匈牙利、泰国、印度、越南等诸多小语种国家的开发者，自发为千问3当起了“推广大使”，赞赏千问模型让他们第一次拥有了最顶级的本国语言模型。

第三，千问拥有最广泛的“朋友圈”，围绕千问打造了极强的开源生态。

“从来没有一个模型的发布能像千问3这样，得到这么多生态的支持。”

在千问3开源当天，技术大拿Simon Willis在围观了模型发布全程后发出如此感慨。

在博客标题中，他甚至将千问3视为是模型发布的一大“范本”。

国际开源社区对Qwen3的支持是所有模型中最丰富的，覆盖了主流的开源机构和平台，比如主流推理架构平台SGLang、vLLM、苹果的MXL，以及Ollama、Unsloth AI、Kaggle、openRouter等主流的模型部署工具平台、量化服务、模型服务与推理平台等等。

这意味着，千问3一开源，所有开发者和机构就可直接上手体验，不需要等各种配套，有时这种配套需要数周甚至数月来实现。

在产业界，同样一大批产业链上下游企业宣布适配及接入，除了英伟达，还有英特尔、高通、联发科等多家头部芯片厂商，北上津杭等十余地算力平台，以及华为昇腾、百度千帆、中科曙光等多家AI公司和大模型服务平台，都在连夜接入和适配千问3。

某种程度上说，千问就是目前大模型开源领域的事实上的“标准”，围绕千问自然发展成型的开源生态，最终成为了千问击败所有对手的最重要的“护城河”。

以模型为支点，阿里未来还有什么大招？

千问是全球开源社区的扛把子，也是阿里最重要的AI战略支点。

今年2月，阿里巴巴集团CEO吴泳铭曾公开宣布，未来三年将投入超过3800亿元，用于建设云和人工智能硬件基础设施，总额超过去十年总和。有统计显示，这是中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模投资。

在近日举办的阿里日亲友见面会上，阿里巴巴董事长蔡崇信也再次强调：“阿里要把AI融入每一块业务、每一个环节，未来三到五年，所有业务都应以AI为驱动。”

如此大额度的投资计划，放在当下，无疑是对阿里坚定AI战略的强力证明，并且对于AI的未来，阿里准备好了。

比如，全新开源的千问3，在Agent能力树方面点到了顶级：在评估模型Agent能力的BFCL评测中，千问3创下70.8的新高，超越Gemini2.5-Pro、OpenAI-o1等顶尖模型，将大幅降低Agent调用工具的门槛。同时，千问3原生支持MCP协议，并具备强大的工具调用（function calling）能力，结合封装了工具调用模板和工具调用解析器的Qwen-Agent框架，将大大降低编码复杂性，实现高效的手机及电脑Agent操作等任务。

阿里云百炼上线业界首个全生命周期MCP服务，可满足不同场景的Agent应用开发需求。阿里云牵头的中国第一AI开源社区魔搭（ModelScope），也推出了全新的MCP广场，旨在通过开源开放的方式加速Agent及AI应用的创新和落地。同时，阿里云还预告了AI Agent Store的愿景，通过Agent Store 这种创新模式，把阿里巴巴集团和生态伙伴的Agent向外开放，让各行各业的人都可以拥有自己专属的助理。

肉眼可见，一个以通义系列模型为核心的布局逐渐清晰。更不必说，阿里旗下淘宝、天猫、闲鱼、夸克、高德、钉钉等业务，也正为通义系列模型的发展提供了更为直接的锻炼场所。

以通义系列大模型为支点，阿里正撬动起一个更为广泛的AI落地新未来。

花花编辑

返回列表

上一篇：固态电池板块迎来密集催化，万向钱潮3连板领跑

下一篇：东方妍美-B，专注再生医学材料及特医食品，递交IPO招股书，拟赴香港上市