来源:ITBEAR科技资讯
一款名为HC1的AI推理芯片近日在硅谷引发广泛关注。这款由初创公司Taalas研发的芯片,凭借每秒17000个token的峰值推理速度,成为当前AI芯片领域的现象级产品。与传统方案相比,HC1不仅将推理速度提升10倍,更将成本压缩至二十分之一,功耗降低至十分之一,为LLM(大语言模型)的实时应用开辟了新可能。

HC1的核心突破在于其“芯片即模型”的架构设计。与传统将模型加载至内存的方式不同,Taalas团队直接将Llama 3.1 8B模型固化在硅片上,通过掩模ROM技术实现模型与硬件的深度融合。这种设计虽牺牲了部分灵活性,却换来了极致的能效比——单颗芯片典型功耗仅250W,10颗芯片组成的服务器集群总功耗也不过2.5kW,可直接采用常规空气冷却方案部署。
性能对比数据凸显了HC1的颠覆性。在相同模型测试中,Cerebras的推理速度为2000 token/s,SambaNova约为900 token/s,Groq为600 token/s,而英伟达Blackwell架构的B200仅350 token/s。HC1的17000 token/s表现,相当于将行业标杆性能提升了数个数量级。这种优势源于其结构化ASIC设计理念:通过固定底层电路、仅调整两层掩模的方式,将芯片开发周期从传统6个月缩短至2个月,同时保持设计成本可控。
技术实现层面,HC1采用台积电N6工艺,芯片面积815mm²,支持开源生态。其创新性的存储架构包含可编程SRAM区域,用于保存微调权重(如LoRA)和KV缓存,而模型主体则通过掩模ROM固化执行。为弥补量化带来的精度损失,研究团队开发了LaRA适配器进行重新训练,并配置可调上下文窗口,在灵活性与性能间取得平衡。这种“硬连线”设计虽面临模型迭代风险,却为特定场景提供了前所未有的效率优势。
Taalas的野心不止于单芯片突破。针对DeepSeekR1-671B等超大模型,团队提出了多芯片协同方案:将SRAM部分拆分至独立芯片,使单片HC1的存储密度提升至约20位参数。30颗定制芯片组成的集群可实现每用户每秒12000 token的处理速度,且成本不到同等GPU方案的50%。即使考虑HC1每年更新的假设,其四年总成本仍优于GPU的四年更新周期。
这家成立仅两年的公司,拥有堪称“AMD梦之队”的创始阵容。联合创始人Ljubiša Bajić曾任AMD集成电路设计总监,主导过高性能GPU研发;Leila Bajić拥有AMD、ATI、Altera的跨平台技术管理经验;Drago Ignjatović则是AMD前ASIC设计总监。三位技术领袖的深厚积淀,使Taalas在创立初期即获得2亿美元融资,目前团队规模仅24人,产品研发投入仅3000万美元。
市场对HC1的评价呈现两极分化。支持者认为其亚毫秒级延迟将推动具身智能、实时交互等前沿领域发展;批评者则指出硬编码架构可能加速芯片过时,尤其在模型迭代速度日益加快的背景下。这种争议恰恰反映了AI芯片设计的核心矛盾:通用性与专用性的永恒博弈。Taalas的选择,无疑为行业提供了一条激进却值得深思的新路径。
中考点考是指在中考(初中毕业生升学考试)中,对于某些重点、难点知识点的考查。这种考查方式旨在检验学生对核心知识掌握的深度和广度,确保学生能够熟练运用所学知识解决问题。 一、中考点考的重要性 中...
谷歌母公司Alphabet和马斯克的社交媒体平台X可能成为欧盟监管机构下一个罚款对象? 美国总统特朗普的关税威胁仍在大西洋上空持续盘旋,美国科技巨头在被“回旋镖”打中的同时也成为“战场”之一。 欧盟委...
徽商银行贷款还不上,可以协商还款吗?——我的亲身经历和经验分享大家好,我是一个曾经因为经济状况不佳而遇到贷款还款困难的人,今天想跟大家聊聊一个很多人都关心的问——“徽商银行贷款还不上,可以协商还款吗...
2025年10月27日, 早盘开盘,国内期货主力合约涨跌不一。生猪涨超2%,国际铜、集运欧线涨近2%,鸡蛋、沪铜、液化石油气(LPG)、低硫燃料油(LU)、燃料油涨超1%。跌幅方面,红枣、沪金跌超1...
股指: 昨日,A股市场高位震荡,Wind全A收涨0.17%,成交额2.39万亿元。中证1000指数下跌0.37%,中证500指数上涨0.24%,沪深300指数上涨0.6%,上证50指数上涨0.45%...
本文详细了初中阶段中考各科目的主要考点,帮助学生在复习备考过程中有的放矢,提高学习效率。 一、语文考点梳理 初中语文中考主要包括古诗文阅读、现代文阅读、作文三大模块。其中,古诗文阅读考查学生对...