
周一举办的开发者日活动上,OpenAI 公布了应用程序接口(API)的多项更新,包括推出最新语言模型 GPT-5 Pro、全新视频生成模型 Sora 2,以及一款体积更小、成本更低的语音模型。
此次 API 更新是 OpenAI 一系列公告的组成部分,这些公告均旨在吸引开发者加入其生态系统,其他举措还包括推出智能体构建工具,以及支持在 ChatGPT 内开发应用程序的功能。
OpenAI 首席执行官山姆・奥特曼表示,GPT-5 Pro 的推出可能会吸引金融、法律和医疗健康领域的应用开发者 —— 这些行业均需要 “高准确性和深度推理能力” 的技术支持。
奥特曼还指出,语音功能在未来将至关重要,因为它正迅速成为人们与人工智能交互的主要方式之一。为此,OpenAI 正于 API 中推出 “gpt-realtime mini”:这是一款体积更小、成本更低的语音模型,支持音频与语音的低延迟流式交互。该新型号比 OpenAI 此前的高级语音模型便宜 70%,同时保证 “语音质量和表现力不变”。
最后,参与 OpenAI 开发者生态的创作者如今可通过 API 预览版使用 Sora 2。上周,OpenAI 已发布其最新音视频生成模型 Sora 2,同时推出了Sora 应用 —— 这款应用内满是人工智能生成的短视频。用户可通过 Sora 应用,根据提示生成以自己、朋友或任意事物为主题的视频,并通过 TikTok 式的算法推荐流分享。
奥特曼表示:“(开发者)如今可直接在自己的应用中,使用驱动 Sora 2 生成惊艳视频效果的同款模型。”
Sora 2 在前代模型基础上进行了升级,能生成更逼真、物理逻辑更连贯的场景,实现声音与画面的同步,并提供更强的创意控制权 —— 从精细的镜头调度到风格化视觉呈现均涵盖在内。
奥特曼表示:“例如,你可以先确定一个类似 iPhone 拍摄的视角,然后通过提示让 Sora 将其扩展为一个宏大开阔、具有电影质感的宽幅镜头。但我们目前正在研发的最令人兴奋的成果之一,是这款新模型能将声音与视觉完美匹配 —— 不仅限于语音,还包括丰富的音景、环境音效,以及与画面内容紧密关联的同步特效。”
Sora 2 定位为一款概念开发工具,其应用场景广泛:既可以根据产品的整体风格,为广告打造视觉起点;也能帮助美泰(Mattel)的设计师将草图转化为玩具概念。奥特曼在开发者日活动中举了这个例子,这也间接揭示了 OpenAI 与这家芭比娃娃制造商达成的合作 —— 双方将把生成式人工智能整合到玩具开发流程中。
“作为经销商,我今年还干得下去吗?”7月17日,一名娃哈哈经销商在社交平台上发出了这样的感慨。在记者的追问下,他表示,娃哈哈家族纠纷事件对于产品销售及市场信心都有影响。 近期,一则关于娃哈哈董事长宗馥...
经济观察网 2026年2月11日,中威电子发布公告,公司实际控制人正式从新乡市人民政府变更为付英波先生。付英波作为AI领域资深人士,曾领导旷视科技的AI商业化落地,市场预期其将为中威电子注入人工智能技...
本文为您详细解析中考考点清单英语,帮助您系统掌握英语考试中的重点知识点,提升考试成绩。 一、中考英语词汇考点解析 在中考英语中,词汇是基础也是重点。考生需要掌握以下词汇考点:动词、名词、形容词...
初中期末考试结束后,为学生撰写评语是一项重要的教育工作。以下是一些最新的初中期末考试评语撰写建议,旨在鼓励学生、指导学生进步。 一、综合评价学生的学业表现 在这学期的期末考试中,你表现出了良好...
“60元的费列罗大金球,拳头大小的包装,打开后全是空气?!” 在情人节这个“糖分”很高的节日,鲜花和巧克力带来的甜蜜氛围里,一则则关于费列罗的消费者投诉 【下载黑猫投诉客户端】却在社交平台上迅速发酵。...
谷歌同意支付5000万美元,以解决一起指控该公司对黑人员工存在系统性种族偏见的诉讼。 周四晚间,一份涉及加利福尼亚州和纽约州4000多名谷歌员工的初步和解协议被提交至加州奥克兰联邦法院,并需要法官批...