
周一举办的开发者日活动上,OpenAI 公布了应用程序接口(API)的多项更新,包括推出最新语言模型 GPT-5 Pro、全新视频生成模型 Sora 2,以及一款体积更小、成本更低的语音模型。
此次 API 更新是 OpenAI 一系列公告的组成部分,这些公告均旨在吸引开发者加入其生态系统,其他举措还包括推出智能体构建工具,以及支持在 ChatGPT 内开发应用程序的功能。
OpenAI 首席执行官山姆・奥特曼表示,GPT-5 Pro 的推出可能会吸引金融、法律和医疗健康领域的应用开发者 —— 这些行业均需要 “高准确性和深度推理能力” 的技术支持。
奥特曼还指出,语音功能在未来将至关重要,因为它正迅速成为人们与人工智能交互的主要方式之一。为此,OpenAI 正于 API 中推出 “gpt-realtime mini”:这是一款体积更小、成本更低的语音模型,支持音频与语音的低延迟流式交互。该新型号比 OpenAI 此前的高级语音模型便宜 70%,同时保证 “语音质量和表现力不变”。
最后,参与 OpenAI 开发者生态的创作者如今可通过 API 预览版使用 Sora 2。上周,OpenAI 已发布其最新音视频生成模型 Sora 2,同时推出了Sora 应用 —— 这款应用内满是人工智能生成的短视频。用户可通过 Sora 应用,根据提示生成以自己、朋友或任意事物为主题的视频,并通过 TikTok 式的算法推荐流分享。
奥特曼表示:“(开发者)如今可直接在自己的应用中,使用驱动 Sora 2 生成惊艳视频效果的同款模型。”
Sora 2 在前代模型基础上进行了升级,能生成更逼真、物理逻辑更连贯的场景,实现声音与画面的同步,并提供更强的创意控制权 —— 从精细的镜头调度到风格化视觉呈现均涵盖在内。
奥特曼表示:“例如,你可以先确定一个类似 iPhone 拍摄的视角,然后通过提示让 Sora 将其扩展为一个宏大开阔、具有电影质感的宽幅镜头。但我们目前正在研发的最令人兴奋的成果之一,是这款新模型能将声音与视觉完美匹配 —— 不仅限于语音,还包括丰富的音景、环境音效,以及与画面内容紧密关联的同步特效。”
Sora 2 定位为一款概念开发工具,其应用场景广泛:既可以根据产品的整体风格,为广告打造视觉起点;也能帮助美泰(Mattel)的设计师将草图转化为玩具概念。奥特曼在开发者日活动中举了这个例子,这也间接揭示了 OpenAI 与这家芭比娃娃制造商达成的合作 —— 双方将把生成式人工智能整合到玩具开发流程中。
周三日经225指数收盘上涨0.3%,报39821.28点,汽车和金融股领涨。韩国综合股价指数(Kospi)收涨0.6%,报3133.74点,受国防和造船类股带动。 针对美国将对日本征收25%关税问题,...
专题:普京和特朗普未达成协议 特朗普总统在阿拉斯加以隆重礼遇接待来访的俄罗斯总统普京:红毯、战机编队掠空、并同乘总统专车“野兽”。但几小时会谈过后,双方并未宣布任何实质性成果,结束乌克兰战争的路径依...
近期,海通证券公布了最新的基金公司固定类基金绝对收益分类评分排名榜单,数据显示,截至今年一季末,近1年、2年、3年排名中,景顺长城均位居固收类大型基金公司第1。此外,景顺长城近10年期固收投资能力更是...
当地时间6月19日至21日,中国进出口银行董事长陈怀宇在乌兹别克斯坦开展工作调研。期间,拜会我驻乌大使于骏;与乌投资、工业和贸易部部长库德拉托夫,数字技术部第一副部长佩科斯,中央银行第一副行长赛义杜拉...
国新办将举行新闻发布会,介绍科技金融政策有关情况。 据国新网,国务院新闻办公室将于2025年5月22日(星期四)下午3时举行新闻发布会,请科技部副部长邱勇,中国人民银行副行长、国家外汇局局长朱鹤新和金...
本文将深入探讨初中考试内容的构成,分析各个科目的考试要点,以及学生如何高效准备这些考试,旨在为初中生及家长提供全面的复习策略和指导。 一、初中考试科目构成 初中考试主要包括语文、数学、英语、物...