界面新闻记者 |
界面新闻编辑 | 宋佳楠
OpenAI还是那个最会玩营销的AI公司,早早预告了自己的“12 Days of Christmas” ,这将是其年底最重要的一系列发布会。
12月6日凌晨,OpenAI年末狂欢“Day 1 ”开启,在山姆·奥特曼的总结下 ,两项更新最为重磅:o1模型“满血版”,以及价值200美元/月的ChatGPT Pro订阅计划 。
相较于三个月前发布的o1-preview,o1的智能水平、处理速度 、多模态能力均有明显变化。
通过模型解决数学竞赛题、编程竞赛题的结果呈现 ,o1对比o1-preview的智能水平普遍上升40%-50%,不过在博士级别科学问题的处理上,o1表现反倒稍逊o1-preview。
山姆·奥特曼提到,o1在处理复杂问题时的重大错误率降低了34% ,并且不再是所有难度的问题都会花费较长时间,新版o1会根据问题的难易程度调整处理时间,简单问题往往仅需几秒 ,而非几分钟,这个调整可让用户等待时间普遍下调50%,也解决了o1模式此前最受诟病的问题之一 。
更重要的是 ,新版o1加入了多模态识别能力。OpenAI对此的展现方式格外“硬核”,o1负责人直接手绘了一张供太空数据中心使用的“太空中太阳能收集流程图 ”。由于太空中无法水冷,员工要求o1计算 ,如果需要供给1GW的电,多大面积散热片才能维持GPU正常运转 。
10秒之后,o1堆积了满屏的精密计算 ,最终给出了正确的结果:242万平方米。
根据OpenAI的安排,即日起,o1面向ChatGPT Plus和团队用户开放,企业和教育用户则需要等到下周。
相比智能水平明显升级的o1 ,200美元/月的ChatGPT Pro更值得关注。尽管此前已有传闻,但外界一直惊讶于OpenAI竟然会将一个订阅制收费提升到这么高,这是此前基础订阅版本20美元费用的10倍 。
实际上 ,OpenAI对ChatGPT Pro并不敷衍,在这套服务系统中,它提供了目前最强的o1 pro mode。
在国际数学奥林匹克预选赛题目(AIME 2024)中 ,o1 pro正确率达到86,高于o1版本的78。在编程问题上,两者能力以90对89旗鼓相当 。不过在处理博士级科学问题上 ,o1 pro实现了约3%的优势。
为了证明这些个位数性能提升是否值得200美元,OpenAI还通过极其严苛的连续测试来展示o1 pro mode的稳定性与可靠性。显然,这些能力并不是针对普通需求用户打造 ,而是那些对模型使用体验有同样严格要求的高阶用户 。
值得一提的是,在ChatGPT Pro模式下,用户可以无限制使用各种高阶模型,包括高级语音模式。
这仅仅是OpenAI连续12天狂欢的第一天 ,还有超过90%的内容等待解锁。不过从各种传闻来看,剩余内容中相对重磅的可能是成为“期货”已久的Sora 。在视频模型上,OpenAI终于需要对行业做个更具体的交代了。
网页挤崩溃,OpenAI视频生成大模型Sora终于正式登场|界面新闻 · 科技
科技早报|消息称SHEIN计划明年一季度在英国上市;美国司法部将推动谷歌出售Chrome以打破垄断|界面新闻 · 科技
科技早报 | 库克回应苹果Vision Pro销售不佳;三星或在2026年推出三折叠手机|界面新闻 · 科技
科技早报|科大讯飞拟推首期员工持股计划;Anthropic再获亚马逊40亿美元投资|界面新闻 · 科技
科技早报 | 小马智行美股上市;软银被曝向OpenAI投资15亿美元|界面新闻 · 科技
科技早报|马斯克要求美法院阻止OpenAI“非法”转型;多款APP支持“一证通查”|界面新闻 · 科技
科技早报|英特尔宣布CEO帕特·基辛格退休;OpenAI考虑在AI产品中引入广告|界面新闻 · 科技
科技早报|OpenAI正式推出AI视频生成模型Sora;英伟达涉嫌违反反垄断法,市场监管总局立案调查|界面新闻 · 科技