12月4日,OpenAI CEO Sam Altman在社交媒体透露,从第二天太平洋时间上午10点开始,每个工作日将进行一场发布会,总共12场直播,会展示一些新产品或者样品。此前没有大型科技公司以直播形式连续发布新功能。据The Verge援引消息人士,这些新产品或包括备受期待的文本转视频工具Sora和一个新的推理模型。截至目前,发布会已举办两场。
12月5日,OpenAI在第一天的直播中发布了新的OpenAI o1模型,并推出每月订阅费用200美元的ChatGPT Pro计划。o1模型仍未开放API接口,网页浏览、上传文件、结构化输出、函数调用等功能尚在开发阶段。Pro版本不针对普通用户,而是对AI模型有高度需求的企业和专业团体,可以无限制访问模型,还包括o1 pro模式,使用更多计算来更深入思考。
在三个月前的发布会上,OpenAI发布了代号“草莓”的AI推理模型OpenAI o1系列,包括作为o1模型预览版的OpenAI o1-preview以及小版本的o1-mini。
此次发布的正式版o1模型更新了多模态输入以及提升在数学、科学和编码领域性能,将取代o1-preview模型,被推送给三种不同类型的用户:每月订阅费20美元的ChatGPT Plus用户,在5人以上团队中每人每月30美元的ChatGPT Team用户,以及订阅最新ChatGPT Pro的用户。
12月6日发布的主要内容是为o1模型推出的强化微调能力。根据实测,将o1 mini模型进行微调,微调后模型得分提升80%,超越o1完全体。据OpenAI高级副总裁Mark Chen介绍,该能力目前是预览版,计划在2025年初正式推出,它面向的潜在客户是企业或科研单位,允许用户通过极少的数据在特定领域创建专家模型。
德邦证券认为,OpenAI连续两日发布会都与模型推理相关,正式版o1实现更智能的思考,推理能力大幅提升;强化微调也有望降低定制化AI的开发门槛。
国盛证券预测,OpenAI后续可能发布内容的预测包括:视频生成模型Sora、Agent工具Operator、视频对话模型VideoChatGPT、AI搜索浏览器、绘画模型DALL·E4、3D生成模型、机器人。
Sora于今年2月16日首次公开,体现出高一致性、长达分钟级的视频时长等优势,但一直未见正式发布,OpenAI前首席技术官Mira Murati在3月份的访谈中称,Sora最快今年内开放公测。
国盛证券表示,OpenAI本次发布会将为AI产业在应用端的进展带来重大突破,良性竞争下也可能推动海外其他大模型厂商如谷歌、Anthropic在近期发布重要进展。
12月5日,谷歌DeepMind发布了大型基础世界模型Genie2,可生成各种可控制动作、可玩的3D环境,还可以用于训练和评估具身Agent。只需要一张提示图像,Genie2就能按照输入文本提示,生成对应的交互式虚拟世界。无论是人类还是AI Agent,都可以使用键盘和鼠标来在由AI生成的3D游戏世界里探索和互动。
风险提示:市场需求不及预期;AI技术迭代不及预期;政策发布不及预期;行业竞争加剧。