-
日期: 2025-12-12 | 来源: 腾讯科技 | 有0人参与评论 | 字体: 小 中 大
北京时间12月12日凌晨,OpenAI把发布的GPT-5.2定义为“迄今为止功能最强大的专业知识工作模型系列”。
OpenAI给出的官方文档明确指出,GPT-5.2 的设计初衷在于“创造更大的经济价值”。相较前代,它在电子表格处理、演示文稿制作、代码编写、图像感知、长文本理解及复杂多步项目执行等方面,均实现了全面性能跃升。
为了验证其在真实业务环境中的价值,OpenAI引入了GDPval基准测试,该测试覆盖了9大行业、44类职业的1320个真实业务场景。官方数据显示,GPT-5.2 Pro在高达74.1%的任务中表现超越或持平人类专家。
多家早期合作企业,如Notion、Databricks和Cognition,也从测试中观察到模型在长链条推理、数据分析和代码审查等任务中的错误率显着下降,一致性与稳定性得到明显改善,使其更适合作为“公司级智能体”的核心引擎。
就在一周多前,奥特曼在给员工的私人信息中宣布进入“红色警戒”状态,调集更多资源投入 ChatGPT。行业对于GPT-5.2的预期为,硬刚Gemini 3,夺回SOTA。但是,这次GPT-5.2的发布,并没有看出“应战”的火药味和心虚的“不服感”。
Gemini 3 被 Google 定义为“新一代智能时代的起点”,核心是多模态推理 + 代理能力 + 搜索和 Workspace 场景的深度融合。而GPT-5.2清晰明确指向专业知识场景,强调“经济价值”,定位区别清晰。
GPT-5.2的官方说明文档读下来,整体感觉是,有点无聊,但OpenAI更有商业战略定力了。
OpenAI应用业务首席执行官菲吉·西莫(Fidji Simo)在新闻发布会上也表示:“我们宣布了‘红色警报’,旨在向公司发出明确信号,即我们希望将资源集中在一个特定领域,这也是界定公司优先事项的一种方式。”
西莫同时否认了GPT-5.2系列模型的发布是受“红色警报”行动影响而匆忙提前的,她强调,公司为这款新模型的发布已经进行了数月的准备工作。
在经历了数月准备后推出的GPT-5.2,核心看点完全围绕着“创造更大的经济价值“展开:
●三级模型矩阵: 推出 Instant(极速)、Thinking(深度思考)、Pro(最强解难) 三个版本,以满足从日常轻量对话到复杂科研的不同需求。
●“打工人”实战能力质变: 基于全新的 GDPval 基准,GPT-5.2 Pro 在 74.1% 的真实职业任务(如投行建模、PPT制作)中胜过或持平人类专家,效率提升 11 倍,标志着从“对话”转向“交付”。注:GDPval主要通过直接测试模型在各行各业真实工作任务中的表现来衡量其性能,覆盖美国GDP前九大产业中的44个关键职业领域,从软件开发、法律到医疗护理和机械工程,涵盖了对经济至关重要的专业场景。
- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见