OpenAI 模型变更 - 成本与使用指南
介绍
本指南解释了 OpenAI 提供的各种模型、它们的相关成本以及如何将每种模型用于 PBX 通话、转写、分析和 人工智能坐席。本指南的主要目标可概括如下:
- 降低运营成本
- 标准化默认值
- 使模型选择可预测且可解释
对于想要更详细地比较 OpenAI 模型和定价的用户,OpenAI 提供了一个官方参考页面:https://platform.openai.com/docs/models/
成本与准确率
小型模型价格更便宜,但精度也较低。
- “nano” < “mini” < base < versioned < pro
这条规则适用于所有 OpenAI 模型系列。
模型价格等级(从高到低)
价格实惠
这些型号对……来说是安全的高容量PBX工作负载例如通话摘要、情感分析和客户关系管理 (CRM) 备注。
模型 | 成本水平 | 预期用途 |
gpt-5-nano | 最低 | 工作量极大,任务简单 |
gpt-4.1-nano | 非常低 | 传统兼容性 |
gpt-5-mini | 低 | 默认型号 – 性价比最高 |
gpt-5 | 中等 | 需要时需要更好的推理 |
由于 gpt-5-mini 具有最佳的质量成本比,因此被设置为默认值。
昂贵的
只有在明确需要更高的精度或推理能力时才应使用这些模型。
模型 | 成本水平 | 笔记 |
gpt-5.1 | 高的 | 高级摘要、质量保证审核 |
gpt-5.2 | 非常高 | 仅进行高价值分析 |
极其昂贵(未公开)
这些模型可能会产生非常高的成本,目前尚未公开。
模型 | 成本水平 |
gpt-5-pro | 非常高 |
gpt-5.2-pro | 非常高 |
注意: 如果价格变得更加亲民,这些模型未来可能会面世。
弃用模型
OpenAI 正在投资开发更新、更高效的架构,因此以下模型将被弃用。这些模型已开始从 ChatGPT 中移除,并将于未来几个月内全部弃用:
- gpt-4o
- gpt-4o-mini
- gpt-4-turbo
- gpt-4.1
- gpt-4.1-mini
- O4-mini
参考: https://openai.com/index/retiregpt-4o-and-older-models/
为什么要弃用?
- 旧式构建
- 性价比不如 GPT-5-mini
- 同等输出质量下,价格更高
转写模型(PBX 转录)
由于这些变化,我们现在将模型选择公开在以下路径:系统 → 集成 → 转写 → OpenAI。
这样,管理员就可以选择最符合其成本和质量要求的转录模式。
使用的通话录音端点 API
- v1/audio/transcriptions
- v1/audio/translations
模型
模型 | 成本水平 | 预期用途 |
whisper-1 | 最便宜 | 批量通话录音的默认设置 |
gpt-4o-mini-transcribe | 中等的 | 更好的格式 |
gpt-4o-mini-transcribe | 更高 | 最高转录质量 |
Whisper 仍然是 PBX 转录中最具成本效益的选择。
文本与分析模型(PBX 分析)
使用的摘要/情感端点 API
- v1/chat/completions
模型
- gpt-5-mini(默认)
- gpt-5.2(价格昂贵)
- gpt-5.1(价格昂贵)
- gpt-5
- gpt-5-nano
- gpt-4.1-nano
- gpt4o(旧版兼容性)
- gpt4mini(旧版兼容性)
实时模型(实时通话和人工智能代理)
通话端点
- v1/realtime
模型
模型 | 成本水平 |
gpt-realtime-mini | 降低 |
gpt-realtime | 更高 |
即时的模型是总是更贵比文本模型更复杂,所以我们也添加了 mini。
文本端点
- v1/responses
模型
- gpt-5-mini(默认)
- gpt-5.2(价格昂贵)
- gpt-5.1(价格昂贵)
- gpt-5
- gpt-5-nano
- gpt-4.1-nano
- gpt4o(旧版兼容性)
- gpt4mini(旧版兼容性)
最后更新时间
本文件最后更新日期为2026年2月3日。


