GPT-4o mini：最具成本效益的小模型

先做个广告：如需代注册ChatGPT或充值 GPT4.0会员（plus），请添加站长微信：gptchongzhi

推荐使用GPT中文版,国内可直接访问：https://ai.gpt86.top

2024年7月18日，OpenAI发布了新款GPT-4o mini小模型，以下为详细介绍。

今天，我们宣布推出GPT-4o mini，这是最具成本效益的小模型。期望GPT-4o mini将使AI更加经济实惠，可以显著扩大人工智能的应用范围。GPT-4o mini在MMLU上的得分为82%，目前在LMSYS排行榜的聊天偏好方面优于GPT-41。它的价格为每百万输入tokens 15美分，每百万输出tokens 60美分，比GPT-3.5 Turbo便宜60%以上。

由于具备低成本和低延迟，GPT-4o mini可以实现很多任务，例如链接或并行多个模型调用（例如，调用多个API）的应用程序，将大量上下文传递给模型（例如，完整的代码库或对话历史），或通过快速、实时的文本响应与客户交互（例如，客户支持聊天机器人）。

如今，GPT-4o-mini通过API可以支持文本和视觉，在未来将会支持文本、图像、视频和音频的输入和输出。该模型拥有到2023年10月的知识，支持一个128K tokens的上下文窗口，每个请求最多支持16K个输出tokens。由于与GPT-4o共享了改进的标记器，处理非英语文本现在更具成本效益。

一个具备卓越文本智能和多模态推理的小模型

GPT-4o mini在文本智能和多模式推理的学术基准上超越了GPT-3.5 Turbo和其他小模型，并支持与GPT-4o相同的语言范围。它还展示了函数调用的强大性能，这可以使开发人员能够构建获取数据或与外部系统进行操作的应用程序，与GPT-3.5 Turbo相比，它还提高了长上下文性能。

GPT-4o mini已经在几个关键基准上进行了评估：

推理任务：GPT-4o mini在涉及文本和视觉的推理任务中优于其他小型模型，在文本智能和推理基准MMLU上的得分为82.0%，而Gemini Flash的得分为77.9%，Claude Haiku的得分为73.8%。

数学和编码能力：GPT-4o mini在数学推理和编码任务方面表现出色，优于市场上以前的小型模型。在测量数学推理的MGSM上，GPT-4o mini的得分为87.0%，而Gemini Flash的得分为75.5%，Claude Haiku的得分为71.7%。GPT-4o mini在衡量编码性能的HumanEval上的得分为87.2%，而Gemini Flash的得分为71.5%，Claude Haiku的得分为75.9%。

多模态推理：GPT-4o mini在多模态推理评估MMMU上也表现出色，得分为59.4%，而Gemini Flash和Claude Haiku的得分分别为56.1%和50.2%。

作为模型开发过程的一部分，我们与少数值得信赖的合作伙伴合作，以更好地了解GPT-4o mini的用例和局限性。我们与Ramp和Superhuman等公司合作，发现GPT-4o mini在从收据文件中提取结构化数据或生成高质量电子邮件响应等任务上的表现明显优于GPT-3.5 Turbo。

内置安全措施

安全从一开始就内置在我们的模型中，并在开发过程的每一步得到加强。在预训练中，我们过滤掉我们不希望模型学习或输出的信息，如仇恨言论、成人内容、主要汇总个人信息的网站和垃圾邮件。在训练后，我们使用强化学习和人类反馈（RLHF）等技术使模型的行为与我们的策略保持一致，以提高模型响应的准确性和可靠性。

GPT-4o-mini内置了与GPT-4o相同的安全缓解措施，我们根据我们的准备框架和自愿承诺，使用自动化和人工评估对其进行了仔细评估。社会心理学和错误信息等领域的70多名外部专家对GPT-4o进行了测试，以识别潜在风险，我们已经解决了这些风险，并计划在即将发布的GPT-4o系统卡和准备记分卡中分享详细信息。这些专家评估的见解有助于提高GPT-4o和GPT-4o-mini的安全性。

在这些经验的基础上，我们的团队还利用我们研究的新技术，努力提高GPT-4o mini的安全性。API中的GPT-4o-mini是第一个应用我们的指令层次结构方法（instruction hierarchy method）的模型，这有助于提高模型抵抗越狱、快速注入和系统快速提取的能力。这些使得模型的响应更加可靠，并有助于在大规模应用中更安全地使用。

我们将继续监控GPT-4o mini的使用情况，并在识别新风险时提高模型的安全性。

可用性和定价

GPT-4o-mini现在可以作为文本和视觉模型在助理API、聊天API和批处理API中使用。开发人员每100万输入tokens支付15美分，每100万输出tokens支付60美分（大约相当于标准书中的2500页）。我们计划在未来几天推出GPT-4o mini的微调。

从今天开始，在ChatGPT中，Free、Plus和Team用户将能够访问GPT-4o mini，以代替GPT-3.5。企业用户也将从下周开始获得访问权限，这符合我们的使命，即让所有人都能享受到人工智能的好处。

后续

在过去的几年里，我们见证了人工智能的显著进步，同时成本也大幅降低。例如，自2022年推出功能较弱的型号text-davinci-003以来，GPT-4o mini的成本下降了99%。我们致力于继续降低成本，同时增强模型功能。

我们设想一个未来，模型将无缝集成到每个应用程序和每个网站中。GPT-4o mini正在为开发人员更高效、更经济地构建和扩展强大的AI应用程序铺平道路。人工智能的未来正变得越来越容易获得、可靠，并嵌入我们的日常数字体验中，我们很高兴能继续引领这一潮流。

参考文献：

1. https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

代充值gpt4.0