欢迎访问chatgpt中文教程网,学习chatgpt相关知识,以下是正文内容:
最具成本效益的小型模型隆重推出
OpenAI官方致力于让智能技术更加广泛可及。今天,OpenAI官方宣布推出GPT-4o mini,这是最具成本效益的小型模型。OpenAI官方期望GPT-4o mini能够显著扩展AI应用的范围,通过降低成本让智能技术更为普及。GPT-4o mini在MMLU上得分为82%,在LMSYS排行榜的聊天偏好中表现优于GPT-4 。其输入代币每百万15美分,输出代币每百万60美分,比之前的前沿模型便宜了一个数量级,比GPT-3.5 Turbo便宜超过60%。
GPT-4o mini凭借其低成本和低延迟,能够支持多种任务,例如链式或并行调用多个模型(如调用多个API)、向模型传递大量上下文(如完整的代码库或对话历史),或者通过快速的实时文本响应与客户互动(如客户支持聊天机器人)。
GPT-4o mini目前支持API中的文本和视觉功能,未来将支持文本、图像、视频和音频的输入和输出。该模型具有128K的上下文窗口,每个请求支持高达16K的输出代币,并拥有截至2023年10月的知识。得益于与GPT-4o共享的改进版分词器,处理非英语文本的成本现在更加低廉。
小型模型,卓越的文本智能与多模态推理 🤖💡
GPT-4o mini在学术基准测试中超越了GPT-3.5 Turbo和其他小型模型,在文本智能和多模态推理方面表现出色,并支持与GPT-4o相同的语言范围。它在函数调用中表现优异,使开发者能够构建获取数据或与外部系统交互的应用程序,并且相比GPT-3.5 Turbo在长上下文处理方面有了显著提升。
GPT-4o mini在几个关键基准测试中的表现 :
推理任务:在涉及文本和视觉的推理任务中,GPT-4o mini比其他小型模型表现更好,在MMLU(文本智能与推理基准测试)中得分82.0%,而Gemini Flash得分77.9%,Claude Haiku得分73.8%。 数学与编码能力:GPT-4o mini在数学推理和编码任务中表现出色,超越了市场上的其他小型模型。在MGSM(数学推理测量)中,GPT-4o mini得分87.0%,而Gemini Flash得分75.5%,Claude Haiku得分71.7%。在HumanEval(编码性能测量)中,GPT-4o mini得分87.2%,而Gemini Flash得分71.5%,Claude Haiku得分75.9%。 多模态推理:在MMMU(多模态推理评估)中,GPT-4o mini也表现出色,得分59.4%,而Gemini Flash得分56.1%,Claude Haiku得分50.2%。
模型评估分数 📊
作为模型开发过程的一部分,OpenAI官方与一些受信任的合作伙伴合作,以更好地了解GPT-4o mini的使用场景和局限性。OpenAI官方与Ramp和Superhuman等公司合作,发现GPT-4o mini在从收据文件中提取结构化数据或在提供线程历史记录时生成高质量电子邮件回复等任务上,比GPT-3.5 Turbo表现显著更好。
内置的安全措施 🔒
安全性从一开始就被内置到模型中,并在OpenAI官方的开发过程中得到了不断强化。在预训练过程中,OpenAI官方过滤掉不希望模型学习或输出的信息,如仇恨言论、成人内容、主要聚合个人信息的网站和垃圾信息。在后期训练中,OpenAI官方使用人类反馈强化学习(RLHF)等技术来对齐模型行为,以提高模型响应的准确性和可靠性。
GPT-4o mini具有与GPT-4o相同的安全缓解措施,OpenAI官方通过准备框架进行自动化和人工评估,OpenAI官方自愿承诺的原则进行详细评估。超过70名社会心理学和错误信息领域的外部专家测试了GPT-4o,以识别潜在风险,OpenAI官方已经解决了这些问题,并计划在即将发布的GPT-4o系统卡和准备评分卡中分享详细信息。这些专家评估的见解有助于提高GPT-4o和GPT-4o mini的安全性。
基于这些经验,OpenAI官方的团队还使用新技术提高了GPT-4o mini的安全性。这些新技术受OpenAI官方研究的启发,在API中的GPT-4o mini是第一个应用OpenAI官方的指令层次结构方法的模型,这有助于提高模型抵御越狱、提示注入和系统提示提取的能力。这使得模型响应更可靠,有助于在大规模应用中更安全地使用。
OpenAI官方将继续监控GPT-4o mini的使用情况,并在识别新风险时改进模型的安全性。
可用性与定价 💰
GPT-4o mini现在在Assistants API、Chat Completions API和Batch API中作为文本和视觉模型提供。开发者支付每百万输入代币15美分和每百万输出代币60美分(大致相当于标准书中的2500页)。OpenAI官方计划在未来几天内推出GPT-4o mini的微调功能。
在ChatGPT中,Free、Plus和Team用户今天起可以访问GPT-4o mini,取代GPT-3.5。企业用户也将从下周开始访问,这与OpenAI官方让AI益处惠及所有人的使命一致。
未来展望 🌟
在过去的几年里,OpenAI官方见证了AI智能的显著进步,同时成本大幅下降。例如,GPT-4o mini的每个代币成本比2022年推出的性能较低的text-davinci-003下降了99%。OpenAI官方致力于继续沿着这一轨迹前进,在提高模型能力的同时降低成本。
OpenAI官方设想了一个未来,模型将无缝集成到每个应用程序和每个网站中。GPT-4o mini正在为开发者更高效、更经济地构建和扩展强大的AI应用铺平道路。AI的未来正变得越来越普及、可靠,并嵌入到我们的日常数字体验中,OpenAI官方很高兴能继续引领这一潮流。
总结 📋
GPT-4o mini的推出标志着OpenAI官方在智能技术普及和成本效益方面的重要一步。通过卓越的性能和显著降低的成本,GPT-4o mini将为开发者和用户带来更多可能性。OpenAI官方将继续努力,确保AI技术的安全性和可靠性,同时推动AI在各个领域的应用和发展。
参考资料 📚
OpenAI LMSYS leaderboard Ramp Superhuman Preparedness Framework Reinforcement Learning with Human Feedback (RLHF) Simple-evals GitHub repository
温馨提示 🌐
感谢大家阅读这篇关于GPT-4o mini的文章!如果你对AI技术感兴趣,或者希望了解更多关于我们最新进展的信息,请记得关注“猫头虎技术团队”公众号,OpenAI官方会持续分享最前沿的科技动态与应用案例,让我们共同见证AI的未来!
本文链接:http://xiaogongchang.cn/chatgpt/1161.html
chatgpt plus订阅ChatGPT写代码WishBucketchatgpt需要付费么chatgpt付费用户量chatgpt图片OpenAIAI模型商店chatGPT应用商店国内用户如何注册chatgpt