OpenAI 秘密研发全新推理技术 “Strawberry”,目标实现 AI 深度研究

chatgpt中文网2024-07-13160

先做个广告:如需代注册帐号或代充值Chatgpt Plus会员,请添加站长客服微信:gptchongzhi

推荐使用GPT中文版,国内可直接访问:hhttps://ai.gpt86.top 

据知情人士和路透社看到的内部文件显示,ChatGPT 制造商 OpenAI 正在开展一项代号为 “Strawberry” 的项目,旨在为其人工智能模型提供一种全新方法。

该项目的细节此前从未被报道过,OpenAI 此举是为了在与微软支持的其他初创公司的竞争中,展现其模型具备提供高级推理能力的潜力。

路透社在 5 月份看到的一份 OpenAI 内部文件副本显示,OpenAI 内部团队正在开发 Strawberry。该文件详细说明了 OpenAI 计划如何使用 Strawberry 进行研究,但路透社无法确定该文件的具体日期。消息人士称,该计划仍在进行中,路透社也无法确定 Strawberry 距离公开还有多久。

这位知情人士表示,Strawberry 的工作原理即使在 OpenAI 内部也是一个严格保密的秘密。

该文件描述了一个使用 Strawberry 模型的项目,旨在使 OpenAI 的人工智能不仅能够生成查询的答案,还能进行足够的预先计划,以便能够自主、可靠地在互联网上导航,执行 OpenAI 所说的 “深度研究”。

据对十几位人工智能研究人员的采访,这是迄今为止人工智能模型一直无法做到的事情。

在被问及有关 Strawberry 和本报道中所报道的细节时,OpenAI 公司发言人在一份声明中表示:“我们希望我们的人工智能模型能够像我们一样看待和理解这个世界。对新的人工智能能力的持续研究是该行业的普遍做法,业界一致认为,这些系统将随着时间的推移在推理方面得到改进。”

这位发言人没有直接回答有关 Strawberry 的问题。

Strawberry 项目以前被称为 Q*,路透社去年曾报道称,Q* 在公司内部已被视为一项突破。

两位消息人士称,他们在今年早些时候看到了 OpenAI 员工向他们展示的 Q* 演示,该演示能够回答当今市售模型无法回答的棘手科学和数学问题。

据彭博社报道,OpenAI 在周二的一次内部全体员工大会上展示了一个研究项目的演示,该公司声称该项目具有类似人类的新推理能力。OpenAI 的一位发言人证实了这次会议,但拒绝透露会议内容的细节。路透社无法确定所演示的项目是否是 Strawberry。

这位知情人士表示,OpenAI 希望这项创新能够大幅提高其人工智能模型的推理能力,并补充说,Strawberry 涉及在人工智能模型在非常大的数据集上进行预训练后,对其进行专门处理的方法。

路透社采访的人工智能研究人员表示,推理是人工智能实现人类或超人水平智能的关键。

虽然大型语言模型已经能够比任何人类更快地总结密集的文本并撰写优雅的文章,但这项技术在常识问题上往往存在不足,而这些问题的解决方案对人类来说似乎是直观的,例如识别逻辑谬误和玩井字游戏。当模型遇到这类问题时,它常常会 “产生幻觉”,编造虚假信息。

路透社采访的人工智能研究人员普遍认为,在人工智能的背景下,推理涉及形成一个模型,使人工智能能够提前计划,反映物理世界的运作方式,并可靠地解决具有挑战性的多步骤问题。

提高人工智能模型的推理能力被视为释放模型能力的关键,这些能力包括从做出重大科学发现到规划和构建新的软件应用等各个方面。

OpenAI 首席执行官萨姆·奥尔特曼在今年早些时候表示,在人工智能领域,“最重要的进步领域将围绕推理能力”。

其他公司,如谷歌、Meta 和微软,以及大多数进行人工智能研究的学术实验室,也在尝试不同的技术来提高人工智能模型的推理能力。然而,研究人员在大型语言模型 (LLM) 是否能够将想法和长期规划纳入其预测方式方面存在分歧。例如,现代人工智能的先驱之一、在 Meta 工作的 Yann LeCun 经常表示,LLM 不具备类似人类的推理能力。

人工智能面临的挑战

这位知情人士表示,Strawberry 是 OpenAI 计划克服这些挑战的关键组成部分。路透社看到的文件描述了 Strawberry 旨在实现的目标,但没有描述实现方式。

据四位了解 OpenAI 说法的消息人士透露,近几个月来,该公司私下向开发者和其他外部人士暗示,它即将发布推理能力显著提高的技术。他们拒绝透露姓名,因为他们无权谈论私事。

其中一位消息人士表示,Strawberry 包括一种对 OpenAI 生成式人工智能模型进行“后训练”的专门方法,或者在基本模型已经对大量通用数据进行“训练”之后,对其进行调整,以特定方式提高其性能。

一位了解此事的消息人士表示,Strawberry 与斯坦福大学在 2022 年开发的一种名为“自我推理器”(Self-Taught Reasoner,简称 STaR)的方法有相似之处。斯坦福大学教授、STaR 的创始人之一 Noah Goodman 告诉路透社,STaR 使人工智能模型能够通过迭代创建自己的训练数据,将自身“引导”到更高的智能水平,并且从理论上讲,它可以用来让语言模型超越人类的智能水平。

Goodman 说:“我认为这既令人兴奋,也令人恐惧……如果事情继续朝着这个方向发展,我们作为人类需要认真思考一些问题。” Goodman 与 OpenAI 没有关联,也不熟悉 Strawberry。

OpenAI 内部文件显示,OpenAI 为 Strawberry 设定的目标之一是执行长期任务 (LHT),第一个消息来源解释说,这指的是需要模型提前计划并在较长时间内执行一系列操作的复杂任务。路透社无法确定该数据集中的内容,也无法确定“较长时间”指的是多长时间。

文件和其中一位消息人士称,OpenAI 尤其希望其模型利用这些功能,在“CUA”(计算机使用代理)的帮助下,通过自主浏览网络来进行研究,该代理可以根据其发现采取行动。OpenAI 还计划测试其在软件和机器学习工程师工作中的能力。



GPT4代充值

本文链接:http://xiaogongchang.cn/chatgpt/1151.html

chatgptplus多少钱chatgpt 金融应用gpt-4o检测人的情绪GPT4oGPT-4o小米应用商店有chatgpt吗chatgpt神奇对话chatgptplus如何充值chatgptplus下载DALL-E 3

相关文章