OpenAI杀手级功能上线,国内大模型能否硬刚?,OpenAI突破性新功能引发挑战,国内AI巨头如何应对?

先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi

OpenAI最近推出了一项备受瞩目的新功能,引发了业界的广泛讨论。这项功能被看作是具有“杀手级”潜力,可能会对市场产生重大影响。人们也开始关注中国的大模型是否能够与OpenAI的新功能相抗衡。国内市场的参与者正在密切观察这一发展,并评估其对本土技术和产业的潜在影响。随着AI技术的不断进步,国内企业和研究机构也在加大投入,以确保在全球竞争中保持竞争力。这一事件标志着AI领域的竞争进入了一个新的阶段,国内外企业都在准备迎接新一轮的技术挑战。

ChatGPT Pro有点儿太贵,暂时没买,但晚上下班回家看了下OpenAI发布会和推特上的一些分享,可以了解下实现这个功能需要哪些技术。

推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top 

首先看一下这个功能的输入输出。

输入:一般来说是需要深度分析的问题,然后要求输出一个报告。

输出:一份完整的报告,特点是Fully cited document,即「全部引用的文档」。

如果不能理解这一点儿,可以看下面这个例子,Deep Research功能会大量的从互联网中引用别人的说法,而不是生编硬造。    

    

简单来说,就是「口说有凭」。

你可以通过这个链接来访问这个完全的Deep Research过程(请确保你能访问ChatGPT)。

https://chatgpt.com/share/67a17492-d304-8007-aef0-20a2ac406d88

除了输出和输出,这个功能还会追问和确认一遍需要研究的内容,比如下面这种,因为每一次Deep Research都需要花费5-30分钟不等,多花点时间确认一下可以节省时间和资源。    

从它的运行原理上来看,包含的技术可以分解为:    

 Reasoning 推理大模型

这个对应了OpenAI的o系列大模型,对一个复杂问题可以拆解和多步推理,但DeepSeek R1出现后,推理大模型领域注定会百花齐放,这个算不上什么优势。    

    

结论:DeepSeek R1完全具备类似的功能。

Web Browsing 联网能力

首先传统大模型本身的数据肯定会停留在某个时间点,所以最新的消息肯定得从互联网得知,其次「citation」索引这种东西肯定得经过验证才敢放在文档上,所以联网能力也是必不可少的,o3-mini系列的联网能力不错可用。    

但具备联网能力的大模型真不少,DeepSeek的R1和联网甚至在OpenAI前面可以同时激活。    

Qwen系列的联网功能也早早实现了。    

甚至知乎自己的AI,知乎直答,也很早就具备了联网搜索的能力。    

结论:国内外相关技术都很成熟。

超长上下文能力    

这个他们发布会没提,但50000多字的报告生成,大概率是需要一个超长的上下文空间将历史信息都放一起,分段的话严重的造成思维的不连贯。

前两天读了MiniMax-01系列的论文,它的一个特性就是超长上下文能力,并且强调这个就是未来Agent实现的关键要素之一。    

    

你可以看到MiniMax做的大海捞针Needle In A Haystack Test的实验,在400万token长度的上下文里面可以实现无损retrieve。

并且2024年很早的时候,Kimi和Qwen就在尝试百万token级别的context长度。    

我估计ChatGPT的Deep Research起码得到了百万级别,甚至不排除更长的上下文。

结论:属于工程能力,可以被解决且已经有被解决的现实案例。

外部工具整合,比如Python的data analysis

这个功能其实2023年ChatGPT就做出来的功能,也就是ChatGPT内部有个沙盒程序在跑代码,不像别的大模型只能生成代码让你自己跑,ChatGPT直接可以跑一些简单的代码。

该功能也利用了这个功能,对于一些图表,它可以直接调用Python能力生成。

Claude有类似的功能,可以直接渲染Html文件,但是在别的大模型上没怎么看到过。

对于没有代码知识但又想用代码生成一些图表的人来说这就是神器,理论上不是很复杂,但是兼容这个功能还不太多。    

    

结论:已经实现了的案例不多,但没有多大的技术鸿沟,是可以攻克的部分。

应用领域

毫无疑问这个功能非常有用,特别是对于需要调研报告的行业,结论或者某一句话必须得有出处,这个出处就是citation。

最常见的领域就是写论文,下图里面蓝色的地方都是引用的参考文献。    

    

总结来说,这个功能的确很有用,但是应用范围并不广泛,会集中在需要翔实报告的领域,比如商业,科研等。它的实现是多种已有技术的整合,单个技术上不存在难点,相信国内很快会有类似的产品出现,甚至会有更强的性能。


代充值gpt4.0

本文链接:http://xiaogongchang.cn/chatgpt/2756.html

OpenAI国内AI巨头

相关文章