先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi
推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top
ChatGPT原理简介
GPT2没有引起多大轰动,真正改变NLP格局的是第三代版本。
GPT3训练的数据包罗万象,上通天文下知地理,所以它会胡说八道,会说的贼离谱,比如让你穿越到唐代跟李白对诗,不在一个频道上,他说的你理解不了,你说的他理解不了。
GPT3太泛了,把世界上所有的东西都给训练了,不受约束条件的、无法无天,给它发一个指令,它抗拒指令,按照自己的思维模式去做,比如我问一个问题,接下来你用python代码的方式来回答我,它可能不按照这个模式来,不受我的约束。
这就是GPT3,不按照我们自己的思维去做我们自己的事情,也是给后面的ChatGPT做了一个铺垫。
GPT3 三种模式对比
Zero-shot
不管我输入什么,后面都会加上提示,比如把英文转换成法语,接下来就输出了法语。
One-shot
为了让它更好的理解我说的意思,我给它举了一个例子。
举一个例子,这个例子作为输入,我让你干什么,我给你举一个例子,你回答的时候可以参考这个例子。
这些例子都是我写到输入对话框中,一起给到模型,模型基于我写的例子,再往下输出。
Few-shot
Few-shot是举多个例子。
这就是GPT3的基本思想。
Few-shot像在下游任务中又做了个简单的训练,比如举了三个例子,即三条数据,相当于把下游任务融入到了这个任务当中。
GPT3本质上还是一个生成式模型,它不需要下游任务,下游任务可以放到Few-shot或放到One-shot中。
横轴表示语言模型的大小, One-shot和Few-shot之间还是存在差异的,尤其是模型越大的时候,差异越明显,Few-shot效果更好一些。
GPT3网络结构没有什么亮眼的,就是把Transformer做的更大了。
NLP哪家强,就看谁的模型更大,谁的数据更多。
OpenAI训练的GPT-3 1750亿个权重参数,每批次的训练数据大小是3.2M,这么大的量级,目前只有OpenAI大型GPU集群才能玩的转。
准备训练数据
准备数据不难,但数据又多又干净才不容易准备。
OpenAI对收集到的数据有质量的判断,对于网页的爬取会设计一些算法去评估哪些网页要求比较低或可信度比较低的,它会把这些网页过滤掉,只爬一些有价值的网页。
GPT三代算法告诉我们一件事,这种生成式语言模型能解决一切的事情,即以不变应万变。以后的趋势是GPT这个系列一家独大,可能再过10年NLP的其他分支就不存在了,因为一个通用大模型可以解决所有的事情,干嘛还要每个NLP分支做自己的东西呢。
ChatGPT优缺点
除此之外,ChatGPT有些类似于古希腊的传说英雄阿喀琉斯:它非常强大,却有一个致命的弱点——无法联网,这限制了它只能停留在2021年的水平。但是很快,我们将迎来一个“鱼与熊掌兼得”的时刻。通过插件集的Web浏览功能,ChatGPT将能够联网,实时搜索互联网上最新的资讯。我们已经获得了测试资格,并提前体验了这一功能,为大家总结了下面几个重点。
1. 要获取插件,首先需要进入设置。点击用户名下方的三个点,再选择设置,然后进入 Beta 功能选项即可。
2. 注意,即使你是 Plus 用户,如果没有开启 Beta 功能,你也看不到新的更新。
3. 有些用户的设置中可能只有「General」和「Data Controls」选项,还没有插件选项。
4. 有些用户早在两天前就已经获得了 Browsing 权限。
5. 需要注意的是,如果用户关闭了数据共享,将无法使用插件来浏览网页。
6. 官方网页声称所有的 Plus 用户都有插件,但实际情况可能并非如此,需要留意。7. 这个更新正在逐步推出,预计一周内所有用户都能够访问到新功能。
8. 有部分付费用户检查后发现自己的设置中没有 Beta 功能的选项。
9. 但是,也有些用户检查后发现自己已经获得了访问插件商店的权限,并且发现了 60+ 个可用的插件。不少用户都非常兴奋。
在我的测试中,我提出了一个非常棘手的问题:《塞尔达传说:王国之泪》的最快通关时间是多长?由于这款游戏今年 5 月 12 日才正式发售,因此任何关于它的信息都是最近才发布的。当我询问 ChatGPT 时,它给出了一个有趣的回答。
起初,它回答了一个通关时间为 92 分钟的答案,并提供了一个中文游戏媒体的引用。但是,我请求它再次确认信息是否准确,ChatGPT 于是提供了一个通关时间为94 分钟的答案,并提到另一个国外媒体的引用。我对此感到非常好奇,于是多次要求它前往游戏通关记录网站 SpeedRun.com 确认哪一个答案是正确的。
尽管 SpeedRun.com 没有发布通过审核的通关成绩,但 ChatGPT 认为通关时间为 94 分钟的答案是正确的,并提供了另一个国外媒体的引用,称这个答案已经通过多个来源的核实。事实上,这两个通关时间都是由同一个玩家创造的纪录,但由于 92 分钟的记录比 94 分钟晚了两天,因此报道的新闻较少。
如果我们稍微减低一些要求,让ChatGPT仅仅检索5篇,并且使用它更加熟悉的英语作答,那么它就可以成功地完成这个任务。这个全新版本的ChatGPT就像一个游戏,只需要进行一些不同的尝试,就可以组合出许多意想不到的效果。Rowan Cheung,The Rundown博客的作者,总结了8种联网版ChatGPT的使用方法,非常值得一试。
ChatGPT的Browsing模式为用户带来了独特的搜索体验。它能够更准确地查找你需要的内容,并快速生成你需要的信息。
然而,这个模式也有一些明显的问题:次数限制、找不到网站以及回答速度缓慢。因此,它目前无法完全取代传统的搜索引擎。尽管如此,我们不妨展望未来,期待GPT-4模型能够达到GPT-3.5模型同样快速生成答案的速度。总的来说,ChatGPT已经是一个十分强大的网络工具,但是离完美还有一段距离。未来,ChatGPT将会更新更多插件和功能,使其变得更加强大。
【微信号】linhuihui2021
个人转载内容至朋友圈和群聊天,无需特别申请版权许可。
需要更多知识:
欢迎加我微信,围观我朋友圈。