ChatGPT:优点和缺点同样明显,还藏着无限可能

chatgpt中文网2024-07-06641

chatgpt 欢迎访问chatgpt中文教程网,学习chatgpt相关知识,以下是正文内容:



ChatGPT原理简介




GPT2没有引起多大轰动,真正改变NLP格局的是第三代版本。

GPT3训练的数据包罗万象,上通天文下知地理,所以它会胡说八道,会说的贼离谱,比如让你穿越到唐代跟李白对诗,不在一个频道上,他说的你理解不了,你说的他理解不了。

GPT3太泛了,把世界上所有的东西都给训练了,不受约束条件的、无法无天,给它发一个指令,它抗拒指令,按照自己的思维模式去做,比如我问一个问题,接下来你用python代码的方式来回答我,它可能不按照这个模式来,不受我的约束。

这就是GPT3,不按照我们自己的思维去做我们自己的事情,也是给后面的ChatGPT做了一个铺垫。

GPT3 三种模式对比

Zero-shot

不管我输入什么,后面都会加上提示,比如把英文转换成法语,接下来就输出了法语。

One-shot

为了让它更好的理解我说的意思,我给它举了一个例子。

举一个例子,这个例子作为输入,我让你干什么,我给你举一个例子,你回答的时候可以参考这个例子。

这些例子都是我写到输入对话框中,一起给到模型,模型基于我写的例子,再往下输出。

Few-shot

Few-shot是举多个例子。

这就是GPT3的基本思想。

Few-shot像在下游任务中又做了个简单的训练,比如举了三个例子,即三条数据,相当于把下游任务融入到了这个任务当中。

GPT3本质上还是一个生成式模型,它不需要下游任务,下游任务可以放到Few-shot或放到One-shot中。

横轴表示语言模型的大小, One-shot和Few-shot之间还是存在差异的,尤其是模型越大的时候,差异越明显,Few-shot效果更好一些。

GPT3网络结构没有什么亮眼的,就是把Transformer做的更大了。

NLP哪家强,就看谁的模型更大,谁的数据更多。

OpenAI训练的GPT-3 1750亿个权重参数,每批次的训练数据大小是3.2M,这么大的量级,目前只有OpenAI大型GPU集群才能玩的转。

准备训练数据

准备数据不难,但数据又多又干净才不容易准备。

OpenAI对收集到的数据有质量的判断,对于网页的爬取会设计一些算法去评估哪些网页要求比较低或可信度比较低的,它会把这些网页过滤掉,只爬一些有价值的网页。

GPT三代算法告诉我们一件事,这种生成式语言模型能解决一切的事情,即以不变应万变。以后的趋势是GPT这个系列一家独大,可能再过10年NLP的其他分支就不存在了,因为一个通用大模型可以解决所有的事情,干嘛还要每个NLP分支做自己的东西呢。



ChatGPT优缺点




除此之外,ChatGPT有些类似于古希腊的传说英雄阿喀琉斯:它非常强大,却有一个致命的弱点——无法联网,这限制了它只能停留在2021年的水平。但是很快,我们将迎来一个“鱼与熊掌兼得”的时刻。通过插件集的Web浏览功能,ChatGPT将能够联网,实时搜索互联网上最新的资讯。我们已经获得了测试资格,并提前体验了这一功能,为大家总结了下面几个重点。

首先是开启方式,ChatGPT Plus 用户可以进入设置列表查看自己是否有 Beta 功能一栏,然后按照上面的步骤启用 Browsing 模式。
以下是一些重点:

1. 要获取插件,首先需要进入设置。点击用户名下方的三个点,再选择设置,然后进入 Beta 功能选项即可。

2. 注意,即使你是 Plus 用户,如果没有开启 Beta 功能,你也看不到新的更新。

3. 有些用户的设置中可能只有「General」和「Data Controls」选项,还没有插件选项。

4. 有些用户早在两天前就已经获得了 Browsing 权限。

5. 需要注意的是,如果用户关闭了数据共享,将无法使用插件来浏览网页。

6. 官方网页声称所有的 Plus 用户都有插件,但实际情况可能并非如此,需要留意。7. 这个更新正在逐步推出,预计一周内所有用户都能够访问到新功能。

8. 有部分付费用户检查后发现自己的设置中没有 Beta 功能的选项。

9. 但是,也有些用户检查后发现自己已经获得了访问插件商店的权限,并且发现了 60+ 个可用的插件。不少用户都非常兴奋。

这几个重点列得怎么样?是不是感觉有些信息还挺重要,但一些内容重复了?
这些重点其实是我用 ChatGPT 的 Browsing 模式,检索 Reddit 上的讨论贴后自动生成的,我只做了一点阅读优化。
这里就要讲到启用 Browsing 模式的第一个功能:读取链接。
你只要在对话框发送一个链接,它就能读取目标网站的内容,然后再根据这些内容生成针对性的回答,并且会在答案上标注来源。
比如当你在逛论坛时,你更希望得到一个解决方案,而不是迷失在一句句闲聊之中,这时候你就可以把这篇帖子发给 ChatGPT,让它帮你总结。
同理,它也可以帮你总结冗长的报告、论文、案例等等文章,帮你快速找到重点,节省大量的时间。
既然连了网,Browsing 模式自然也可实时检索互联网上的最新资料作答。

在我的测试中,我提出了一个非常棘手的问题:《塞尔达传说:王国之泪》的最快通关时间是多长?由于这款游戏今年 5 月 12 日才正式发售,因此任何关于它的信息都是最近才发布的。当我询问 ChatGPT 时,它给出了一个有趣的回答。

起初,它回答了一个通关时间为 92 分钟的答案,并提供了一个中文游戏媒体的引用。但是,我请求它再次确认信息是否准确,ChatGPT 于是提供了一个通关时间为94 分钟的答案,并提到另一个国外媒体的引用。我对此感到非常好奇,于是多次要求它前往游戏通关记录网站 SpeedRun.com 确认哪一个答案是正确的。

尽管 SpeedRun.com 没有发布通过审核的通关成绩,但 ChatGPT 认为通关时间为 94 分钟的答案是正确的,并提供了另一个国外媒体的引用,称这个答案已经通过多个来源的核实。事实上,这两个通关时间都是由同一个玩家创造的纪录,但由于 92 分钟的记录比 94 分钟晚了两天,因此报道的新闻较少。


那么最快纪录到底是多少呢?这名玩家在视频网站上又发布了 89 分钟的纪录,但由于缺乏媒体报道,ChatGPT 不容易检索到这条纪录。
至此我们可以总结一下用 Browsing 模式搜索的几个特点:
1. ChatGPT 可以检索到权威媒体和平台上的最新信息
2. ChatGPT 可以根据你指定的网站检索相应的内容
3. ChatGPT 依然存在真实性偏差的问题,它会依赖信源数量判断信息的真实性
4. 你可以多次要求 ChatGPT 核实信息,搜索更多的信源作交叉验证
Browsing 模式虽然回答的内容不一定准确,但它确实给了我一个全新的搜索体验:
过去我需要在 Google 给出的 10 个链接一个个点,反复提炼内容才能找到我想要答案或者进一步搜索的关键信息,现在 ChatGPT 先帮我总结了一遍,给了我最接近答案的线索(回答或者信源)。
例如上文给出的 89 分钟纪录,就是我根据 ChatGPT 给出的视频博主进一步搜索找到的。
你还可以点开新增的小方框,详细地看到 ChatGPT 的检索过程:检索关键词、点开链接、阅读网页、思考,最后整套流程下来再作答。在这里还能看到它参考了哪些网站,给了用户很高的透明度。
那么联网版 ChatGPT 可以取代 Google 或者 Bing 了吗?我认为并没有,因为 ChatGPT 的缺点也明显:
1. ChatGPT Browsing 必须调用 GPT-4 模式,这意味着你会受到相应的次数限制(3 小时 25 次),不能无限制地追问。
2. ChatGPT Browsing 检索网站时失败的几率很大,检索失败、宕机、吐不出字都是时有的事。
3. 即使它工作正常,它作答的速度也很慢,大概需要 2-3 分钟才能完成作答
也就是说,如果正常搜索就能解决你的问题(例如最新的奥斯卡影帝是谁),完全没有必要用 ChatGPT Browsing ——除非你就是想找人聊聊天。
ChatGPT Browsing 真正的用途,应该是把它的浏览功能和文本生成功能结合起来一起使用,下面举个例子。
我可以让它帮我上网收集与《塞尔达传说:王国之泪》相关的 10 篇文章,总结成一篇文章,让我快速了解这个游戏。
这时候它就会马不停蹄地搜索内容,自我消化,最后提炼出重点汇总在一起。从它给出的总结效果来看,基本可以代替我们「一文看完 XXX」系列的文章了。
当然,我们也不能给它太大的压力,不然它就很容易出错。就像上面那样,要求它检索 10 篇,它最终只找到了 2 篇。

如果我们稍微减低一些要求,让ChatGPT仅仅检索5篇,并且使用它更加熟悉的英语作答,那么它就可以成功地完成这个任务。这个全新版本的ChatGPT就像一个游戏,只需要进行一些不同的尝试,就可以组合出许多意想不到的效果。Rowan Cheung,The Rundown博客的作者,总结了8种联网版ChatGPT的使用方法,非常值得一试。


1. ChatGPT 现已为您收集最新的新闻,并整理成带有来源链接的表格。即刻阅读这些汇总的资讯,随时掌握全球动态!
提示词:「列出本周 AI 领域发生的 10 件事情」,然后跟上 「将其放入带有链接到来源的表格中」。
2. 汇总页面及链接分享。ChatGPT通过汇总Newsletter内容,为大家提供了所有提到的工具的链接。让大家可以更方便地获取这些实用工具,提高生活效率。现在,让我们一起来查看这篇Newsletter吧!
提示词:「为我总结这份 'The Rundown' 的通讯,并创建一个包含 10 个 URL 的列表 [链接]」。
第三点功能是让 ChatGPT 帮你找出特定 subreddit 中的热门帖子。你可以使用这个功能在多个不同的 subreddit 上查找,ChatGPT 会在 5 分钟内为你提供全面的最新信息。无需费力地手动浏览不同的社区,ChatGPT 轻松为你解决这个问题。
提示词:「今天在 /r/chatgpt 上的热门帖子是什么」。
4. 分析 Twitter 的开源算法代码。使用 Twitter 的算法代码,ChatGPT 现在可以告诉你如何在 Twitter 上爆火。
提示词:「拿这段 Twitter 算法的代码,告诉我如何在 Twitter 上爆火的最佳方法 [代码]」。
5. 找出你想去旅行的地方的宝藏打卡点。再也不需要深入探索旅游点,ChatGPT 会为你做这个工作。
提示词:「找出毛伊岛,夏威夷的宝藏打卡点」。
6. 为你找到评论。不再需要在网上花费数小时搜索产品评论,ChatGPT 会为你做这个工作。
提示词:「基于最佳评论,找出温哥华排名前 3 咖啡店」。
7. 概述表现最好的股票。ChatGPT 现在是你的个人股票分析师(这不是投资建议)。
提示词:「你能告诉我本周表现最好的 10 只股票是什么?」。
8. 创建文章并引用来源。ChatGPT 现在可以为你创建一篇完整的论文,并引用其来源。
提示词:「对关于人工智能的威胁,写一篇短篇论文,并至少引用 5 个来源,附上 URL 链接到这些来源」。

ChatGPT的Browsing模式为用户带来了独特的搜索体验。它能够更准确地查找你需要的内容,并快速生成你需要的信息。

然而,这个模式也有一些明显的问题:次数限制、找不到网站以及回答速度缓慢。因此,它目前无法完全取代传统的搜索引擎。尽管如此,我们不妨展望未来,期待GPT-4模型能够达到GPT-3.5模型同样快速生成答案的速度。总的来说,ChatGPT已经是一个十分强大的网络工具,但是离完美还有一段距离。未来,ChatGPT将会更新更多插件和功能,使其变得更加强大。


【微信号】linhuihui2021

个人转载内容至朋友圈和群聊天,无需特别申请版权许可。

需要更多知识:

欢迎加我微信,围观我朋友圈。


本文链接:http://xiaogongchang.cn/chatgpt/517.html

相关文章