ChatGPT官方出品,OpenAI 推出自己的“提示工程师”教程

先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi


推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top 

该指南对于那些希望充分利用大型语言模型(LLM)的人来说非常有价值。我极力推荐。

Six strategies for getting better results,这里是他们总结的六大策略,有助于从 GPT-4 获取更优质的结果:

1、Write clear instructions-给出清晰明确的指令

这些模型无法读懂你的想法。如果输出内容过长,可以要求简洁回复。如果输出内容过于简单,可以要求专家级的写作水平。如果你不喜欢当前的格式,可以展示你希望看到的格式。模型对你的需求猜测得越少,你获得想要的结果的可能性就越大。

策略举例:

  • 在你的查询中包含详细信息,以获得更相关的答案。 

  • 要求模型扮演一个特定角色。

  • 使用分隔符清晰地标示输入的不同部分。

  • 明确指定完成任务所需的步骤。

  • 提供示例。

  • 指定输出内容的期望长度。

比如我们要求模型扮演一个特定角色,OpenAI给出了官方的例子,你可以在提问前,先设置一个角色,比如“你是一名经验丰富的数据库开发工程师”、“假设你是一名生物化学老师,以下答案是面向高中二年级以上的同学”等等。

2、Provide reference text-提供参考文本

语言模型在回答关于深奥的主题或提供引用和网址时,可能会“自信地”编造虚假答案(这就是所谓的人工智能“幻觉”)。就像备忘录可以帮助学生在考试中取得更好成绩一样,向这些模型提供参考文本可以帮助它们提供更少错误的回答。 
策略:
  • 指导模型使用参考文本来回答问题。
  • 指导模型在回答时引用参考文本中的内容。
比如,让LLM只在提供的文本范围寻找答案,如果找不到答案直接返回“我不知道”。

3、Split complex tasks into simpler subtasks-分而治之
就像在软件工程中将一个复杂系统分解为一组模块化组件是一个好习惯一样,对于提交给语言模型的任务也是如此。复杂的任务比简单任务更容易出错。此外,复杂任务往往可以重新定义为一系列简单任务的工作流,在这个工作流中,早期任务的输出用于构建后续任务的输入。 
策略:
  • 使用意图分类来识别针对用户查询最相关的指令。
  • 对于需要进行非常长对话的对话应用,概括或过滤之前的对话。
  • 逐部分概括长文档,并递归地构建完整概要。
比如用户说帮我恢复网络,可以向模型提供一组更具体的指令,以供其处理后续步骤,比如首先咨询用户,线缆是否接触良好,然后再考虑下一步。

4、Give the model time to "think"-给模型思考的时间
如果要求你计算17乘以28,你可能不会立刻知道答案,但如果给予时间,你仍然可以算出来(就像我们之前讨论过的系统1和 系统2,一个是直觉性,一个是逻辑性的)。同样地,模型在尝试立即回答时,比花时间推敲答案更容易犯推理错误。在回答之前要求一个“思考过程”可以帮助模型更可靠地推理出正确答案。

策略:

  • 指导模型在急于得出结论之前先自行解决问题。

  • 使用内心独白或一系列查询来隐藏模型的推理过程。

  • 询问模型在之前的尝试中是否有遗漏的地方。

下面这个提示就是使用“内心独白”的方式来隐藏推理过程,并且让LLM只使用特定的回复词和用户沟通,比如Hint。

5、Use external tools-使用外部工具

通过使用其他工具的输出来弥补模型的弱点。例如,文本检索系统(有时称为 RAG 或检索增强生成)可以告诉模型关于相关文档的信息。像 OpenAI 的代码解释器这样的代码执行引擎可以帮助模型进行数学计算和运行代码。如果某个任务可以通过工具而不是通过语言模型更可靠或高效地完成,那么将其转移出去,以便充分利用两者的优势。 (举一个例子 ,如果让大模型计算44+27=?,LLM可能会胡言乱语,每次给出不一样的答案,因为他按照44+27=后面那个词的概率,但是这是一个精确的计算,所以可以让大模型使用计算器,让大模型定义两个变量,var a=44, b=27,然后把这个交给计算器或者代码,最后把计算结果返回回来)

策略:

  • 使用基于嵌入的搜索来实现高效的知识检索。

  • 使用代码执行来进行更准确的计算或调用外部API。

  • 给模型提供访问特定功能的权限。

6、Test changes systematically-系统性评估

如果你能够衡量性能,提高性能就会变得更加容易。在某些情况下,对提示的修改可能会在几个孤立的示例上取得更好的性能,但在更具代表性的示例集上导致整体性能下降。因此,为了确保更改对性能有正面影响,可能需要定义一个全面的测试套件(也称为“评估”)。 

策略:

  • 参考标准答案评估模型输出。

以上就是官方给出的提示工程的6大方法,使用的好可以来提高LLM的回答质量,更好的利用LLM的能力。

代充值gpt4.0

本文链接:http://xiaogongchang.cn/chatgpt/1002.html

OpenAI提示工程指南

相关文章