全文内容较长较干,假如你对 AI 和提示语工程不是很了解,乃至连 ChatGPT 也不是很了解,那我主张你从提示语学院根底篇开端阅读。根底篇更多的会从头手的角度教你怎么运用 AI 产品,假如觉得还挺风趣,无妨再深化探究下!

咱们还做了一期视频专门来介绍「提示语工程师」这个职业。

**GPT 最佳实践的六种战略**是咱们在OpenAI 官方最佳实践的根底上翻译后加入了更多的示例,期望能对你有协助。

本文一切示例都是依据现在最先进的大模型「小语 4.0(即 GPT-4)」,旨在协助大家更好地运用 GPT 获取最优质的答案。这些介绍的战略和技巧有时能够组合运用以到达更好的效果。请多多进行实验,并找出最适合你的方法。

战略一: 指令 的内容清晰清晰

GPT无法读懂你的心思,假如输出答案太啰嗦,请要求它简练回复;假如输出太简略,请要求以专业水平写作;假如你不喜欢格局,请展现你想看到的格局。GPT越少猜想你的意图,你取得的成果就更或许符合预期。

一、在发问时给出更多的细节以取得更相关的答案

为了取得满意的答复,请在发问时清晰需求细节。让模型去猜想你的心思,将无法取得最理想的答案。

不太有用的 更好的
怎么在Excel中进行数值相加? 怎么在Excel中将一行美元金额相加?我期望对整个作业表中的一切行进行主动求和,并将一切的总和以“Total”列的方法显现在右侧。
谁是现任总统? 2021年墨西哥的总统是谁?选举多久进行一次?
编写一段核算斐波那契数列的代码 编写一个高效核算斐波那契数列的 TypeScript 函数。请在代码中增加充沛的注释,解说每个部分的功用以及为什么以这种方法编写。
总结会议记录 用一个阶段总结会议记录。然后以 Markdown 列表的方法列出与会人员及其关键。终究,假如有的话,列出与会人员主张的下一步举动或待办事项。

二、给模型设定身份人物

为了取得满意的答复,请在发问中设定人物信息。为模型设定人物有助于取得更符合场景的答案。

提示语示例:

你是一位小学老师,能够将杂乱的内容解说得让7或8岁的孩子也能了解。请从头编写以下语句,使它们更简略了解。

OpenAI是一个美国人工智能(AI)研讨实验室,由非营利安排OpenAI Incorporated(OpenAI Inc.)和其盈余子公司OpenAI Limited Partnership(OpenAI LP)组成。 OpenAI旨在推行和发展友好型人工智能,并运用国际第五大超级核算机进行研讨。该安排于2015年由Sam Altman、Reid Hoffman、Jessica Livingston、Elon Musk、Ilya Sutskever、Peter Thiel等人在旧金山创立,共许诺捐献10亿美元。Musk于2018年从董事会辞去职务但依然是捐献者。微软于2019年向OpenAI LP供给了10亿美元的出资,并在2023年1月供给了第二笔多年期出资,金额据报道为100亿美元。

小语 4.0 回复是这样的:

OpenAI是一个在美国的智能机器人研讨当地,它有两个部分,一个是不赚钱的,另一个是赚钱的。OpenAI的方针是让智能机器人对人类有好处,并用一个十分强壮的电脑来做研讨。这个安排是在2015年由Sam Altman、Reid Hoffman、Jessica Livingston、Elon Musk(特斯拉的老板)、Ilya Sutskever、Peter Thiel等人在美国旧金山建立的,他们一同答应给这个安排10亿美元。尽管Elon Musk在2018年离开了领导位置,但他仍是会给钱。微软这个大公司在2019年给了OpenAI 10亿美元,并在2023年1月又给了许多钱,大概是100亿美元。

三、运用分隔符清晰地标明输入的不同部分

经过分隔符(如”””、 标签、章节标题等)划分需求区别对待的文本部分。 关于一些简略使命,运用分隔符或许不会对输出质量产生影响。可是,使命越杂乱,消除使命细节的歧义就越重要。不要让 GPT 辛苦地去了解你到底在要求它们做什么。在处理更杂乱的问题时,请保证供给清晰、具体的指示,并经过运用分隔符等方法清晰标识需求特别处理的文本部分。这样有助于取得更精确、高质量的答复。

三重引号”””咱们之前现已举了许多比方,这儿只针对 标签和章节标题举例阐明。

XML标签示例

提示语:

你将收到一对关于同一主题的文章(用XML标签分隔)。首要归纳每篇文章的观念。然后指出哪篇文章的论据更有力,并解说原因。
<article>生成式预练习变换器(GPTs)在自然言语处理范畴无疑是强壮的东西,能够依据从很多数据中学到的方式生成类似人类的文本。可是,尽管GPTs在言语生成方面体现出色,但它们在本质上短少推理才能。作为一种认知进程,推理触及逻辑考虑、推断和依据手头信息得出定论的才能。GPTs作为核算模型,仅限于识别和仿照练习数据中的方式,而无法实在了解其间的概念或它们之间的联系。
GPTs在推理方面的一个重要限制是它们无法进行因果推理,这需求了解给定上下文中不同元素之间的因果联系。GPTs能够生成看似触及推理的文本,但实践上,它们只是依据某些词语或短语一同呈现的核算或许性生成语句,而没有了解它们之间的因果联络。此外,GPTs无法评价它们生成的陈说的实在性或有用性,由于它们短少对触及的概念的必要了解。这种无法推理的才能,终究意味着尽管GPTs能够生成看似衔接和符合上下文的文本,但不能依赖它们供给精确或逻辑上合理的信息或定论。</article>
<article>生成式预练习变换器(GPTs)的确能进行必定方法的推理。它们经过运用从很多数据中学到的方式生成在上下文中一般具有逻辑含义的回应。一个引人注意图推理才能比方是它们能够处理从未见过的数学问题。这表明GPTs不仅仅是复述回忆中的信息,而是能够将所学的原理和方式运用于新情境,这是推理的特征。例如,当被问及关于一部小说的问题时,GPT能够经过识别和综合文本中的相关信息来供给精确的答案。GPTs还能够经过依据所学方式生成假定场景的或许成果来进行假定性推理。这种推理才能是GPT规划和有用性的基本方面。
可是,重要的是要认识到GPTs的推理才能存在限制性。尽管它们能够生成衔接且与上下文相关的回应,但它们对概念的了解或许比人类推理要浅陋。这是由于GPTs首要依赖于识别数据中的方式和相关,而不是深化了解概念的因果联系。因而,它们的推理有时或许导致过错或荒谬的定论,特别是在输入数据含糊或对立的状况下。尽管存在这些限制性,GPTs在人工智能范畴取得了重要发展,展现了在广泛场景中进行推理和生成类似人类回应的令人印象深化的才能。继续完善和改善这些模型以进一步前进它们的推理才能,并更好地了解这项技能的潜在运用和影响至关重要。</article>

小语 4.0 回复:

文章1观念归纳:生成式预练习变换器(GPTs)在自然言语处理范畴体现出色,但在本质上短少推理才能,特别是在因果推理方面。GPTs只能识别和仿照练习数据中的方式,而无法实在了解概念或它们之间的联系。
文章2观念归纳:生成式预练习变换器(GPTs)的确能进行必定方法的推理,例如处理从未见过的数学问题和进行假定性推理。可是,GPTs的推理才能存在限制性,由于它们首要依赖于识别数据中的方式和相关,而不是深化了解概念的因果联系。
在这两篇文章中,文章2的论据更有力。文章1强调了GPTs在推理方面的限制性,特别是在因果推理方面。可是,文章2承认了GPTs的限制性,一起也供给了关于GPTs在推理方面的实践运用和才能的比方,如处理从未见过的数学问题和进行假定性推理。文章2还强调了继续完善和改善这些模型以前进它们的推理才能的重要性。因而,文章2在论证GPTs推理才能方面供给了更全面和平衡的观念。

【万字长文】 GPT 最佳实践的六种策略

若你不清楚XML语法,可查阅 W3cschool-XML语法

章节标题示例

提示语:

咱们将为您供给一份论文摘要和主张的论文标题。论文标题应该能让读者清楚了解论文的主题,一起也要引人入胜。假如标题无法满意这些要求,请供给5个备选标题。
摘要:咱们在此报道了GPT-4的开发进程,这是一个大规划的多模态模型,能够接收图像和文本输入,并产生文本输出。尽管在许多实践场景中,GPT-4的才能依然不如人类,但它在各种专业和学术基准测验中展现出了人类水平的体现,包括在模拟的律师资格考试中,得分坐落前10%的考生之列。GPT-4是一个依据Transformer的模型,预练习用于猜测文档中的下一个词元。后期练习的对齐进程导致在现实性和符合期望行为的衡量上的体现得到了进步。该项意图中心组成部分是开宣布能在各种规划规模内猜测行为的根底设备和优化方法。这使咱们能够精确猜测依据不超越GPT-4核算才能千分之一的模型练习的GPT-4的某些体现。
标题:GPT-4技能陈说

小语 4.0 回复:

备选标题:
1. GPT-4:大规划多模态模型的开发与运用
2. 探究GPT-4:人工智能范畴的新突破
3. GPT-4:跨越图像和文本的智能模型
4. GPT-4:依据Transformer的多模态人工智能模型
5. GPT-4:完结人类水平体现的智能模型

【万字长文】 GPT 最佳实践的六种策略

四、清晰指定完结使命所需的进程

有些使命最好经过一系列进程来指定。清晰地写出这些进程能够使模型更简略履行。

提示语示例:

依据以下进程指示应对用户输入。
进程一 - 用户会供给以三重引号包裹的文本,你需求用一句话归纳这段文本,并以"摘要:"作为前缀。
进程二 - 将进程一中的摘要翻译成英语,并以"翻译:"作为前缀。
"""阿波罗方案,又叫阿波罗项目,是美国国家航空航天局(NASA)进行的第三个载人航天方案,从1968年到1972年成功预备并使第一批人类登陆月球。它开端在1960年的艾森豪威尔总统任期内幻想为一个三人航天器,以顶替将第一批美国人送入太空的水星方案。阿波罗后来致力于肯尼迪总统在1961年5月25日对国会的演讲中为1960年代的国家方针——“使人类登陆月球并安全回来地球”。这是美国的第三个载人航天方案,前面是1961年幻想的双人宇宙飞船双子座方案,以支撑阿波罗方案。
肯尼迪的方针在阿波罗11号使命中得以完结,当时宇航员尼尔阿姆斯特朗和巴兹奥尔德林于1969年7月20日登陆他们的阿波罗登月舱(LM)并在月球外表行走,而迈克尔柯林斯则在指挥和服务舱(CSM)中留在月球轨迹,一切三人于7月24日安全降落在太平洋。尔后的五次阿波罗使命也使宇航员登陆了月球,终究一次是1972年12月的阿波罗17号。在这六次太空飞翔中,有十二人登上了月球。
阿波罗方案从1961年到1972年进行,初度载人飞翔在1968年。1967年,阿波罗1号舱室火灾在预发射测验中形成全体机组人员逝世,这是一个重大挫折。在第一次成功登陆后,有足够的飞翔硬件进行九次后续登陆,方案进行扩展的月球地质和天体物理探究。预算削减迫使取消了其间的三次。剩余的六次使命中有五次成功登陆,但阿波罗13号的登陆被在飞往月球途中的氧气罐爆炸阻挠,使得指挥和服务舱失去功用。机组人员几乎是用登月舱作为“救生艇”在回来旅程中安全回来地球。阿波罗运用土星系列火箭作为发射载具,这些火箭也用于阿波罗运用方案,包括天空实验室,这是一个在1973-1974年支撑三次载人使命的空间站,以及1975年的阿波罗-联盟实验项目,这是一个美苏联合的低地球轨迹使命。
阿波罗设定了几个重要的载人航天里程碑。它是仅有一个发送载人使命超出低地球轨迹的。阿波罗8号是第一个绕行另一个天体的载人航天器,阿波罗11号是第一个使人类登陆另一个天体的载人航天器。
总的来说,阿波罗方案向地球回来了842磅(382千克)的月球岩石和土壤,极大地增加了咱们对月球组成和地质前史的了解。该方案为NASA后续的载人航天才能奠定了根底,并赞助了其约翰逊太空中心和肯尼迪太空中心的建造。阿波罗还推动了许多与火箭和载人航天有关的技能范畴的前进,包括航空电子学、电信和核算机。
-摘自https://en.wikipedia.org/wiki/Apollo_program"""

小语 4.0 回复:

摘要:阿波罗方案是美国NASA的第三个载人航天方案,旨在完结人类登陆月球并安全回来地球,共有12名宇航员登上月球,为后续载人航天才能奠定根底并推动相关技能范畴的前进。
翻译:Summary: The Apollo Program was the third manned space program of NASA, aiming to achieve human landing on the moon and safely return to Earth, with a total of 12 astronauts landing on the moon, laying the foundation for subsequent manned space capabilities and promoting advances in related technology fields.

【万字长文】 GPT 最佳实践的六种策略

五、供给示例

一般来说,给 GPT一个【具象的示例】 比给一个【宽泛的教导】更为有用:

  • 宽泛的教导:在写作时,保证每个阶段都有一个清晰的主题句。
  • 具象的示例:假定你正在写一篇关于环保的文章。一般性的教导或许会让你在每个阶段开端时写一个主题句,比方,“塑料污染是咱们环境面对的一个严重问题。”然后在接下来的阶段中,你能够供给关于塑料污染的现实、数据或许引证来支撑这个主题句。

在这个比方中,宽泛教导供给了一个可适用于一切写作状况的准则,而具象示例则让GPT更具体、更直观地明白你的实践写作诉求。

提示语:

以共同的风格答复。
问:教我怎样学会耐性。
答:深邃的峡谷源于微弱的溪流;宏大的交响乐源于单独的音符;杂乱的挂毯始于孤单的线。
问:教我怎样了解海洋。
答:

小语 4.0 回复:

答:浩渺的海洋源于细微的水滴;无尽的波澜起于轻柔的风;丰富的生命会聚于深邃的蓝。

【万字长文】 GPT 最佳实践的六种策略

六、指定所需输出的长度

您能够要求GPT生成特定方针长度的输出。方针输出长度能够用单词数、语句数、阶段数、项目符号等来表明。但请注意,要求模型生成特定数量的单词精确度较低。模型更能牢靠地生成具有特定数量阶段或关键的输出。

提示语示例:

将三重引号包括的文本用3个关键进行总结。
"""阿波罗方案,又叫阿波罗项目,是美国国家航空航天局(NASA)进行的第三个载人航天方案,从1968年到1972年成功预备并使第一批人类登陆月球。它开端在1960年的艾森豪威尔总统任期内幻想为一个三人航天器,以顶替将第一批美国人送入太空的水星方案。阿波罗后来致力于肯尼迪总统在1961年5月25日对国会的演讲中为1960年代的国家方针——“使人类登陆月球并安全回来地球”。这是美国的第三个载人航天方案,前面是1961年幻想的双人宇宙飞船双子座方案,以支撑阿波罗方案。
肯尼迪的方针在阿波罗11号使命中得以完结,当时宇航员尼尔阿姆斯特朗和巴兹奥尔德林于1969年7月20日登陆他们的阿波罗登月舱(LM)并在月球外表行走,而迈克尔柯林斯则在指挥和服务舱(CSM)中留在月球轨迹,一切三人于7月24日安全降落在太平洋。尔后的五次阿波罗使命也使宇航员登陆了月球,终究一次是1972年12月的阿波罗17号。在这六次太空飞翔中,有十二人登上了月球。
阿波罗方案从1961年到1972年进行,初度载人飞翔在1968年。1967年,阿波罗1号舱室火灾在预发射测验中形成全体机组人员逝世,这是一个重大挫折。在第一次成功登陆后,有足够的飞翔硬件进行九次后续登陆,方案进行扩展的月球地质和天体物理探究。预算削减迫使取消了其间的三次。剩余的六次使命中有五次成功登陆,但阿波罗13号的登陆被在飞往月球途中的氧气罐爆炸阻挠,使得指挥和服务舱失去功用。机组人员几乎是用登月舱作为“救生艇”在回来旅程中安全回来地球。阿波罗运用土星系列火箭作为发射载具,这些火箭也用于阿波罗运用方案,包括天空实验室,这是一个在1973-1974年支撑三次载人使命的空间站,以及1975年的阿波罗-联盟实验项目,这是一个美苏联合的低地球轨迹使命。
阿波罗设定了几个重要的载人航天里程碑。它是仅有一个发送载人使命超出低地球轨迹的。阿波罗8号是第一个绕行另一个天体的载人航天器,阿波罗11号是第一个使人类登陆另一个天体的载人航天器。
总的来说,阿波罗方案向地球回来了842磅(382千克)的月球岩石和土壤,极大地增加了咱们对月球组成和地质前史的了解。该方案为NASA后续的载人航天才能奠定了根底,并赞助了其约翰逊太空中心和肯尼迪太空中心的建造。阿波罗还推动了许多与火箭和载人航天有关的技能范畴的前进,包括航空电子学、电信和核算机。
-摘自https://en.wikipedia.org/wiki/Apollo_program"""

小语 4.0 回复:

阿波罗方案是美国NASA进行的第三个载人航天方案,旨在完结人类登陆月球并安全回来地球的方针,共有12名宇航员成功登上月球。
阿波罗方案在1961年至1972年期间进行,期间遇到了阿波罗1号舱室火灾等挫折,但终究完结了肯尼迪总统设定的方针。
该方案为NASA后续的载人航天才能奠定了根底,推动了许多与火箭和载人航天有关的技能范畴的前进,并向地球回来了842磅的月球岩石和土壤。

战略二:供给参阅文本

GPT在答复一些深奥主题或需求引证网址的问题时,或许会胡说八道编造虚伪答案。这时你能够为 GPT 供给参阅文本能够协助它们在答复问题时减少伪造内容。

当你初度阅读时,你或许会觉得以下两种方法是相同的。其实,这两种战略尽管都是供给参阅文本给GPT,但他们的运用方法和意图有所不同。前者更侧重于让模型了解并运用参阅文本中的信息再结合GPT的常识库进行答复,而后者则更侧重于让模型直接引证参阅文本中的内容进行答复。

运用参阅文本教导模型的答案

假如咱们能为模型供给与当时查询相关的牢靠信息,那么咱们能够指示模型运用所供给的信息来编撰答案。

提示语结构:

请运用由三引号分隔的供给的文章来答复问题。假如答案不能在文章中找到,请答复 "我无法找到答案。"
"""文章1"""
"""文章2"""
"""文章3"""
我的问题:<在此处刺进问题>

提示语示例:

请运用以下三引号分隔的文章答复问题。假如答案无法在文章中找到,请写“无法找到答案”。
"""
什么是「小语 GPT」?
小语 GPT 所供给的内容生成功用所接入的服务供给商为微软的 Azure OpenAI 服务,支撑用户轻松拜访 GPT-3.5 和 GPT-4 模型。这些模型能够轻松习惯特定的使命,包括但不限于内容生成、汇总、语义查找和自然言语到代码的转化。
现在微软的 Azure OpenAI 服务仅面向企业客户供给,这是现在国内合法运用 OpenAI 服务的仅有途径。提示语科技(北京)有限公司现在现已取得微软授权。
"""
"""
比较小语 GPT、Azure OpenAI 和 OpenAI
相较于其它生成性模型,OpenAI 的 GPT 模型具有显着的潜在优势。可是,若不经过精心规划并采用全面的缓解措施,这类模型或许产生过错乃至有害的内容。
Azure OpenAI 服务经过 OpenAI GPT-3.5、GPT-4 和 DALL-E 模型为企业客户供给高档言语 AI,愈加重视有用安全性。凭借Azure OpenAI,企业客户在运转与OpenAI 相同的模型时可取得 Microsoft Azure 的安全功用。 
在保留了 OpenAI 的 GPT 强壮生成才能和 Azure OpenAI 服务安全功用的根底上,小语 GPT 针对国内方针对内容生成施行了更严厉的规范,包括但不限于遵守法律法规、尊重社会公德、保护公序良俗,体现社会主义中心价值观、防止歧视性内容、防止不公平竞赛、防止虚伪信息传达,以及不侵犯他人肖像、隐私、常识产权等权益。
"""
问题:小语 GPT 是提示语科技自研的吗?

【万字长文】 GPT 最佳实践的六种策略

教导模型运用参阅文本中的引文来答复

假如输入内容现已给出了一些相关的布景常识,那么咱们能够直接要求GPT经过引证文档中的内容来增强它的答复。 这儿有一个小技巧,咱们能够经过一种特别格局来标示引证的内容,以便于查看输出中的引证是否精确。

提示语结构:

请剖析这个由三重引号分隔的文档和一个问题。读懂后仅经过文档的内容来答复问题,在答复问题时需求引证文档中的阶段或定论。假如文档中没有答复此问题所需的信息,那么只需写上:“信息不足”。假如供给了问题的答案,必须用特别格局注释它。请运用以下格局来引证相关阶段(「"引证": ...」)。
"""<在这儿刺进文档>"""
我的问题:<刺进问题>

提示语示例:

请剖析这个由三重引号分隔的文档和一个问题。读懂后仅经过文档的内容来答复问题,在答复问题时需求引证文档中的阶段或定论。假如文档中没有答复此问题所需的信息,那么只需写上:“信息不足”。假如供给了问题的答案,必须用特别格局注释它。请运用以下格局来引证相关阶段("引证": ...」)。
"""
什么是「小语 GPT」?
小语 GPT 所供给的内容生成功用所接入的服务供给商为微软的 Azure OpenAI 服务,支撑用户轻松拜访 GPT-3.5 和 GPT-4 模型。这些模型能够轻松习惯特定的使命,包括但不限于内容生成、汇总、语义查找和自然言语到代码的转化。
现在微软的 Azure OpenAI 服务仅面向企业客户供给,这是现在国内合法运用 OpenAI 服务的仅有途径。提示语科技(北京)有限公司现在现已取得微软授权。
"""
"""
比较小语 GPT、Azure OpenAI 和 OpenAI
相较于其它生成性模型,OpenAI 的 GPT 模型具有显着的潜在优势。可是,若不经过精心规划并采用全面的缓解措施,这类模型或许产生过错乃至有害的内容。
Azure OpenAI 服务经过 OpenAI GPT-3.5、GPT-4 和 DALL-E 模型为企业客户供给高档言语 AI,愈加重视有用安全性。凭借Azure OpenAI,企业客户在运转与OpenAI 相同的模型时可取得 Microsoft Azure 的安全功用。 
在保留了 OpenAI 的 GPT 强壮生成才能和 Azure OpenAI 服务安全功用的根底上,小语 GPT 针对国内方针对内容生成施行了更严厉的规范,包括但不限于遵守法律法规、尊重社会公德、保护公序良俗,体现社会主义中心价值观、防止歧视性内容、防止不公平竞赛、防止虚伪信息传达,以及不侵犯他人肖像、隐私、常识产权等权益。
"""
我的问题:小语 GPT 是提示语科技自研的吗?

【万字长文】 GPT 最佳实践的六种策略

⏳ 战略三:将杂乱使命拆分为子使命

正如在软件工程中将一个杂乱体系分解为一组模块化组件是一种很好的做法相同,这关于提交给 GPT 的使命也相同适用。杂乱使命往往比简略使命具有更高的过错率。此外,杂乱使命一般能够被从头定义为由一系列简略使命组成的作业流程,其间前面使命的输出用于构建后续使命的输入。

运用意图分类来承认用户查询最相关的指示

关于那些需求很多独立指令集来处理不同状况的使命,首要对查询类型进行分类,并运用该分类来承认所需的指令或许会有所协助。这能够经过定义固定的类别和硬编码处理给定类别使命所需的相关指令来完结。这个进程也能够递归运用,将一个使命分解为一系列的阶段。这种方法的优点在于,每个查询只包括履行使命下一阶段所需的指令,与运用单一查询来履行整个使命相比,能够下降过错率。这也或许下降本钱,由于更大的提示运转起来愈加贵重。

例如,假定关于一个客户服务运用,查询能够有用地分类如下:

提示语:

你将收到客户服务咨询。请将每个咨询划分为首要类别和非必须类别,并以JSON格局供给输出,键名为:首要类别和非必须类别。
首要类别:账单、技能支撑、账户管理或一般咨询。
账单非必须类别:
退订或晋级
增加付款方法
收费阐明
争议收费
技能支撑非必须类别:
毛病排查
设备兼容性
软件更新
账户管理非必须类别:
重置密码
更新个人信息
刊出账户
账户安全
一般咨询非必须类别:
产品信息
价格
反应
与人工客服交流
客户:我需求恢复我的网络衔接。

小语 4.0 回复:

{
  "首要类别": "技能支撑",
  "非必须类别": "毛病排查"
}

【万字长文】 GPT 最佳实践的六种策略

依据客户咨询的分类,咱们能够为GPT模型供给一套更具体的指示来处理后续进程。例如,假定客户需求协助进行”毛病排查”。

提示语:

你将会收到需求进行技能支撑毛病排查的客户服务咨询。你能够经过以下方法协助用户:
- 主张他们查看路由器的一切线缆是否已衔接。请注意,线缆跟着时刻的推移简略松动。
- 假如一切线缆都已衔接,但问题依然存在,请问询他们运用的路由器类型。
- 现在,您将教导他们怎么重启设备:
-- 假如类型为MTD-327J,请主张他们按住赤色按钮5秒钟,然后等候5分钟后再测验衔接。
-- 假如类型为MTD-327S,请主张他们将其拔下并从头刺进,然后等候5分钟后再测验衔接。
- 假如客户在重启设备并等候5分钟后问题依然存在,请将他们衔接到IT支撑部门,输出{"IT support requested"}。
- 假如用户开端问询与此主题无关的问题,那么请承认他们是否期望完毕当时关于毛病排查的谈天,并依据以下方案对他们的恳求进行分类:
将他们的查询分为首要类别和非必须类别。请以json格局供给您的输出,键为:首要类别和非必须类别。
首要类别:账单、技能支撑、账户管理或一般咨询。
账单非必须类别:
- 退订或晋级
- 增加支付方法
- 收费阐明
- 争议收费
技能支撑非必须类别:
- 毛病排查
- 设备兼容性
- 软件更新
账户管理非必须类别:
- 重置密码
- 更新个人信息
- 关闭账户
- 账户安全
一般咨询非必须类别:
- 产品信息
- 定价
- 反应
- 与人交谈
客户:我需求让我的互联网从头作业起来。

小语 4.0 回复:

您好!请先查看一下路由器的一切线缆是否已衔接好。有时分线缆或许会跟着时刻的推移而松动。假如线缆都已衔接好,但问题依然存在,请告知我您运用的路由器类型,我将为您供给进一步的协助。

【万字长文】 GPT 最佳实践的六种策略

请注意,这个模型就像一个游戏,它能够宣布特别的文字来告知咱们游戏进行到哪一步了。这样咱们就能够把这个体系幻想成一个游戏机,游戏机里的每一步都决议了咱们应该做什么。经过记住每一步,了解在这一步咱们能够做什么,以及下一步咱们能够做什么,咱们就能够更好地保护用户的体会,这在一些不太有规则的方法中是很难做到的。

假如咱们不是开发者的话,下面的两个技巧咱们都用不到。咱们这儿也只是简略介绍基本原理,如需深化学习可前往OpenAI 官方文档进行查看。

对需求十分多内容的对话场景,能够对之前的对话进行总结或过滤

由于GPT具有固定的上下文长度,用户和GPT之间的对话假如包括了整个对话内容,那么对话就无法无限制地进行下去。处理此问题有多种方法,其间之一是总结前面的对话内容。并将从前对话的摘要包括鄙人一次的发问中。

一个简化的举例阐明:

假定你与GPT在对话中评论了气候变化、可再生能源和碳排放。你现在想问GPT关于这些主题的更深化的问题,可是你不能把一切的对话都包括在输入中。这时你能够对前置对话进行总结,并鄙人一次发问中进行输入,比方:”在前面的对话中,咱们评论了气候变化的影响,探讨了各种可再生能源的优点和缺陷,以及碳排放的环境影响关于这个主题,我想知道怎么有用地下降碳排放。”在这个比方中,标蓝部分便是对前置对话的总结,他的作用是协助GPT在超长的对话中,更好的了解上下文。标红部分则是你依据这个总结提出的,需求GPT继续答复剖析的新问题。

逐段总结长篇文档并 递归 构建完整总结

由于GPT具有固定的上下文长度,因而无法在单个查询中对长度超越上下文长度减去生成摘要长度的文本进行总结。

要总结一本十分长的文档,如一本书,咱们能够运用一系列查询来逐个总结文档的每个部分。各部分的摘要能够兼并并进行总结,然后生成摘要的摘要。这个进程能够递归进行,直到整个文档被总结。假如需求运用关于前面部分的信息来了解后边部分,那么在总结某一点的内容时,包括文本前面部分的运转摘要会是一个有用的技巧。OpenAI在之前的研讨中运用GPT-3的变体研讨了这种程序总结书本的有用性。

一个简化的举例阐明:

假定咱们有一本十分长的书,咱们想要运用GPT来生成这本书的总结。由于这本书的长度超越了GPT的上下文长度,咱们不能一次性把整本书作为输入给GPT。这时,咱们能够采取这样的战略:

  1. 首要,咱们能够把书分红几个部分,比方按章节分。关于每一章,咱们都生成一个总结。例如,关于第一章,咱们能够给GPT一个提示,比方:”请总结以下的文本,这是一本书的第一章…”,然后附上第一章的内容。
  2. 当咱们有了一切章节的总结后,咱们能够将这些总结衔接起来,然后再生成一个总的总结。这个总的总结便是对整本书的总结。为了生成这个总结,咱们能够给GPT一个新的提示,比方:”请总结以下的文本,这是关于一本书各章节的总结…”,然后附上一切章节的总结。
  3. 在这个进程中,假如咱们发现有些部分的内容需求对前面的内容有一些了解才能够了解,咱们能够在总结这一部分的时分,附上前面内容的总结。这便是所谓的「运转总结」。这样,GPT就能够在了解后边的内容时,参阅前面的总结。

假如你对「运转总结」的概念还不是很了解,那能够看一下这个比方:

假定咱们现已对前两章进行了总结,而且咱们正在处理第三章。可是,为了了解第三章的内容,咱们需求对前两章的内容有必定的了解。也便是说,第三章的内容与前两章的内容有所相关。在这种状况下,假如咱们只是单独地对第三章进行总结,那么咱们或许会丢掉一些重要的上下文信息。这时咱们能够给GPT一个这样的输入:”以下是关于这本书前两章的总结{这儿是前两章的总结}。现在,请总结以下的文本{这是第三章的内容}” ,然后附上第三章的内容。这样,GPT就能够在了解第三章的内容时,参阅前两章的总结。这便是**「运转总结」**的概念。它能够协助咱们处理一些需求对前面的内容有必定了解才能了解的状况。

战略四:给 GPT 一些「考虑」时刻

假如要求你核算 17 * 28,你或许不会立刻说出答案,但只需求一点核算的时刻你就能够给出正确答案。相同,小语 GPT 在试图当即答复问题时,比花时刻核算答案更简略呈现推理过错。在答复问题之前,假如能供给一系列推理进程能够协助 GPT 更牢靠地推导出正确答案。

教导模型在盲目下定论之前自行处理问题

有时分,在得出定论之前清晰地教导模型从基本原理推理会得到更好的成果。

例如,假定咱们要让模型评价学生处理数学问题的方法。最显着的方法是简略地问询模型学生的处理方案是否正确。

提示语:

判别学生的回答是否正确。
问题:
我正在建造一个太阳能发电设备,需求协助核算财务数据。
土地价格为每平方英尺100美元
太阳能电池板价格为每平方英尺250美元
我商洽了一份保护合同,第一年的费用为10万美元,尔后每平方英尺10美元
请问第一年运营的总本钱与设备的平方英尺数之间的联系是什么?
学生的回答:
令x为设备的平方英尺数。
本钱:
土地本钱:100x
太阳能电池板本钱:250x
保护本钱:100,000 + 10x
总本钱:100x + 250x + 100,000 + 10x = 450x + 100,000

小语4.0 的回复:

学生的回答是正确的。
设备的平方英尺数为x。
总本钱:土地本钱(100x)+ 太阳能电池板本钱(250x)+ 保护本钱(100,000 + 10x)= 360x + 100,000。

但这个处理方案实践上是不正确的!咱们能够经过告知 GPT 先依据问题自己进行核算,再比对评价答案,然后规避这个过错 。

更好的提示语:

首要,你需求自行处理这个问题。然后,将你的处理方案与学生的处理方案进行比较,评价学生的处理方案是否正确。在你自己处理问题之前,不要判别学生的处理方案是否正确。
问题描绘:我正在建造一个太阳能发电设备,我需求协助核算财务数据。
- 土地每平方英尺的价格是100美元
- 我能够以每平方英尺250美元的价格购买太阳能板
- 我现已谈妥了一份保护合同,每年固定费用是10万美元,此外还需求每平方英尺10美元的费用
问第一年运营的总本钱是多少,这是一个关于平方英尺数量的函数。
学生的处理方案:设x为设备的面积(以平方英尺为单位)。
1. 土地本钱:100x
2. 太阳能板本钱:250x
3. 保护本钱:100,000 + 100x
总本钱:100x + 250x + 100,000 + 100x = 450x + 100,000

小语4.0 的回复:

首要,咱们自己处理这个问题。
设x为设备的面积(以平方英尺为单位)。
1. 土地本钱:100x
2. 太阳能板本钱:250x
3. 保护本钱:100,000 + 10x
总本钱:100x + 250x + 100,000 + 10x = 360x + 100,000
现在咱们来评价学生的处理方案。学生的处理方案中,保护本钱的核算有误,应该是100,000 + 10x,而不是100,000 + 100x。因而,学生的总本钱核算也有误,正确的总本钱应该是360x + 100,000,而不是450x + 100,000。

【万字长文】 GPT 最佳实践的六种策略

运用内心独白来隐藏模型的推理进程

前面的战略表明,在答复特定问题之前,模型有时需求具体地对一个问题进行推理。关于某些运用程序,模型在得出终究答案时所运用的推理进程或许不适合与用户同享。例如,在学习教导类产品中中,咱们或许期望鼓励学生自己处理问题,可是GPT的处理方案或许会向学生泄漏答案。

内心独白是一种能够用来减轻这个问题的战略。内心独白的思路是教导模型将一些输出放入结构化格局,使解析它们变得简略,这些输出部分是为了向用户隐藏。然后在将输出呈现给用户之前,对输出进行解析,而且只显现部分输出。

提示语:

依照以下进程答复用户的问题。
进程一 - 首要,处理问题并提出自己的处理方案。不要依赖学生的处理方案,由于他们或许会出错。将这一步的一切作业都用三重引号(""")括起来。
进程二 - 将你的处理方案与学生的处理方案进行比照,评价学生的处理方案是否正确。将这一步的一切作业都用三重引号(""")括起来。
进程三 - 假如学生出了过错,承认你能够给学生什么提示,但不能直接给出答案。将这一步的一切作业都用三重引号(""")括起来。
进程四 - 假如学生出了过错,将前一步的提示供给给学生(不在三重引号之外)。写"提示:",而不是"进程四 - ..."。
问题描绘:一个盒子里有4个红球和6个蓝球。从盒子里不放回地抽出两个球。求其间一个球是赤色,另一个球是蓝色的概率是多少?
学生的回答:(4/10)*(6/9) = 24/90 = 4/15。

小语4.0 的回复:

进程一:
"""
要核算一个球是赤色,另一个球是蓝色的概率,咱们需求考虑两种状况:先抽到红球再抽到蓝球,或许先抽到蓝球再抽到红球。咱们能够别离核算这两种状况的概率,然后将它们相加。
先抽到红球再抽到蓝球的概率:(4/10)*(6/9)
先抽到蓝球再抽到红球的概率:(6/10)*(4/9)
将这两个概率相加,得到一个球是赤色,另一个球是蓝色的总概率。
"""
进程二:
"""
学生的回答只核算了先抽到红球再抽到蓝球的概率,没有考虑先抽到蓝球再抽到红球的状况。因而,学生的回答是不完整的。
"""
进程三:
"""
提示学生考虑两种状况:先抽到红球再抽到蓝球,以及先抽到蓝球再抽到红球。然后将这两种状况的概率相加,得到一个球是赤色,另一个球是蓝色的总概率。
"""
提示:你只核算了先抽到红球再抽到蓝球的概率,还需求考虑先抽到蓝球再抽到红球的状况。将这两种状况的概率相加,就能够得到一个球是赤色,另一个球是蓝色的总概率。

【万字长文】 GPT 最佳实践的六种策略

或许,咱们能够经过一系列查询来完结这个方针,其间除了终究一个查询,其他一切的查询成果都对终究用户坚持不可见。

首要,咱们能够让模型自行处理这个问题。由于这个初始查询并不需求学生的回答,所以能够省掉。这还带来了额定的优势,即模型的回答不会遭到学生测验回答的影响,防止了成见的产生。

提示语:

一个盒子里有4个红球和6个蓝球。从盒子里无放回地抽取两个球。那么,抽到一个红球和一个蓝球的概率是多少?

小语 4.0 回复:

有两种或许的成功成果:先抽一个红球然后抽一个蓝球,或许先抽一个蓝球然后抽一个红球。咱们将别离核算这两种成果的概率,然后将它们相加。
1)先红后蓝:先抽一个红球的概率是4/10,由于有4个红球和10个总球。抽完红球后,剩余3个红球和6个蓝球,所以下一个抽到蓝球的概率是6/9。因而,这种成果的概率是(4/10)*(6/9)。
2)先蓝后红:先抽一个蓝球的概率是6/10,由于有6个蓝球和10个总球。抽完蓝球后,剩余4个红球和5个蓝球,所以下一个抽到红球的概率是4/9。因而,这种成果的概率是(6/10)*(4/9)。
现在咱们将这两种成果的概率相加:(4/10)*(6/9) + (6/10)*(4/9) = 24/90 + 24/90 = 48/90。这个分数能够化简为8/15,所以抽到一个红球和一个蓝球的概率是$\boxed{\frac{8}{15}}$。

接下来,咱们能够让模型运用一切可用的信息来评价学生回答的正确性。

提示语:

将您的回答与学生的回答进行比较,评价学生的回答是否正确。
问题描绘:“一个盒子里有4个红球和6个蓝球。从盒子里抽出两个球,不放回。求抽到一个红球和一个蓝球的概率是多少?”
您的回答:“有两种或许的成功成果:先抽一个红球然后抽一个蓝球,或许先抽一个蓝球然后抽一个红球。咱们将别离核算这两种成果的概率,然后将它们相加。
1)先红后蓝:先抽一个红球的概率是4/10,由于有4个红球和10个总球。抽完红球后,剩余3个红球和6个蓝球,所以下一个抽到蓝球的概率是6/9。因而,这种成果的概率是(4/10)*(6/9)。
2)先蓝后红:先抽一个蓝球的概率是6/10,由于有6个蓝球和10个总球。抽完蓝球后,剩余4个红球和5个蓝球,所以下一个抽到红球的概率是4/9。因而,这种成果的概率是(6/10)*(4/9)。
现在咱们将这两种成果的概率相加:(4/10)*(6/9) + (6/10)*(4/9) = 24/90 + 24/90 = 48/90。这个分数能够化简为8/15,所以抽到一个红球和一个蓝球的概率是$\boxed{\frac{8}{15}}$。”
学生的回答:“(4/10)*(6/9) = 24/90 = 4/15”。

小语 4.0 回复:

学生的回答是过错的。他们只核算了先抽到一个红球再抽到一个蓝球的概率,但没有考虑到另一种或许的成功成果,即先抽到一个蓝球再抽到一个红球。正确的回答,正如您所示,是将两种成功成果的概率相加,得到8/15的概率。

终究,咱们能够让模型运用自己的剖析来构建一个有协助的导师人物的回复。

提示语:

您是一位数学教导老师。假如学生犯了过错,请以不泄漏答案的方法给学生供给提示。假如学生没有犯过错,只需给他们一个鼓励性的评论。
问题陈说:"""一个盒子里有4个红球和6个蓝球。从盒子里抽出两个球,不放回。求抽到一个红球和一个蓝球的概率是多少?"""
您的回答:"""有两种或许的成功成果:要么先抽到一个红球再抽到一个蓝球,要么先抽到一个蓝球再抽到一个红球。咱们将找出这两种成果的概率,然后将它们相加。
1) 先红后蓝:先抽到一个红球的概率是4/10,由于有4个红球和10个总球。抽到一个红球后,剩余3个红球和6个蓝球,所以下一个抽到蓝球的概率是6/9。所以这种成果的概率是(4/10)*(6/9)。
2) 先蓝后红:先抽到一个蓝球的概率是6/10,由于有6个蓝球和10个总球。抽到一个蓝球后,剩余4个红球和5个蓝球,所以下一个抽到红球的概率是4/9。所以这种成果的概率是(6/10)*(4/9)。
现在咱们把这两种成果的概率相加:(4/10)*(6/9) + (6/10)*(4/9) = 24/90 + 24/90 = 48/90。这个分数能够化简为8/15,所以抽到一个红球和一个蓝球的概率是$\boxed{\frac{8}{15}}$。"""
学生的回答:"""(4/10)*(6/9) = 24/90 = 4/15"""
剖析:"""学生的回答是过错的。他们只核算了先抽到一个红球再抽到一个蓝球的概率,但没有考虑到另一种或许的成功成果,即先抽到一个蓝球再抽到一个红球。正确的回答,正如您所示,是将两种成功成果的概率相加,得到8/15的概率。"""

小语 4.0 回复:

学生的回答是过错的。他们只核算了先抽到一个红球再抽到一个蓝球的概率,但没有考虑到另一种或许的成功成果,即先抽到一个蓝球再抽到一个红球。正确的回答,正如您所示,是将两种成功成果的概率相加,得到8/15的概率。所以,请再次查看您的核算进程,并保证您考虑了一切或许的成功成果。

问询模型前面处理是否遗失了任何内容

当咱们运用GPT从一个较大的文档(长文章或书本)中抽取与某个特定问题相关的摘抄时,咱们能够在模型列出每个摘抄后,问询GPT是否还有遗失的摘抄。 这是由于当源文档较大时,模型或许会过早地停止抽取,导致未能列出一切相关的摘抄。在这种状况下,咱们能够经过向模型提出跟进的查询,问询模型是否有在前几轮中遗失的摘抄,然后前进模型的功能。

举例:

假定你正在运用GPT-3模型从一本关于气候变化的书中抽取与“全球变暖的首要原因是什么?”相关的摘抄。这本书有几百页,全文具体地评论了气候变化的各个方面。

在这种状况下,你或许会给模型一个如下的提示:从这本书中找出一切关于“全球变暖首要原因”的摘抄。保证摘抄包括解说所需的一切相关上下文-换句话说,不要提取短少重要上下文的小片段。然后模型开端作业,找到了一些摘抄,并排出了它们。可是,由于书的内容十分多,模型或许过早地停止查找,导致遗失了一些重要的摘抄。

在这种状况下,你或许会给模型一个如下的提示:从这本书中找出一切关于“全球变暖首要原因”的摘抄。保证摘抄包括解说所需的一切相关上下文-换句话说,不要提取短少重要上下文的小片段。然后模型开端作业,找到了一些摘抄,并排出了它们。可是,由于书的内容十分多,模型或许过早地停止查找,导致遗失了一些重要的摘抄。

️ 战略五:运用外部东西

经过运用其他东西的输出来补偿GPT的弱点。例如,代码履行引擎能够协助GPT进行数学核算和运转代码,文本检索体系能够告知GPT有关的文档。假如一个使命能够由一个东西而不是GPT更牢靠或高效地完结,咱们应该果断运用东西而不是GPT。

运用代码履行进行更精确的核算或调用外部API

有些较为杂乱的数学运算GPT无法给出满意的回答。这时能够教导模型编写程序代码来进行完结。生成输出后,能够提取并运转代码。终究,假如需求,能够将代码履行引擎(如Python / JavaScript解说器)的输出作为输入供给给模型以进行下一次查询。

提示语:

你能够经过将Python代码包裹在三个反引号中来编写和履行,例如```此处填写代码```。运用这种方法,你能够进行核算。
请找出下列多项式的一切实数根:3*x**5 - 5*x**4 - 3*x**3 - 7*x - 10

小语 4.0 回复:

要找出多项式的一切实数根,咱们能够运用Python的`numpy`库中的`roots`函数。首要,咱们需求装置`numpy`库,然后导入它并运用`roots`函数找到多项式的根。这是相应的代码:
```python
import numpy as np
coefficients = [3, -5, -3, 0, -7, -10]
roots = np.roots(coefficients)
real_roots = [root for root in roots if np.isreal(root)]
print(real_roots)
```
请注意,这个代码或许无法在这个平台上运转。你能够在本地Python环境中运转它以取得成果。

【万字长文】 GPT 最佳实践的六种策略

遗憾的是,这种方法GPT 现在只能给到咱们Python代码,还没有方法将代码运转直接给到咱们成果(有些鸡肋),咱们接下来能够选择找一个在线代码运转东西(注意将言语切换为 “Python3″),仿制这段代码运转得到答案。

【万字长文】 GPT 最佳实践的六种策略

发散一下

将GPT难以处理的问题转化成某种程序代码是一个巧妙的技巧,同理,这个技巧你能够用于:

  1. GPT生成PPT纲要,导入到 PowerPoint 中生成 PPT
  2. GPT生成Mermaid代码,经过mermaid.live来生成流程图表
  3. GPT生成Midjourney提示语,并经过Midjourney进行AI绘图

这个技巧无需你懂得编程常识,只要你找到对应的东西和东西所需求的语法,即可处理问题!

调用外部 API

假如咱们不是开发者的话,这个技巧咱们不太会用到。在这儿进行简略介绍,如需深化学习可前往OpenAI 官方文档进行查看。

代码履行的另一个好用例是调用外部API。假如模型被正确地教导运用API,它能够编写运用它的代码。经过供给文档和/或展现怎么运用API的代码示例,能够教导模型怎么运用API。

提示语:

体系:
你能够经过将其封装在三重反引号中来编写和履行Python代码。一起,请注意您能够拜访以下模块,以协助用户向他们的朋友发送信息:
```python
import message
message.write(to="Bob", message="嘿,下班后想碰头吗?")
```
用户:
请告知爱丽丝,我将在10点在咖啡店与她碰头。

这儿解说下上面的提示语:

在给出的提示语中,供给了一个Python代码示例,展现了怎么运用这个API。代码中,首要导入了“message”模块,然后调用了“write”函数,向“Bob”发送了一条信息:“嘿,下班后想碰头吗?”。

“嘿,下班后想碰头吗?”是一个现已给出的运用API的示例。依据用户提出的使命:“请告知爱丽丝,我将在10点在咖啡店与她碰头”。这个使命需求运用上述的API来完结。替换掉示例中发送的消息内容和接收者即可。

所以,这段内容的意图是让模型学习怎么运用API,并用它来完结特定的使命。

小语 4.0 回复:

```python
import message
message.write(to="爱丽丝", message="嘿,咱们10点在咖啡店碰头。")
```

【万字长文】 GPT 最佳实践的六种策略

运用依据嵌入的查找完结高效常识检索

假如咱们不是开发者的话,这个技巧咱们不太会用到。在这儿进行简略介绍,如需深化学习可前往OpenAI 官方文档进行查看。

假如将外部信息源作为输入的一部分供给给模型,那么模型就能够运用这些信息生成更有见地且更及时的答复。例如,假如用户问询关于某部特定电影的问题,将关于该电影的高质量信息(如演员、导演等)增加到模型的输入中或许会很有协助。嵌入可用于完结高效的常识检索,以便在运转时动态向模型输入中增加相关信息。

文本嵌入是一个能够衡量文本字符串之间相关性的向量。类似或相关的字符串在嵌入空间里会比不相关的字符串距离更近。运用这一现实以及快速向量查找算法的存在意味着嵌入能够用来完结高效的常识检索。具体而言,能够将文本语料库拆分红多个块,然后将每个块嵌入并存储起来。接下来,将查询恳求进行嵌入,然后履行向量查找以找到与查询恳求最相关的文本块(即在嵌入空间中距离最近的那些文本块)。

在OpenAI Cookbook中能够找到示例完结。

⚙️ 战略六:体系化测验改动

在进行运用了 GPT 模型的体系改善时,例如引入新指令或新规划,有时很难判别这些改动是使体系变得更好仍是更差。经过观察少量样本或许会有所启示,但在小样本状况下,很难区别实在的改善和随机运气。评价程序(或称为“evals”)能够协助优化体系规划,保证改善措施的有用性。

好的评价程序应具备以下特色:

  1. 具有代表性:评价程序应反映实在国际的运用状况,或至少具有多样性。
  2. 包括多个测验用例:增加测验用例能够前进核算效力,然后更精确地评价改善措施的效果。
  3. 易于主动化或重复:评价程序应便于主动化履行或重复进行,以便在不同阶段对体系进行继续评价。

输出评价能够由核算机、人类或两者混合完结。核算机能够运用客观规范(如只有一个正确答案的问题)以及一些主观或含糊规范进行主动评价。例如,OpenAI Evals是一个开源软件框架,供给了创建主动评价的东西,能够协助用户依据特定规范对模型输出进行评价。

将模型输出与规范答案进行比照评价

在某些状况下,咱们能够经过将模型输出与已知的规范答案进行比照,来评价模型的体现。例如,假如已知问题的正确答案应包括一组特定的已知现实,咱们能够运用模型查询来核算答案中包括了多少必需的现实。这种方法能够协助咱们更精确地评价模型在处理特定问题时的体现。

这儿咱们举个比方,这是一个满意悉数条件的示例输入,提示语:

你将得到由三个引号分隔的文本,这应是对一个问题的答案。请查看以下信息是否直接包括在答案中:
- 尼尔阿姆斯特朗是第一个登月的人。
- 尼尔阿姆斯特朗第一次登月的日期是1969721日。
关于每一个信息,请履行以下进程:
1 - 从头陈说该信息。
2 - 从答案中引证最接近此信息的内容。
3 - 考虑一下,假如一个不了解这个主题的人读了这个引证,他是否能直接推断出这个信息。在做出决议之前,解说为什么能够或许为什么不能够。
4 - 假如第3步的答案是必定的,那么写“是”,不然写“否”。
终究,核算出有多少个“是”的答案。将这个计数以{"计数": <刺进计数> }的方法供给。
文本:
"""尼尔阿姆斯特朗由于成为首位登上月球的人类而闻名于世。这一前史性的事情产生在1969年7月21日,阿波罗11号使命期间。"""

这儿的文本便是模型的输出,咱们这儿仅展现了对模型输出的评价。

小语 4.0 回复:

1 - 从头陈说该信息:
尼尔阿姆斯特朗是第一个登上月球的人。
2 - 从答案中引证最接近此信息的内容:
"尼尔阿姆斯特朗由于成为首位登上月球的人类而闻名于世。"
3 - 考虑一下,假如一个不了解这个主题的人读了这个引证,他是否能直接推断出这个信息。在做出决议之前,解说为什么能够或许为什么不能够。
能够。由于引证中清晰提到了尼尔阿姆斯特朗是第一个登上月球的人类。
4 - 假如第3步的答案是必定的,那么写“是”,不然写“否”。
是。
1 - 从头陈说该信息:
尼尔阿姆斯特朗在1969721日第一次登月。
2 - 从答案中引证最接近此信息的内容:
"这一前史性的事情产生在1969年7月21日,阿波罗11号使命期间。"
3 - 考虑一下,假如一个不了解这个主题的人读了这个引证,他是否能直接推断出这个信息。在做出决议之前,解说为什么能够或许为什么不能够。
能够。由于引证中清晰提到了这一前史性事情产生在1969721日,阿波罗11号使命期间。
4 - 假如第3步的答案是必定的,那么写“是”,不然写“否”。
是。
终究,核算出有多少个“是”的答案。将这个计数以{"计数": <刺进计数> }的方法供给。
{"计数": 2}

【万字长文】 GPT 最佳实践的六种策略

这是一个只满意一个条件的示例输入,提示语:

你将得到由三个引号分隔的文本,这应是对一个问题的答案。请查看以下信息是否直接包括在答案中:
- 尼尔阿姆斯特朗是第一个登月的人。
- 尼尔阿姆斯特朗第一次登月的日期是1969721日。
关于每一个信息,请履行以下进程:
1 - 从头陈说该信息。
2 - 从答案中引证最接近此信息的内容。
3 - 考虑一下,假如一个不了解这个主题的人读了这个引证,他是否能直接推断出这个信息。在做出决议之前,解说为什么能够或许为什么不能够。
4 - 假如第3步的答案是必定的,那么写“是”,不然写“否”。
终究,核算出有多少个“是”的答案。将这个计数以{"计数": <刺进计数> }的方法供给。
文本:
"""尼尔阿姆斯特朗从登月舱走出来,成为第一个在月球上行走的人,创造了前史。"""

小语 4.0 回复:

1 - 从头陈说该信息:
- 尼尔阿姆斯特朗是第一个在月球上行走的人。
- 尼尔阿姆斯特朗登月的具体日期未提及。
2 - 从答案中引证最接近此信息的内容:
- "尼尔阿姆斯特朗从登月舱走出来,成为第一个在月球上行走的人,创造了前史。"
3 - 考虑一下,假如一个不了解这个主题的人读了这个引证,他是否能直接推断出这个信息。
- 关于第一个信息,能够直接推断出尼尔阿姆斯特朗是第一个在月球上行走的人,由于引证中清晰提到了这一点。
- 关于第二个信息,无法从引证中推断出尼尔阿姆斯特朗登月的具体日期,由于引证中没有提到日期。
4 - 成果:
- 是
- 否
{"计数": 1}

【万字长文】 GPT 最佳实践的六种策略

这是一个没有满意条件的示例输入,提示语:

你将得到由三个引号分隔的文本,这应是对一个问题的答案。请查看以下信息是否直接包括在答案中:
- 尼尔阿姆斯特朗是第一个登月的人。
- 尼尔阿姆斯特朗第一次登月的日期是1969721日。
关于每一个信息,请履行以下进程:
1 - 从头陈说该信息。
2 - 从答案中引证最接近此信息的内容。
3 - 考虑一下,假如一个不了解这个主题的人读了这个引证,他是否能直接推断出这个信息。在做出决议之前,解说为什么能够或许为什么不能够。
4 - 假如第3步的答案是必定的,那么写“是”,不然写“否”。
终究,核算出有多少个“是”的答案。将这个计数以{"计数": <刺进计数> }的方法供给。
文本:
"""在69年的夏天,一次巨大的飞行,阿波罗11号,如传说中的勇士一般。尼尔阿姆斯特朗成为了继巴兹奥尔德林之后的第二个在月球上行走的人。"""

小语 4.0 回复:

1 - 从头陈说该信息:尼尔阿姆斯特朗是第一个登月的人。
2 - 从答案中引证最接近此信息的内容:“尼尔阿姆斯特朗成为了继巴兹奥尔德林之后的第二个在月球上行走的人。”
3 - 考虑一下,假如一个不了解这个主题的人读了这个引证,他是否能直接推断出这个信息。在做出决议之前,解说为什么能够或许为什么不能够:不能够,由于文本中提到尼尔阿姆斯特朗是在巴兹奥尔德林之后的第二个在月球上行走的人,而不是第一个。
4 - 假如第3步的答案是必定的,那么写“是”,不然写“否”:否。
1 - 从头陈说该信息:尼尔阿姆斯特朗第一次登月的日期是1969721日。
2 - 从答案中引证最接近此信息的内容:“在69年的夏天,一次巨大的飞行,阿波罗11号,如传说中的勇士一般。”
3 - 考虑一下,假如一个不了解这个主题的人读了这个引证,他是否能直接推断出这个信息。在做出决议之前,解说为什么能够或许为什么不能够:不能够,由于文本中只提到了1969年夏天,而没有具体到721日。
4 - 假如第3步的答案是必定的,那么写“是”,不然写“否”:否。
终究,核算出有多少个“是”的答案。将这个计数以{"计数": <刺进计数> }的方法供给。
{"计数": 0}

【万字长文】 GPT 最佳实践的六种策略

跟踪模型输出与规范答案的堆叠类型以及是否对立

此外,除了上述将模型输出与规范答案进行比照评价。还能够运用例如跟踪候选答案与规范答案之间的堆叠类型,以及候选答案是否与规范答案的任何部分相对立。这种评价方法能够协助咱们更全面地了解模型在处理各种问题时的体现,然后为进一步优化模型供给有价值的参阅。

以下是一个比方,其间的答案尽管不够理想,但却并未与专家答案产生对立,提示语:

请依照以下进程处理用户的输入。在进行下一步前,请具体复述每个进程,例如:“进程1:逐渐推理...”。
进程1:逐渐推理提交的答案与专家答案中的信息是否为以下几种状况之一:不相交、彻底持平、是子集(即提交的答案信息比专家答案少)、是超集(即提交的答案信息比专家答案多),或有部分交集(即有一些交集,但并非子集或超集)。
进程2:逐渐推理提交的答案是否与专家答案的任何部分产生对立。
进程3:输出一个结构如下的JSON目标:{"堆叠类型": "不相交""彻底持平""是子集""是超集""有部分交集", "对立": "真""假"}。
用户输入:
"""
问题:“尼尔阿姆斯特朗最为人所知的事情是什么?它在什么时分产生的?假定运用UTC时刻。”
提交的答案:“他不是在月球上行走过吗?”
专家的答案:“尼尔阿姆斯特朗最为人所知的是他成为第一个在月球上行走的人。这个前史性的事情产生在1969年7月21日。”
"""

小语 4.0 回复:

进程1:逐渐推理提交的答案与专家答案中的信息是否为以下几种状况之一:不相交、彻底持平、是子集(即提交的答案信息比专家答案少)、是超集(即提交的答案信息比专家答案多),或有部分交集(即有一些交集,但并非子集或超集)。
在这个比方中,提交的答案与专家答案有部分交集。提交的答案提到了尼尔阿姆斯特朗在月球上行走,而专家答案也提到了这一点。可是,提交的答案没有提到具体的日期,而专家答案供给了具体的日期。
进程2:逐渐推理提交的答案是否与专家答案的任何部分产生对立。
在这个比方中,提交的答案与专家答案没有产生对立。
进程3:输出一个结构如下的JSON目标:{"堆叠类型": "不相交""彻底持平""是子集""是超集""有部分交集", "对立": "真""假"}。
在这个比方中,输出的JSON目标为:{"堆叠类型": "有部分交集", "对立": "假"}。

【万字长文】 GPT 最佳实践的六种策略

这是一个带有答案的示例输入,直接与专家答案相对立,提示语:

请依照以下进程处理用户的输入。在进行下一步前,请具体复述每个进程,例如:“进程1:逐渐推理...”。
进程1:逐渐推理提交的答案与专家答案中的信息是否为以下几种状况之一:不相交、彻底持平、是子集(即提交的答案信息比专家答案少)、是超集(即提交的答案信息比专家答案多),或有部分交集(即有一些交集,但并非子集或超集)。
进程2:逐渐推理提交的答案是否与专家答案的任何部分产生对立。
进程3:输出一个结构如下的JSON目标:{"堆叠类型": "不相交""彻底持平""是子集""是超集""有部分交集", "对立": "真""假"}。
用户输入:
"""
问题:“尼尔阿姆斯特朗最为人所知的事情是什么?它在什么时分产生的?假定运用UTC 时刻。”
提交的答案:“1969年7月21日,尼尔阿姆斯特朗成为了继巴兹奥尔德林之后的第二个在月球上行走的人。”
专家的答案:“尼尔阿姆斯特朗最为人所知的是他成为第一个在月球上行走的人。这个前史性的事情产生在1969年7月21日。”
"""

小语 4.0 回复:

进程1:逐渐推理提交的答案与专家答案的联系。在这个比方中,提交的答案与专家答案有部分交集。由于它们都提到了尼尔阿姆斯特朗在月球上行走的事情和产生的时刻,但提交的答案过错地将尼尔阿姆斯特朗描绘为第二个在月球上行走的人。
进程2:逐渐推理提交的答案是否与专家答案的任何部分产生对立。在这个比方中,提交的答案与专家答案产生了对立,由于它过错地将尼尔阿姆斯特朗描绘为第二个在月球上行走的人,而专家答案指出他是第一个。
进程3:输出一个结构如下的JSON目标:{"堆叠类型": "有部分交集", "对立": "真"}。

【万字长文】 GPT 最佳实践的六种策略

这是一个示例输入,其间的答案是正确的,但供给的具体信息稍微超出了必要规模,提示语:

请依照以下进程处理用户的输入。在进行下一步前,请具体复述每个进程,例如:“进程1:逐渐推理...”。
进程1:逐渐推理提交的答案与专家答案中的信息是否为以下几种状况之一:不相交、彻底持平、是子集(即提交的答案信息比专家答案少)、是超集(即提交的答案信息比专家答案多),或有部分交集(即有一些交集,但并非子集或超集)。
进程2:逐渐推理提交的答案是否与专家答案的任何部分产生对立。
进程3:输出一个结构如下的JSON目标:{"堆叠类型": "不相交""彻底持平""是子集""是超集""有部分交集", "对立": "真""假"}。
用户输入:
"""
问题:“尼尔阿姆斯特朗最为人所知的事情是什么?它在什么时分产生的?假定运用UTC时刻。”
提交的答案:“1969年7月21日,约在02:56UTC时刻,尼尔阿姆斯特朗成为第一个踏上月球外表的人类,这标志着人类前史上的一个重大成就。”
专家的答案:“尼尔阿姆斯特朗最为人所知的是他成为第一个在月球上行走的人。这个前史性的事情产生在1969年7月21日。”
"""

小语 4.0 回复:

进程1:逐渐推理提交的答案与专家答案中的信息状况为:是超集(即提交的答案信息比专家答案多)。
进程2:逐渐推理提交的答案与专家答案的任何部分没有产生对立。
进程3:输出一个结构如下的JSON目标:{"堆叠类型": "是超集", "对立": "假"}。

【万字长文】 GPT 最佳实践的六种策略