本文正在参加「金石计划」

上文 OpenAI Embedding:根据人工智能的查找新篇章 有讲到Embedding的基础概念以及OpenAI Embedding 的才能和运用场景,这篇文章讲讲如何手把手构建谈天机器人。

谈天机器人介绍

谈天机器人作为一项重要的企业级服务,能够帮助企业构建关乎自己特定事务的谈天机器人。谈天机器人或客服帮手是一种利用人工智能技能,经过互联网上的文本或语音途径,与用户进行交互并完成事务价值的工具。近年来,谈天机器人的开展取得了显著的进步,从最初的根据简略逻辑和规则的机器人,到现在根据天然言语了解(NLU)和对话办理(DM)的智能机器人。

较早之前,一些比较知名且运用广泛的谈天机器人包含:

  • 微软的小冰:一个根据社交网络的谈天机器人,能够与数亿用户进行天然、情感和多轮的对话,供给文娱、新闻、天气等内容。
  • 谷歌的Duplex:一个根据语音的谈天机器人,能够经过电话为用户预订餐厅、理发店等服务,运用天然言语生成技能来仿照人类的语音特征。
  • 亚马逊的Alexa:一个根据智能音箱的谈天机器人,能够经过语音辨认和组成技能来与用户进行对话,供给音乐、新闻、购物、操控智能家居等功能。
  • Facebook的Messenger:一个根据即时通讯平台的谈天机器人,能够与用户进行文本或语音的交互,供给游戏、支付、客服等功能。

OpenAI Embedding:快速实现聊天机器人(一)

OpenAI fine-tuning 完成谈天机器人

近一年来,技能突飞猛进,为人熟知的是,2020年,OpenAI发布了第一个根据大规模预练习言语模型(PLM)的谈天机器人ChatGPT-3.5,它运用了GPT-3.5模型作为编码器和解码器,并在很多对话数据上进行微调。

我们能够借助于这种大型言语模型(LLM)GPT-3,经过运用对话或会话数据来fine-tuning模型,生成类似于天然对话的文本。这种才能使其成为构建自定义谈天机器人的最佳选择。

但fine-tuning的方法,首先要准备很多可行的数据集(Prompt和Completion),第二练习一次的本钱也不低,最后有或许练习出来的新模型会不尽善尽美,要再次调整数据进行练习。

这块咱们放在后面的章节去fine-tuning,先快速完成一个谈天机器人最重要。

OpenAI embedding & davinci 完成谈天机器人

上个章节其实也讲到了,OpenAI embedding的最主要的运用场景便是根据特征向量查找最为类似的文本,我们能够收集类似度前N的文本,调用OpenAI davinci/GPT模型提炼优化文本,终究得到最为贴近的答案,能够见下面比较粗糙的流程图。

OpenAI Embedding:快速实现聊天机器人(一)