在外卖场景中,用户逗留时刻相比传统电商较短,因而关于实时发现和反运用户爱好的才能有着更高的要求。为处理该问题,美团外卖算法团队探究出了一套适用于外卖场景的智能陪同型导购架构和战略。这一举措现已取得了显著成效,本文将详细介绍外卖查找技能团队建立智能陪同型导购时,所遇到的应战以及处理思路,期望能对大家有所协助或启发。

1 布景

1.1 什么是外卖查找导购?

查找导购是外卖查找中的个性化查找词主张模块的总称,在查找途径中的遍地为用户供应引导,进步用户的选购功率。下面按照用户运用外卖查找的途径来介绍查找导购的各个模块:① 用户进入外卖主页,美团在顶部查找框的内部和下方别离供应查找主张,即框内词框下词;② 用户点击查找框会进入到查找引导页中,咱们在前史查找下方的查找发现中供应查找主张;③ 用户在查找框中自动输入查找词后,将会唤起查找词联想功能,即查找SUG,为用户供应补全查找词的主张;④ 用户主张查找后将进入到查找成果页。

全体流程如下图1所示,其间红框部分即为本文评论的要害:框内词、框下词以及查找发现模块。

美团外卖智能陪伴型导购的探索与实践

1.2 为什么要做智能陪同型的外卖查找导购?

在餐饮领域,用户体会永远是线下商家优化的要害。其间,导购服务直接影响着用户的购前决议方案,对商家的转化率和营业额有着严重的含义。像海底捞等商家甚至主打极致的用户体会,经过体贴入微的店员服务让用户感到“时时刻刻被关怀”。外卖服务将餐饮消费场景从线下搬到了线上,用户经过查找/引荐场景找到自己感爱好的商家和菜品,但相较于线下环境中有“时刻关怀着”的店员,线上这个进程显得较为“被迫和严寒”。

依据以上灵感,咱们决议从2022年开端着力打造智能陪同型导购。在用户运用查找/引荐时,咱们环绕用户表现出的爱好自动供应更智能的查找主张,更好地承接用户实时改变的意图和被激发出的灵感。一同,咱们也处理了用户打字输入本钱高、不知道附近的供应能否满意他们的需求以及不知道怎么清晰表达他们的需求等三个方面的痛点。

2 问题与应战

怎么将智能陪同型导购这一充溢“赛博朋克”感的构想在美团外卖场景进行落地呢?咱们遇到了以下的应战:

  • 应战1:线下的导购追求1对1的极致实时的个性化体会,而外卖查找的导购怎么由被迫导购(用户手动改写才会触发导购系统的改写)变为自动导购(智能感知和判别用户在什么时刻、什么场景需求针对性的改写导购),强化用户实时的个性化体会,智能感知和判别用户每一个需求服务的场景?处理方案:凭借美团自研的Alita端智能[1][2]的意图感知才能,智能判别何时需求针对性地改写。一同,对模型引进实时异构行为序列进行建模,打造端云结合排序模型,感知用户实时多变的爱好。
  • 应战2:导购的优化除了满意用户体会之外,还需求为全体的转化方针负责,怎么让导购的优化与下流场景/全体场景的优化方针保持一致?处理方案:对全场景数据进行一致建模,打造依据自监督学习的一致模型,在对样本进行“无效”过滤以及归因的根底上,一同联动查找成果页进行全链路的多方针功率优化。
  • 应战3:怎么像依据大模型的对话进口一样将用户在物理世界的行为转化为机器/算法能够了解的信息,并像真人导购一样和用户“对话”?处理方案:咱们后续方案经过对用户行为的了解,测验在适当机遇自动将用户引导到大模型的对话进口,满意其深度对话的需求。

3 首要工作

咱们将以上说到的问题和应战作为主线,分为两个章节进行详细介绍。其间在3.1章节介绍框内词智能改写,3.2章节介绍导购Query引荐全场景一致模型。

3.1 框内词智能改写

3.1.1 智能改写引荐框架

全体链路

上文说到,要完成框内词智能改写,建立出一套适用于外卖的、依据端智能框架的Query引荐系统非常重要。建立思路能够用4W1H来总结:

  • Where/How:框内词智能改写的Query展现在哪?框内词智能改写的Query的展现形式是什么?(触及产品形状)
  • Who/When:框内词智能改写需求对什么样的用户触发?在什么机遇下触发?(触及用户意图感知)
  • What:框内词智能改写需求展现什么?(触及算法战略)

在对上述问题进行深入思考和多方讨论后,咱们终究与产品、端智能、客户端、运用服务和引荐工程等相关方一同,建立了适用于外卖导购的框内词智能改写Query引荐链路:

美团外卖智能陪伴型导购的探索与实践

上图2展现了从“用户点击主页Feed商家卡片”开端,到框内词智能改写的Query展现”的全流程。当客户端搜集到用户进店行为后,调用Alita的意图感知引擎;满意框内词智能改写的触发条件后,对用户在端上的进行特征处理、计算和存储,并将计算好的特征传递给客户端拼装框内词智能改写的恳求;框内词智能改写的恳求经过运用服务层的Disptch透传给Query引荐的后端服务,经过召回、排序、过滤、机制、封装阶段,终究回来框内词智能改写的成果到客户端进行展现。

产品形状

前期导购服务在用户进入外卖主页时会自动触发改写,但除非用户手动触发改写操作,框内词会一向轮播首次改写时的成果,造成了很多的流量浪费。

为了处理这个问题,咱们测验运用依据Alita的意图感知才能。如视频演示,当用户在主页阅览商家并加购菜品“【爆款】麻酱凉皮”后回来主页,吸顶的查找框中的框内词会自动更新,并轮播到新的查找词“凉皮”,一同展现擦亮动效。当用户点击查找按钮后,会直接跳转到查找成果页,展现更多与凉皮相关的商家及菜品,协助用户进行选购。

3.1.2 智能改写引荐战略

端实时信号搜集

用户实时的下单爱好与用户在主页、店内的实时行为有着较强的关联,怎么经过端上实时信号的搜集才能去获取、加工实时行为以便于引荐系统更好了解用户意图是咱们重视的要害。相比服务端,用户在端上的特征首要有以下两个特征:

  1. 实时性更好,从“准实时”到“超实时”的交互;
  2. 维度更细,从“交互Item”进化到“Item交互的Micro-粒度”[3]

因而,凭借端智能的才能,咱们不再受限于用户自动下拉恳求改写的机制,能够实时感知用户实时行为、偏好,实时智能决议方案更新引荐成果,缓解反应信号感知推迟问题。

咱们梳理了用户点击商家卡片后在店内以及店内产品详情页的首要行为,运用Alita在端上信息搜集的才能,获取了当时Session内的商家的点击信息及在店内其逗留时长等信息,一同咱们记录了用户在店内针对菜品的各种行为,详细包含查看、点击或者加购等,以参数的形式传给后端供引荐排序战略运用,更细粒度地捕捉用户实时改变的述求。

端实时触发战略

为了探究最优的触发条件,咱们依据用户在店内的不同行为和用户逗留时刻,结合如下图4所示的用户店内逗留时长散布以及用户主页点击数量散布,测验了菜品点击菜品、加购菜品等行为触发,逗留时长(10s/5s/2s/0s)触发等条件。

试验证明,放宽触发条件尽管会经过添加框内词智能改写恳求的曝光量,覆盖更多的用户,有利于后续战略迭代,但也会增大不相信触发的风险,导致框内词的功率下降。终究,咱们选定将进店大于2s或者进店点击过菜品作为智能改写的触发条件,两个条件满意其一即可。

此外,考虑到用户在店内阅览商家详情页期间会点击或加购不止一个菜品,并且用户在商家详情页的逗留时长越长、用户行为越丰富,服务端的引荐成果也就越精准,所以咱们没有挑选当用户满意触发条件后(进店大于2s或者进店点击过菜品)当即触发作为咱们的触发机遇,而是挑选关于满意触发条件的恳求,会在“用户从主页Feed的商家详情页离店后当即触发”作为咱们的触发机遇。

这么做的优点是,离店时会将用户在店内的一切行为经过客户端带到服务端,协助智能改写系统能够更准确地捕获用户的喜好,一同还能够减少同一商家内多次触发带来的不必要的功能开销。一同为了缓解功能的压力,咱们设置了同一Session内最多触发30次改写的战略限制,经过计算该战略覆盖的UV超越90%,现已能够满意咱们的需求。

美团外卖智能陪伴型导购的探索与实践

在线作用及线上指标计算口径如下:

  • 查找UV_RPM = 查找实付买卖额/ 查找曝光人数(DAU)* 1000
  • 查找UV_CXR = 查找买卖用户数 / 查找曝光人数(DAU)
  • 框内词UV_CTR = 框内词点击用户数 / 框内词曝光用户数

美团外卖智能陪伴型导购的探索与实践

智能改写召回战略

经过数据剖析,咱们发现14.9%的用户会在进店行为后主张查找,且此种状况奉献了查找20%的QV,证明了搜/推场景联动能够协助外卖场景“新动线”(查找联动引荐联合优化,带动外卖大局的添加)的推进。进一步剖析发现,以上状况下,60%的用户的查找Query与用户Last-Click行为存在强相关性,表现为用户一般会在点击商家后持续查找Last-Click店肆相应的品牌或者主营品类。

依据以上剖析,本文对召回战略进行优化。与用户手动改写框内词的恳求不同,咱们对框内词智能改写系统的召回进行了以下两点优化,一个是关于Trigger实时性的优化,另一个是为了更贴合用户实时的爱好意图,咱们运用更实时的Trigger规划了多种X2Q的召回[3]

  • 端云联动的Trigger实时性优化:经过将端上Alita的特征透传到用户爱好中心Tribe中,在Tribe中完成端特征解析加工,使Tribe具有更加实时的用户特征信息。咱们交融了在端侧搜集到的实时信号以及云侧用户爱好中心搜集到的实时点击序列,将最近一个商家作为咱们的触发Trigger。
  • 新增POI2Query召回:依据商家前史30天查找成单数据,聚合查找场景下单到当时POI的Top Query调集,得到查找成单商家Query召回;经过发掘曩昔30天用户在点击对应POI后查找的Top Query调集,得到点击商家后查找Query召回。
  • 新增SPU2Query召回:运用端上获取到的触发框内词智能改写的点击和加购SPU信息作为Trigger,依据SPU前史30天查找成单数据,聚合查找场景下单到当时SPU的Top Query调集。
  • 新增POI2Query2Query召回:前期的优化验证了POI2Query的有效性,所以咱们经过Swing CF的办法了解计算了Query之间的类似性,将用户触发端智能的POI泛化的Top1的Query作为Trigger,泛化出类似的相关Query。

咱们在线进步行了多组召回的融化试验,详细作用如下表:

美团外卖智能陪伴型导购的探索与实践

智能改写排序战略

依据端/云交融排序模型:鉴于场景冷启,咱们刚开端直接运用了非智能改写场景的导购排序模型(用户手动改写场景调用的框内词模型),该模型引进了用户实时商家点击序列、实时查找序列以及用户的Last Behavior进行联合建模。由于智能改写场景有实时性要求更高的特征,如图5所示,咱们在用户行为序列的运用中,交融了端上搜集的更为实时的信号,进步了用户行为序列的实时性。

美团外卖智能陪伴型导购的探索与实践

依据预练习的自监督学习模型(运用用户自动输入数据进行预练习,场景数据Fine-tuning的办法进行学习):为了更好地学习到本场景内用户的爱好偏好,本文在词服务多场景建模的模型中加入了智能改写场景内的数据进行模型迭代。为了防止由于新场景数据较少导致过拟合,咱们运用用户自动输入数据进行预练习,场景数据Fine-tuning的办法进行学习,并取得了不错的作用,详细做法见3.2。

线上融化试验的详细作用见下表:

美团外卖智能陪伴型导购的探索与实践

3.2 导购Query引荐全场景一致模型

跟着端智能在导购场景的运用,词服务场景现已扩展到了如图1所示的五个场景(框内词、框下词、查找发现、框内词智能改写以及猜你想搜)。可是,假如每个场景都独自迭代一个模型,这将消耗很多时刻和精力。此外,单场景模型无法运用多个场景的共性进行辅佐学习。关于新场景或小场景等练习数据较少的场景,直接运用单个场景的数据进行练习,很简单导致过拟合问题。因而,咱们测验一致导购的五个Query引荐场景的模型。

下面,本文将从特征建设、样本建设、用户实时异构行为序列建模、导购联动查找成果页全链路多方针功率优化以及依据自监督学习的全场景一致模型等五个模块别离介绍咱们的工作。

3.2.1 特征建设

特征在排序的作用中,起到非常重要的作用,依据外卖查找导购的实际场景,结合外卖推搜特征Matrix标准及特征重要度剖析,如下图6所示,咱们从User、POI、Query、Context以及组合等5个维度[4]下手来构建外卖导购特征Matrix,特征数量共120+。

美团外卖智能陪伴型导购的探索与实践

  • User维度:该维度包含用户在不一同间窗口内的不同行为计算特征,比方时刻窗口能够挑选1天/7天/30天/60天/180天等,行为特征首要有查找行为、点击行为以及购买行为等,以此来表征用户的爱好。
  • POI维度:首要是POI在不一同间窗口的行为计算特征来表征POI的热度,时刻窗口和行为类型参考User维度的设定,除此之外,还包含POI的商家分类等根底属性信息。
  • Query维度:首要包含Query的查找量、点击率以及成单率等计算特征,此外还包含Query的商家分类及分词信息。
  • Context维度:首要是时刻,如时段、星期几、节假日;场景特征,如当时所在场景(框内、框下、查找发现)等等。
  • 组合维度:Context-Item组合维度,组合Areaid_x_item以及Period_x_item的穿插维度,发掘不一同段下Item的曝光点击率等特征;User-Item组合维度,User在不一同间窗口内对Item查找、点击等行为次数等。

除了上面说到的5种维度的特征外,为了配合异构行为序列建模,咱们也规划了用户的异构序列特征,该部分在3.2.3中详细介绍。

3.2.2 样本建设

“无效”样本过滤

在用户点外卖时,翻开美团外卖App会默许访问外卖主页,一同会默许曝光词服务。因而,不管用户是否想阅览词服务,前端都会对其进行曝光,一同在引导页的查找发现也是同理。而传统的点击率模型的样本标注会将曝光未点击Item标注为负样本,因而对那些并不是想阅览词服务的用户(如进入App就直接去了主列表或者金刚页),就会引进有偏负样本,即把用户或许只是由于没注意到词服务而没点击的样本,都算成了用户不想点击的负样本,然后使得练习与评价样本集不能准确反映用户的爱好偏好。

为了消除上面说到的有偏负样本的影响,咱们依据查找导购词服务的实际场景特征(框内词、框下词在主页默许曝光及查找发现在引导页默许曝光),咱们进行了“无效”样本过滤,关所以否“无效”的定义,咱们进行了以下测验和探究:

  • User维度的“无效”样本过滤:经过计算用户在曩昔的前史7天内对导购有无行为,假如有过点击行为,咱们以为这部分用户是能够感知到导购功能的,保存其一切的恳求数据,而对7天在导购无行为的用户,假如本次恳求中用户没有任何点击,咱们会将本条恳求的样本悉数过滤掉。详细的,在主页假如用户在当时恳求对框内词和框下词都没有点击,咱们会将本次恳求的样本悉数过滤,同理该战略也会运用在引导页的查找发现样本上。
  • Session维度的“无效”样本过滤:假如当时Session内用户在导购内有点击行为,咱们会将Session内一切恳求样本都保存,反之咱们会以为本次Session用户没有感知到导购,会将本次Session内一切恳求样本视为“无效”样本。
  • QV维度的“无效”样本过滤:假如当时恳求用户没有任何点击行为,咱们会将本次恳求的样本视作“无效”样本。详细的,在主页假如当时恳求框内词和框下词都没有点击的样本,咱们会将本次恳求的样本过滤,同理该战略也会运用在引导页的查找发现样本上。

能够看到,User维度->Session维度->QV维度是过滤条件依次收紧的进程,经过下表的离线试验咱们发现,关于三个场景GAUC的表现上,QV维度的“无效”样本过滤作用最佳。

美团外卖智能陪伴型导购的探索与实践

咱们将离线最优的版别(QV维度“无效”样本过滤)在线进步行了试验,作用如下表所示:

美团外卖智能陪伴型导购的探索与实践

查找多场景样本归因

在外卖查找导购中,每天稀有百万用户阅览了某个Query之后尽管没有在导购对其点击/下单,却在查找其他进口(SUG/自动查找)对其点击/下单。例如在图7的左图中,框下词模块为用户引荐出“川菜”,可是用户没有运用框下词,并且去自动查找“川菜”,然后在SUG/自动查找下单,同理在图7的查找发现模型也存在类似的状况。

可是,在导购精排模型的样本中会将在本场景曝光未点击的样本视为CTR/CXR的负样本,因而模型在练习时会收到这些Query不符合用户点击/成单偏好的监督信号,然后学着去将它们排得靠后,造成模型优化的方向与实际中这些Query满意用户点击/成单偏好的事实相反的误差。因而,咱们需求处理这一Query引荐场景下的样本归因误差问题,来进步外卖查找场景下的千人成交率。

美团外卖智能陪伴型导购的探索与实践

为处理这一问题,要害在于要让模型具有预估导购内点击/成单才能之外,还要有预估用户查找大局点击/成单的才能。为此,咱们将模型中的CTR/CXR的预估方针,由曝光后导购进口内点击/成单概率升级为曝光后查找大局点击/成单概率这样一种可落地的完成办法。

依据这一方案,咱们在构造样本时,捉住要害细节,为严厉确保查找大局点击/成单Label的物理含义,关于导购进口曝光未点击/成单,之后查找其他进口(如SUG/自动查找)有点击/成单的状况,只在样本中将最接近成交时刻戳的导购进口曝光的未点击/成单负样本修正为点击/成单正样本。经数据剖析,咱们发现上述查找大局成交归因建模办法可对每天的练习样本扩大约30%的点击/成单正样本,有较为足够的影响面。

由于样本归因误差建模修改了Label,因而需求一个新的离线评价准则。为了评价模型的有效性,咱们回归问题本质,仍捉住模型是否做到了确保对本进口点击/成单样本的预估才能的根底上,具有了更强的查找大局点击/成单预估才能的要害要害,来构建评价系统。

详细地,咱们穿插评价基线模型与查找多场景样本归因纠偏模型的CTR/CXR预估,分在导购进口内点击/成单样本及在查找大局点击/成单样本上的GAUC。成果显示,查找多场景样本归因模型,在确保对导购进口点击/成单样本的排序才能基本不降的一同,显著进步了对查找大局点击/成单样本的排序才能,然后证明模型的有效性。

全网成交纠偏模型的在离线作用如下表所示:

美团外卖智能陪伴型导购的探索与实践

咱们将全网成交纠偏模型在线进步行了试验,作用如下表所示:

美团外卖智能陪伴型导购的探索与实践

3.2.3 用户实时异构行为序列建模

用户爱好建模一向被业界以为是完成排序成果“千人千面”的要害,是个性化排序系统中必不可少的一个模块。尽管用户爱好建模已有诸多研讨,但结合外卖查找事务自身的LBS特征进行用户爱好建模,仍是一项不小的应战。现在,词服务模块在用户行为爱好向量上的探究还处于空白阶段,所以咱们决议对词服务模型进行用户爱好建模,以此来进步模型捕获用户爱好的才能。

建立导购用户爱好建模五维系统:如图8所示,咱们建立了抱负版的导购用户爱好建模五维系统,形成了“行为周期、行为情形、行为模式、行为表明、爱好抽取”用户爱好五维建模系统迭代认知[5]

美团外卖智能陪伴型导购的探索与实践

首先,用户爱好是跟着时刻动态改变的,为了更好地了解用户的爱好偏好和需求,咱们能够按照行为周期维度将用户的全周期爱好划分为用户实时爱好、短期爱好和长时间爱好。

其次,外卖LBS特性导致用户在不同的LBS情形下具有不同的行为偏好,归结为行为情形维度。

再次,结合外卖自身事务特征,用户的首要行为包含查找/阅览/点击/加购/下单等行为,将这一系列动作归结为行为模式维度。

终究,业界用户爱好建模同样面临的问题,运用哪些行为特征来表明用户爱好,将这归结为行为表明维度,以及怎么对用户爱好进行抽取得到终究爱好向量,归结为爱好抽取维度。能够说,“行为表明”决议了用户爱好表明的上限,“爱好抽取”决议了迫临用户爱好表明上限的或许。

实时异构行为序列选取:与传统的商家引荐建模办法不同[6],咱们在建模用户对商家的行为序列的一同,依据查找导购的场景特征,将用户的实时查找序列和商家泛化Order-Query等异构序列联合建模,以保存场景特征并取得更好的作用。为了协助模型从行为序列中更精准地捕捉到用户的爱好,咱们引进了序列的Sideinfo信息来辅佐学习,在行为表明上,咱们引进点击商家ID和Query ID以及根底类特征:商家名、商家Tag、Query分类、Query分词等特征;在行为情形上,咱们将LBS特性作为上下文特征:就餐时刻、区域、距离。

异构行为序列建模:用户行为序列蕴含了非常丰富的用户爱好和偏好信息,现在主流办法是将用户行为序列中的Item进行Pooling后的成果来表征用户爱好,这种办法的假设是用户行为序列内的Item对用户爱好的奉献是等价的,但简单存在噪声。Guorui Zhou等提出的DIN模型[7],以为用户行为序列内不同的Item对用户当时的爱好,奉献是不同的,经过Attention来刻画这种奉献。因而,咱们将模型从DNN升级为DIN,模型结构如下图9所示:

美团外卖智能陪伴型导购的探索与实践

咱们将搜集到的用户行为序列以及其对应的Sideinfo喂到如下图所示的模型中,Behavior Seq与Target Item进行Target Attention后进行聚合,得到用户的爱好序列表明,一同由于在前期的测验中得到了用户Last Click行为非常高效的结论,所以咱们将用户三个序列的last行为还进行了独自建模,将三个序列的Last行为及Sideinfo与Target Item进行聚合,然后经过一个MLP,得到用户最实时的爱好表明。将上述的两个爱好表明与Target Item以及Other features聚合后经过MLP后,得到Output。

咱们对用户实时异构行为序列建模进行了多组离线的融化试验,离线作用如下表所示:

美团外卖智能陪伴型导购的探索与实践

咱们将离线最优的版别(3个序列+3个Last行为)在线进步行了试验,作用如下表所示:

美团外卖智能陪伴型导购的探索与实践

3.2.4 导购联动查找成果页全链路多方针功率优化

导购场景作为引流进口,外卖用户在导购的成单途径能够笼统为[1]导购Query曝光->[2]导购Query点击->[3]查找成果页曝光->[4]查找成果页点击->[5]查找成果页加购->[6]查找成果页成单。假如优化方针仅考虑导购场景内的信号“场景内的CTR作为方针”,却并未直接面向查找场景的全体功率,即联动查找成果页的用户反应来优化,存在部分最优的问题。为此,咱们引进词服务下流场景,即查找成果页的用户反应信号,并进行词服务PV维度的归因,构建CXR方针并进行建模。

依据以上布景,咱们将单方针的导购精排模型升级为多方针模型,添加查找成果页成单的方针,依据Share-Bottom的结构进行多方针联合建模。为了建模两个方针的共性,一同考虑到CXR是在CTR条件下产生的行为,所以咱们采用了Bayesian的思维,将CTR网络的终究一层的输出Concat到CXR的上面,再计算CXR的Logit。模型结构如图10所示:

美团外卖智能陪伴型导购的探索与实践

在机制上,咱们经过机制公式交融CTR和CXR两个方针:

Score=w1∗pCTR+w2∗pCXRS \text { core }=w_{1} * p C T R+w_{2} * p C X R

在经过多组试验验证,当时,在线作用到达最优,后续方案测验离/在线多方针寻参。咱们对导购联动查找成果页全链路多方针功率优化进行了多组离线的融化试验,离线作用如下表所示:

美团外卖智能陪伴型导购的探索与实践

咱们将离线最优的版别(多方针优化+CTR输出Concat到CXR)在线进步行了试验,作用如下表所示:

美团外卖智能陪伴型导购的探索与实践

3.2.5 依据自监督学习的全场景一致模型

跟着“陪同型”导购场景在查找各个模块的不断落地,Query引荐场景现已扩展到了五个。可是,独自迭代每个场景的模型面临着如下应战:

  • 小场景和新场景练习数据不足。多个Query引荐场景中,关于新场景(例如框内词智能改写、猜你想搜)练习数据比较少,直接用单个场景反应数据练习,会导致过拟合问题;
  • 多个场景一致建模。能否一同运用多个场景的数据,建模多个场景的共同点、不同点,进步多场景排序模型的功率呢?
  • 反应闭环问题[8]。现在这种偏向功率的练习办法,会导致排序系统展现出来的item一般具有高频的特征,很多长尾的item没有曝光的机会,马太效应严重,不利于生态的长时间健康成长;
  • 降本增效。关于多个类似场景,假如每个场景都独自迭代一个模型耗时耗力,一同也需求很多的机器资源。

为了处理以上问题,咱们采用了一种依据自监督学习的全场景一致建模的办法[9]。这种办法采取了Pre-training和Fine-tuning两个阶段的办法。经过数据计算,咱们发现用户前史查找行为前后具有关联性。

因而,在预练习阶段,咱们学习了言语模型BERT[10]中Next Sentence Prediction(NSP)和GPT[11]中Next Word Prediction(NWP)任务的思维,运用用户前史行为数据和用户自动输入的信息(SUG以及自动查找数据),学习猜测用户下一个输入的Query(Next-Query Prediction)。在Fine-tuning阶段,咱们运用各场景的隐式反应数据来Fine-tuning得到全场景一致模型。

由于在预练习阶段让模型见到了更多其他场景的Query,咱们能够在必定程度上缓解反应闭环的问题。一同,在Fine-tuning阶段运用了全场景数据并对场景信息进行建模,所以咱们的多个场景一致模型能够在缓解小场景和新场景过拟合问题的一同,还能够统筹建模出不同场景的共性和特性。下面将别离介绍Pre-training和Fine-tuning。

Pre-training预练习:由于用户自动输入的Query正是Query引荐排序模型抱负的成果,所以咱们依据用户前史行为,猜测下一个用户自动输入的Query。下面咱们别离从样本构建、特征Matrix以及预练习流程三部分介绍Pre-training的进程。

  • 样本构建:咱们运用SUG以及自动查找场景内数据,采用类似于3.2.2的思维。例如,当用户输入“和府捞面”时,SUG曝光了该Query,可是用户没有点击,而是直接点击查找按钮自动查找“和府捞面”,关于这类SUG曝光未点击,可是产生了自动查找的状况,咱们将自动查找的点击数据归因到SUG数据中。

美团外卖智能陪伴型导购的探索与实践

  • 特征Matrix:在Pre-Train的模型中,挑选出SUG和词服务共用的特征进行预练习,包含用户爱好建模方面的序列特征以及用户画像特征等。在Fine-Tune阶段,咱们会预加载Pre-Train的特征,然后添加了Dense Features和Scenario Features。

  • 预练习流程:咱们规划的预练习任务是依据用户前史行为,猜测下一个用户自动输入的Query,由于用户自动输入的Query正是Query引荐排序模型抱负的成果。由于简单地随机采样会使得负样本过于简单,因而咱们采样用户自动查找Query时SUG曝光未点击的Query作为困难负例[7]。

美团外卖智能陪伴型导购的探索与实践

Fine-tuning微调:运用词服务场景数据微调预练习模型,学习多个场景之间的共性,一同加入场景信息,学习多个场景之间的不同。如上图12所示,由于预练习阶段没有Dense Features和Scenario Features,因而Prediction Layer的输入维度不同,所以Prediction Layer的参数没有同享,两个阶段同享的是Embedding Layer和行为序列建模的部分。试验发现,Fine-tuning阶段固定住Query和POI Embedding时,作用最好。由于这两个Embedding参数量为亿级,练习数据不充分时简单过拟合。一同,咱们也经过对比,直接将用户自动行为数据交融到词服务数据中进行练习,试验成果证明了预练习的有效性。

打破反应闭环:咱们剖析了在三个场景(框内词、框下词以及查找发现)的数据,对比了有无预练习的模型半个月内给一切用户引荐出的Unique Query的个数,咱们发现当加入预练习后,能够显著进步引荐出的Query多样性,三个场景别离添加9.6%、13.6%以及10.8%的Unique Query的个数,打破了引荐闭环。

后续方案:结合大模型预练习的全场景一致模型,凭借大模型更强壮的表征和泛化才能,咱们方案后续运用大模型对Query的Embedding进行预练习,然后运用本场景内的数据进行Fine-tuning,然后进步模型在导购全场景的引荐作用和泛化才能。

咱们对依据自监督学习的全场景一致模型进行了多组离线的融化试验,离线作用如下表所示:

美团外卖智能陪伴型导购的探索与实践

咱们将离线最优的版别(预练习+微调阶段不更新Query和POI Embedding)在线进步行了试验,作用如下表所示:

美团外卖智能陪伴型导购的探索与实践

4 总结与展望

本文介绍了咱们在外卖智能陪同型导购的探究与测验,其间首要包含:

  1. 凭借Alita端智能的意图感知才能,智能判别何时需求针对性的改写,将被迫型导购变成自动型导购。
  2. 为了追求和线下导购一样1对1极致的实时性的个性化体会,咱们在对模型引进实时异构行为序列进行建模的一同,打造端云结合排序模型,捕获用户实时多变的爱好。
  3. 导购的优化除了满意用户体会之外,还需求为全体的转化方针负责,咱们对全场景数据进行一致建模,打造依据自监督学习的一致模型,在对样本进行“无效”过滤以及归因的根底上,一同联动查找成果页进行全链路的多方针功率优化。

现在智能陪同型导购现已在外卖查找全量,累计收获了如下收益:

  • 查找DAU +1.02%、查找UV_RPM +1.70%。
  • 查找框内词UV_CTR +187%、查找框下词UV_CTR +141%、查找发现词UV_CTR +121%。

未来,咱们将从以下方向进行探究优化:

  1. 智能改写赋能更多场景:在查找成果页以及外卖主页Feed页,运用端智能的意图感知才能,判别用户爱好产生收敛的机遇,运用导购Query引荐的才能,响运用户更细粒度的需求表达,满意用户找同类商家、找同品牌商家、找用户感爱好的产品或者品类的需求。
  2. 凭借大模型的才能赋能导购模型:结合大模型预练习的全场景一致模型,凭借大模型更强壮的表征和泛化才能,咱们方案后续运用大模型对Query的Embedding进行预练习,然后运用本场景内的数据进行Fine-tuning,然后进步模型在导购全场景的引荐作用和泛化才能。

5 本文作者

翔锟、营飞、关璐、泽钰、张聪、晓鹏、北海等,来自美团到家研发平台/查找引荐技能部。

运祥、周全、张晶等,来自到美团外卖事业部/产品部。

6 参考文献

  • [1] Gong Y, Jiang Z, Feng Y, et al. EdgeRec: recommender system on edge in Mobile Taobao[C]//Proceedings of the 29th ACM International Conference on Information & Knowledge Management. 2020: 2477-2484.
  • [2] 端智能在大众点评查找重排序运用实践
  • [3] 交互式引荐在外卖场景的运用
  • [4] 美团外卖引荐情境化智能流量分发的实践与探究
  • [5] Zhou G, Zhu X, Song C, et al. Deep interest network for click-through rate prediction- [C]//Proceedings of the 24th ACM SIGKDD international conference on knowledge discovery & data mining. 2018: 1059-1068.
  • [6] Wenlong Sun, Sami Khenissi, Olfa Nasraoui, and Patrick Shafto. 2019. Debiasing the human-recommender system feedback loop in collaborative filtering. In WWW’19. 645–651.
  • [7] Gu Y, Bao W, Ou D, et al. Self-Supervised Learning on Users’ Spontaneous Behaviors for Multi-Scenario Ranking in E-commerce[C]//Proceedings of the 30th ACM International Conference on Information & Knowledge Management. 2021: 3828-3837.
  • [8] Devlin, Jacob, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. “Bert: Pre-training of deep bidirectional transformers for language understanding.” arXiv preprint arXiv:1810.04805 (2018).
  • [9] Radford, Alec, Karthik Narasimhan, Tim Salimans, and Ilya Sutskever. “Improving language understanding by generative pre-training.” (2018).

招聘信息

查找引荐算法工程师

  1. 了解大规模深度学习、图学习等技能,运用注意力机制、回忆网络、联系网络等模块,从跨多个时空VV场景的海量数据中了解用户需求、发掘用户爱好,优化点击率、转化率模型,为用户展现更适宜、更感爱好的美食和产品。
  2. 了解强化学习、可解释深度学习、多模态学习、多方针优化等技能,优化重排、混排模型,智能调控流量分发,优化平台生态,完成消费者和商家共赢。
  3. 能够运用知识图谱、计算视觉、自然言语生成等技能,面向用户爱好,协助商家自动化智能生成展现内容和文案,进步推行功率。
  4. 追踪并研讨人工智能前沿技能,探究技能在零售、医疗电商场景的运用。

感爱好的同学能够将简历发送至:libeihai02@meituan.com。等待与大家一同同事,共创未来。

阅览更多

| 在美团公众号菜单栏对话框回复【2022年货】、【2021年货】、【2020年货】、【2019年货】、【2018年货】、【2017年货】等要害词,可查看美团技能团队历年技能文章合集。

美团外卖智能陪伴型导购的探索与实践

| 本文系美团技能团队出品,著作权归属美团。欢迎出于共享和沟通等非商业意图转载或运用本文内容,敬请注明“内容转载自美团技能团队”。本文未经许可,不得进行商业性转载或者运用。任何商用行为,请发送邮件至tech@meituan.com请求授权。