在外卖广告CTR预估建模中,咱们依托图技能在场景化上进行了一系列探究。本文首要介绍了运用图网络技能的起点,然后从特征层面的笼统图联系到子图扩展以及场景感知子图,逐渐介绍怎么运用图技能建模事务问题,并针对联合练习的线上服务细节及作用进行解释和剖析,期望能给从事相关作业的同学带来一些帮助或启发。

1. 引言

外卖已经成为群众生活中十分的重要组成部分,咱们也逐渐感受到外卖带来的便当。大数据和深度学习年代的到来,使点击率(Click Through Rate, CTR)/转化率(Conversion Rate, CVR)预估技能得到了长足的开展,深度学习技能已经成为业界的主流办法。美团外卖也经过运用深度模型,在线上取得了显着的收益。预估模型所做的事情,是建模蕴藏在数据中、在特定场景下用户和产品之间的相关性(即“人-货-场”)。以点击率预估为例,能够对画像特征、上下文特征、行为特征等进行建模,模型能够感知在该场景下用户和产品之间的相关。

美团外卖是一个场景化事务:用户当时决议计划是受不同场景要素共同影响的成果,这些场景要素包括但不限于LBS地理位置、商家经营状况、时刻餐段。比方在繁华商圈/小城市(LBS)下的作业日/非作业日/正餐/下午茶(时刻餐段),根据商家经营状况圈选商家。比较于传统电商事务来说,添加了LBS和时段的束缚,其场景化要素更为丰厚。同时,外卖具有很强的即时需求性质,用户的决议计划链路会很短,长时刻“逛”外卖App的状况较少,故单次用户决议计划具有短时性的特色,这也进一步对外卖场景化添加了更多的建模要素。 因而,怎么将用户的外卖需求进行场景化建模,然后提高用户在运用外卖时的下单体验,成为外卖预估模型需求重点处理的问题。

1.1 问题与应战

相较于传统电子商务,用户爱好在外卖事务下呈现出愈加显着的场景化特色,具有【用户-场景-爱好-决议计划】链路:即用户在特定场景下,结合自身需求与个人饮食爱好,发生决议计划。

图技术在美团外卖下的场景化应用及探索

场景化建模在本质上,是在给定场景条件下,比方地理位置、餐段时刻、气候等,根据用户爱好为用户匹配出最佳产品。环绕场景化建模这一方针,业界从不同视点进行了一系列技能探究:

  • 特征建模:结构用户-产品-场景交互的核算特征/穿插特征,例如:用户在午饭时段的品类偏好、用户夜宵时段点击商户数量核算等。
  • 序列建模:分场景行为序列,精细化描写在不同场景下的用户爱好,例如:用户在不同蜂窝下的Session行为,在不同时刻段的Session行为。

以上建模办法能够建模场景要素在用户决议计划产品时的影响,但存在一些问题:

  • 特征建模,尤其是特征穿插的进程中,简单引进噪声,会对模型学习发生负面影响。
  • 序列建模,依靠于用户行为的丰厚程度,在分场景行为区分下对低频用户的爱好描写不友好,同时高频用户的爱好描写简单陷入个人爱好封闭圈。
  • 穿插和序列范式对场景的描写并不完好,穿插范式存在维度上限,序列范式局限于用户已有行为偏好。

因而,场景化建模存在以下应战:

  • 怎么抽取有用场景特征穿插。
  • 怎么打破序列建模下的爱好封闭性。
  • 怎么完好地对用户决议计划场景进行有用描写。

针对上述问题特色,经过逐层分解,咱们发现需求一种愈加完好、高效的信息表达办法,能够具有:联系猜测才能、大局信息传达才能、高阶表达才能,而咱们在图技能的范畴中找到相应的处理计划,后文会针对这些问题和图技能的解法顺次进行打开,期望这些考虑和实践阅历能对咱们有所帮助或许启发。

1.2 图技能介绍

近些年来,跟着图神经网络(Graph Neural Networks)的快速开展[1],越来越多的人开端关注起图数据。工业界也呈现了图技能的相继落地,许多运用场景都能够笼统为节点向量化表明、分类、聚类、链接猜测等图任务办法。

  • 关于召回场景来说,根据多种实体间天然存在的相关交互图,构建深度匹配模型学习到的Embedding表达能够直接用来衡量用户-产品的偏好、产品-产品相关。
  • 关于预估模型来说,最朴素的视角,即是在用户-产品这个二部图上进行链接猜测。

在美团内部事务中,Graph Embedding/GNN技能在多个技能团队落地;如美团渠道[2],[4],[10]相关作业以及外卖技能Represent-Learning项目等,都取得了不错的正向收益。 比较传统欧式空间结构类型数据,图结构数据具有以下特色:

  • 结构化:图网络具有拓扑结构性,这种结构化特性往往代表了一些规则。例如节点重要性,社区结构等。
  • 相关化:图网络供应了一种复杂联系和交互的衡量办法。例如相相联系、依靠联系能够经过图表征学习进行衡量。
  • 大局化:图网络构建选用全域数据,比较私域化的序列数据,图结构数据愈加能够体现出集体偏好信息。
  • 强泛化:运用图网络的音讯传达机制,图上节点丰厚信息更简单传达到冷门节点上,提高冷门节点表达才能。

从业界信息表明的开展趋势来看,信息表明是在升维的:从手艺特征,到序列建模,再到图建模,背后是对愈加完好信息的有用描写的诉求。

  • 手动特征年代:根据行为日志核算开掘用户/商家/产品画像。缺陷是描写粒度较粗、不精准、表达才能有限。
  • Neural Network(NN)序列模型年代:根据原始行为序列规划用户爱好提取模块端到端学习用户爱好。优点是一定程度从多峰和动态演化方面提高了用户爱好表达的精确性。缺陷是较难学习到结构化信息,关于行为数据强依靠,头部用户行为密布,中长尾用户行为稀少。
  • Graph Neural Network(GNN)年代:万物皆图。序列能够看做是一个子图,比较于序列,图结构数据关于信息的表达,愈加结构化、完好、丰厚。

在日常事务优化中咱们也发现,如果说要找到一种办法化的建模言语能够精确、完好的翻译出咱们的事务场景,那么呈现出来的建模言语便是“图”。

图技术在美团外卖下的场景化应用及探索

因而,咱们等待经过图技能手段,完成外卖场景下的场景建模。以下咱们将从图算法探究和详细工程实践落地两大方面,阐述咱们在图技能场景建模上的尝试及阅历。

2. 图技能的场景化探究

外卖场景化是指根据用户-商家/产品完好交互信息(<User、POI、Time、Location>)中开掘到的共性Pattern。咱们经过构建用户-商家/产品交互场景图来描写和提取这个Pattern,并将场景先验知识引进到预估模型当中辅助决议计划。业界已经有前沿探究将GNN运用于LBS场景建模,如美团渠道的STGCN[2]从时空结合的视点描述了LBS场景下GNN运用,外卖数据组的“门控超图GNN”[3]描述了超图在外卖LBS场景化建模的运用;比照普通GNN办法都取得了SOTA的作用。

针对美团外卖的场景化建模特色,咱们在图算法上也进行了一系列探究,别离在场景特征穿插、子图拓宽感知、元途径场景图三个方面,环绕着在不同场景下的用户-POI建模的方针,进行了多方面的探究,在离线评价、线上事务上均取得了不错的作用。

2.1 根据特征图的场景特征穿插建模

2.1.1 场景特征穿插

特征是机器学习模型的源动力,业界常言“特征的上限决议了模型的上限”。NN年代曾经,模型作用的提高有很大一部分来自于特征工程。跟着模型进入NN年代,NN模型具有的拟合才能以及在数据红利的加持下,极大地削减了算法工程师们在特征工程上的精力开支,作业重点开端聚焦于模型结构。尽管理论上NN能够拟合悉数函数,但在有限的数据和练习周期内,无法快速地逼近作用上限。在这种布景下,显式特征穿插从头得到咱们的关注,环绕主动穿插特征,业界陆续迭代出FM/xDeepFM/DCN/CAN等模型,并取得了十分好的作用。

在美团外卖场景,也阅历了第一阶段的手动穿插特征,以及第二阶段的主动穿插特征。但在场景化建模中咱们发现:穿插特征带来了信息增益,但往往也会带来“噪声”问题;比方详细到样本粒度来说,不同类型的样本所需求的有用穿插特征并不是完全共同,存在差异性。近两年业界的一些作业,如Fi-GNN、L0-SIGN、阿里FIVES等,也都在对应的事务中发现全量信息穿插引进噪声问题。

因而,从迭代思路来看,期望能够引进更多的穿插特征,同时也削减噪声信息的引进,完成在样本粒度的“个性化”穿插特征。

2.1.2 图视角的特征穿插

特征穿插,能够笼统为“从全量特征集中,挑选出K组特征两两组合,完成给模型带来高效非线性表达才能的意图”。本质上能够看做是特征-特征之间二部图的联系猜测:将特征看作节点,特征之间的相相联系看作边,则能够将一切特征之间的相相联系构成一张图网络。两个节点连边的权重,可看作对应特征之间穿插联系的强弱。经过将此联系图嵌入到模型练习进程中,联系图中不同边权即反映了不同特征穿插的重要程度。

每个样本中N个特征互相之间构成一个全连通图记为M,图中的每个顶点表明特征F,顶点之间的边表明恣意两个特征Fi和Fj的相关度,记为M<i, j>。经过联合练习联系图和预估模型,更新参数矩阵M,使联系图的语义信息与预估模型坚持相关性和共同性,主要进程如下图3所示:

图技术在美团外卖下的场景化应用及探索

主要步骤可描述如下:

  • Step1. 树立参数矩阵(随机初始化得到),对特征所对应的向量表明做点积,成果作为相联系数。
  • Step2. 对矩阵施加L0惩罚,用于束缚矩阵M的参数尽量挨近0,削减无用的场景穿插。
  • Step3. 参数矩阵0,1化,用于确认需求参加聚合的节点。
  • Step4. 图聚合,关于每个特征来说,与其存在交互的多个特征进行聚合操作,聚合办法运用Attention。
  • Step5. 将聚合后的特征向量表明,做为该特征新的向量表明,用在下流CTR预估的联合练习中。

经过特征穿插系数笼统为图的边权重要性评价问题,使模型具有了对场景特征之间相关强弱的猜测才能,然后能够愈加高效地引进穿插特征,为用户的场景化建模供应更多的信息输入。

2.2 根据子图扩展的行为图建模

2.2.1 场景序列建模的痛点和图处理思路

在外卖算法模型迭代中,序列建模也阅历了较长时刻的迭代,从单场景短期Session建模到多场景用户长时刻行为爱好建模,在多个方向上都做出了翔实的探究。序列建模能够在用户前史行为中,充分开掘用户的爱好偏好,但是因为用户行为序列自身是“有偏采样”的反馈:不同用户所在的地理位置、商家供应状况、运用频次等方面存在着较大差异;且高低频用户的点击行为分布差异显着,呈现出高频用户行为丰厚调集、低频用户行为稀少的特色。

关于高频用户,或许会导致爱好圈封闭导致模型建模无法跳脱既有的爱好圈;关于低频用户,因为信息的缺少导致其爱好描写不完好。因而,咱们需求具有拓宽用户爱好鸿沟的信息扩展才能、对单点信息的扩充才能;即寻找一种新的数据结构,打破二维线性束缚,完成三维立体扩展,根据此种主意,咱们从图的视点来从头考虑用户行为建模:以私域线性行为序列作为爱好描写基础,以公域大局互联联系图作为爱好弥补,树立个别差异性与集体共性的衔接。

2.2.2 行为POI子图规划

用户行为信息是指用户在渠道的点击/下单活动记载,是最原始最直接的关于用户爱好的描写,尤其是针对行为稀少用户来说,行为POI序列中恣意节点都值得注重。但关于这部分用户,仅仅依靠个人行为POI很难建模爱好,如果能够经过图的办法扩展用户行为,能够有时机跳脱个人私域行为束缚,透过大局行为图捕捉不同场景下的潜在爱好。

咱们根据用户Session行为构建了POI网络:在同一个Session里,用户所点击过的POI存在相关,那么能够将每个Session里的POI构建一个连通图;因为不同用户行为的POI是有堆叠的,整个外卖场景下的不同POI簇之间经过这些堆叠的POI链接,就能够构成一张POI网络。关于恣意一个POI,咱们都能够从POI行为网络中,寻找到该POI的一跳、二跳街坊,这些街坊能够作为POI信息的相关弥补。这样,关于用户的行为爱好描写,不仅仅局限在用户已有的序列上,而是能够经过子图进一步扩展。

比较传统序列建模办法,图网络建模能够运用大局用户行为互联的高阶网络结构,借助POI序列扩展用户爱好:

  • 关于行为稀少用户,经过大局行为互联图,弥补用户爱好建模线索。
  • 缓解根据密布用户行为建模发生的马太效应,跳出前史行为探究潜在爱好,提高推荐成果泛化性。

详细的,针对用户行为序列中的每一个POI,都能够经过子图进行扩展,扩展后的子图经过卷积的办法构成POI的向量表明,如下图(左)所示。经过行为序列的扩展,运用户行为得到弥补,然后得以跳出用户个人爱好局限,丰厚用户和POI的信息表达。

图技术在美团外卖下的场景化应用及探索

在POI子图的基础上,咱们进一步考虑怎么有用地聚合不同POI,达到子图信息愈加完好的表达。

  • 建模不同POI之间强弱不同的相相联系,运用Attention结构动态分配确认POI在所属子图中的贡献度。
  • 考虑到POI子图是由Session构建的,用户的行为序列存在差异,相应地POI信息表达在不同用户序列中也存在差异,POI子图信息应该在不同行为上下文序列中自适应表达。
  • 为了捕捉这种差异性,在子图卷积的进程中,咱们将中心节点与当时行为序列中其他节点做聚合,然后建模行为上下文场景相关性。

中心节点不仅受到序列和子图影响,也受到当时候选POI的影响。因而在联合下流练习的进程中,咱们将中心节点与样本Target POI进行聚合。

图技术在美团外卖下的场景化应用及探索

Atten1=atten(W11⋅Nodei∣∣W12⋅Nodecenter)Atten2=atten(W21⋅Nodei∣∣W22⋅Nodeavg)Atten3=atten(W31⋅Nodei∣∣W32⋅Nodetarget)Ei=softmax(Atten1+Atten2+Atten3)\begin{aligned} Atten_1 = atten(W_{11} Node_{i} || W_{12} Node_{center}) \\ Atten_2 = atten(W_{21} Node_{i} || W_{22} Node_{avg}) \\ Atten_3 = atten(W_{31} Node_{i} || W_{32} Node_{target}) \\ E_{i} = softmax(Atten_1 + Atten_2 + Atten_3) \end{aligned}

NodecenterNode_{center}是当时子图中心节点Embedding;NodeavgNode_{avg}是行为序列节点Embedding均匀;NodetargetNode_{target}是样本方针节点Embedding;Attention函数是两层前馈神经网络,激活函数为LeakyReLU。

离线练习时,是根据用户行为序列,对序列中每个POI作爱好子图拓宽;而子图生成时选用预采样(Message Passing)+联合练习聚合的办法;经过以上三种聚合办法,得到属于行为序列中POI对应的向量表明。因为这个进程不仅是扩展了POI,还将序列信息、候选POI信息考虑到了每个节点的表明中,咱们称这种为子图感知卷积。经过子图感知卷积,使卷积的进程中,POI的向量表明与上下文信息发生相关,然后使POI的嵌入表明交融了更精确的爱好信息。

2.3 根据元途径的场景图建模

2.3.1 从事务特色动身-元途径建模的初衷

咱们对用户决议计划进程进行笼统,将用户User与商户POI在给定Context环境下的一次交互界说为一个事情(Event),多个用户和POI交互的成果界说为事情链(EventChain)。关于多个强相关的事情链(不同事情链经过公共节点衔接),就构成了一个场景,而场景之间的User、POI主体又存在衔接,这样延打开,实际上就构成了一个“场景”拓扑网络图,如下图所示:

图技术在美团外卖下的场景化应用及探索

能够看到,实际上事情链组成的“场景”是一种异构图:比方具有某些特点(消费频率、餐饮偏好等)的用户U,在某个上下文C下(时刻、地点等),点击/购买了具有某些特点(品类、主营菜品等)的商户P,这个决议计划进程实际上是个最简单的U-C-P元途径。事情链是在这个元途径的基础上继续扩展,得到的更长的元途径实例(U-C1-P2-C2-U’)。经过事情链,能够树立起场景要素的联系链接,而对场景的完好描写,便是对场景要素表明和要素联系的抽取。

至此,咱们将场景化建模,笼统为异构图上元途径建模问题。接下来,咱们将介绍怎么在这个场景图上,完成对用户决议计划场景的建模。

2.3.2 到事务中去-元途径建模的完成

元途径UCPCU表达的语义为:不同用户在不同时空场景下,点了同一家商户,当然不同场景需求能够界说不同的元途径。为了进一步交融元途径中丰厚的语义表达,仅仅依靠单一的元途径的话,所表达的语义会受到束缚。咱们从用户U动身,经过该元途径能够扩展出一系列的元途径实例,这些实例描写了不同场景下,用户和POI的跨时空相关。整个建模进程分为以下几步:

  • Step1. 用户和商户节点存在较多特点,比较节点拓扑结构包括更多语义信息。咱们将特点信息看作节点,经过GraphSAGE的办法聚合到用户和商户表明中。
  • Step2. 从用户U动身,根据元途径,扩展出多条元途径的实例(事情链)。下图展现多条实例,包括:U-C1-P1, U-C2-P2-C3-U’,U-C2-P3-C4-U”-C5-P4;经过扩展能够树立起用户U和商户P4的相关。
  • Step3. 元途径实例查询向量表明后进行拼接,并与样本中的用户(Target User)进行交互。多条候选元途径的规划,能够打破单一元途径依靠信息裁剪造成的信息缺失。交互的办法采纳Attention,即核算当时用户与一切候选元途径的相关,并终究作用于下流预估中。

图技术在美团外卖下的场景化应用及探索

context_feature=Edc=concat(cate_fea∣dense_fea)metapath_instance_emb=Emie=concat(Eu∣Ep∣Ec)\begin{aligned} context\_feature = E_{dc} = concat(cate\_fea\ |\ dense\_fea) \\ metapath\_instance\_emb = E_{mie}= concat(E_{u} \ | \ E_{p}\ |\ E_{c}) \end{aligned}

关于线上恳求,检索同场景下Emie。

Esub=∑Attenion(Emie,Edc)⋅Emie\begin{aligned} E_{sub} = \sum Attenion(E_{mie}\ , \ E_{dc} ) E_{mie} \end{aligned}

经过图网络技能,咱们扩展了不同场景下的用户潜在爱好,借助注意力机制捕捉当时决议计划,与不同元途径对应场景的相关性,然后完成场景化建模。

3. 工程实践落地

3.1 场景图CTR模型主结构

在模型结构规划的进程中,咱们依照”低耦合、高内聚、可插拔、无依靠“的准则,将“行为子图拓宽模块”、“元途径场景子图模块”、“特征图穿插模块”三个子方向迭代作为独立模块接入到模型中。

图技术在美团外卖下的场景化应用及探索

3.2 根据子图扩展的行为图联合练习

在“根据子图扩展的行为图建模”中,关于每个恳求在线模块都需求进行“行为序列长度 * 街坊数”次向量查询和核算,当行为序列较长时对在线CTR预估服务来说会存在较大的RT应战。

考虑POI之间的”大局行为互联图”和用户的长时刻爱好较为稳定,因而针对长时刻行为子图拓宽选用根据行为POI和采姿态图进行聚合不依靠候选Target POI,短期行为子图拓宽计划依然选用2.2.2中计划根据序列和候选Target POI动态核算,长短期POI运用不同的Embedding空间。根据此上线计划采纳长时刻行为子图离线核算+在线查询的思想,离线核算用户长时刻行为序列子图Embedding并灌库,在线查询Redis获取子图Embedding参加后续核算。

根据子图拓宽的长时刻行为模块如下图所示:

图技术在美团外卖下的场景化应用及探索

咱们将整个进程分为三步,保证线上耗时不添加的核心在于Step2的子图拆分重构。因为线上Serving进程中行为子图Embedding表明不会发生变化,因而运用子图查询或聚合后查表,其成果是共同的。

  • Step1. 端到端练习

在原有CTR模型的基础上,针对POI行为序列进行子图查询扩展:每个POI申请从图引擎中进行邻域卷积采样操作,即从二阶街坊聚合到一阶街坊,再聚合到POI自身。

  • Step2. 拆分子图查询模块,聚合Embedding,灌库

练习完成后,将原有子图查询模块拆分,再对长时刻行为中全量POI做一次子图POI-Embedding聚合操作,得到行为POI的子图Embedding。灌库阶段,将长时刻行为子图POI的Embedding和其他特征的Embedding写入Redis存储中。

  • Step3. 对联合练习的模型进行重构导出生成新的线上Serving模型

将长时刻行为“子图扩展的行为图模块”中子图聚合核算重构为直接查询Embedding表征,线上从Step2灌库的成果中查取Embedding。

这样避免线上大量卷积操作的耗时,线上试验验证,高峰期TP99与TP999新增模块耗时基本相等。

3.3 场景子图模块

根据元途径的场景图建模是选用元途径Metapath的办法来表明CTR任务样本中的用户子图和商家子图,采姿态图来自预选构建好的User、POI、Context(Context节点包括了蜂窝、餐段信息)异构行为场景图。

3.3.1 离线异构图构建

因为Context会同时衔接User与POI,在异构图上Context节点会成为超级节点(能够衔接一个蜂窝内简直悉数的User和POI),POI类型节点也或许成为超级节点(衔接区域内一切Context节点);当呈现了遍及的超级节点后,会导致图上游走采样困难、噪声加重。咱们在规划构建Context节点以及异构边时避免了这一问题:

  • Step1. Context节点作为时空上下文,贯穿用户和门店;细化Context节点(比方包括蜂窝、餐段、品类),那么User与Context的衔接边、Context与POI的衔接边都会大大削减。
  • Step2. 不同User或许经过Context节点跳转到不同POI上,为了避免采样时从User节点动身的Path跳转到不相关的POI上,Context节点最好能够体现用户爱好(品类信息其实便是一种)。
  • Step3. 关于边权有所束缚,能够避免Context类型节点成为超级节点,POI的问题也会处理。

3.3.2 元途径采样建模

用户爱好、行为相对是分散的,从User节点动身,沿着边能够跳转到不同Context上去,得到相对广泛的实例,而Metapath采样得到的实例能够视作是User决议计划场景表征调集,详细进程如下:

  • Step1. 以用户子图中U-C-P-C-U这样的途径为例,采样出N份实例,按用户节点分散的第一个Context分类存储,如得到M组实例,公式如下。其间Ci是每个分组的实例数,Uuid: <Context1: [Metapath1, Metapath2]; Context2: [Metapath3, Metapath4]; ; ContextM: [Metapath5, Metapath6]>。

N=∑i=1MCiN = \sum_{i=1}^{M} C_{i}

  • Step2. 关于一个用户恳求,按Uuid与当时恳求Context查询User子图,得到能够匹配当时场景决议计划信息的用户决议计划场景子图表达。
  • Step3. 借助注意力机制捕捉当时决议计划,核算不同Metapath instance与对应场景的相关性,然后完成场景化建模。

3.4 作用收益

子图拓宽联合练习离线AUC+2千分点;特征穿插子图模块离线AUC+1千分点;场景子图交互离线AUC+2.5千分点。

3.4.1 高低频场景感知

经过图建模规划,咱们的模型能够对高低频场景感知,然后提高场景下对运用户的作用。 详细地,在外卖展现广告CTR预估事务中,剖析场景化图算法在不同频次的用户体现状况:核算高频(曩昔一个月在美团外卖点击POI次数>150次)和低频(曩昔一个月在外卖点击POI次数<15次)用户,比较试验组比较对照组(与未选用场景图的Base模型AB试验)的线上目标(点击率, CTR/产品交易额(Gross Merchandise Volume, GMV)。同时,咱们还依照高低频用户别离核算了三级品类的人均曝光数量,比照基线的人均曝光数量。

CTR GMV 人均曝光品类数量
低频用户 +1.58% +1.08% +0.02品类
高频用户 +2.68% +1.94% +0.3品类

从上表成果能够看出:

  • 低频和高频用户的CTR和GMV均有提高,证明感知子图卷积能够有用捕捉高低频场景,完成场景化下用户爱好描写。
  • 低频和高频用户人均曝光品类数量均有提高,而且高频用户的人均品类添加更多,阐明具有更好的爱好开掘探究才能,能够帮助高频场景用户跳脱已有的爱好圈。

3.4.2 特定时空场景感知

为验证场景图模型关于不同场景的识别和描写才能,进一步比照引进场景图联合建模比照无场景图在时刻品类和空间需求下的感知变化(以下多组核算成果均为多天/同时段累计成果)。

3.4.2.1 时刻品类场景

奶茶品类是下午时段的热销品类,从曝光转化比来看在下午茶时段较高且时段效应显着,咱们核算了某事务奶茶品类上多天同时段,曝光数量占该时刻段总曝光数量的份额,并比较试验组比较基线的涨幅状况,从时段上看,试验组在下午茶时刻段(14-16时)奶茶曝光份额上升,而晚间正餐期间曝光份额削减,阐明场景图模型的品类时段感知才能得到加强而且在流量挑选上趋向优质流量,模型上线后在奶茶品类上的整体后验CTR目标体现正向。

图技术在美团外卖下的场景化应用及探索

3.4.2.2 空间需求场景

外卖上的用户需求和行为具有显着的周期效应:即作业日和非作业日,用户的行为具有较大差异。例如,在非作业日,用户多数是在家(小区)而不是写字楼,会有更大的倾向在美团外卖上选购菜品、添置生活用品等(转化曝光比更高)。

咱们以某事务超市便当的品类曝光为例,咱们核算了从周一到周日连续7天,超市便当曝光占当天的总曝光量占比,依照试验组和对照组比照曝光占比状况。从图中能够看出,试验组曝光在周一、周二削减,周末上升,阐明模型捕捉到了作业日和非作业日下,超市便当的购物场景差异,模型上线后在超时便当品类的整体后验CTR目标也体现正向。

图技术在美团外卖下的场景化应用及探索

4. 总结和展望

与传统电商推荐不同,外卖推荐呈现出场景化的特色:供应受LBS强束缚、用户决议计划链路短、易受所在环境影响,因而场景化建模是外卖推荐亟需处理的问题。图网络技能已经在学术界和工业界进行了较为深化的探究,在美团外卖场景化建模中遇到的应战,咱们也经过图技能进行了相应的优化求解,别离经过场景特征图穿插、场景序列子图扩展、元途径场景图,在穿插特征去噪、打破用户爱好封闭圈、完好场景图描写方面进行了探究。

在算法落地上,考虑到线上的耗时问题,咱们在Serving阶段拆分重构长时刻行为子图,在不改动模型成果的状况下削减了核算复杂度,满意了线上的性能要求。图技能的场景化落地尽管取得了一定的收益,但依然存在一些问题需求处理,例如特征图穿插在算力束缚下,只能满意部分特征穿插;关于场景的元途径描写依然依靠于先验人工界说,没有走上“主动驾驶”之路,未来咱们会继续进行探究。

5. 作者简介

任建、张伟、雨枫、黄坤、慧楠、鹏业、张波,均来自美团外卖广告技能团队。

6. 参考资料

  • [1] Li F, Chen Z, Wang P, et al. Graph intention network for click-through rate prediction in sponsored search[C]//Proceedings of the 42nd international ACM SIGIR conference on research and development in information retrieval. 2019: 961-964.
  • [2] Han H, Zhang M, Hou M, et al. STGCN: a spatial-temporal aware graph learning method for POI recommendation[C]//2020 IEEE International Conference on Data Mining (ICDM). IEEE, 2020: 1052-1057.
  • [3] Yang T, Zhang L, Shi C, et al. Gated Hypergraph Neural Network for Scene-Aware Recommendation[C]//International Conference on Database Systems for Advanced Applications. Springer, Cham, 2022: 199-215.
  • [4] Wu L, Li Z, Zhao H, et al. Learning the implicit semantic representation on graph-structured data[C]//International Conference on Database Systems for Advanced Applications. Springer, Cham, 2021: 3-19.
  • [5] Xie Y, Wang Z, Li Y, et al. Fives: Feature interaction via edge search for large-scale tabular data[C]//Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. 2021: 3795-3805.
  • [6] Chang J, Gao C, Zheng Y, et al. Sequential recommendation with graph neural networks[C]//Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2021: 378-387.
  • [7] Shao Z, Xu Y, Wei W, et al. Heterogeneous Graph Neural Network with Multi-view Representation Learning[J]. arXiv preprint arXiv:2108.13650, 2021.
  • [8] Li Z, Cui Z, Wu S, et al. Fi-gnn: Modeling feature interactions via graph neural networks for ctr prediction[C]//Proceedings of the 28th ACM International Conference on Information and Knowledge Management. 2019: 539-548.
  • [9] Fu X, Zhang J, Meng Z, et al. Magnn: Metapath aggregated graph neural network for heterogeneous graph embedding[C]//Proceedings of The Web Conference 2020. 2020: 2331-2341.
  • [10] Wang Y, Xu H, Yu Y, et al. Ensemble Multi-Relational Graph Neural Networks[J]. arXiv preprint arXiv:2205.12076, 2022.

阅览美团技能团队更多技能文章合集

前端 | 算法 | 后端 | 数据 | 安全 | 运维 | iOS | Android | 测验

| 在公众号菜单栏对话框回复【2021年货】、【2020年货】、【2019年货】、【2018年货】、【2017年货】等关键词,可检查美团技能团队历年技能文章合集。

图技术在美团外卖下的场景化应用及探索

| 本文系美团技能团队出品,著作权归属美团。欢迎出于共享和沟通等非商业意图转载或运用本文内容,敬请注明“内容转载自美团技能团队”。本文未经许可,不得进行商业性转载或许运用。任何商用行为,请发送邮件至tech@meituan.com申请授权。