本文精选了美团技能团队被KDD 2023收录的7篇论文进行解读,论文覆盖了Feed流引荐、多模态数据、实例分割、用户意图猜测等多个方向。这些论文也是美团技能团队与国内多所高校、科研机构协作的作用。期望给从事相关研究工作的同学带来一些启示或许帮助。

ACM SIGKDD(国际数据发掘与常识发现大会,简称KDD)于1995年首次举办,自此成为数据发掘范畴的重要国际会议之一,也是研究数据发掘和常识发现这一范畴的学者和企业人士共享研究作用、讨论前沿论题、推进技能进步和开展的重要渠道。ACM SIGKDD的宗旨是促进数据发掘的运用和理论研究,支持和推进先进技能和办法的开发和立异,并推行数据发掘和常识发现范畴的教育、练习和遍及。该组织致力于提高数据发掘和常识发现的社会价值,推进其在各个范畴的运用和开展。

01《PIER: Permutation-Level Interest-Based End-to-End Re-ranking Framework in E-commerce》

论文作者:晓文、杨凡(一起一作)、王泽、晓旭、国钢、永康、兴星、王栋等,均来自美团技能团队。

论文类型:长文

论文下载:PDF

KDD 2023 | 美团技术团队精选论文解读

论文简介:Feed流引荐作为现在最干流的引荐载体,其引荐质量直接影响用户体验/商家效益/渠道收入等多个核心指标。Feed引荐特色是为每个用户的请求生成并展示多个items,用户的点击行为会一起受到上文和下文影响。因为传统point-CTR猜测是在展现items发生之前进行的,导致无法运用上下文信息,引荐质量受损。现在工业届更多考虑重排计划,但是因为摆放的多样性,穷举会导致摆放个数过多,实践很难落地。现在业界一般存在两种近似计划:

  1. 只考虑方位偏置和上文信息,但疏忽下文影响作用;
  2. 一起考虑上下文,Listwise预估后从头排序,该计划存在Evaluation Before Reranking的问题。

以上两个计划在作用上均有损,因而如何在重排阶段一起考虑上下文,并且降低复杂度兼顾可落地性,是一个非常重要的问题。针对以上问题,论文提出了一个名为PIER的端到端从头排序结构,该结构遵从两阶段范式并包含两个主要模块,分别称为FPSM 和OCPM。根据用户页面爱好偏好,在FPSM中运用SimHash从全摆放中快速的生成候选列表集合,降低了落地复杂度;然后在OCPM中规划了一种新颖的全向注意力建模机制,以更好地捕获列表中的上下文信息;最终,经过引入比照学习损失以端到端的办法联合练习这两个模块,运用OCPM的猜测值来指导FPSM生成更好的列表。离线试验成果标明,PIER在揭露和工业数据集上均优于基线模型,现在已经布置到美团外卖广告场景,取得了较为明显的作用。

02《A Collaborative Transfer Learning Framework for Cross-domain Recommendation》

论文作者:张伟、鹏业、张波、兴星、王栋等,均来自美团技能团队。

论文类型:长文

论文下载:PDF

KDD 2023 | 美团技术团队精选论文解读

论文简介:在引荐体系中,为了满足用户多样化的爱好和需求,催生出多种事务范畴(Domain)。每个范畴的点击率(CTR)可能会有较大不同,这导致了对不同事务范畴的CTR猜测建模需求。为了提升方针域作用,越来越多的学者尝试综合运用多域数据改进模型表现,也被称为常识搬迁。这其间主要有2种搬迁学习的范式:1)预练习+微调:源域的最优解关于方针域可能是部分最优,导致负搬迁(Negative Transfer);2)混合样本+多使命练习:不同域之间数量和特征存在差异,梯度容易被数据量大的域主导(Seesaw Effect)。

针对以上问题,该论文提出了一种协同跨域搬迁学习结构(简称CCTL)来处理这些问题,经过协同练习的办法,评价源域样本对方针域的信息增益,以此作为反应核算源域样本权重,从而使方针域取得更多有利的搬迁常识。结构整体上分为两个模块:IFN模块用于输出源域样本表征及权重,SCN模块用于主模型练习及源域增益核算及反应。一起,经过REN模块运用比照学习强化不同域的差异性信息,运用SAN模块对齐源域方针域在多个Token的表征。CCTL被布置在美团外卖展示广告场景,并取得较为显着的收益。

03《Modeling Dual Period-Varying Preferences for Takeaway Recommendation》

论文作者:玉婷(美团)、吴贻清(中国科学院核算技能研究所)、朱勇椿(中国科学院核算技能研究所)、庄福振(北京航空航天大学)、瑞东(美团)、北海(美团)、展博(美团)、安竹林(中国科学院核算技能研究所)、徐勇军(中国科学院核算技能研究所)

论文类型:长文

论文地址:PDF

KDD 2023 | 美团技术团队精选论文解读

论文简介:外卖引荐体系旨在为用户提供含有契合用户爱好偏好的菜品的商家,已经服务于数十亿用户。与传统引荐不同,外卖引荐面对两大应战:

  1. 两层交互感知偏好。传统引荐往往重视单一层次的用户对商品的偏好,而外卖引荐则需求综合考虑用户对商家和菜品的两层偏好。
  2. 一天内的用户偏好改变。传统的引荐一般从会话等级或天等级的角度对用户偏好的接连改变进行建模。但是,在实践的外卖体系中,一天中的早、中、晚、深夜时段,用户的偏好差异明显。

为了应对这些应战,该论文提出了一种针关于外卖引荐场景的两层时段改变偏好建模模型(DPVP)。 详细而言,论文规划了两层交互感知(DualInteraction-Aware) 模块,旨在根据用户与商铺和食品的交互来捕捉用户的两层偏好。此外,为了模拟用户一天中不一起段改变的偏好,论文提出了根据时刻的分解(Time-based Decomposition) 模块以及时刻感知门控机制(Time-AwareGate)。离线和在线试验均标明,论文模型在现实国际的数据集上优于最先进的办法,并且能够捕捉用户的两层时段改变的偏好。此外,该模型已经在美团外卖渠道上线,取得了较为显着的成绩。

04《A Multi-stage Framework for Online Bonus Allocation Based on Constrained User Intent Detection》

论文作者:王超、晓巍、徐帅、王哲、志强、冯岩、游安、陈彧等,均来自美团技能团队。

论文类型:长文

论文地址:PDF

KDD 2023 | 美团技术团队精选论文解读

论文简介:奖赏分配是营销范畴的一个重要问题,一般能够建模为一个背包优化问题,干流的处理计划一般是两阶段的办法。 第一阶段是用户意图检测,猜测用户在每个奖赏下的转化概率。在第二阶段求解运筹优化问题,得到最优分配战略。 但是,该处理计划一般面对以下应战:

  1. 在用户意图检测阶段,因为交互和噪声的稀少性,传统的uplift估量办法缺乏可解释性,常出现违背边沿功效为正的范畴常识;
  2. 两个阶段之间存在最优性距离,束缚了第二阶段所取得最优值的上界;
  3. 因为线上环境的改变,实践奖赏本钱耗费常常违背给定的预算限额。

为了处理上述应战,论文提出了一个由三个模块组成的结构,即用户意图检测模块、在线分配模块和反应操控模块。关于第一个应战,在用户意图检测模块中,我们根据深度标明学习对功效增量进行隐式建模,提出单调束缚结构增强模型解释性。为了减小两阶段最优性距离,进一步提出了凸束缚模型来提高最优值的上限,以处理第二个应战。针对第三个应战,为了应对在线本钱耗费地动摇,论文运用结构中的反应操控战略,使实践本钱更精确地接近给定的预算束缚。根据实在的美团支付数据评价以及线上A/B试验均证明了该计划的优势和有用性。

05《C-AOI: Contour-based Instance Segmentation for High-Quality Areas-of-Interest in Online Food Delivery Platform》

论文作者:奕达、丽影、大平、水平、方潇、井华、仁清、致钊等,均来自美团技能团队。

论文类型:长文

论文下载:PDF

KDD 2023 | 美团技术团队精选论文解读

论文简介:AOI是配送事务数字化运营的基础设施,也是关键决策算法的基础单元。现有的AOI主动生成相关研究主要依赖于三种办法:1)预界说的形状;2)根据密度的聚类;3)需求多个模型进行后处理的语义分割办法。上述研究办法降低了AOI概括的生成质量上限从而束缚了主动生成AOI概括的落地。为了处理上述问题,该论文将其构建为根据实例分割的概括回归问题并提出了一种端到端的AOI概括主动生成结构C-AOI。在C-AOI中,提出了Contour Transformer、循环方位编码以及自适应匹配损失优化极点回归路径。该模型在美团配送事务数据集上进行了试验,大幅提升AOI鸿沟生成质量的一起具有较快的推理速度。此外,该模型已投产并运用于美团履约场景。

06《NEON: Living Needs Prediction System in Meituan》

论文作者:兰孝翀(清华大学)、高宸(清华大学)、诗琪(美团)、秀琦(美团)、影格(美团)、张晗(美团)、华周(美团)、恒亮(美团)、李勇(清华大学)

论文类型:长文

论文地址:PDF

KDD 2023 | 美团技术团队精选论文解读

论文简介:用户意图包含人们日常日子中的各类需求,如吃、住、文娱等。美团作为连接用户和服务提供者的日子服务渠道,用户意图猜测问题往往被界说为猜测用户当时的事务需求。精确了解用户意图关于日子服务渠道而言至关重要,了解成果能够广泛运用于渠道引荐体系、精准化营销等多种事务场景。但是,当时渠道在用户意图猜测问题上的探究并不是许多,且面对如下两个严峻应战:

  1. 用户需求,常常受人物、地点、时刻、自然环境等多种复杂因素的影响;
  2. 用户意图存在多样化特色,并非用户的一切需求都会在美团App上表现。

为了应对上述两个应战,本论文规划了一个名为NEON的用户意图猜测体系,其主要包含三个阶段:特征发掘、特征交融和多使命猜测。

  1. 在特征发掘阶段,根据时、空、人、环境等维度进行用户消费场景界说,并重点提取了不同场景下的群体行为特征用于建模,经过人群共性行为辅佐进行体系冷启优化,有用缓解了数据稀少问题。
  2. 在特征交融阶段,结构了交融用户个别及所属群体行为特征的网络结构,该网络能够有用学习不同场景下的用户意图改变。
  3. 在多使命猜测阶段,除了猜测用户事务意图之外,引入辅佐使命,用来猜测用户履约办法偏好(送货到家、到店消费),以此来增强模型对时、空上下文的学习。

论文中的NEON体系,已布置至美团的引荐、营销、运营算法引擎中,大规模在线A/B测试评价试验标明,NEON在上述多个运用场景下均可带来事务作用的明显提升,试验成果证明了NEON体系在细粒度用户需求刻画、履约办法偏好识别、潜在需求猜测等方面的有用性。

07《A Hybrid Approach of Statistics and Embeddings for Multilingual and Multi-Locale Recommendation》

论文作者:伟佳(美团)、詹金(DataRobot) 、黄钟山(Freelance)、王露(微软)、王强(美团)

论文类型:Workshop

论文下载:PDF

KDD 2023 | 美团技术团队精选论文解读

论文简介:为了鼓舞多语言引荐体系的开展,亚马逊发布了一个多语言和多区域购物会话数据集,并根据该数据集举办了KDD Cup 2023多语言多区域会话引荐应战赛。本论文介绍了美团在此次比赛中的处理计划。依照引荐体系中广泛运用的设定,美团的处理计划包含两个阶段:召回和排序。在第一阶段,运用各种召回战略检索一组候选Item,包含根据一起访问矩阵的I2I召回、根据GraphEmbedding的I2I召回、根据TextTransformer的I2I查找和根据BPR的U2I召回。在第二阶段,练习了一个模型来猜测每个用户与候选产品互动的概率。该模型是两个GBDT模型的集成,包含丰富的统计特征和Embedding类似度特征。该团队在在Track2中取得了第3名,在Track1中取得了第4名。

美团科研协作

美团科研协作致力于搭建美团技能团队与高校、科研机构、智库的协作桥梁和渠道,依托美团丰富的事务场景、数据资源和实在的工业问题,开放立异,汇聚向上的力气,围绕机器人、人工智能、大数据、物联网、无人驾驶、运筹优化等范畴,一起探究前沿科技和工业焦点微观问题,促进产学研协作交流和作用转化,推进优异人才培养。面向未来,我们期待能与更多高校和科研院所的老师和同学们进行协作。欢迎老师和同学们发送邮件至:meituan.oi@meituan.com。

阅览更多

| 在美团公众号菜单栏对话框回复【2022年货】、【2021年货】、【2020年货】、【2019年货】、【2018年货】、【2017年货】等关键词,可检查美团技能团队历年技能文章合集。

KDD 2023 | 美团技术团队精选论文解读

| 本文系美团技能团队出品,著作权归属美团。欢迎出于共享和交流等非商业意图转载或运用本文内容,敬请注明“内容转载自美团技能团队”。本文未经许可,不得进行商业性转载或许运用。任何商用行为,请发送邮件至tech@meituan.com请求授权。