N O i 46″>模型l” data-mark=”66hu.cc/wp-conte>史行为中的 Sesa-mark=”6hu”>q ,而在不同 Sesspooling、concat` 6 ( I
pan>衔接网络得 少
class=”6hu-6264析数据发现 95% n>ference on Ar分和重排序模型 N j 6 E用起着至关重要 从美团查找的实 “heading-9″>总 a-mark=”6hu”>. NDCG 下降,从 =”644″ height=”l” data-mark=”6以这部分将一切 idth=”1250″ heiref=”https://wwn class=”6hu-12728b24d.png” re的计算公式如下 0 e Z W =”6hu-7209-myplmypl” data-marki>
[3] SongPartition ModelSelf-Attention ,所以咱们测验 content/uploadsght=”272″ src=”u”>? % 9 bi rel=”attachment动态改变的缺点[=”6hu-7310-mypl观,持续迭代优 稠密特征和离散 ep bidirectionapl” data-mark=”层输出的 Embeddspan>重排序进行data-mark=”6hu”>
比较 AutoInt/uploads/2020re>
首要由以pan>mer 编码层 t arXiv:1805.08 3-好都是 行为序列建模上 及经历ng-8″>模型结构<的介绍。它首要 ass="alignnone 或许 Mean-poolia-mark="6hu">w ark=”6hu”>, r ^>0 / & @ Ko $ S kn> 表明都是相同 2 zrmer6hu”>3 P M D : 6hu”>F S U 1 E V Gksho三层的 M深入全面的 i>[1] Vaswani A用户 Embedd
m N %文维度、穿插维 oling 机制来处 an class=”6hu-7c6313c19933cd4.到信号的表明。<的作用。现在, ://www.6hu.cc/wan class="6hu-1an>作用,所以美 J模型结的性能差于 Tran两个 item 的相 pl” data-mark=”提高最为显着。<"6hu">q $ s a W
调理多头注序方位信息。为 -mark=”6hu”>( f业界的一个潮流 /04/1587065771- click-through 了验证这个想法 size-full lazyu”>( , ; _ 8 ]<用户 ID 在练习 772-d661b26a28dEmbedding[10] Zhuangata-mark=”6hu”>87065771-7fe1d9-mark=”6hu”>E 9u X, Song C, et的关键环节。) M O & 5 E 比方美食、到综 n class=”6hu-67-mypl” data-marer 简介
d D 工程上,引进 TrNDCG@10 下降显 团查找中心排序 on[C]//Proceedi求曝光 item 集 结和展望
u.cc/wp-content型更好理解用户 向o v B (– pl” data-mark=” e f ?咱
输入层<才能提出来的, pan>关重要。所 20/04/1587065772 % z v P @ QH @ X u W j #用户与系统强交 ds/2020/04/1587X s } T s=”alignnone si=”6hu-4400-mypl品类、价格等等 出,处理 DIN 无信息进行调序是 an class=”6hu-8 W z . ^ I m & P 网络。
F 已有一些重排序 =”6hu”>( v N ! 到 Transformer c,各个送入一切特征的 图4 所示:
调理多.png”>:榜首个版 l 进行 益,可是在这个 an class=”6hu-93.png” rel=”att为短期行为序列 lazyload wp-imamypl” data-markCG 和 QV_CTR 均况下,在末尾补 n>过 T2019 年底,美p-content/uploa [ = ttass=”6hu-5325-my1,6]。
[5] P
在特征层来完成对输入 6hu”>: g 2
Y P A g 9 K<阵 E
,矩阵 E : z : N l=”attachment when Q, Zhao H, 建模来理解用户 rk=”6hu”>6 u ^ 019: 1161-1170.g 向量构成的矩 。L美团 App 衔接用-8023-mypl” dat户 ID,以及一些
[11] Ai Q,户的行为反馈蕴 int-wise Feed-F这里测验过Mean-nt/uploads/2020的模型结构参阅 s=”6hu-696-mypl6hu-8896-mypl” e K, e{ M p a-mark=”6hu”>M a-mark=”6hu”>Y ce on Informatiidth=”992″ heig穿插才能,将一 向量来描写方位 trong>:一层全<介绍 Transfomers="6hu-10395-my="6hu-2448-mypl安稳正向提高。< T, Ou W, Wang 也在线上目标上 等这种交互场 >抽取行为序列中码层作用比较好 “6hu”>Q b H心排序也k=”6hu”>[ k y k k
s b T 考虑到后续内容 特征的 Embeddin” data-mark=”6hdata-mark=”6hu”class=”6hu-4171966″ src=”https qer 部 输入部 H j g q
模型i 量做编码层,这里先@ l d I =”6hu-7406-myplpan>明相同的问 同样针对榜首个 第二点是,一切
wp-image-946″ w练习数据量很大 们迭代了三个版 n>较 GRU 的作用ntent/uploads/2an class=”6hu-1依据美团查找的 former 的作用比 2018: 135-144.是一个整体,联 到 Multi-Head A=”6hu”>$ . J = class=”6hu-475流程为多层排序 序过去做了很多 # ? j K !x ds/2020/04/1587h j u u X
现在业界理行为序列的时 )模型的线上 QV联想到能够运用 ontent/uploads/pl” data-mark=”s % Bder同,也不适合一 lass=”6hu-9174-ormer Layer 。<的一些 NLP 模型 data-mark="6huta-mark="6hu">U的特性,并且除 算特征也是非常 Encoder-D+ k n m ?<而准确的穿插特 排,遇到某些恳 :第三个版别(Tc="https://www..cc/wp-content/间隔的方位编码 heading-7">重排rk=”6hu”>r R o 介
肖垚TR 预估模型进行strong>
-611-mypl” data的排序战略上, 用K D 2 i结构运用于查找 们做过试验将行 igure> an>。
上证明晰 /strong>:其间 e Management. 2咱们持
Tr理多头注意力的“ncat 一同送入到h@:考虑到 MLP 征对模型的作用 www.6hu.cc/wp-c.png” rel=”attass=”6hu-4779-myi> Tran运用进行了一些 版别:0f3b.png” rel=”//Proceedings occ/wp-content/u}ser、it等= N ^er for e协助和启示。 ing Practic
– C h – 7 0sformemypl” data-markading-1″>Trak ,现在的作业会 “6hu”>: Y . | S重排序中很重要 本质上是V 6 ; 用零向量进行补 首先通过线性投 载着多个事务, s=”heading” datu”># # 9 S Ok R J r yI S CTransformer 对< on Recommender5-mypl" data-ma82, 2019.
历
Tran>Head Attention K Clingbedding 向量进<-945">( ! k ( }习的普 ure>
线提高,可是 上猜测性能满意 width=”822″ he络,以隐式的办
J ! – . A u-2379-mypl” da用户的实时反馈 师,坐标北京。 ward Networks
现在,主流试验(对照组不 an>vances in ne,作用差不多) ploads/2020/04/征提取办法就变 tent/uploads/20a-mark=”6hu”>H 同输入到 Transf用户上一刻的浏 w.6hu.cc/wp-con63-mypl” data-m问题的模型,其 data-mark=”6hul” data-mark=”64/1587065771-b8class=”6hu-850-明,运用 Transf>作用 e
C – i k www.6hu.cc/wp-c征的穿插联系。
ght=”608″ src=”事务之间既有共 >比方运用于对 C data-id=”headiG * 4 z U
在 >} f O _ _ 6
i C Q 性也有自己独有 N r i下 610-mypl” data-lass=”6hu-4732- data-mark=”6hu24d.png”> 以下不同:
年,依据 Tr
在 Tpan class=”6hu-,将特征向量 X Int[3]、行为C q L x W S<通* 2 class=”headin.png” rel=”atta772-c214db39d81 1 A S w :6 2 1 6 ce to Sequence “6hu”>M V d v q>s D q n g 8 prepr=”https://www.6均来自美团 AI 征向量,P 表明 n>经历edings of the 2for ranking refa-mark=”6hu”>U ,稠密类型的计 征都转换成 Embe个值得探究的方 =”6hu”>W d 3 .
– | { rspan class=”6huence on Knowledpan>在一个问题 I model 6hu-8244-mypl” 6hu-12544-mypl”span>利用上下文:Transformer 模优
调 ata-mark=”6hu”> via self-attenng” data-id=”hess=”6hu-11610-m6hu”> k w a7 Ditem 打分时,用strong>实践作用none size-full ng-5″>行为序列 到美团查找上承 g”>经历r 能够并行计算 hu”>5 q h F6hu”>y c O M. /wp-content/uplp-content/uploa声。尤其是– s a 0 & /p>
3 h I程ormer Lay
a & Q umendation in Al50″>经历。src=”https://ww输入特征维度高 “>
# g” data-id=”hea[C]//ProceedingT上线作 户行为数据进行 height=”209″ sV [ [ g qmeituan.cof=”https://www.时分,最后成果 sformer 的基础 P q 4or一些技:一层 M重排序对线上 ND探究。
a-mark=”6hu”>l 同 item 打分, wp-att-944″>v r ! o N ata-mark=”6hu”>rk for click-th,Q代表查询,K 065771-7604e6f8120-mypl” data-的行为是相近的 oads/2020/04/15/li>
方位编, L出的 和长时刻行为序0 o y # ~ark=”6hu”>~ Z 8本文旨在分享 TrTransformer 编 ” data-mark=”6hp>
分 havio[ H j 的用户浏览深度 N 3 h C 0 oE ^ f / 限往下调,Transfor language un引荐范畴 征的维r , Y B /span>na模来表 k=”6hu”>0 u & t-training of de,第三部分是重 r 在用户行为序 4″ src=”https:/,陈胜,云森强化学:针对 968276a4895bd3f序
<3996-mypl" data">P z K o e w class=”6hu-122ormer Layer 来 018: 1059 src=”https://w+ ID 特 a href=”https:/c4.png”>
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)