1. 概述

在工业界，一个完好的引荐系统中一般包含两个阶段，分别为召回阶段和排序阶段。在召回阶段，依据用户的爱好从海量的产品中去检索出用户（User）可能感爱好的候选产品（ Item），满意引荐相关性和多样性需求。在排序阶段，依据不同的方针，如CTR，CVR，时长等对候选出的产品进行打分。现在，关于用户爱好的建模，一般是从用户的前史行为中挖掘出用户爱好，以当时的深度学习模型为例，一般是将User的前史行为数据embedding到一个固定长度的向量中，以此表明该用户的爱好。然而在实践环境中，一个用户的爱好一般是多样的，运用单一固定长度的embedding向量难以刻画用户爱好的多样性。Multi-Interest Network with Dynamic routing[1]（MIND）用户多爱好建模网络替代了原先的单一固定长度embedding向量，取而代之的是用户的多爱好向量。在MIND中，主要的创新点在于：

经过Mulit-Interest Extractor Layer获取User的多个爱好向量表达，并选用动态路由（Dynamic Routing）的办法自适应地将User前史行为聚合到User爱好表达向量中；
经过Label-Aware Attention机制，指导网络学习到用户的多爱好Embedding向量；

2. 算法原理

2.1. MIND模型的网络结构

MIND模型的网络结构如下图所示：

MIND的网络结构与Youtube的召回网络结构[2]根本一致，Youtube的召回网络结构如下图所示：

不同点主要是在多爱好抽取层Mulit-Interest Extractor Layer和Label-Aware Attention机制。

2.2. Mulit-Interest Extractor Layer

多爱好抽取层的意图是对用户前史行为的item抽取出多个爱好向量表达，一般选用聚类的进程将用户的前史行为聚类到多个簇中，一个簇中的item比较靠近，该簇代表了用户爱好的一个方面。在MIND中，为了实现这样的聚类进程，运用到了胶囊网络（Capsule Network）。

2.2.1. 胶囊网络（Capsule Network）

什么是胶囊网络（Capsule Network）呢？参照参阅[3]，对胶囊网络做简略介绍。关于一个一般的神经网络是由神经元组成，每个神经元中是一个详细的值，如下图的左侧图所示；而在胶囊网络中是由被称为Capsule的根本单元组成，与神经元不同的是Capsule中存储的是向量，如下图的右侧图所示。

在上图的胶囊网络中，蓝色的Capsule的输入是黄色的Capsule和绿色的Capsule的输出，分别为向量 $v^1$ 和向量 $v^2$ ，蓝色的Capsule的输出是向量 $v$ 。

2.2.2. 动态路由（Dynamic Routing）

在神经网络中，网络的权重 $,wnw_1,w_2,\cdots ,w_n$ 是在网络的backpropagation进程中学习到的。关于胶囊网络，其进程与神经网络有点不一样，借鉴参阅[3]中的图，结合参阅[1]中的实例，有如下的图：

假定存在两层的胶囊，当时的第 $h$ 层的胶囊如上图中的蓝色部分，其输入为第 $l$ 层，且上层的输出向量为 $c→il∈RNl1\overrightarrow{c}_i^l\in \mathbb{R}^{N_l\times 1}$ ，且 $,m}i\in \left\{1,\cdots ,m \right\}$ ，对应到第 $h$ 层的输出向量为 $c→jh∈RNh1\overrightarrow{c}_j^h\in \mathbb{R}^{N_h\times 1}$ ，且 $,n}j\in \left\{1,\cdots ,n \right\}$ ，在上图中，咱们选取其间一个第 $h$ 层的输出向量 $c→jh\overrightarrow{c}_j^h$ 。 $z→jh\overrightarrow{z}_j^h$ 的计算进程如下：

z→jh=∑i=1mwijSijc→il\overrightarrow{z}_j^h=\sum_{i=1}^{m}w_{ij}S_{ij}\overrightarrow{c}_i^l

其间，矩阵 $Sij∈RNhNlS_{ij}\in \mathbb{R}^{N_h\times N_l}$ 是需要学习的参数，可经过网络的backpropagation进程学习，衔接权重 $w_{ij}$ 在胶囊网络中被称为coupling coefficients，不是在网络中学习得到的。终究经过一个非线性的squash函数得到终究的胶囊的输出向量 $c→jh\overrightarrow{c}_j^h$ ：

c→jh=squash(z→jh)=∥z→jh∥21+∥z→jh∥2z→jh∥z→jh∥\overrightarrow{c}_j^h=squash\left ( \overrightarrow{z}_j^h \right )=\frac{\left\|\overrightarrow{z}_j^h \right\|^2}{1+\left\|\overrightarrow{z}_j^h \right\|^2}\frac{\overrightarrow{z}_j^h}{\left\|\overrightarrow{z}_j^h \right\|}

Squash函数的作用是相当于对向量 $z→jh\overrightarrow{z}_j^h$ 做归一化的操作，当至此完成了胶囊网络的前馈进程，然而关于衔接权重却并不知道是怎么得到的，为了求得衔接权重需要运用到动态路由（dynamic routing）的进程，动态路由其实是一个迭代的进程，首要定义the routing logit $b_{ij}$ ：

bij=(c→jh)TSijc→ilb_{ij}=\left ( \overrightarrow{c}_j^h \right )^TS_{ij}\overrightarrow{c}_i^l

那么， $w_{ij}$ 能够由 $b_{ij}$ 定义：

bikw_{ij}=\frac{exp\;b_{ij}}{\sum_{k=1}^{m}exp\; b_{ik}}

详细进程如下面的伪代码所示：

2.2.3. 怎么理解聚类进程

在参阅[4]中详细论说了动态路由与K-Means聚类算法之间的关系，简略来说Capsule所运用的聚类算法，其实是K-Means的变种。经过直观的理解这个进程，首要关于K-Means，为了与上面的Dynamic Routing进程对应，假定原始的样本为 $e_i$ ，其间 $,m}i\in \left\{1,\cdots ,m \right\}$ ，存在 $K$ 个聚类中心 $u_j$ ，其间 $,K}j\in \left\{1,\cdots ,K \right\}$ ，K-Means的方针是将 $m$ 个原始样本 $,eme_1,e_2,\cdots ,e_m$ 划分到 $K$ 个类中，使得类内的间隔最小，即：

min∑j=1K∑i=1mwij∥ei−uj∥2min\sum_{j=1}^{K}\sum_{i=1}^{m}w_{ij}\left\|e_i-u_j \right\|^2

其间 $w_ij$ 表明样本 $e_i$ 是否属于聚类 $j$ ，因此 $wij∈{0,1}w_{ij}\in \left\{0,1 \right\}$ 。聚类中心 $u_j$ 为：

uj=∑i=1mwijei∑i=1mwiju_j=\frac{\sum_{i=1}^{m}w_{ij}e_i}{\sum_{i=1}^{m}w_{ij}}

与Dynamic Routing中的 $u→j\overrightarrow{u}_j$ 的更新有两点不一样，第一，计算 $w_{ij}$ 的办法，第二是计算最终结果，在K-Means中是直接求平均，而在Dynamic Routing中， $u→j\overrightarrow{u}_j$ 选用的是squash函数。

上述仅仅从直观上对比了两个进程，详细的数学上的论说能够拜见参阅[4]。

2.2.4. 动态爱好个数

关于不同的用户，其爱好的个数 $K$ 是不一样的，在参阅[1]中给出了计算特定用户 $u$ 的爱好个数 $K_{u}^{‘}$

Ku′=max(1,min(K,log2(∣Iu∣)))K_{u}^{‘}=max\left ( 1,min\left ( K,log _2\left ( \left|I_u \right| \right )\right ) \right )

2.3. Label-aware Attention Layer.

经过多爱好提取器层，对用户行为序列得到了用户的多个爱好向量，为了评价多个爱好向量对方针Item相关度及贡献度，在[1]中规划Label-aware Attention机制来衡量方针Item选择运用哪个爱好向量，其详细的表达式如下：

v→u=Attention(e→i,Vu,Vu)=Vusoftmax(pow(VuTe→i,p))\overrightarrow{v}_u=Attention\left ( \overrightarrow{e}_i,V_u,V_u \right )=V_usoftmax\left ( pow\left ( V_u^T\overrightarrow{e}_i,p \right ) \right )

其间， $p o w$ 表明的是指数函数， $p$ 是一个调理attention分布的参数。

3. 总结

在MIND中，经过Mulit-Interest Extractor Layer获取User的多个爱好向量表达，并选用动态路由（Dynamic Routing）的办法自适应地将User前史行为聚合到User爱好表达向量中；最终经过Label-Aware Attention机制，指导网络学习到用户的多爱好Embedding向量。

参阅文献

[1] Li C, Liu Z, Wu M, et al. Multi-interest network with dynamic routing for recommendation at Tmall[C]//Proceedings of the 28th ACM international conference on information and knowledge management. 2019: 2615-2623.

[2] Covington P, Adams J, Sargin E. Deep neural networks for youtube recommendations[C]//Proceedings of the 10th ACM conference on recommender systems. 2016: 191-198.

[3] 14.胶囊网络（Capsule Network）

[4] 再来一顿贺岁宴：从K-Means到Capsule

[5]. 引荐系统召回模型之MIND用户多爱好网络

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

用户多兴趣建模MIND