动态权重在推荐中的应用
动态权重
1. 从LHUC说起
语音识别领域2016年一项开创性工作提出了LHUC(Learning Hidden Unit Contribution)算法, 在DNN网络中为每个speaker学习对应的hidden unit contribution, 然后与common hidden layer相结合,以此提升不同speaker的语音识别准确率。这项工作属于domain adaptation领域,LHUC方法相比之前工作最重要的改进点是模型实现domain adaptation的过程不依赖target domain样本re-training,因此可以拓展到任意多个domain,之前方法由于re-training成本较高,仅适用于有限个domain。
2. LHUC和动态权重的关系
近几年国内一些头部公司将LHUC算法运用到推荐系统领域取得了不错的效果,下面选择一些代表性的工作进行介绍。论文中对LHUC思想有各种改进,称呼也不尽相同,如dynamic weights,adaptive parameter generation等,本文统一以动态权重指代这一类方法。
2.1 PPNet
需要注意一下蓝色部分的 Gate NN 部分,其中 uid,pid,aid 分别表示 user id,photo id,author id,进行梯度回传;但是左侧其他特征,虽然也会和这 3 个 id 特征的 embedding 拼接到一起作为所有 Gate NN 的输入,但并不接受 Gate NN 的反传梯度,减少 Gate NN 对现有特征 embedding 收敛产生的影响。
Gate NN 的数量同左侧神经网络层数一致 (上图中灰色网络共四层,因此一共有四个 Gate NN),其输出同每一层神经网络的输入做 element-wise product 来做用户的个性化偏置。Gate NN 采用的是一个 2 层神经网络,其中第二层网络的激活函数是 $2 * sigmoid$,这一部分与 LHUC 原文中设置是相同的。
2.1.1 动态权重思想的体现
-
PPNet通过Gate NN结构达到增强用户个性化表达的能力。
-
GateNN结构共两层,第二层网络的激活函数是2 * sigmoid,默认值为1。
-
GateNN的输入中额外增加了三个独有特征uid,pid,aid 分别表示 user id,photo id和author id。
-
训练过程中左侧所有sparse特征不接受Gate NN 的反传梯度,这样操作的目的是减少 Gate NN 对现有特征 embedding 收敛产生的影响。
2.2 POSO
-
MLP结构
-
MMoE结构
2.3 PEPNet
PEPNet和PPNet的结构类似。添加了对不同场景(Domain)的个性化特征
2.4 阿里M2M
2.4.1 动态权重思想的体现
- 场景scenario相关特征生成动态参数Weight和Bias。
- 模型输入input(同时包括场景相关特征和其它特征)直接使用上面的输出作为MLP的参数。与LHUC的一个小区别是,论文中没有直接采用场景相关动态权重从所有input生成的公共hidden layer中提取场景个性化信息的操作
思考:
LHUC和ppnet和POSO的区别?
和CAN的对比:
-
CAN和DW针对的问题很像,都是针对“合不上,分不开”的问题
-
合不上
:如果每个特征只有一套embedding,需要与其他所有embedding交叉,可能相互干扰。- 这和DW将所有场景数据合一起训练,面临的“模型被数据多的场景带偏”问题,很相似。
-
分不开
:如果每对儿交叉特征都有自己独立的embedding,特征空间太稀疏不好训,而且也占用太多资源。- 这和DW为每个场景单独建模,面临的“数据少场景不好训、占用资源多、不好维护”问题,很相似。
-
-
CAN和DW解决的方法很像
-
CAN把target item id/category embedding reshape成一个MLP,与user feature交叉时,就把user feature喂入这个dynamic generated MLP
-
DW利用“特征敏感”特征动态生成一个MLP,把其他所有特征喂入这个dynamic generated MLP
-
Reference
- Learning Hidden Unit Contributions for Unsupervised Acoustic Model Adaptation
- 快手落地万亿参数推荐精排模型
- POSO: Personalized Cold Start Modules for Large-scale Recommender Systems
- 推荐系统难题挑战(7):POSO,从模型角度解决用户冷启动问题
- POSO方法的实际应用和分析思考
- 「2023 | 快手」PEPNet: 脱胎于LHUC的极致个性化
- PEPNet: Parameter and Embedding Personalized Network for Infusing with Personalized Prior Information
- Leaving No One Behind: A Multi-Scenario Multi-Task Meta Learning Approach for Advertiser Modeling