Skip to content

yeahyuanw/RecommendSystemPapers

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 

Repository files navigation

Must Read Papers on Recommend System

Recall

  • 2019-RecSys-Google: Sampling-Bias-Corrected Neural Modeling for Large Corpus Item Recommendations

    该论文提出了一个双塔模型用于Youtube的召回。传统的softmax在工业级应用中,计算量会非常大,所以普遍会采用基于采样的softmax。该论文采用了batch softmax,并考虑了采样带来的偏差(流式数据中,高频的item会被经常的采样到batch中)。论文通过item在流式数据中出现的平均间隔来计算item的概率,通过将item的概率应用到batch softmax的交叉熵loss中,来减少由于采样带来的偏差。

Rank

  • 2014-KDD-Facebook: Practical Lessons from Predicting Clicks on Ads at Facebook

    Facebook提出了经典的GBDT+LR模型,利用GBDT进行特征筛选和组合,根据样本进入GBDT树的叶子节点,重新构建feature vector,输入到LR模型进行CTR的预测。为了评估CTR预测概率的精确性,还介绍了Normalized Entropy、Calibration两种评估方法。这篇论文还对LR模型的实时训练中的样本拼接,模型特征分析,负采样后的CTR校准等工程trick进行了介绍。

  • 2016-RecSys-Google: Deep Neural Network for YouTube Recommendation

  • 2016-DLRS-Google: Wide & Deep Learning for Recommender Systems

    该论文提出了Wide & Deep 模型来进行CTR预估。Wide & Deep模型利用Wide部分结合线性模型的记忆能力、Deep部分的DNN模型为sparse feature学习到低维的dense embedding,对没有出现过的特征组合有更好的泛化性,同时能带来更高阶的非线性特征交叉。

  • 2017-IJCAI-Huawei: DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

    Wide & Deep模型的Wide部分的二阶特征还是需要人工组合。DeepFM模型利用FM模型来替换Wide & Deep中的Wide部分,自动进行二阶特征的组合。Deep部分和FM的二阶部分共用特征的embedding矩阵,学习高阶特征组合,提高特征交互的表征能力。

  • 2018-KDD-Alibaba: Deep Interest Network for Click-Through Rate Prediction

    该论文提出了DIN模型来进行CTR预估。DIN模型引入了attention机制,论文提出了Activation Weight,来计算候选Item与用户的历史行为序列的item的权重,然后对所有历史行为序列Item的embedding进行加权求和。

  • 2019-AAAI-Alibaba: Deep Interest Evolution Network for Click-Through Rate Prediction

    该论文提出了DIEN模型来进行CTR预估。DIEN包括了embedding层、Interest Extractor Layer、Interest Evolving Layer,最后将行为序列的向量、ad、user profile、context的向量进行拼接,输入到MLP进行预测。模型的核心模块就是:Interest Extractor Layer和Interest Evolving Layer。

    Interest Extractor Layer: 用GRU来对用户点击行为序列之间的依赖进行建模。论文认为GRU的最终隐藏状态$h_T$只能表示最终兴趣导致了点击行为,并没有很好的利用到GRU的中间隐藏单元$h_t(t<T)$。论文认为兴趣会导致连续的多个点击行为,所以引入了辅助loss,用行为$b_{t+1}$来指导$h_t$的学习。

    Interest Evolving Layer: 对与target Ad相关的兴趣演化轨迹进行建模。论文提出了AUGRU--带注意力更新门的GRU结构。通过使用兴趣抽取层的GRU隐藏状态$h_t$和target Ad计算得到相关性$a_t$,再将GRU中更新门$u_t$乘以$a_t$。AUGRU可以减弱兴趣“漂移”带来的影响。

  • 2018-SIGIR-Alibaba: Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate

    该论文提出了ESMM模型来进行CVR预估。论文认为传统的CVR预估存在两个问题:i) SSB:传统的CVR的训练集只是曝光样本中的点击样本,点击转化了的为正,点击未转化的为负。但是预测是的时候是所有曝光样本空间,训练数据和预测数据来自不同的分布,存在Sample Selection Bias问题;ii) CVR训练使用的点击样本远远小于CTR训练的曝光样本,所以存在Data Sparsity问题。

    ESMM是一个新的多任务框架,引入CTR和CTCVR作为辅助任务来学习CVR。ESMM的Loss函数由CTR和CTCVR两部分组成,并没有用到CVR任务的Loss。这样就可以在完整的曝光样本空间中进行训练和预测。$L(\theta_{cvr}, \theta_{ctr})=\sum^{N}{i=1}l(y_i,f(x_i;\theta{ctr})) + \sum^{N}{i=1}l(y_i&z_i,f(x_i;\theta{ctr}*f(x_i;\theta_{cvr}))$

  • 2019-CoRR-Meitu/Tencent: FLEN: Leveraging Field for Scalable CTR Prediction

    该论文提出了FLEN模型来进行CTR预估。

Rerank

MultiTask

Coldboot

Reinforcement Learning

Graph Neural Network

Calibration

Online Learning

Look-alike

Position bias

  • 2019-RecSys-Huawei:PAL: a position-bias aware learning framework for CTR prediction in live recommender systems

    对于纯推荐类场景,前面的item存在因为position导致ctr偏高的情况;对于搜索+推荐的场景,前面的item又有可能比实际偏低,存在了position bias。一般的做法是在训练过程中,将position作为一维特征,在测试的时候将position设一个默认值0或者一个比较小的负数。这篇论文认为预测时position设置一个默认值,值不同时,线上效果的差别比较大。所以,提出了一个PAL模型来解决position bias问题。PAL将一个item被点击的概率bCtr拆分为 item被曝光的概率probSeen * item曝光后被点击的概率pCtr 。probSeen模块的输入是position,用一个线性模型进行训练;pCtr的输入是user profile, item feature, context等特征,论文采用了DeepFM模型。线下两个模块联合训练,线上预测时只有pCtr部分,这样就避免了去在线上预测时调参position的默认值。