业务场景 在真实的业务场景下,我们往往需要对所有商品的一个子集构建个性化推荐模型。在完成这件任务的过程中,我们不仅需要利用用户在这个商品子集上的行为数据,往往还需要利用更丰富的用户行为数据。定义如下的符号: U——用户集合 I——商品全集 P——商品子集,P ⊆ I D——用户对商品全集的行为数据集合 那么我们的目标是利用 D 来构造 U 中用户对 P 中商品的推荐模型。
1.利用python进行数据清洗,按日、时画出用户行为可视化数据图表,初步观察分析数据。 2.构建透视图等表进一步构建思特征设计。 3.数据具有稀疏性与随机性,设计分类推荐模型。 4.数据过滤,矫正,交互特征设计和特征提取。 5.基于kmeans的样本均衡处理和归一化处理。 6.基于GBDT的cut_off等参数调节,对train样本进行训练。