推荐算法(6) 实例

一、推荐系统外围构架
从用户日志经过推荐系统得到推荐列表,返回给UI界面;
用户在UI界面,反馈,生成日志,最后储存起来。

界面设置:
1.展示物品
2.物品有推荐理由
3.提供按钮反馈

数据收集和储存:
针对不同的行为的特点,需要不同的存储方式。书中给了一个表格,列出了不同的用户行为采取的不同存储方法。

实时存储的一般放在数据库和缓存中,
大规模非实时数据存在分布式文件系统(HDFS)

二、推荐系统的架构
特征联系目标用户和待推荐商品:如图,表示“UserCF,ItemCF,基于特征的推荐”这三种推荐算法中,用户和商品的联系方式,可以全部抽象为基于特征的推荐。

但是需要考虑的特征很多,主要包括三种:人口统计学特征,用户的行为特征,用户的话题特征。此外系统的推荐任务也很多。如果同时考虑所有特征,完成所有推荐任务,那么这个推荐系统会很复杂,而且很难通过配置文件方便的配置不同特征和任务的权重。因此,推荐系统需要由多个推荐引擎组成,每个推荐引擎负责一类特征和一种任务,而推荐系统的任务就是将推荐引擎的结果按照一定的权重或者优先级进行合并和排序。

三、推荐引擎架构
推荐引擎的架构:具体可以结合书中的图和例子进行理解。

生成用户特征向量:用户的特征主要包括两种:注册信息,行为信息。对于注册信息,可以直接放到内存用。需要重点考虑的是如何计算出用户的行为特征。特征向量由特征以及特征的权重组成。

**利用用户行为计算特征向量时需要考虑:用户行为的种类(用户付出代价越大的行为权重越高);用户行为的时间(时间越近,权重越大);用户行为的次数;物品的热门程度(需要加重不热门物品对应的特征的权重)。

**特征与物品相关的推荐:在拿到用户的特征向量后,我们可以根据离线的相关表得到初始的物品推荐列表。离线相关表可以存储在MYSQL中,存储格式(特征ID,物品ID,权重)。该表存储了一种推荐引擎(不是一个特征)的推荐结果,可以通过对该标的查询,获得某个特征下,权重最高的前N个物品。不同的推荐引擎会产生不同的离线表。当进行在线推荐时,会将这些相关表按照配置的权重相加,然后将最终的相关表保存在内存中,最后推荐给用户。

过滤模块:需要过滤的物品包括:用户已经产生过行为的物品;候选集以外的物品(产品需求;用户选择的区间内的物品);某些质量很差的物品;

排名模块:新颖性;多样性;时间多样性;用户反馈;

(0)

相关推荐

  • MIND - 基于动态路由的用户多向量召回

    问题背景 ▐  应用场景 在一个典型的推荐场景中,推荐算法的任务是将一个经过筛选排序的,贴近用户兴趣的商品列表推荐给用户.下面两张图片展示了手机淘宝两个比较典型的推荐场景,分别是首页的信息流场景和微详 ...

  • 斯坦福大学最新论文|知识图卷积神经网络在推荐系统中的应用

    推荐系统广泛应用于互联网应用和服务中.传统的协同过滤推荐算法通常会遇到用户-物品交互的稀疏性问题和冷启动问题,可以通过引入额外的信息来解决,如用户/物品属性信息和社交网络.近年来,为了解决上述问题,一 ...

  • 解读|阿里、腾讯和百度发表于KDD2018上的论文(含附录)

    本文对阿里巴巴.腾讯及百度在2018KDD上发表的论文进行了解读,涵盖了几个方面的内容. 阿里巴巴(4篇):搜索结果排序.视觉搜索.推荐算法和图嵌入. 腾讯(2篇):文本匹配和智能医疗领域. 百度(2 ...

  • 年轻人开始“反推荐算法”:算法不讲武德!

    深燃(shenrancaijing)原创 作者 | 王敏 编辑 | 向小园 "算法不讲武德!"越来越多年轻人发觉,生活正在被算法控制. 从事互联网运营的卢锋,想要搜索某个科技产品的 ...

  • 推荐算法(8)评测指标

    推荐算法(8)评测指标

  • 推荐算法(5)利用社交网络数据

    影响用户相信某个推荐结果的因素,90%的用户相信朋友对他们的推荐.基于社交网络的推荐可以很好的模拟现实社会.所以利用社交网络数据进行推荐可以增加用户对系统的信任度.另外利用用户在社交网络的数据可以解决 ...

  • 推荐算法(4)利用上下文信息

    上下文信息包括: 时间的上下文.地点的上下文.心情的上下文- 一.时间的上下文 1.理论 1)时间上对用户的影响: 1.用户自己的兴趣变化(随年龄,时间的变化,兴趣也在变化) 2.物品有自己的生命周期 ...

  • 推荐算法(2):基于内容的推荐

    思路: 根据用户过去喜欢的产品(本文统称为 item),为用户推荐和他过去喜欢的产品相似的产品 流程: 内容表征 Item Representation:为每个item抽取出一些特征(也就是item的 ...

  • 推荐算法(1):协同过滤总结

    一.协同过滤方法: (1)基于内容/基于领域的协同过滤 ICF 计算items之间的相似度,推荐与A的已知item最相关的item 步骤: 1.输入item-user矩阵 2.求item-item相似 ...

  • 推荐算法(3):利用用户标签数据

    第一种CB 第二种 UCF 第三种 用户标签行为数据.就是人为的添加的标签,比如用户对看的一部电影打标签,写博客时作者给博客打的标签.标签分两种:一种是作者或者专家给商品打标签,一种是普通用户对商品打 ...

  • 图解抖音推荐算法

    抖音推荐算法究竟如何是做抖音短视频运营的同学非常关心的问题,抖音官方并没有披露正式的算法,但凭借着民间的智慧和官方披露的部分信息中,网友已经总结出抖音推荐算法的秘密.这里整理资料如下: 首先看短视频发 ...

  • 从零到万的粉丝:抖音的推荐算法到底是怎样的?

    为什么现在各家都要做抖音.原因很简单. 在抖音,哪怕你没有任何名气,没有一个粉丝,完全零流量,也可以在很短的时间内打造出一个100万精准粉丝的大号. 只要上传了视频,抖音平台都会自动分配精准流量,为产 ...