您当前的位置:首页 > 新闻 > 科技

从0到1,基于内容的推荐算法的产品设计

时间:2020-03-31 14:03:05  来源:  作者:

 

从0到1,基于内容的推荐算法的产品设计

 

一、前言&定义

可能很多和笔者一样非数据或算法科班出身的产品同学在涉及到需要进行内容推荐的产品时无从下手,尽管在网络上可搜索到各种算法的基本原理和公式,但或过于专业或直接呈现最终逻辑,但具体怎么做还是一头雾水,笔者抛开理论和复杂的公式,直接从产品出发设计一套最小可行性从0到1的推荐算法能力

 

什么是基于内容的推荐算法

基于内容的推荐:核心思想是根据推荐物品或内容的元数据,发现物品或者内容的相关性,然后基于用户以往的喜好记录,推荐给用户相似的物品。

从0到1,基于内容的推荐算法的产品设计

简单地理解就是:根据用户过去喜欢的内容,为用户推荐和他过去喜欢的内容相似的内容。

 

二、算法整体架构说明

1. 明确算法目的

我们在最开始做推荐算法时,要清楚初始阶段目的:即在保证内容质量的前提下根据用户行为推荐尽可能符合用户期望的丰富内容。

这句话虽然很短,但包含了三个很重要的关键词:内容的质量、内容丰富(多元)度和符合预期。

 

2. 推荐算法整体逻辑

基于推算的场景,我们很容易发现推荐逻辑:用户在线进行操作行为时,系统向后台发起用户数据召回请求,然后根据排序模型形成最终用户看见的内容,最后通过用户的请求和记录完善用户行为,以进行后续的内容匹配。常见的推算下图:

从0到1,基于内容的推荐算法的产品设计

图片虽然看起有点复杂,抽丝剥茧就三个核心:一套内容管理后台+多个权重算法+展示逻辑。

 

3. 推荐算法产品框架

基于算法逻辑和最小可行性目的,我们可以整理出简单的产品框架,如下图:

从0到1,基于内容的推荐算法的产品设计

很明显算法推荐公式可以不用立马就建立一套复杂的算法模型,只要有基础的用户管理、内容管理能力,结合内容质量权重和用户喜好权重,考虑到去中心化和时效应影响,就可完成在保证内容质量的前提下根据用户行为推荐尽可能符合用户期望的丰富内容。

 

三、具体算法权重设计

1. 质量管理评分公式

质量评分总得分Score由三大模块得分加权计算得出,其公式如下所示:

(系数可根据业务情况自行调整,起始分为100)

其中A、B、C为三大模块各自得分值。Score得分为三大模块得分乘以各自对应系数。

各模块得分由其多项评分指标及对应系数加权计算得到,此处以A模块为例:

其中为A模块下对应的各项指标得分, 为各项指标得分所对应的权重系数。

A-内容流量模块评分

内容流量为是内容对流量的吸引能力体现,初始化的产品建议的核心热度加权:停留时间(退出率)>评论量>点赞量>收藏量>PV/UV>转发量。下表为案例:

从0到1,基于内容的推荐算法的产品设计

B-内容质量模块评分

主要根据后台内容的状态进行评断,在机审能力未完全搭建以前,本模块受到人工影响较大。

从0到1,基于内容的推荐算法的产品设计

附:评分公式

目前对于内容推荐型的评分算法,推荐贝叶斯平均评分法作。其公式如下:

其中,n为当前内容的评分次数,M为总内容平均得分,S为单个内容总得分,C为动态系数。

单个内容评分得分 = (总内容的平均得分 * C系数) + 单个产品的评分总和) / (当前内容的评分次数+ C系数)

C系数为每个内容的被评分的平均次数,即C=所有内容被评论的总次数/所有内容数量。例如:总共有1000个文章 一共被评论了50000次,那C就等于50000/1000=50。

小例:

从0到1,基于内容的推荐算法的产品设计

(贝叶斯平均法评估示例)

结论:以贝叶斯平均为依据的排序更能反应真实的情况,打分次数多且评分较高的产品会更加靠前,打分次数多评分较低的产品则会更加靠后,与单纯依据每个产品的平均分排序相比,这种结果更有意义。

C-用户质量模块评分

用户质量根据后台人工标识用户属性加上其发帖质量2个维度构成。

从0到1,基于内容的推荐算法的产品设计

 

2. 用户喜好评分公式

用户行为记录是获取用户相关推荐的主要依据,初期是根据用户关注、浏览喜好以及用户搜索关键词对用户喜好进行统计,基本的逻辑如下:

从0到1,基于内容的推荐算法的产品设计

喜好评分=浏览喜好分类*0.6+关注人内容*0.4 +搜素内容分类*0.0

(系数可根据业务情况自行调整,起始分为100)

从0到1,基于内容的推荐算法的产品设计

举例说明:

(1)通过用户的浏览记录,获得用户的喜好标签

从0到1,基于内容的推荐算法的产品设计

那么对于同一分类下的内容按照公式增加喜好值。

(2)获取用户的关注用户,获得喜好标签

从0到1,基于内容的推荐算法的产品设计

那么对于关注用户下的内容按照公式增加喜好值。

(3)如果内容1属于分类A,并且是用户D创建的,这个内容对于用户来说就是两个权重值相加 =查看内容分类*0.6+关注人内容*0.4

 

四、前端展示权重设计

通过质量评分和用户喜好评分,我们能得到以内容为主。针对不同用户的内容质量和喜好评分值,那么就可以得到一个简单的推荐逻辑(推荐列表):按照用户喜好评分推荐质量评分较高的内容,若得分相同则按内容创建时间倒序排列进行推荐。

但在实际推荐中除了保证用户喜好外,需要尝试去中心化的内容展示模式,所以最终展示的推荐内容,应该来自三个模块:

A、用户喜好列表:通过用户喜好评分,为用户推荐内容评分质量较高的内容,这是主要推荐内容。

推荐逻辑:先对内容按照用户喜好值进行从高到低的排序,再喜好值A以上的内容中依次健康值高于阀值B、阀值C、阀值D的内容随机推荐,低于阀值D不进行推荐。

B、高质量非喜好列表:用户喜好值低于某个阀值但内容流量评分较高的内容。

C、初始流量推荐列表:通过用户喜好评分,为用户推荐内容质量审核过但流量不高的内容。

从0到1,基于内容的推荐算法的产品设计

老用户算法为:Score=A*0.7+B*0.2 +C*0.1(系数可根据业务情况自行调整)

其中0.7、0.2、0.1位A、B、C为三大模块初始系数,它受到时间效应变化。

新用户冷启动的算法为:ScoreL= B*0.9 +C*0.1

其中B模块直接调用流量池健康评分。

注意:喜好评分和健康值相同时,随机选取加载量,在同一轮加载过程中同一信息需要剔重。

 

1. 时间效应计算方式

为了进一步去中心化,以及推荐准确性,根据热度冷却公式:

本期系数 = 上期系数 x exp(-(冷却系数) x 间隔的小时数)。T为初始热度,此处默认为0.7,为上一期温度,为冷却系数,为间隔小时数。

 

五、关于A/B测试

推算推荐更加需要进行A/B test,因为我们在初始化的过程中,具体的权重设置是否合理是无法得知的,但是能保证的时没有垃圾推荐的流出,所以A/B测试结果对优化权重格外重要,将用户分流至对应方案内,在保证每组用户特征相同的前提下,根据用户的真实数据反馈,帮助产品决策。当然随着测试样本变多对技术架构考验越大。

 

六、尾声

正如开头所说本文的算法是剥离于内容推荐算法理论公式,根据实际产品出发进行的设计,其核心是保证内容质量的前提下根据用户行为推荐尽可能符合用户期望的丰富内容,具有相当的局限性,它适用于没有完善的算法团队和进行最小可行试验的产品。希望文章对和我一样没有算法基础的同学带来帮助和启发,野路子的产品悲哀。欢迎大家交流。

本文由 @jingtianz 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议



Tags:产品设计   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
产品设计实际上是一个广泛的概念,其中包含系统的思想生成和发展,最终导致了新产品的创造。设计概念和思想,最终将其转化为有形的产品和发明。工业设计师不仅关注产品的外观,而...【详细内容】
2021-01-12  Tags: 产品设计  点击:(189)  评论:(0)  加入收藏
汽车是生活交通工具,它的造型很精致,线条有艺术也很迷人,性能也相当不错,受全球人民的喜爱与追求。在制造业中很多企业转变仿真玩具车或装饰品那么它是如何设计的呢?下面我们一...【详细内容】
2020-07-09  Tags: 产品设计  点击:(136)  评论:(0)  加入收藏
一、前言&定义可能很多和笔者一样非数据或算法科班出身的产品同学在涉及到需要进行内容推荐的产品时无从下手,尽管在网络上可搜索到各种算法的基本原理和公式,但或过于专业...【详细内容】
2020-03-31  Tags: 产品设计  点击:(89)  评论:(0)  加入收藏
玩快手两个月,从产品设计和作品的传播算法两个层面谈一下自己的感受。一、产品设计进入快手看到的三个菜单:“关注”、“发现”、“同城”。这三个菜单,是用户发出的作品能够进...【详细内容】
2019-10-25  Tags: 产品设计  点击:(146)  评论:(0)  加入收藏
▌简易百科推荐
非法购买公民信息、开发人脸认证规避技术……今年年初,广东省公安厅网安部门侦破全国首例破解“青少年防沉迷系统”的新型网络犯罪案件,抓获犯罪嫌疑人13名,查处非...【详细内容】
2021-12-28    人民日报客户端  Tags:数据安全步   点击:(5)  评论:(0)  加入收藏
就在今天,腾讯方面宣布将在2022年1月31日下架企业QQ和营销QQ,其实这一消息的降临并不让笔者意外,因为早在今年的10月28日20点之后,企业QQ和营销QQ就被停止了续费服务。相信很多...【详细内容】
2021-12-27  科技探险家    Tags:企业QQ   点击:(22)  评论:(0)  加入收藏
日前,上海交通大学发布《全球电竞之都评价报告》,对全球15个致力于发展电竞之都的城市进行评价,上海作为中国城市电竞发展的排头兵,其拥有众多优质电竞企业及完整产业集群,因此排...【详细内容】
2021-12-27  经济日报    Tags:电竞   点击:(3)  评论:(0)  加入收藏
为优化网络氛围环境,微博又开始整顿用户信息了。本月月初,微博官方发布公告,要求昵称中带有如“二货”“SB”“瘪三”“娘炮”等明显低俗或侮辱性词汇的用户尽快修改,否则将面临...【详细内容】
2021-12-24  运了个营    Tags:微博   点击:(10)  评论:(0)  加入收藏
昨日谷歌宣布,自2022年12月19日开始停止对OnHub的软件支持,OnHub路由器仍将提供Wi-Fi信号,但用户无法用谷歌Home应用程序管理它。无法更新Wi-Fi网络设置、添加额外的Wifi设备或...【详细内容】
2021-12-22  雷峰网    Tags:Google OnHub   点击:(5)  评论:(0)  加入收藏
IT之家 12 月 20 日消息,百度网盘青春版 iOS 客户端今日晚间率先开启内测,安卓客户端将在稍后内测。使用苹果 iPhone 的IT之家小伙伴可以点此下载内测版,需要先下载 TestFlight...【详细内容】
2021-12-21  IT之家    Tags:百度网盘   点击:(10)  评论:(0)  加入收藏
对于拼车单,是接还是不接,不少网约车司机表示很矛盾。接吧,钱少事多,常常跑了个寂寞,不接吧,车多客少,挑三拣四没饭吃。 在平台大力推广拼车单之下,不少司机迫于生活压力,最终还是打...【详细内容】
2021-12-17  网约车情报分享    Tags:滴滴   点击:(9)  评论:(0)  加入收藏
蓝鲸TMT频道12月16日讯,据饿了么官方微信公众号,近日,在圆桌会上,蓝骑士与平台交流了配送安全问题。饿了么表示,线上将技术手段融入安全防护;线下将持续进行安全培训,并试点智能头...【详细内容】
2021-12-17    金融界  Tags:饿了么   点击:(24)  评论:(0)  加入收藏
开源最前线(ID:OpenSourceTop) 猿妹编译项目地址: https://github.com/restic/restic全球知名代码托管平台 GitHub 今天就重磅发布了今年的年度报告——《2021 年度 O...【详细内容】
2021-12-17  Python部落    Tags:   点击:(9)  评论:(0)  加入收藏
新京报快讯 据中国网络视听节目服务协会网站消息,12月15日,中国网络视听节目服务协会发布了《网络短视频内容审核标准细则》(2021)。中国网络视听节目服务协会组织有关短视频平...【详细内容】
2021-12-16    新京报  Tags:短视频   点击:(11)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条