本文作者:小旺

常用推荐算法,常用推荐算法有哪些

小旺 02-14 10
常用推荐算法,常用推荐算法有哪些摘要: 什么是算法推荐服务?今日头条是如何做推荐算法的?今日头条的机器算法推荐,是根据什么计算的?什么是算法推荐服务?推荐算法是计算机专业中的一种算法,通过一些数学算法,推测出用户可能喜欢...
  1. 什么是算法推荐服务?
  2. 今日头条是如何做推荐算法的?
  3. 今日头条的机器算法推荐,是根据什么计算的?

什么算法推荐服务?

推荐算法是计算机专业中的一种算法,通过一些数学算法,推测出用户可能喜欢东西,目前应用推荐算法比较好的地方主要是网络,其中淘宝做的比较好。所谓推荐算法就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。推荐算法主要分为6种。

今日头条是如何做推荐算法的?

作为行业先行者的今日头条,主动将算法原则公开,也体现了这种开放态度,这展示了一个商业公司反哺互联网行业的正确姿势,也展现了一家技术平台的责任感。公开独门秘笈也是一种大格局!

你关心的才是头条”,今日头条自2012年创 建以来就打出这样的广告语,可见其对用户体验的 重视程度。比起内容生产者,今日头条更倾向于用 数据分析的领先者来定位自己,其个性化新闻推荐 系统应用引起了社会的广泛关注。

针广受众议的今日头条算法,现根据已有知识学习经验,现总结如下文,如有不同意见欢迎评论区交流、指正。

一、传统推荐算法介绍

(1)基于用户的协同过滤

基于用户的协同过滤算法是基于这样的***设:偏好相似的用户,一般有相同的物品兴趣,如电影如果存在一个和目标用户具有相似偏好的群体,那么该群体喜欢的其他电影,目标用户很有可能也喜欢。所以在为目标用户进行推荐时,可以先找到这样的用户群体,然后将该群体喜欢,而没有被目标用户看过的电影推荐给他。

常用推荐算法,常用推荐算法有哪些

(2)基于内容的协同过滤

基于内容的协同过滤算法,根据已经对项目评价过的数值,找出类似的项目并推荐给用户。与基于内容的推荐不同,前者基于用户的历史评分数据。如果大多数喜欢项目A的用户也喜欢项目B,则后者基于项目本身的内容特征。

常用推荐算法,常用推荐算法有哪些

二、头条的具体推荐算法

今日头条的推荐系统算法,如果用形式化的方式去描述实际上是拟合一个用户对内容满意度的函数,这个函数需要输入三个维度的变量。

第一个维度是内容。头条现在已经是一个综合内容平台,图文、视频、UGC小***、问答、微头条,每种内容有很多自己的特征,需要考虑怎样提取不同内容类型的特征做好推荐;第二个维度是用户特征包括各种兴趣标签,职业、年龄、性别等,还有很多模型刻划出的隐式用户兴趣等;第三个维度是环境特征。这是移动互联网时代推荐的特点,用户随时随地移动,在工作场合、通勤、旅游等不同的场景,信息偏好有所偏移。

常用推荐算法,常用推荐算法有哪些

三、头条与其他公司的算法对比

(1)百度

百度是搜擎起家,数据基础是海量的三方网页。

百度用到的算法实际维度会成熟很多,信息维度包含了信息覆盖的广度、用户搜索趋势、信息变化趋势、用户的点击反馈、以及内容源的PageRank算法。另外还整合了些人工整理,所以,在大数据概念火起来之前,百度在算法上就已经遥遥领先了,搜擎算法应该还是一个全局召回的模块,在群体和个性化方面表现并不出色,百度还是局限于优势反制,在移动端的发展不够好制约了个性化算法上的探索。

(2)腾讯

腾讯最重要的数据就是用户及用户关系了。

记得非常早期的时候,听百度桌面的团队宣讲过他们在用户画像上的调校,用户的基础信息,都可以通过用户的关系调校到正确的水平,比如QQ上用户填了年龄是3岁,仍然可以从关系人群中校正真实的年龄。

(3)阿里

阿里推荐算法技术更是应用到多领域了。

团队自主创新的MLR模型和算法,在阿里业务中大范围推广和应用带来了非常好的效果,另外在大数据智能方面,因为省去特征工程,具备了从数据接入到应用的全自动功能。阿里的人群广告定向算法,当然淘宝的商品排序、千人千面也***用类似算法,只是在这个算法基础上增加销量等其他权重,但展现量的高低,很大程度上看的还是点击权重。根据算法可以一窥直通车等推广工具得分、关键词与商品关联性高低、等一系列与展现有关的算法模型。

总结

不管是平台自己生产的原创产品,还是“他山 之石”,今日头条作为一个平台,应当对用户接收的内容产品质量负责。因此平台应做到净化环境, 提高平台的内容质量,与知名原创作者签约,加强与相关媒体机构的合作,解决版权问题

如今的算法大多还在发展期,作为以算法见长的平台应着力完善算法,努力实现数字化、 智能化,使算法尽量完整准确地对人们信息需求的重点和全貌进行画像,更好的了解用户。完善后的 算法不应是只推送用户偏爱的内容,还要适量的渗透一些社会主流价值的内容,帮助用户打破信息茧房,使用户对社会有一个较为全面的认知,以免与社会脱节。

今日头条的算法一直为外界所诟病,就连人民日报都曾发文点名批评。

在题为《向今日头条等低俗信息传播通道亮红牌》的文章中,人民日报写道:

“算法推荐”的信息有多不靠谱,多么无底线,广大网民特别是孩子们的家长感同身受,甚至伤痕累累。

人民日报指出,今日头条上存在大量低俗信息,甚至垃圾信息。今日头条是以新闻的名义,打着“算法推荐”的幌子,让各种良莠不齐的信息充斥网民手机。只要有粘度、流量,能带来利益就推,什么低俗离奇推什么,这不仅侵占了网民有益阅读空间,还损害了社会道德。今日头条随机整改,清理违规账号。

今年1月11日,今日头条召开分享交流会,首次公开分享了今日头条推荐算法的基本原理。

今日头条资深算法架构师、中国科学技术大学计算机博士曹欢欢在分享会上表示,

算法分发并非是把所有决策都交给机器,我们会不断纠偏,设计、监督并管理算法模型。希望这次分享能让更多的人理解算法,并共同参与到算法模型的制定中来,以改善算法,更好的为用户服务,让算法为社会创造更大的价值。”

曹欢欢还介绍了头条使用的五种推荐算法,包括传统的协同过滤模型,监督学习算法Logistic Regression模型,基于深度学习的Factorization Machine,以及DNN和GBDT。(这五种算法具体是[_a***_]实行,可能要点儿专业知识储备才懂?emmmm…小编也不太明白)

不过,曹欢欢也说,由于现在很难有一套通用的架构模型适用于所有的推荐场景,所以很多公司会做多个算法的组合。

他还透露,以下四种特征将会影响到推荐:

第一,是相关性特征,即评估内容的属性和维度与用户是否匹配。说白了,就是将符合你平时喜好领域的相关内容推荐给你。

第二,是环境特征,即地理位置时间

第三,是热度特征,即全局热度、分类热度,主题热度,以及关键词热度等。

第四,是协同特征,指通过用户行为分析不同用户间相似性,比如点击相似、兴趣分类相似、主题相似、兴趣词相似,甚至向量相似,从而扩展模型的探索能力,部分解决所谓算法越推越窄的问题。

今日头条的机器算法推荐,是根据什么计算的?

(上)

1.今日头条的双标题功能,标题非常的重要,双标题则可以推荐更多的用户,同样的一篇文章,其中一个标题会比第二个标题的推荐的用户更多。

2.列举古代敬惜字纸的例子,中国古代对字纸非常崇拜。因为字=内容生产= 传播分发。古代内容生产和内容分发是完全合一的,而现代内容生产和内容分发则是分离的。

3. 看待咨讯发展的一个特别视角,关键词就是内容生产和内容分发。南方周末黄金时代的三驾马车说法,一个报社最重要的三股力量是***编、经营、发行。

4.影响内容生产、内容分发的三大因素:受教育人口质量与数量,技术进步和机制。

(中)

1.互联网技术发展,门户互联网开始诞生,少数网站有内容***编的权力,集纳所有的媒体内容,让全国人民来看,即门户模式。门户网站对资讯的传播非常重要,门户网站的分发能力非常强。

2.07,08年中国进入内容与分发双轨制时代。报社掌握内容生产和分发,互联网放大分发效果,中心式分发推动乏力。

2.非中心分发模式有两种:算法分发和社交分发。

3.移动互联网推动非中心式分发大爆发:上网人数提升,在线时长提升,人机合一。

4.非中心式分发推动资讯大爆发。

5.社交分发有利有弊,粉丝价值,冷启动难,红利消失,不够精准。

6.重大变量:短***拉低内容生产和消费门槛。

(下)

1.算法推荐的基本流程:消重,审核和推荐。

2.算法推荐对内容生产的新需求 :数量,质量和丰富性。

3.算法推荐对内容质量的把控:拦截低质,奖励优质,模型识别,注重反馈。

头条的推荐算法不完全依赖粉丝数,所以即使你没有粉丝,也有可能在头条平台上创作出10万甚至上百万阅读量的爆款内容,那既然不依赖粉丝数,头条是如何推荐的呢?

一篇文章发布后会经过一轮推荐周期:初审、冷启动、正常推荐、复审

常用推荐算法,常用推荐算法有哪些

初审,一般是机器进行审查,我们在创作完成后也可以使用头条的灵犬进行测试,看看文章是否符合要求,每个平台的要求都不一样,你在头条上过审了,但是百家号不一定过审。那机器审查些什么东西呢,主要是检查文章有没有“触雷”,其次是查重和原创保护检查。

冷启动,过初审后系统把你的内容推送给一小批可能对你内容感兴趣的人群,然后根据这个人群的反应,比如说读完率、点赞互动评论的整体情况,对你进行下一轮的正常推荐,这一阶段非常重要。

正常推荐,如果冷启动阶段,文章互动率比较高,点赞,评论都很好,收藏量也很多,那么系统就会给你加大推荐,推荐给更多的用户。

复审,当推荐到一定程度后,系统会给用户的反馈情况进行复审,比如说有人举报,或者负面评论过多,如果在复审种,发现你属于标题党或者内容过于负向,将系统将会不再推荐,这一阶段会有人工参与,这是你是否成为爆款的最后一步,很多一开始几万阅读,然后就不推荐了,就是在这一步被终止了。

以下四类模型会对推荐起重要作用

常用推荐算法,常用推荐算法有哪些

第一类是相关性特征,就是评估内容的属性和与用户是否匹配。

显性的匹配包括关键词匹配、分类匹配、来源匹配、主题匹配等。像算法模型中也有一些隐性匹配,从用户向量与内容向量的距离可以得出。

第二类是环境特征,包括地理位置、时间。

这些既是偏置特征,也能以此构建一些匹配特征。

第三类是热度特征。

包括全局热度、分类热度,主题热度,以及关键词热度等。内容热度信息在大的推荐系统特别在用户冷启动的时候非常有效。

第四类是协同特征,它可以在部分程度上帮助解决所谓算法越推越窄的问题。

协同特征并非考虑用户已有历史。而是通过用户行为分析不同用户间相似性,比如点击相似、兴趣分类相似、主题相似、兴趣词相似,甚至向量相似,从而扩展模型的探索能力。

总结

头条推荐算法并没有对外公布具体参数权重,所以想要获取更多的推荐量,还是得创作出高质量的内容,这一点对于所有平台都是最重要的。

我是非著名攻城狮,希望我的回答对您有用,感谢您的关注与支持!

关键词、关键词、关键词!

重要的事情说三遍。

这个问题之前我先问你几个问题:

1.如果一个人迎面向你走来,你是如何判断他是男人还是女人的呢?

答案是:用眼睛看他的外观,看他的穿着打扮。

对于一般人来说长头发的就是女人,短头发的就是男人;穿男***装的就是男生,穿女性服装的就是女人;比如穿裙子的必定是女人。还可以看相貌。

2.如果让你找到你的老公,你去哪里找呢?

答案是:根据经验,如果他没有在你的身边,那么有很大概率是在家里或者公司。

3.如何在一群人当中找到你喜欢的?

答案是:你可能喜欢漂亮的,也可能喜欢个子高的,也可能喜欢肤白貌美的,也可能喜欢水蛇腰的,以至于这些特征,你就能够在一群人当中一眼找到自己所喜欢的那一个人。

4.如何让一群人同时在人群中找到一个人?

答案是:把这一个人的外貌特征告诉这一群人。

根据上面的问题,你有所察觉了吗?

常用推荐算法,常用推荐算法有哪些

第1个问题当中,你要判断一个人是男人还是女人,只能是通过他的外貌特征去判断,嗯,他的外貌特征包括了头发,相貌,穿着打扮等等。

在头条上你喜不喜欢看一篇内容直接看标题基本上就知道了,说白了,这就如同你判断一面走来的这个人是男人还是女人一样,你所关注的只有那几个关键点,这几个关键点就是关键词

第2个问题中你知道自己的老公是在哪里,是因为你有过往的经验,这如同在头条当中,我们要想找到自己喜欢的内容,那就直接去相对应的领域寻找,如何确定领域呢?这是一种约定俗成的关键词标注的方法。

比如你和你的老公约定俗成,他要么是在家里,要么是在公司;你和头条APP约定俗成,你想看的内容只能是在相对应的领域之下。

第3个问题当中,如何在一群人当中找到你喜欢的?当时你有自己的审美标准,可以一眼就从千千万万的人当中找到自己最喜欢的那一个,所谓的自己的审美标准其实就是一个个的关键词,比如上面所说的肤白貌美、细腰长腿。这和我们在千千万万的头条内容当中,找到自己所喜欢的那一个是完全一样的。

都是通过一些自己所喜欢的关键词找到自己所喜欢的内容

第4个问题当中,如何让一群人同时在人群当中找到一个人,这其实与我们平时在浏览器当中搜索,相对应的内容是一样的,我们需要输入不同的关键词匹配出来的内容,那一定是我们需要的。

如果没有,那就加大对关键词的搜索

常用推荐算法,常用推荐算法有哪些

明白了这些道理之后,那我们就来回答这个问题的本身,头条是属于机器分发,每一条内容上传之后都要进行机器审核,进而给一篇内容打上各种各样的关键词,再把它推送给喜欢这些关键词的用户

说白了就是你所喜欢的这个关键词,正好和这一篇文章的关键词相匹配,所以机器就把它推荐给你了。

所以说头条的机器推荐说白了就是一个关键词的标注

***如你的文章当中有100多个关键词,恰好在头条的用户群当中,有1000个人喜欢这个内容,所以自己会把这一篇内容分发给他1000个人,看他们是否喜欢?

如果喜欢那就扩大关键词范围,让文章关键词相对应的或者是相关联的关键词用户看到这篇内容,如果他们也喜欢,那么就继续扩大关键词范围,也就是所谓的扩大推荐量。

如果你的文章当中有100多个关键词,头条的用户当中并没有人喜欢这些关键词,那么你的文章可能阅读量就会很低,因为推荐量很低,最本质的原因是大家都不喜欢这些关键词。

还有一种可能是把你的内容推荐给1000个用户之后,发现这些用户并不喜欢你的那种,那他就会降权处理,所谓的降权处理指的就是这样的推荐量,因为机器判定你的这篇内容可能是相对来说比较低质量的,或者是没有价值的。

这里还有一点比较重要,头条的机器审核当中,本来就嵌入了一些违规的词汇,如果你正好在文章当中使用了这些词汇作为自己文章的关键词,那么你的文章会被头条机器判定为质量差或者违规,他会进行打压处理,甚至有可能直接判定违规。

严重的可能会封号。

常用推荐算法,常用推荐算法有哪些

以上就是我对头条机器审核、算法推荐的理解,希望对你有用!

文章版权及转载声明

[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系邮箱:83115484@qq.com,我们会予以删除相关文章,保证您的权利。转载请注明出处:http://www.beizi123.com/post/12498.html发布于 02-14

阅读
分享