手把手教你处置介绍系统中的位置偏向疑问

介绍系统最早的算法是 年发明的协同过滤。自协同过滤算法降生之日起,人们便与介绍系统中的各种不偏心现象作奋斗。只管介绍系统中的不偏心现象宽泛存在,并且重大影响了介绍系统的生态肥壮开展,这些现象真正惹起人们关注却要等到2 在人类的人工智能开展历程中有个里程碑事情,就是国际学术会议 Fa 的创立。这个会议专门针对人工智能伦理,可以说把人工智能中的品德疑问,包含介绍系统中的不偏心性疑问,泄露给了全环球的钻研者。

那么疑问来了,什么是介绍系统的不偏心性?介绍系统作为一种算法,重要为用户介绍它或许感兴味的东西。该算法会产生适度采购抢手产品、在介绍列表顶部介绍的东西过热等等一系列不偏心疑问。其中在介绍列表顶部介绍的东西过热的疑问,被称为位置偏向疑问( ),惹起了学者的宽泛关注。

咱们应用正则化的方式来处置位置偏向疑问。首先 咱们把矩阵合成算法作为原生算法。矩阵合成算法的损失函数定义如下:

矩阵合成的实质就是应用降维手腕修还原始矩阵中的缺失值。在损失函数的定义里,R 就是原始矩阵中已知的评分数据,U 是东西特色向量。在实践的经常使用环节中,损失函数须要启动处置能力经常使用。处置之后的损失函数如下:

经过处置之后,算法可以防止数据产生意外值。咱们可以从另外一个角度去看这个疑问,咱们可以以为其实矩阵合成是保角降维运算( 就是从高维空间降维处置过之后的向量空间。

咱们假定在介绍系统中,系统给每个用户都介绍了一个东西列表。这个东西列表中一切的东西都被陈列上了。因此,最差的曝光状况就是一个东西被排在了列表最低端。所以 咱们可以应用这一点,设计出一个正则化项,用来处罚损失函数 L

是东西在介绍列表中的位置,而 m 是一切东西的数量。由于介绍列表中存在幂律效应,也就是越抢手的东西越容易出如今列表的上方,而这类东西用户评分往往很高。因此咱们把损失函数 L

上方咱们用随机梯度降低方法来对损失函数 L 启动求解,获取了如下公式:

以上就是整个算法的流程。该算法由 北京达评奇智网络科技有限责任公司

上方咱们探讨一下该算法在不同的数据汇合上的体现 作者驳回了两个不同的数据汇合启动算法测评:M ovieLens 1 Million>

区分是该算法和另外几种算法在 数据集上的测评效果,可以看到,不论是在准确率(测评目的为 Mean ),热度偏向目的还是位置偏向目的的测评上,该算法均体现优秀。

数据汇合上的体现。与上一组数据相似,该算法的性能体现出众,能够很好的处置位置偏向疑问。

介绍系统中的不偏心现象由来已久,随着近些年来人们关于介绍系统的关注度不时地优化。介绍系统偏心性疑问也惹起了越来越多人的关注。介绍系统中关注最多的不偏心性疑问其实是盛行度偏向(P

前期大少数跟进上班重要驳回正则化项的方式启动。 的方式将用户和东西排名作为变量,嵌入到矩阵合成算法中,取得了不俗的效果。本文所引见的算法,沿用了传统的正则化项的思绪,应用了介绍系统中的幂律现象,成功对介绍系统中的位置偏向启动建模,较为令人满意的处置了该疑问。

随着商品化大潮愈演愈烈,以及最近几年的环球经济不景气。越来越多的企业主开局关注自己的短期利益,而疏忽所谓人工智能伦理等短期收益仿佛不如传统方法,然而常年收益却能使公司建设起完善的生态体系和出色的品牌效应的技术方向。假设咱们不处置介绍系统的马太效应,咱们会发现介绍系统的生态会变差:比如在游戏中,咱们给用户介绍玩家联盟。最有效的方式其实或许是介绍人数最多的前 个联盟,但假设咱们为了谋求点击率就这么做,毫无不懂会把剩下的联盟所有搞死,整个产品的生态也就完了。所以有的时刻,咱们就算是就义了由点击率优化带来的经济效益,也应该把产品的口碑和生态搞好。而本文引见的算法,就提供了这样一种思绪。

汪昊,前 Funplus 人工智能试验室担任 。曾在 ThoughtWorks、豆瓣、百度、新浪等公司担任技术和技术高管职务。 在互联网公司和金融科技、游戏等公司任职 13 年,关于人工智能、计算机图形学和区块链等畛域有着深入的见地和丰盛的阅历。在国际学术会议和期刊宣布论文 42 篇,取得IEEE SMI 2008 最佳论文奖、ICBDT 2020 / IEEE ICISCAE 2021 / AIBT 2023 / ICSIM 2024最佳论文报告奖。

您可能还会对下面的文章感兴趣: