快捷导航
打印 上一主题 下一主题

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

[复制链接]
查看: 5654|回复: 8

该用户从未签到

5008

主题

5034

帖子

1万

积分

积分
15104
跳转到指定楼层
楼主
发表于 2024-9-2 16:50:46 | 只看该作者 |只看大图 回帖奖励 |正序浏览 |阅读模式

马上注册,结交更多淘宝商家,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

本文是阿里巴巴的一篇论文先容投稿。这篇论文被收录于2017国际知识发现与数据发掘大会(KDD),重要在商品智能排序范畴举行了研究。

这篇论文重要陈诉,客岁双11期间,淘宝搜刮在有限盘算资源情况下,怎样拿到更好的排序结果、包管用户的搜刮体验、以及点击、成交量和成交额等目标的完成。

实际的结果是,客岁双11当天,淘宝搜刮引擎的负载在最高峰也没有凌驾70%,CPU的利用率低沉了约45%,搜刮的匀称耽误降落了约30%,同时带来的GMV提升了近1%。

以下是这篇论文的详细先容。

《多层级联学习在大型电商排序体系的应用(Cascade Ranking for Operational E-commerce Search)》

作者:刘士琛,肖非,欧文武,司罗

该论文筹划并实现了一种级联式电商搜刮方式:它的重要头脑是将一次排序分成递进的多个阶段,各阶段利用徐徐复杂的特性去得到徐徐正确的结果。在靠前阶段利用简朴特性过滤显然不合要求的结果,在靠后阶段利用复杂特性辨别难以区分的结果。除此以外,算法团结电阛阓景的特殊性,严格限定了引擎的相应时间以及返回商品的数目,以包管用户的搜刮体验。

离线实行和在线实行均验证了算法的正确性以及有用性,对比传统的方法能提升正确率的同时大幅提升了盘算性能;在客岁双11,在新增了大量正确又耗时的盘算特性(包罗强化学习和深度学习特性)的情况下,算法极大的包管了引擎的服从,使排序对引擎的压力降落40%,同时使排序结果有较大提升。

面对的标题

淘宝的搜刮体系无疑是环球最大的电商搜刮体系。“最大”这里包罗商品量、用户量,包罗引导的成交额、点击成交量,还包罗引擎的访问次数、访问QPS…如许一个搜刮引擎,所须要面对的访问压力也是巨大的,尤其在“双十一”等大促场景,压力更是寻常的数倍。

别的一样寻常搜刮引擎的目标重要是引导点击,而在电商中,排序的结果更渴望引导的是成交量和成交额。

因此我们的搜刮体系、排序方案须要思量多种实际标题。起首是在有限盘算资源情况下,怎样拿到更好的排序结果;其次是怎样包管用户的搜刮体验,包罗结果返回时间、返回商品量等;末了是怎么包管电阛阓景下的多目标,包罗点击、成交量和成交额。

已有方法的不敷

学术界和工业界都有大量learning to rank方面的研究,均渴望能通过呆板学习,为用户给出更优的排序结果。然而绝大部门干系工作都会集在怎样提升排序的质量,却并不关系排序的服从,而太低效的排序方案在实际的工业在线应用中,通常是不可担当的。

淘宝搜刮和其他类似应用重要采取的办理方案是利用一种“两轮排序方案”:在第一轮利用非常简朴的特性去得到一个小的候选集;第二轮在小的聚集上做复杂的排序。但是这种启发式的方案并不能包管性能与结果的弃取是最优的。基于以上思量,我们须要一种全新的、工业可用的、能更公道平衡服从与性能的排序方案。

CLOSE排序算法,平衡性能与服从,保障用户体验

论文受图像中快速目标检测算法的启发,发现并不是引擎中的每个商品都须要全部特性到场盘算、排序——一些根本特性能资助过滤掉大多数商品;徐徐复杂的特性过滤徐徐难以区分优劣的商品;全部特性排序剩余商品。

基于如许的头脑,论文提出了一种多轮级联排序方法Cascade model in a Large-scale Operational Ecommerce Search application(CLOES)。

CLOES重要采取了一种基于概率的cascade learning方法,将排序分为多轮盘算;将排序结果和CPU的盘算量作为优化目标,一起创建数学模子,同时优化。

除了思量性能与服从,算法还思量了用户的搜刮体验,包管用户在输入任何一个query后都能在限定时间内得到富足的返回结果。末了CLOES还思量了电阛阓景的特殊性,保障了多目标的平衡与可调解。

平衡性能与服从的排序(Query-Dependent Trade Off Between Effectiveness and Efficiency)

论文最紧张的部门就是怎么样去平衡一个排序算法的性能和服从,那么我们重要利用的方法是cascade learning,即将一次排序拆分成多个递进阶段(stage),每个阶段选用徐徐复杂的特性去过滤一次商品聚集。同时我们利用learning to rank设定,将排序标题转化为一个二分类标题,预估每个商品的点击率。

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

如图所示,我们记一个商品x(表现为一个k维向量)在Query q下,能通过第j个stage的概率为

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

,此中

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

表现sigmoid函数。那么一个商品终极能被点击的概率为能通过全部stage的概率之积:

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

我们通过极大似然估计去拟合样本,利用负的log似然来表现丧失函数,那么底子的丧失函数可以表现为

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

关注的是排序的正确性:

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

此中左边项表现似然函数,影响模子的正确度;右边项

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

表现正则项,一方面是防止过拟合,另一方面能防备特性干系导致的ill-condition标题。

由于在实际的搜刮排序中,我们除告终果,性能也是不得不关注的部门,因此我们须要将体系的性能性能斲丧也加到目标中。我们可以求CPU的总斲丧即是每个stage下的性能斲丧之和:

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

。此中

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

表现每个stage上须要盘算的商品量的渴望,

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

表现商品x能进入第j个stage的概率,

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

表如今第j个stage上的feature举行一次盘算的总耗时。那么我们得到一个新的loss

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

除了思量排序的结果,分身了模子的盘算量:

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

通过调解

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

,我们能调治体系的性能与服从。

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

越大,体系负载越低,但排序结果也越差;

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

越小,排序结果越好,但体系开销越大。

用户体验保障(Multiple Factors of User Experience)

如果直接利用上述模子,确实可以直接低沉引擎的负载,但是仍旧存在2点用户体验上的标题:1是对于某些query(特殊是hot query),大概盘算latency仍旧会非常高;2是某些query(一样寻常是长尾query)下,返回给用户的结果特殊少。那么为相识决这2个标题,我们进一步的增长了2个束缚:单query下的latency不能凌驾100(只是举例,不肯定是100)ms;返回给用户的结果数不能小于200。那么很自然的,我们会想到利用类似SVM的loss情势:

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

上述公式可以比力直观的明确为当query下的latency小于100ms(N的值)的时间,loss为0;大于100ms时,loss为(latency-100)的线性倍数;返回结果数类似。然而该函数黑白凸、不可导的,并倒霉于标题的求解。因此为了求解的方便,我们利用了一个凸近似函数modified logistic loss去逼近SVM loss,可以证明,该loss和hinge loss是险些同等的,当我们取一个较大的

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

的时间:

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

综上,我们思量了用户的2种体验之后,终极的目标函数可以写成下面情势:

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

此中

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

表现渴望返回给用户的最少结果数(比方200),

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

表现渴望的最大latency(比方100ms)。通过最小化

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

,我们既能在有限的盘算资源下得到更好的排序结果,又能分身用户的搜刮体验。

商品场景下的多目标(Importance Factors of E-commerce Search)

电商搜刮与网页搜刮大概广告有较大区别:我们关注的不但是点击 ,成交量、成交额等指标同样紧张。然而如果我们将全部正样本(点击和成交)一样处理处罚,由于点击样本量宏大于成交样本,那么我们更像在学习一个CTR使命;这在我们想得到更高的成交额或GMV时是不公道的。因此我们为差别范例、差别代价的正样本设置了差别的权重。更详细的,我们会区分样本商品的log(代价)、点击和成交,于是在表现正确的似然项上,做了如下修正:

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

在上式中,

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

越大,成交样本的权重更高;

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

越大,代价因素的影响越大。权重的作用重要会表如今优化过程的梯度求解上。

离线与在线验证

为了验证算法的有用性,我们随机采样了线上一天的日志做交织验证,数据取自2016年10月尾。我们重要观察的指标有2点:测试集上的AUC以及性能总斲丧。对比的算法有1,利用全部特性做一次排序;2,利用简朴特性做一次排序;3,线上利用的2-stage方法;4,CLOES算法,取

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

;5,CLOES算法,取

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

实行结果如下表。从表中我可以看到利用全部特性的正确率无疑是最高的,然后盘算斲丧也是最高的;线上利用的2-stage方法能显着的低沉盘算服从的标题,只有方法1的30%,但是AUC也低沉到0.76。我们重要对比的是如今线上利用的方法3—2-stage approach,利用了CLOES,在险些类似的盘算斲丧下,AUC能从0.76提升到0.80;在险些类似的AUC下,盘算斲丧能从30%进一步降落到18%。

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

在离线验证了算法结果后,我们在双11前夕对算法举行了上线,以渴望低沉引擎的盘算压力。上线期间的引擎CPU利用率以及匀称搜刮latency变革如下图:可以看到CPU利用率从32%降落到18%;而匀称的搜刮latency从33ms降落到24ms,图中有2条曲线分别表现引擎的2个集群。

须要注意的是,在引擎压力大量降落的情况下,线上的排序指标,包罗CTR和GMV是略上升的。

双11当天,淘宝搜刮怎样做到更好?这篇论文给出了答案

受益于CLOES,在双11当天,引擎的负载在最高峰也没有凌驾70%,CPU的利用率低沉了约45%,搜刮的匀称耽误降落了约30%,同时CLOES自己带来的GMV提升了近1%。思量到其他由于性能改善而能上线的特性(包罗实时特性和RNN特性等),排序的CTR提升有10%-20%,同时成交量、GMV等指标也有大幅提升(指标对比基于尺度A/B Test)。

其他的实行结果以及算法细节请见原文。

总结

搜刮对于电商来说是最大的流量入口,搜刮排序的质量对用户的体验、对商家的收入、对平台的服从都会起到至关紧张的作用。未来搜刮会继承以用户的搜刮体验为重要目标,为用提供能更优质、更能满足用户个性需求的排序结果。

从技能上,多种呆板学习技能都会与搜刮排序干系,比方:思量到用户的长期体验,我们须要强化学习技能;思量数据的分布差别等等标题,须要counterfactual learning技能;思量更好的个性化体验,须要representation learning的干系技能;思量更具交互性的搜刮,我们须要自然语言处理处罚,知识图谱等方面技能……淘宝搜刮会一连的优化用户的购物体验,同时渴望贡献更多精良的算法、办理方面给工业应用及学术研究。

论文下载

https://arxiv.org/pdf/1706.02093.pdf


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!




上一篇:上石美工包月 中小商家排名靠前应该怎么做?
下一篇:淘宝卖家该怎样从细节入手,快速提拔店肆的权重和流量,突破逆境
这里可以随意广告或签名,发布主题后即可显示,设置方法:右上角【我的设置-个人信息-个性签名】
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩推荐

让创业更简单

  • 反馈建议:admin@tao92.com
  • 工作时间:周一到周五 10:00-19:00
  • 淘九二电商网祝您店铺火火火!!!

云服务支持

精彩文章,快速检索

关注我们

Copyright   ©2015-2016  淘宝卖家开店运营论坛_淘宝卖家经验交流学习社区  Powered by©Tuyuanma  技术支持:tao92