淘宝卖家开店运营论坛_淘宝卖家经验交流学习社区

标题: KDD'23 | 阿里淘宝:重新审阅搜索粗排 [打印本页]

作者: 运营笑笑    时间: 2024-8-5 17:01
标题: KDD'23 | 阿里淘宝:重新审阅搜索粗排
KDD'23 | 阿里淘宝:重新审阅搜索粗排

本文约3600字,发起阅读5分钟本文先容了阿里淘宝搜索的最新工作模块。


各人好,我是kaiyuan。迩来大模子LLM的各类信息有种乱花渐欲迷人眼的感觉,刷几篇KDD'23的文章岑寂一下。


本日禀享阿里淘宝搜索的最新工作,发表在KDD'23上:Rethinking the Role of Pre-ranking in Large-scale E-Commerce Searching System[1]。【团体思绪非常清晰样,用的评估指标、模子框架等,同样可以应用在向量召回模块】。


KDD'23 | 阿里淘宝:重新审阅搜索粗排


论文对电商搜索粗排模块举行重新定位,提出了新的离在线同等性更高的评价指标,并基于此优化全域多目的学习框架(All-Scenario-based Multi-Objective Learning framework,ASMOL ),AB测试结果GMV提升1.2%。


现在大厂的搜索体系根本是多阶段级联架构,如下图,告急由召回、粗排、精排、重排等部门构成。


KDD'23 | 阿里淘宝:重新审阅搜索粗排

粗排作为承上启下的模块,受限于算力等因素,模子告急有两种演进门路:



固然模子结构有差别的演进门路,但粗排的目的比年来不绝是比力明白的: 聚焦在怎样对齐精排的排序本领上 ,一些评估指标也以AUC、精排同等性为主。乃职苄些团队的粗排模子练习数据仍和精排保持同等,这会带来严厉的SSB题目(下文会详细先容)。同时, 疯狂地拟合精排,固然短期会带来部门收益,但从长期看会带来严厉的马太效应 。


着实,跳出这个怪圈,我们没须要把粗排架得那么高,粗排模块只须要 从大量的候选中找到一个服从最优的商品聚集即可 ,对这些商品的排序只是一个附加要求(否则要精排干啥呢 对吧)。


重界说评估指标:全域Hitrate


做过召回的同砚都清晰,离在线指标对齐是一个非常头疼的题目。由于召回模块位于团体搜索链路的最底层,中心存在各个模块的复杂逻辑,到终极曝光给用户,离线指标的收益很难与在线转化指标很好地对应。


粗排也同样面对如许的题目,先容全域hitrate之前,先来看看通例的评价指标。粗排位于全链路的中心,须要同时思量 「召回->粗排」 以及 「粗排-> 精排」 两阶段的丧失,才华做好承上启下的工作,单看任何一部门都是片面的。


启下:粗排->精排丧失权衡


精排更注意商品的排序精度,因此以下粗排指标也雷同


  1. AUC :曝光空间下的AUC,有购买活动的商品作为正例。淘宝搜索一页哀求会出10个商品,通常使用AUC@10来权衡,精排模子也使用该指标,因此可以借此评估粗排和精排的同等性水平;
  2. 粗排hitrate@10 :粗排越头部的商品能带来更多搜索场景内成交,分析粗排排序本领更强,与精排本领更靠近;
  3. 曝光商品粗排总分与精排服从分数的NDCG/逆序对 :对雷同商品聚集,粗排打分和精排打分的排序差别,差别越小,分析两者越靠近。


承上:召回->粗排丧失权衡


承上阶段,粗排须要更多关注商品聚集的优劣,这与召回的目的是同等的,通常使用hitrate@k来权衡。

KDD'23 | 阿里淘宝:重新审阅搜索粗排

分母是全部正例聚集(可以是点击/加购/购买等), 分子是粗排top商品聚集和正例聚集的交集。


但差别于各召回分支,曝光商品完全来自于粗排输出,因此粗排输出聚集的hitrate肯定是100%,在该指标上,新模子肯定是打不外线上基线的。


全域hitrate:场景内纠偏


既然场景内hitrate(In-Scenario Purchase Hitrate@k,ISPH@k )是有偏的,一个直观的想法就是增补更多其他场景的正例来纠偏,称为全域hitrate(All-Scenario Purchase Hitrate@k,ASPH@k),详细地,可以引入保举、广告、购物车等非搜索场景成交的样本。


但由于非搜索场景不存在query,作者通过干系性作为关联条件,将用户在场景外的成交item,关联到用户在场景内的query上,且要求场景内query和场景外成交item构成的query-item对满足肯定的干系性条件。


基于上述的指标(ISPH@k和ASPH@k),作者对淘宝搜索各个模块的现状举行了分析和对比,也可由此探索优化的上限空间。

KDD'23 | 阿里淘宝:重新审阅搜索粗排



优化方案


在先容优化方案之前,提一下传统的粗排模子筹划。




KDD'23 | 阿里淘宝:重新审阅搜索粗排

淘宝新版粗排模子大图如下所示。告急优化点包罗练习样本构造、全域样本学习、精排模子蒸馏、多目的丧失函数优化等等,下面分别详细先容。


KDD'23 | 阿里淘宝:重新审阅搜索粗排


练习样本&标签


差别于一样寻常排序模子,这里的粗排练习样本使用的是user&query(哀求)维度的,一条record内会包罗多个正样本和负样本。包罗了以下几种:



前面提到了粗排评估指标: 全域成交hitrate ,一个直接优化的方式就是 引入全域成交样本,将其添加到曝光样本中 ,同时将曝光、点击和成交标签都设为1。同时,将之前全域有成交活动但被作为负例的样本修正标签,将其成交标签置为1。


精排样本和粗排样本会作为全部任务的负样本,目的是为了让粗排模子保持练习和推测空间的同等性,克制严厉的SSB题目。

KDD'23 | 阿里淘宝:重新审阅搜索粗排

  1. 只使用曝光样本的模子结果最差 ,由于在线serving时,对练习没见到过的候选商品无法做出精准预估,这会使得粗排输出聚集结果欠好;
  2. 对比三、四行,PRC作为简朴负样本,RC作为困难负样本, 加上困难负样本对模子结果资助更大;


别的,差别负样本的配比也会对结果产生影响。

KDD'23 | 阿里淘宝:重新审阅搜索粗排


蒸馏精排


粗排模子想要得到更好的预估精度,学习精排是一个非常常见的思绪,业界也已经有非常多的乐成落地方案。通过知识蒸馏的方式学习精排,有几个长处:



论文接纳的是对精排模子产出的CTR和CTCVR打分举行学习,


KDD'23 | 阿里淘宝:重新审阅搜索粗排


实验结果表明,只在曝光样本上举行蒸馏,粗排模子指标更好(也从另一角度证明,精排对于其未见过的样本打分是不精准的,假如再在这部门举行蒸馏学习,会带来一些噪声 )。

KDD'23 | 阿里淘宝:重新审阅搜索粗排


学习任务


样本的构造情势是list-wise的,故丧失函数选用list-wise ranking loss,针对曝光、点击、购买分别建模


KDD'23 | 阿里淘宝:重新审阅搜索粗排

但是当一条样本中有凌驾一个正例时,直接使用softmax的情势会使得正-正样本之间产生不公道的比力。参考Circle-Loss,对丧失函数举行了优化:


KDD'23 | 阿里淘宝:重新审阅搜索粗排


终极会加上上一节的蒸馏丧失一起盘算总丧失



总结


文章一泰半篇幅在分析粗排评估指标以及验证粗排模块在搜索全链路中的定位,分析清晰题目、优化指标,已经乐成一泰半了。模子优化也没有让人感觉是那种花里胡哨无法落地的强行讲故事,能落地且有结果,猛烈保举干系方向的同砚一读!


末了,简朴摆列下一些重点:




KDD'23 | 阿里淘宝:重新审阅搜索粗排

from:承上启下:基于全域漏斗分析的主搜深度同一粗排


KDD'23 | 阿里淘宝:重新审阅搜索粗排


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
作者: tiantian987    时间: 2024-8-10 19:59
看看学习下 支持个
作者: lookafer    时间: 2024-8-11 04:52
很好学习了
作者: 442156446    时间: 2024-8-11 07:13
过来学习啦 哈哈
作者: qph370    时间: 2024-8-17 01:29
写的不错 谢谢分享
作者: lyglulu    时间: 2024-8-18 11:11
学习到了 赶快利用一下去
作者: amaoamao    时间: 2024-8-22 13:48
谢谢老板的帖子
作者: webcnnc    时间: 2024-8-25 22:08
66666666666666
作者: 夢中的旋律    时间: 2024-8-31 16:41
厉害学习到了
作者: suggestest    时间: 2024-9-6 17:04
6666 不错好文章
作者: 100yes    时间: 2024-9-9 10:53
谢谢楼主分享
作者: xiaowei119    时间: 2024-9-12 04:22
不知道实力运用这个方法会怎么样
作者: lenit    时间: 7 天前
支持楼主  来学习一下
作者: qqpp2008    时间: 昨天 03:19
来学习下,每天学习才能不断地进步 开好淘宝店




欢迎光临 淘宝卖家开店运营论坛_淘宝卖家经验交流学习社区 (https://tao92.com/) Powered by Discuz! X3.3