然而,朱小强也指出,co-design 的方法论更多的是一种新的技术思考模式,使得我们设计新的技术时可以从更大的视角出发、敢于打破原有约束、重新定义新的体系,而不是什么灵丹妙药。 推荐系统的瓶颈
从事推荐系统研发多年的朱小强见证了推荐技术近二十年的蓬勃发展,他认为,宏观的技术体系已经相对完整,尤其是近些年来与大规模机器学习、深度学习、强化学习等技术结合后,推荐技术越发强大。不过,掀开技术的外壳,审视推荐系统的内核,他认为有两个关键问题还需要更多的突破: 一是模型跟随问题。数据挖掘领域经典的“啤酒与尿布”案例,在今天的推荐系统中同样存在,而且更加隐蔽和普遍。在构建推荐模型时,往往是基于系统收集的展现-反馈日志体系,同时挖掘用户近期的历史行为,进而训练模型,对未来的用户兴趣进行预测。这个体系乍看很合理,但深入思考后会发现,推荐模型大都时候是依据用户在系统中留下的蛛丝马迹做相应的判断,这种判断本质是在跟随用户的显式行为,或者很多时候我们称之为重定向。
换句话说,用户点击了什么,模型接着给用户推荐什么,不一定是一模一样的推荐,但是非常像。这个问题不是出在模型本身,而是我们构建模型的方式。这类问题还有一些别的叫法,比如数据陷阱、数据循环等直观上大家容易想到一些解法,如经典的 e&e 策略。但是随机的探索不仅低效,而且难以撼动整体数据分布。
阿里妈妈在这个问题上已经做了一些努力,比如 TDM 这种新型的检索算法,已经比传统方法在全库最优计算、模型泛化等方面有所突破,召回结果的多样性也有显著改善;MIMN 排序模型,已经突破了用户历史行为序列长度的建模瓶颈,在淘宝场景下使用超过 1000 长度的超长历史行为来理解用户、刻画其兴趣,这样模型就有更大的可能性跳出短时间的行为重定向,带来一些惊喜的结果。但是坦白讲,这些解法都还是局部优化,真正的突破还需要业界更多持续的努力,其中关键点在于对数据循环链路的掌控,不仅仅拟合数据分布,同时能够主动地扰动数据分布,结合算法设计,构建更具洞察与推理的推荐技术。 二是集合展现问题。这与推荐系统的展现交互密切相关。目前有两类典型的交互方式,一类是淘宝、今日头条等以瀑布流式上下滑动的空间维度集合展现;一类是以抖音、快手等沉浸式左右滑动的时间维度集合展现。不论哪种模式,对于用户而言,会在短时间连续浏览到批量的内容结果。如果把用户的每一次浏览看成是其与推荐系统的一次对话,那么推荐系统在这种连续交互式对话上还处于处级阶段。
目前大都数推荐系统构建均采用点估计加后链路集合调控为主的方式。最近也出现了一些面向集合推荐的技术,如 beam-search 式整页推荐。但是这些技术还缺乏跟用户有效的及时对话和反馈机制。这也是受限于系统硬件以及计算时效性等因素,很难在用户浏览或点击完一个结果后快速进行针对性调整。今天,端计算的逐步兴起,给这个领域带来了新的契机。此外,集合结果的最优生成与动态反馈调优算法,仍然需要新的突破。 理想中的推荐系统
最后,朱小强还补充了自己从多年从事推荐系统研发工作的经验中得出的一些思考,“当我们越深入、越感觉到现有技术的浅薄。我心中理想的推荐系统,应该是像相知多年的老友一样,了解你的喜好习性,洞察你此刻的心情,给予贴心甚至惊喜的推荐。它健谈但不聒噪,懂得适可而止。当然,它也一定是让你足够信赖的。我们今天的推荐系统,就像一个恼人的喋喋不休的话痨,你刚开始谈一个话题,它就源源不断地给你轰炸同质的消息,让你审美疲劳。”
正如朱小强所说,推荐系统作为最重要的个性化服务应用之一,它的主要功能是提供服务、吸引更多的用户使用和停留。从这个角度来看,未来推荐技术还有很大的进步空间。 参考文献:
[1] Han Zhu et al, Learning Tree-based Deep Model for Recommender Systems, KDD 2018
[2] Guorui Zhou et al, Deep Interest Network for Click-Through Rate Prediction, KDD 2018
[3] Guorui Zhou et al, Deep Interest Evolution Network for Click-Through Rate Prediction,AAAI 2019
[4] Qi Pi et al, Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction, KDD 2019
[5] Xiao Ma et al, Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate, SIGIR 2018
[6] Tiezheng Ge et al, Image Matters: Visually modeling user behaviors using Advanced Model Server, CIKM 2018
[7] Yuchi Zhang et al, Improve diverse text generation by self labeling conditional variational auto encoder. ICASSP 2019
[8] https://github.com/alibaba/x-deeplearning/tree/master/xdl
[9] https://github.com/alibaba/x-deeplearning/tree/master/blaze
[10] Guorui Zhou et al, Rocket Launching: A Universal and Efficient Framework for Training Well-performing Light Net, AAAI 2018
[11] https://mp.weixin.qq.com/s/MtnHYmPVoDAid9SNHnlzUw 好消息!AI ProCon 2019推荐系统技术专场迎来重磅嘉宾
想要听到朱小强老师更多关于阿里妈妈推荐系统的详情吗?欢迎来到 AI ProCon 2019,在大会专设的推荐系统技术专场上,朱小强老师将带来一场推荐系统技术的精彩分享! 讲师简介: 朱小强,花名怀人,毕业于清华大学,阿里资深算法专家,现任阿里妈妈深度学习算法平台负责人、兼任定向广告&信息流广告排序技术团队负责人。他主持了三代核心算法架构(大规模、深度端到端、深度实时化)的设计和落地,驱动了深度学习对阿里广告技术的全面变革与创新,领导了阿里开源深度学习框架X-DeepLearning从0到1的自研、从1到开源演进的全过程,在KDD、AAAI、SIGIR等顶级会议上发表过DIN/DIEN/ESMM等多篇有影响力的工业实战论文,是workshop DLP-KDD 2019的发起人和联合主席。 演讲题目:
工业级深度学习2.0:算力+算法+系统架构的co-design理念与实践 演讲内容简介:
推荐系统是个性化服务时代最为典型的应用技术之一,其技术本质是海量用户与物品的信息配对问题。近些年来,工业级深度学习大规模应用到推荐系统,推动了技术的整体变革升级,取得显著的业务收益。然而,随着技术发展的深入,我们很快触及了深度学习在工业场景应用的天花板:算力突破曾经是引爆深度学习技术的重要推力,今天却成为了新的阻力;深度学习如黑洞一样短短数年时间就吞噬掉了上一代技术体系积累的数据、系统、架构以及算力存量,使得新技术的迭代速度逐步下降。
新的挑战下,如何破局,如何进一步释放算力、算法的威力,推动技术的下一步升级?联动算力与算法重新定义新的系统架构,把单点算力通过新的架构放大、进而承载更复杂更实时的计算,这是我们认为的关键解法,我称之为工业级深度学习 2.0。本次演讲中我将围绕着 co-design 的全新方法论,以阿里妈妈的技术演化为样本,介绍工业级深度学习 2.0 的理念思考与具体实践。 演讲提纲:
宏观解析推荐系统中,算法体系、计算力、系统框架、数据链路的关系
梳理深度学习前后的两代推荐技术体系,总结工业级深度学习当前面临的挑战
以阿里妈妈具体实践为例,介绍以co-design为内核的工业级深度学习2.0发展趋势
(演讲内容以现场为准)
除此之外, AI ProCon 2019 推荐系统分论坛还邀请到京东集团高级总监殷大伟、快手科技推荐架构负责人任恺和华为诺亚方舟实验室推荐与搜索项目组资深研究员唐睿明,分享推荐系统在电商、短视频等领域的应用和实践。论坛日程如下: