因果推断在阿里文娱用户增长中的应用(zz)

0 / 1322

因果推断在阿里文娱用户增长中的应用

导读:

如何实现产品的用户增长?显然,这是各家移动互联网应用的头等大事,也是悬在各家业务负责人头上的"天问"。在移动互联网进入下半场的大趋势下,过去粗放式的买量、厂商合作等模式越来越会受到掣肘,将更加依赖精细化的用户增长策略和产品用户体验的细致打磨;经典的 AARRR 模式会逐步转向 RARRA 模式,提升产品留存、拉活、分享传播等方式是构建增长的主要战场。而在此之中,对于一个内容型产品,个性化算法对于用户留存、拉活将起到决定性的作用。

考察与优酷类似的应用,在内容领域,增长的成功案例有:

  • "头条快手"模式:内容分发类产品,代表是"今日头条"、"抖音"、"快手"等。这类产品构建了完善的内容生产和消费生态,旨在通过推荐系统同时刺激生产和消费,实现两端的同时增长。
  • "趣头条"模式:该产品同属内容分发类产品,但较早地参考了网络游戏模式,从各个环节设计用户里程碑和激励,不断引导新用户一步步完成点击、下刷、完整阅读、分享、关注等目标里程碑,并给予虚拟货币和真实货币的激励,在短时间内获取了大量下沉用户。
  • "爱奇艺"、"腾讯视频"模式:这类产品利用大量资金和精准的内容采买眼光,利用头部内容的流量聚集效应,在前几年迅速圈定大批用户,并形成长视频 app 特有用户心智。由于内容头部化,个性化算法在其中发挥的空间和作用较小,产品、模式趋于同质化,内容采买的巨大资金投入使得长视频网站的盈利遥遥无期。

会员增长是长视频产品体系下用户增长的特有子问题。优酷作为国内顶尖的视频内容提供商,上述三种增长模式都是需要进行借鉴的。用户增长问题需要从内容供给、内容分发、权益设计、产品设计等多环节进行联合优化,从算法的角度,其目标可以拆解为两大部分:

  • 用户状态建模:深度建模用户状态和行为,从大数据集中找到使用户从低阶状态到高阶状态转化的干预因子。
  • 个性化分发的升级:将用户行为建模后,在多个场景将这些干预动作落地为个性化推荐算法和营销算法,满足用户的视频内容消费需求。

阿里大文娱是阿里集团双 H 战略 ( Happiness & Health ) 中最为重要的践行者,在不断为广大网民提供优质内容与良好体验的同时,我们也面临着用户规模化增长以及营收有计划提升的压力。我们已经逐步形成以消息推送 ( push )、站外引导 ( dsp ) 以及新用户承接推荐等场景组成的用 户增长业务体系,也已经逐步形成了以权益发放 ( 营销 ) 以及商业化 ( 广告 ) 等抓手组成的收入增长业务体系。基于因果推断的推荐算法、基于双 pid 的动态报价算法以及基于 uplift model 的营销增益模型正是应用在这两大业务体系中的,我们已经在多个业务场景中取得了较为显著的效果提升,我们相信其中的一些技术必将对整个互联网业内在增长算法体系带来一些崭新的视角、思考和实践经验。本文将主要为大家介绍基于因果推断的推荐算法。

01

用户增长和智能

营销算法的目标

刚刚已经介绍了优酷用户增长的业务打法和构思,其中已经提到,个性化的分发算法是实现用户增长的主战场。其中有两大目标:

  • 目标1:用户状态建模。
    深度建模用户状态和行为,从大数据集中找到使用户从低阶状态到高阶状态转化的干预因子。
  • 目标2:个性化算法的升级。
    将用户行为建模后,在多个场景将这些干预动作落地为个性化推荐算法和营销算法,满足和刺激用户的视频内容消费需求。

针对目标1,传统数据分析主要是建模变量之间的相关性而非因果关系,不能从真正的因果关系来设计干预手段。

针对目标2,传统的推荐算法主要进行短期的点击、时长等多目标预估,未能从用户状态的跃迁去设计个性化的目标机制;其次目前大量应用的深度学习类算法同样属于统计学习派别的延展,其模型可解释性差,不能从中推断用户兴趣与内容的因果关系,而该类技术方向的演化会导致用户画像的算法较为单薄,不能满足优酷会员营销核心业务的需求。

基于因果推断的推荐算法我们已经成功应用在消息推送 ( push ) 以及 dsp 外投买量算法等业务中,而在营销场景中应用的 uplift 模型本质上也是因果推断思想的一个典型应用。因此,我们在整个用户增长以及智能营销的业务场景中逐步推广地应用了因果推断的思想,在某些实验中取得了非常好的业务结果,比如我们在 push 和 dsp 业务中的沉默用户召回这个场景下就取得了点击量和点击率的显著提升。

02

用户状态表示

  1. 用户画像与状态表示法

传统的用户画像表示技术要么服务于运营可解释性,要么服务于推荐或广告系统的模型预估,通常建模成向量 ( 离散高维或低维稠密 )。而我们在深入研究在线视频和付费会员业务后,发现状态转移图是更有力地建模该业务下用户画像的数据结构,原因如下:

  • 用户从非会员到购买会员并逐步进入高阶会员的阶段,本质属于一种强规则定义的状态。
  • 在线视频,尤其是长视频领域具备长时间、连续型消费 ( 追剧、追网红 ) 等特点,对比传统的图文推荐系统、电商推荐系统和广告系统,用户的消费行为可以在连续的时间上进行切分,状态表示法是对向量表示法的有力补充。
  • 新用户的承接和推荐策略是用户增长中"促留存",建立心智的重要阶段。借鉴网络游戏和趣头条的思路,将难度较大的"促留存"问题拆分为"目标达成"问题,产品通过策略不断使得用户完成高阶里程碑,是业内目前已证明成功的用户增长方法。

序中已经提到,会员模式是长视频业务的核心付费模式,在用户的整个生命周期内,其大体的会员状态转移图如下:

Figure 1:会员转化状态

新用户阶段是产品对用户建立信任感的最重要时期,新用户在优酷 app 中的里程碑可以大致描述如下:

Figure 2:新用户状态里程碑

可以看到,用户在不同的状态下,我们期望他们能完成状态的"跃迁",也就是从低阶状态不断往高阶状态:"持续消费","订阅/关注","追剧","会员稳定期"等转化。

可以预见的是,这种用户画像的表示方法,将会对业内长久以来已经趋于成熟的个性化推荐算法步向新的发展阶段:即为用户增长这个核心业务问题更好的服务。首先是多目标的排序机制,对于在不同状态下的用户,个性化算法的机制目标会不同 ( 跃迁至目标态 );其次启发我们从更前沿的算法高度来研究状态跃迁的干预手段问题,进而解决推荐系统中长期难解的"可解释性"、"幸存者偏差"、"兴趣探索"等问题。

针对干预手段的研究,在2019年用户增长 & 智能营销团队组建之后,对因果推断 ( Causal Inference ) 算法率先进行了研究和落地,目前在个性化推送、外投 DSP 应用了基于 matching 的无偏 user-cf 算法,智能红包发放场景应用了 uplift model,取得了显著的核心业务指标提升,并得到了业务方和兄弟团队的一致认可。现将无偏 user-cf 算法介绍如下,uplift model 可参考文末推荐文章。

03

基于因果推断的无偏 user-cf 设计

  1. 因果推断 ( Causal Inference ) 简介

因果推断 ( Causal Inference ) 作为新兴的人工智能技术方向,旨在突破传统数据分析和机器学习方法的瓶颈,建模大规模数据集中的因果关系,为干预手段的设计提供指导,为构建下一代面向用户增长的全域分发系统提供理论基石。

因果推断的核心研究课题:

  • 从众多观测到/未观测到的变量中找出致因 ( causes )
  • 预估某个行为/因素的影响力/效益 ( causal effect )

对于个体,来说,核心是寻找反事实 ( counterfactual ) 镜像。在个性化推荐中,一个难题就是消除"幸存者"偏差,即如何将低活用户通过良好的路径推荐,逐步变成产品的高活用户。我们定义问题如下:

  1. 目标

消去推荐系统的偏差。用户增长需要消去高活用户带来的行为偏置,提升低活用户推荐效果。

  1. 假设

用户变成低活、沉默的原因主要是因为对之前推荐不满意 ( 负例 )。

  1. 方法

① 构建 Counterfactual 镜像人:

利用无偏信息构造相似度量,构造低活 user 到高活 user 的 matching:

  • 基础人口属性、安装的长尾 app 信息等
  • 主动搜索行为 ( 非被动推荐 ),尤其是长尾 query

② 去除低活用户的 leave causes,推荐相似高活用户的 stay causes。对于推荐系统来说,这些 causes 包括:

  • item 本身:但缺少泛化容易推出老内容
  • item 的泛化特征:标签、时效性、质量

Figure 3:无偏 usercf 设计

注意,由于使用了 matching 方法,这里的算法非常类似传统的 user-cf 类算法,但是和传统 user-cf 核心的区别在于:

  • matching 不使被动推荐数据,个性化推送、站内推荐、运营推荐的内容都不使用。
  • 只匹配低活到高活,活跃度相同的用户之间不进行匹配。
  1. 业务收益

该算法落地后,在两个 baseline 相对较高的算法场景中取得了较大的收益:其中个性化推送 ( push ),在沉默用户中获得了 50%+ ctr 和 50%+ click 的双增长,在外投 dsp 业务中,拉活量对比峰值接近翻倍。

04

总结与展望

目前算法的应用,只是对应了两个用户状态 ( 低活->高活 ) 之间的推断,如 Figure 1 和 Figure 2 所描述的,用户增长的目标是将细分的低阶状态往高阶目标态上进行跃迁,那么该类算法很显然将会在数据分析、产品设计、分发优化等各个环节发挥巨大作用。整个2019年团队的实践虽然取得了很大的业务效果,但只是对该算法方向相对较浅显的应用,且对于优酷整体的增长问题来说,应用的场景还不够多,未来期望在其基础理论和实践都投入更多的资源。

可以预见的是:对于整个业内用户增长的方法论,该方法在未来必将成为核心的理论基石。对于个性化推荐这一经典领域,该方法为解决经典难题"幸存者偏差","可解释性","用户表示","兴趣探索"等提供了漂亮的解法。


**导读:**本文主要从偏向底层的推荐算法角度来阐述信息流推荐系统升级如何助力用户增长。我们知道,内容信息流实际上已经算是信息流中比较小的概念,其中包含图文信息流、短视频信息流和内容+电商信息流,而对于用户来讲实际上是一个消费时间的产品体验,从而对内容生态产生很大的助力 ( 包括PGC、UGC的短内容生态 ),这就是本文主要的问题——内容信息流。本文旨在解决的问题是:基于推荐算法视角,来解决信息流产品用户增长的问题。其中,主要问题就是如何提升留存率。

01

关于用户增长

做过推荐系统方面工作的同学应该清楚的知道,推荐工程里面主要包含推荐算法和搜索算法。而我们往往关注的是Stoptime这样的指标,使用有监督的模型来解决一系列问题,例如点击率、单次时长等。对于留存问题和大盘规模问题在机制上,有很大的不足,比如:推荐新的篇章,从用户方面和生态方面都存在着双边的幸存者偏差问题。

1. 问题分析

首先看下大的背景,目前是移动互联网进入下半场的大趋势,过去粗放式的买量、厂商合作等模式越来越受到掣肘,未来将更加依赖精细化的用户增长策略、产品和用户体验的细致打磨。经典的AARRR模式会逐步转向RARRA模式,提升产品留存、拉活、分享传播等方式是构建增长的主要战场,对于一个内容型产品来说,个性化算法对于用户留存、拉活起到了决定性的作用。

在信息流产品增长上,有三种比较成功的模式:

  • 头部内容模式:一种比较"重"的模式,该类产品利用精准的内容采买,引入优质的头部内容创作者,利用头部内容的流量聚焦效应,迅速圈定大批用户,并形成内容APP特有的用户心智;但是由于内容头部化,个性化算法在其中发挥的空间和作用较小,产品模式趋于同质化。
  • 下沉/激励模式:该类产品参考了网络游戏模式,从各个环节设计用户里程碑和激励,不断引导新用户一步步完成点击、下刷、完整阅读、分享、关注等目标里程碑,并给予虚拟货币和真实货币的激励,在短时间内可以获取大量下沉用户。‍‍‍‍‍‍‍‍‍‍‍
  • 生态构建模式:该类产品构建了完善的内容生产和消费生态,旨在通过推荐系统同时刺激生产和消费,实现两端的同时增长。

因此,个性化的核心问题主要分为两个:

  • 用户状态建模:深度建模用户状态和行为,通过对于大数据集中分析,找到使用户从低阶状态到高阶状态转化的干预因子。也就是如何把新用户转化成低阶用户,然后从低阶用户转化到高阶用户,用户流失后如何召回,类似这样的用户状态转化。
  • 个性化分发的升级:将用户行为建模后,在多个场景下将这些干预动作转化为个性化推荐和营销,满足用户的消费需求。

2. 增长要素

什么样的内容会让用户觉得好?我们来看看用户增长的要素:

  • 优质内容/时效性:内容的更新频率以及内容的质量是用户增长的关键。
  • 个性化体验:千人千面,推荐的内容符合当下的需求。
  • 多渠道获客:多渠道获客的能力也是增长的一个关键因素。
  • CPC vs LTV:维持CPC ( 按点击收费 ) 和LTV ( 用户对系统的长期价值 ) 的一个平衡。

算法如何助力增长呢?主要有以下几点:

  • 精细化买量/外投;
  • 提升留存;
  • 衡量推荐这样Action的效用;
  • 消除幸存者偏差。

02

关于推荐算法

推荐系统在国内大概已经有十多年的应用,模型架构和算法都有很大的升级。

1. 推荐系统回顾

首先回顾下推荐系统:

  • 劣质系统:只会推荐一些低俗 ( 只满足低层次需求 )、兴趣受窄、搬运内容 ( 无稀缺性 )、陈旧内容的信息。
  • 良性系统:区别于劣质系统,在各个环节都会不断增加信息量 ( 多样性 ),不同层次的用户引入 ( 用户多样性 ),各类高质量内容的引入 ( 内容多样性 ),内容更具时效性 ( 提升媒体属性 ),探索出用户中长尾兴趣:当头部内容过期时从而更合理的承接。
  • 问题在哪儿?主要存在以下问题:统计机器学习模型存在缺陷;长期的指标观测体系匮乏以及业务短视;缺乏合理的机制设计和产品视角。

2. 信息流推荐的增长目标

用户满意度的衡量:

  • 衡量用户满意度的指标有很多,但主要集中在三大方面:内容相关性、内容质量和内容时效性,时效性一定程度上代表内容的稀缺性。
  • ctr代表什么:一定需要ctr吗?对内容无认知的用户需要衡量用户对列表页素材的满意度,对内容有认知的用户还需要衡量用户对内容本身的满意度。
  • 用户对内容真正的认可是通过点赞、分享、评论这种互动的方式来表现的,目前很多产品注重对互动的引导。

信息流推荐的增长目标,主要包括:

  • 提升用户留存、LTV
  • 通过分发筛选出优质内容、优质生产者:在传统的认知中,喜欢什么就给什么;但是更新后的认知是创造需求和玩法,持续优质内容生产
  • 构建内容生态:提高分发时效性;增加对upgc主的激励 ( 曝光、点击、粉丝、分成 );通过准入、扶持打压、激励这种机制维持一个好的生态和增长。只有通过用户和生态两端的同时增长,才能让产品得到一个飞轮效应,良性发展

03

核心增长机制

1. 双边冷启动与流转机制

① 概述****

在管理上也有这样的一种思想,就是新人做老事、老人做新事,促进事情稳定向前推进,这就是流转机制设计的主要思想。因此,如何对新用户和新内容做双边冷启动就成了核心的问题。从算法来看,这是两个不太相同的问题,但从整体设计思想来讲,两者又比较相近。新内容通过相关性分析可以达到探索、分发、推广的效果。进而新用户如何探索他的兴趣?比如推荐股票,一定会先推荐近期走势最好的股票;推荐科幻片,大概也是这样,推荐评分最高的,这样就可以实现新用户规模本身的增长。对于新内容来讲,通过老用户面对热内容的探索分析,也可以逐步推进内容生态的增长,其实这并不完全是算法的问题,这同样是贯穿从内容运营到产品设计整个体系的一个哲学思想。

对于新和旧的定义是通过置信度对应到多峰兴趣级别,同时对应到topic兴趣的级别;对于新和老的准确定义应该是经过某些流量的分发验证,而不是简单通过来的早晚;新内容冷启机制也叫爬坡机制。

这里面带来的技术问题包含:

  • 基于表征学习的排序技术,难以表达置信度;神经网络技术很难表达最重要的概念。
  • 新内容冷启动技术选型业内有很多的方案:随机保量 ( 短期降效、对生态fairness问题相对友好、构建宝贵的无偏数据集,消偏应用 ) +Bandit类算法 ( 短程收敛性有一定劣势 ) +uncertainty预估 ( 个人推荐 )
  • 新用户冷启动的技术选型和新内容还是有很大差别的,其主要是通过强化学习、联邦学习这种人工智能的方式进行分析,而通过统计学,很难分析出人的偏好。

② 详细实现****

双边冷启动与流转机制的实现,主要包括:

a. 早期以显式标签+统计连续值为主的推荐系统

  • Rank = pRelevance(topic | user)^ cu * pCTR( item | topic)^ ci 一方面用主题到用户的相关性,另一方面用item到主题的统计值或者模型的估分,这里面会有两个置信的概念,一个是用户兴趣的置信度,一个是item本身的置信度;
  • 新item冷启探索:ci低会提高cu,侧重主题到用户的相关性值以及预估稳定性;
  • 新用户冷启/兴趣探索:cu低会提高ci,侧重item到主题的统计值以及预估稳定性;
  • 纯利用:对于老人做老事,ci高,cu也高,推荐的短期效率指标是最高的,但是长期来看,如果只注重这种推荐的短期效率指标,不对新用户和新内容进行探索,那长期就很难发展下去。

b. 以表征学习为主的推荐系统,这块主要是思考如何做成Risk-aware recommendation,目前构建排序模型uncertainty的一种方式如下:

c. 超参学习/调控的目标→系统全局E&E

**3. 消偏与因果推断:**背景介绍

对于幸存者偏差问题,我们是通过因果推断的方式解决的。推荐系统其实是一个因果推断的问题,通过用户是什么样的人,从而推测用户会喜欢什么样的item;对于推荐的causal effect,用户会不会喜欢?效用有多大?会不会成为高价值客户?如果推荐后,用户会有hot moment,我们可以判定,推荐效果是好的。

为什么会存在幸存者偏差呢?

  • 推荐模型本身的样本就是有偏的,user和item偏同时存在,比如用户没看喜欢的部分没有参与到模型训练中。
  • 对应到item,就是selection-bias和fairness问题。比较典型的案例是youtube net,user embedding average pooling本质上,依然是item-embased,后续诸多改进没有本质的解决消偏问题。这样就会导致后续推的东西比较类似,如果第一次推的好就会留下用户,推得不好用户就会很快流失。

4. 消除幸存者偏差:Casual Inference推荐框架

假设:

在因果推断的推荐框架中,假设用户变成低活、沉默的原因主要是用户对之前推荐的内容不满意。

方法:

  • 构建反事实镜像人:利用无偏信息构建相似度量,构建低活user到高活user的匹配 ( Matching / Propensity Score / IPW,Causal Embedding )
  • 去除低活、沉默用户的leavecause,推荐高活镜像人的stay causes

经过实践探索后发现,causal inference框架将成为用户增长方向的理论基石,对于消偏、效用衡量、归因和生态公平性问题都有解法;同时,causal inference也为经典推荐算法难题提供解法,如selection-bias、低活用户画像和推荐可解释性等问题。

5. 面向增长的用户画像

**① **状态里程碑表示法

经典用户画像,主要要服务于运营的可解释性、推荐或广告系统的模型预估;通常建模成向量:高维离散、低维稠密以及多峰embedding。由于信息流产品具备连续型消费的特点 ( 同主题下的消费,upgc关注、直播 ),用户消费行为可以在连续的时间上进行切分,因此状态表示法是对向量表示法的有力补充,状态表示法主要包含活跃度、置信度,多峰兴趣的置信度、活跃度;这样将难度较大的"促留存"问题拆分为"目标达成"问题,通过策略不断使得用户完成高阶里程碑,将"促留存"的抓手聚焦在用户状态跃迁速度的提升上。

② 全生命周期因果推断

全生命周期的因果推断:

在构建面向增长的用户画像时,需要采用全生命周期因果推断:

  • 状态跃迁效用衡量
  • 找到使用户从低阶到高阶状态转化的干预因子:
    · 内容变化:新内容上下架、热点事件的产生和消逝
    · 捕捉兴趣的变化
    · 分发幸存者偏差问题

根据causes的actions:

  • 推断后的数据统计到内容采买和生产
  • 干预场的设计和页面组织
  • 内容供给指导 ( 2b供应链 )
  • 构建时间线上的的推荐系统来推断个性化排序机制

6. 效用理论应用

**① **个性化排序机制

对于效用的普遍认知是:

  • 新用户首次满意消费和活动 ( 内容质量控制 )
  • 低活用户浏览深度和ctr ( 内容质量控制 )
  • 高活用户要增加新颖性和多样性

个性化排序机制通过multi-task learning、强化学习和causal effect的方式,来进行分状态差异化的对用户进行跃迁效用最大化地排序推荐,无论是新用户、低活还是各个细分状态的用户,都会让用户在平台中觉得不是兴趣收窄的,承担着各自的职责。这些内容在阿里都有落地并取得了很大的收益。

② 生态效用技术

效用理论应用是一个比较开放的课题,对于电商、短内容的生态是不一样的。

供给归因:

  • 兴趣覆盖度、兴趣点下的内容质量、时效性、竞争激烈程度
  • 内容供给知道(2B供应链->内容采买/生产/激励机制)

up主激励机制:

  • up主质量体系:关注量曲线、生产效率、生产质量,内容正负反馈
  • 输入就是历史分发数据(曝光量、点击量、关注量、up主质量体系)
  • 计算:
    · 曝光量->爆款成功率
    · 最大化效用:激励函数->内容质量和生产效率的拟合
  • 输出就是一定时间内up主内容的保量、限量range->在线排序的调控约束机制

未来方向:

  • 流量货币化
  • 更多经济学、机制设计理论的引入
    · 演化博弈论分析
    · 竞对分析

以上就是针对面向用户增长的信息流分发机制的分享,特别是短内容领域利用推荐算法推动用户增长的思考,分享比较偏技术,是在阿里多年积累所沉淀下来的东西,没有太多强调推荐算法模型的部分,更多是以整体的算法架构和算法机制设计角度考量生态和用户增长,里面很多问题也是特别难、特别开放的,欢迎大家一起交流探讨。

今天的分享就到这里,谢谢大家。
lALPBG1Q85u6Mt7NAjnNA9M_979_569.png

lALPDiQ3PiqFofjNAinNA-0_1005_553.png

lALPBE1Xf9DQ4nPNAh_NA9s_987_543.png

lALPBFRyfRpcApnNAiTNA-E_993_548.png

lALPDgtYx6kscjHNAjPNA-Q_996_563.png

lALPBGnDdPcSJgvNAiLNA90_989_546.png

附录

下载地址

https://github.com/zhusleep/ai_ppts​

  1. 用户画像:

出品人:陈炜于 ( 阅文集团智能业务中心高级总监, 用户画像在阅文的实践和探索 )

分享嘉宾:徐函秋 ( 小米大数据部武汉用户画像负责人, 小米用户画像实战 ) 王琛 ( 神策数据用户画像研发部 & 武汉研发中心负责人, 神策标签生产引擎架构 ) 张长江 ( 网易数据部技术专家, 网易大数据用户画像实践 ) 姚凯飞 ( 句逗科技联合创始人, 借助用户画像解决电商业务问题 )

02. 用户增长:

出品人:朱张斌 ( 腾讯微视用户增长算法技术负责人 )

分享嘉宾:何晏成 ( 腾讯总监 & 技术专家, 技术驱动用户增长 ) 吴超 ( 腾讯技术专家, 用户增长之智能投放 ) 天师 ( 阿里巴巴高级算法专家, 面向用户增长的feed流分发机制 ) 张殿鹏 ( 腾讯增长服务组副总监, 用户增长的五个基础 )

03. 数据科学:

出品人:宋世君 ( 快手数据分析部负责人 )

分享嘉宾:陈峭霖 博士 ( 腾讯游戏数据科学总监, 亿级数据驱动的游戏数据科学 ) 杨淼钰 博士 ( 快手经济学家, 快手归因分析 ) 金雅然 博士 ( 快手经济学家, 快手归因分析 ) 杨宇杰 ( 网易严选商业智能部技术专家, 数据驱动的网易严选商业智能化实践 ) 巴川 ( 竞技世界首席数据科学家, 游戏平台精细化运营中的数据科学 )

04. 大数据+AI:

出品人:王峰 ( 阿里巴巴资深技术专家 )

分享嘉宾:周克勇 ( 阿里巴巴技术专家, EMR Spark-SQL性能极致优化揭秘 Native Codegen Framework ) 涂轶文 ( 阿里巴巴开发工程师, Flink AI Flow 在疫情监控中的运用 ) 杨旭 博士 ( 阿里巴巴资深算法专家, Alink:基于Flink的机器学习平台 ) 李锐 ( 阿里巴巴技术专家、Apache Hive PMC, Flink 1.11 Hive 集成与批流一体 )

05. 智能助手:

出品人:王浩 博士 ( 天猫精灵用户理解和智能助手负责人 ) 姜飞俊 博士 ( 天猫精灵语义理解团队负责人 ) 曹涌 ( 天猫精灵内容助手负责人 )

分享嘉宾:胡于响 ( 阿里巴巴算法专家, 天猫精灵算法交互体系的演进之路 ) 王鹏伟 博士 ( 阿里巴巴高级算法工程师, 基于大规模无监督语音预训练的语音语义理解 ) 王成龙 ( 阿里巴巴算法专家, 语音助手中的结构化语义表达方法演进 ) 姚晟 ( 阿里巴巴高级技术专家, 智能助手对话交互式语音搜索技术 ) 张跃伟 ( 阿里巴巴算法专家, 跨领域信息流推荐技术 )

06. 联邦学习:

出品人:陈天健 ( 微众银行AI部门副总经理 )

分享嘉宾:王礼斌 ( 腾讯高级工程师, 通过非对称联邦隐藏实际客户 ) 汤韬 ( 中国银联博士后, 联邦学习在小微企业信贷及营销推荐领域的应用与探索 ) 张海宁 ( VMware技术总监, 云原生联邦学习的开源框架 ) 洪澄 博士 ( 阿里巴巴高级安全专家, 联邦学习与安全多方计算 ) 范涛 ( 微众银行高级研究员, FATE: 联邦学习技术落地与应用实践 )

07. 大数据实践:

出品人:蒋鸿翔 ( 网易易数大数据首席架构师 )

分享嘉宾:范欣欣 ( 网易易数数据库技术专家, 详述数据湖在网易的实践 ) 五羖 ( 阿里文娱技术专家, 优酷大数据OLAP技术选型 ) 温正湖 ( 网易易数数据库技术专家, Impala 在网易大数据中的应用和优化实践 )

08. 计算机视觉:

出品人:刘俊晖 ( 爱奇艺智能平台部高级总监 )

分享嘉宾:龙翔 ( 百度资深研发工程师, 高效且有效的实用目标检测技术 ) 马彬 博士 ( 美团点评技术专家, 本地生活场景的短视频分析 ) 篱悠 ( 阿里巴巴高级算法专家, 多媒体电商的AI之路 ) 刘祁跃 ( 爱奇艺科学家, 视频精彩度分析算法及应用 )

09. 自然语言处理:

出品人:王斌 博士 ( 小米人工智能部AI实验室主任,NLP首席科学家 )

分享嘉宾:杨比特 ( 丁香园资深NLP算法工程师, 医疗健康领域的短文本理解 ) 罗锦文 ( 腾讯研究员, 热点挖掘及应用 ) 刘亮 ( 美团资深算法工程师, O2O搜索场景下的查询理解系统 ) 苗艳军 ( 爱奇艺智能理解团队负责人, NLP技术在短视频场景中的应用实践 ) 王凡 ( 百度主任架构师, 通用对话系统的现状和未来 ) 崔建伟 ( 小米工程师, 预训练的应用挑战与实践探索 )

10. 智能语音:

出品人:李先刚 博士 ( 滴滴出行 AI LABS 首席算法工程师,滴滴语音技术负责人 )

分享嘉宾:陈果果 博士 ( seasalt.ai联合创始人, 语音唤醒:开源、落地以及技术优化 ) 李秀林 博士 ( 标贝科技联合创始人兼 CTO, 语音生成及相关拓展技术的应用实践 ) 张学良 博士 ( 大象声科(深圳)科技有限公司CTO, 骨震动传感器在TWS耳机通话降噪中的应用 ) 宋辉 博士 ( 滴滴高级专家研究员, 端到端语音分离技术及其应用 ) 詹坤林 ( 58同城AI Lab 负责人, 58同城智能语音分析平台技术揭秘 )

11. 实时数仓:

出品人:李钰 ( 阿里巴巴高级技术专家,Apache Flink & HBase PMC )

分享嘉宾:张照亮 ( 阿里巴巴技术专家, 阿里巴巴电商搜索推荐的实时数仓演进之路 ) 李金康 ( 美团高级技术专家, 配送实时特征平台建设实践 ) 张庭 ( 菜鸟数据工程师, 菜鸟进口实时数仓2.0升级之路 ) 马进 ( 网易杭研技术专家、网易流计算团队负责人, 网易实时数仓的演进和发展 )

12. 金融科技:

出品人:费浩峻 ( 度小满金融主任架构师 )

分享嘉宾:严澄 ( 度小满金融风控模型负责人, 大数据和人工智能在度小满金融风控的实践 ) 王力 ( 蚂蚁金服高级算法专家, 共享智能在蚂蚁金服的探索与实践 ) 李渔 博士 ( 熵简科技联合创始人, 熵简科技在投研数智化建设中的思考与实践 ) 宋孟楠 ( 360金融算法工程师, 自动化特征工程在金融领域应用 )

13. AI 平台/框架:

出品人:陶阳宇 博士 ( 腾讯大数据智能学习团队负责人 )

分享嘉宾:韩堃 博士 ( 滴滴AI Labs Researcher, DELTA 基于深度学习的语言技术平台 ) 王辉 ( 华为开源工程师, MindSpore简介以及与TVM的联动 ) 郭跃超 ( 腾讯应用研究员, Angel深度学习在广告推荐训练系统中的实践 ) 吴志华 ( 百度资深研发工程师, 飞桨框架和分布式训练技术及其应用 ) 李晓森 ( 腾讯高级研究员, Angel图计算技术与实践 )

14. 风控安全:

出品人:谢强 极验CTO

分享嘉宾:唐霞 ( 平安银行高级业务安全工程师, 金融业务安全与反欺诈 ) 黄埔 ( 极验风控算法专家, 求索图建模风控赋能之路 ) 杨有政 ( 蘑菇街风控总监, 直播电商的风险治理与展望 ) 姚昊 ( 银行科技风险管理专家, 互联网时代下数字银行的科技风险管理 ) 唐梦云 ( 腾讯高级安全工程师, 新基建时代下的安全新挑战 )

15. 搜索算法:

出品人:许静芳 博士 ( 搜狗副总裁,搜狗搜索事业部负责人,搜狗搜索首席科学家 )

分享嘉宾:刘林 ( 京东搜索算法总监, 深度学习在京东电商搜索中的应用实践 ) 陈炜鹏 ( 搜狗搜索研发高级总监, 语义计算在搜狗搜索全链路应用实践 ) 胡云华 博士后 ( 智能一点CEO, 浅谈AI产品算法架构设计 ) 宋睿华 博士 ( 微软(亚洲)互联网工程院首席科学家, 用搜索做好玩儿的对话 )

16. 数据服务与治理:

出品人:任少斌 ( 美团研究员, 数据治理的根基:数据建模及其与服务层的连接 )

分享嘉宾:梁栋 ( 字节跳动数据研发 Leader, 字节跳动的EB级数据治理实践分享 ) 翟东波 ( 搜狐媒体资深开发工程师, 搜狐智能媒体在数据仓库体系建设中的技术实践 ) 布鸪 ( 阿里文娱技术专家, 阿里文娱数据服务平台的进阶之路 ) 余谦 ( 美图资深数据专家, 海量用户下美图大数据服务优化实践 )

17. 广告算法:

出品人:丁宗尧 ( 百度凤巢副总监 )

分享嘉宾:周国睿 ( 阿里妈妈高级算法专家, Rethinking Rank:下一代排序技术体系 ) 刘斌 ( 360资深算法工程师, 效果优化系统在360展示广告的演进 ) 李勇保 ( 快手商业算法策略负责人, 短视频场景下的信息流广告投放技术 ) 连义江 ( 百度资深研发工程师, 同义变换在关键词匹配广告中的角色 ) 刘鹄 ( 京东算法工程师, 视觉信息助力电商广告排序 )

18. 知识图谱:

出品人:王昊奋 博士 ( 同济大学百人计划,特聘研究员 )

分享嘉宾:郑烨翰 ( 百度资深研发工程师, 知识图谱在智能创作中的应用 ) 胡芳槐 博士 ( 海乂知信息科技(南京)有限公司CTO, 助力新基建——基于知识图谱构建新一代数据智能基础设施 ) 陈立玮 博士 ( 腾讯高级研究员, 知识图谱补全技术分享 ) 杜振东 ( 南京云问网络科技有限公司NLP研究院负责人, 面向垂直领域的OpenIE图谱构建技术算法解析 )

19. 推荐算法:

出品人:喻宏勇 ( 腾讯看点推荐研发总监,腾讯14级专家 )

分享嘉宾:丁卓冶 博士 ( 京东推荐算法负责人, 京东推荐算法的探索与实践 ) 谢晓辉 博士 ( Hulu Principal research lead, 推荐系统中冷启动问题探索与实践 ) 章莺 ( 网易云音乐资深算法工程师, 音乐推荐中用户行为序列深度建模 ) 潘建 ( 小米高级软件工程师, 手机厂商怎么做信息流推荐 ) 申恩兆 ( 新浪微博算法工程师, 微博推荐算法实践与ML平台演进 )