微信广告社交播放算法实践
为什么要做社交广告?
首先,我们为什么要做社交广告呢?这是因为微信广告诞生在微信平台之上,而微信是目前国内最大最有影响力的社交平台,所以广告也被寄予厚望。正如之前提到我们的初衷 ― 尝试做些改变。所以,我们在设计朋友圈广告产品时候,就希望让朋友圈广告,也像朋友圈的其他内容一样,成为一个话题,在朋友间流传开来,让好友去给这个品牌代言。于是我们就这样去设计了社交广告。
品牌广告在朋友圈场景下,它的话题传播会更有优势。
首先,朋友圈广告本身就是一条普通的内容,而且收到且互动之后就会沉淀在朋友圈 timeline 中,这样后续的互动提醒都是可以全程参与的,而市面上其他的社交平台广告产品都是在出卖广告位。
其次,朋友圈是一个熟人网络,而且是目前市面上最优质的熟人关系网。直观的想,熟人的推荐和口碑肯定是比陌生人要有力量的多。大家想想微商为什么能火,靠得是什么。这是因为现在的营销方式已经发生变化了。传统的效果广告,我们优化素材,吸引点击,进去还要想办法促成转化,一系列的链条。而现在基于社交传播的营销越来越火,不管是微信里的微商,还是微博的大 V 推荐和软文,都是利用社交关系在做营销。这里关键点是,社交影响力越强,营销的效果就越大。
举个朋友圈中例子,如果你看到一个好友做微商发布一个广告后,可能嗤之以鼻,把他拉黑,然后默默同情他怎么堕落到如此地步了。但如果很多好友都在同时推荐一个商品,你还能保证不受影响吗,这可就不好说了。我们希望社交广告也能有如此的效果。
社交广告推荐过程
我们先来看下传统的效果广告推荐过程:首先,用户通过检索系统,检索出 100 条广告。然后经过基于个人兴趣的点击率预估,得出对这 100 条广告每个的点击概率,再结合广告出价,统一进行排序,排第一的广告返回给用户。
而在朋友圈的社交广告中,首先当然还是经过检索。然后这里不再只是根据用户点击兴趣推荐,还需要考虑用户对这个广告的社交意愿。然后,在排序之前,我们还要经过一次社交传播的投放节奏控制。看看每个广告当前适合给哪些人群投放,对用户做一轮筛选,此时 100 个广告可能只有 50 个适合投放给该用户。最后,再经过考虑社交因素的广告排序,返回一个广告给到用户。
下面就来具体看看这 3 个过程
社交意愿、社交传播节奏控制、基于社交广告排序是社交广告投放三部曲。
第一阶段,社交意愿计算阶段,假设此刻有三个用户同时访问朋友圈,有宝马和可口可乐两个广告在线,该三个用户对这两个广告两两社交互动意愿;
第二个阶段,社交传播节奏控制,它是广告选人阶段,假如这个时刻是让三个人中最好那两个人才能收到广告,那么根据分数计算,发现此时小明此时此刻是没办法收到宝马和可乐这两个广告。但这仅仅只代表此时此刻,随着传播范围的扩散,以及小明受到越来越多的好友的影响,他在之后的某个时刻还是可能继续收到广告的。
第三个阶段,基于社交的排序阶段。此时用户已经拿到了那些他可以收到的广告列表,然后再把社交意愿分加入到排序公式之中,选择最合适的那条广告给到用户。
社交意愿的计算
用户的社交意愿,除了受个人主动的互动兴趣外,还受好友的影响。可以看下图下面影响力作用的几个阶段。首先,最中间,用户对两个广告有一个主动兴趣,这是不受其他人影响的。左边,有两个好友分别对两个广告进行了互动,他们与该用户的影响力都是不同的。右边,是一个传播的过程,表示假如我收到广告后,我的互动可能对其他人造成的影响。
我们通过一个例子来看下影响力在朋友圈环境下和品牌力感知的关系。假如你看到一个洗发水广告,可能就是超市常见的牌子,没用过也没怎么留意过。但此时已经有许多你的好友在下面点赞评论了,而且反应去屑效果真的很棒。这个时候,你可能会想到我的洗发水貌似用了还有头屑啊,那么要不要试试这个呢?此时,你可能回复一个好友说“我也试试去”,但也可能你就不回复了,不过此时你对这个品牌的印象一定是加深的。再想想这些讨论的好友中,假如还有一个是你的老板,可能平时你们都没机会说话,那这个时候要不要也点个赞表达下赞同呢?还可能能吸引下关注。这个就是社交影响力的作用,而这里的主要问题是影响力如何量化。
首先,好友之间的影响力评估,越是亲密的两位好友影响力越大,因此一般会基于亲密度进行模型建设。但我们通过限量的系统发现其带来的收益很小,便对其进一步的数据分析发现主要原因是目标不一致。
举个例子,我们与父母特别亲密,但是我们却不会在他们的朋友圈发表的内容进行评论。于是,我们进一步改进通过更加相关的行为评价影响力,即 A 能影响 B 日常互动的概率,将其定义为影响力,但该数据在一定置信度下十分稀疏,所以通过模型预估方式进行计算。
这里,除了基础的一些特征之外,我们还运用了几个网络特征。比如,好友关系网,正常情况下微信用户有 8 亿,那么这就是一个 8 亿 *8 亿的邻接矩阵。这个是很难用作模型训练的 feature 的。同时,还有其他的一些关系网,比如消息互动,文章阅读等。那么这里,我们采用一种叫 node2vec 的方法将这些图节点映射为一个向量。这个向量维度比较低,我们就能拿这些来进行训练。最终通过 GBDT 和 LR 来进行影响力的预估。
Node2vec 是一种 embedding。首先,就是如何采用图中的节点信息可以尽量保留多一些原始的网络信息。 换到自然语言处理的场景,一般个词可以用它周围的词来表示它,这个也就是 word2vec 的思想。那同理到图中,我们就是可以用一个节点的周围节点来代表它,node2vec 就是用解决如何抽样的问题。
那么,我们拿到抽样后的向量就可以用 word2vec 的方法来进行训练,得出每个网络节点可表示的向量。
前面我们已经知道了两个好友对自己的影响,那么多个好友又是如何互相影响呢?这里我们就引入了传播力模型来对这个问题建模求解。
传统的影响力模型有许多种,这里我列了最为常见的独立级联模型。它的原理是这样的,一个用户每个好友都对自己有一个影响力,这个影响力可以用前面我们提到的方法计算出来。初始时刻,已经有一些人是被激活的,这些人就是种子用户,具体的选择我后面会说到。然后,一个用户的每个已经被激活的好友,根据他们之前的影响力去计算一个激活概率,轮流去激活该用户。这样子迭代下去直到每轮没有新激活用户位置。
传统独立级联模型直接应用会存在图中说的一些问题,所以改为上图中下面的形式(示意),但这样直接做还会存在工程上的问题。主要在于广告系统的时延要求是十分低的,假如用户有 5000 个好友,分布在几百台存储机器上,要在 20ms 内读完,这几乎是不可能完成的事情。
那么这种读扩散的方式不行,我们就换一个思考,采用写扩散的方式。当用户的一个点赞评论数据接收到之后,我们放入消息队列之后,然后社交扩散模块取出,根据关系链,权威度,传播力在内存中计算他对每个好友的影响,然后再告知所有好友这个信息。但是,假如是一一告知,5000 个好友就要 5000 次网络调用,这个开销也是接受不了的。所以,我们会根据路由规则和机器列表,将属于一台机器的用户合并起来写入,最小化网络调用。
完成这些之后,当一个用户来拉取广告时候,只需要一次网络调用,就可以拿到好友对他的影响力了。
注:目前为了引入更多的特征做实时推荐,我们已经将上面架构改为基于图形数据库的形式,架构上更加复杂和巧妙,之后会有文章专门再介绍。
社交传播节奏控制
社交传播节奏控制的核心思想是先传播给优质人群,再让优质人群带动其他人。如下图所示,Ripple 扩散传播系统。
所谓优质人群,在投放初期被定义为种子用户。他们可以通过一些方法进行挖掘:第一,广告主的粉丝,铁杆粉丝用户;第二,广告主最为了解自己的用户,因此根据广告主的需求做出定向挖掘,历史行为用户。正如大家所了解的,InfoQ 粉丝群体庞大,我们之前将粉丝和行业影响力大的人群选择出来进行投放,确定优质人群。与此同时,如果觉得量级不够,我们还可以通过 lookalike 的方法进行用户扩展,在大盘里面找到与之前两步得到的相似用户。
那么投放中如何确定优质人群?我们通过引入一个全局的实时排名队列来分析每个用户与每个广告实时的社交价值,在不同的时段,我们定义优质人群的函数是不同的。
选取优质用户之后,就会在我们的 ripple 扩散传播系统中进行扩散,从种子用户阶段投放,然后逐渐向外扩展,一直到广告预算结束。过程看似简单,但实际投放是一个较为复杂的过程。首先,影响力是实时动态变化的过程;其次,朋友圈广告是基于用户的拉取,而不是简单的推送,所以无法理想化的扩散。
在这两个背景之后,还需要面临具体如何扩散的问题,比如扩散的比例值如何确定;另外,一般品牌广告主也需要合约保量,在保量需求下完成社交扩散动作,这对系统实时性与算法都有很高要求。下面的图中列举了波纹传播系统的几个组成。
基于社交的排序
能换取别人的关注、评论、点赞的事物都可以称之为社交货币。系统内所引入的变量将它价值化、货币化。将货币化的值放入总的价值排序之中和广告主的初价以及广告主的信息进行排序,广告价值的放大代表着我们对社交传播的重视。