息流产品的内容分发方式包括:推荐、投放、push、订阅等,其中的"推荐"是最为主流,也是大家最为熟知的分发方式。但,在实际的信息流产品中,通常是多种分发方式同时并存的,相辅相成,共同打造良好内容生态,共同提升用户体验。 本文将以【投放】为主线,结合我在腾讯信息流推荐领域的多年经验,给出对内容分发场景的一些浅薄思考和理解,欢迎交流/讨论和批评/指正。 - 本文将从:为什么要投放、投放是什么、怎么做投放,三个方面,对一般性的信息流投放系统,展开详细阐述。并结合实践经验,给出个人的所思所想,将包括设计概要、实现细节、挖坑爬坑,等诸多方面。
- 本文尽可能以通俗浅显的语言来描述一些技术问题,以及背后的业务思考,以期让大家通过快速阅读此文,从 0 到 1 到 10,彻底理解投放系统,若能如此,则不胜荣幸(写不出段子的工程师的代码,是没有灵魂的?)
- 如果看完全文,你还是没懂,那一定是我的问题,欢迎线下交流/指正
一 为什么需要投放系统要证明世上没有鬼是很难的,但如果要证明有,却很简单,举例说明即可。同理,要证明为什么需要 xxx,只需要说明:没有 xxx,不行即可。 因此,“为什么要投放”,可转化为:“推荐系统在内容分发场景中有什么不足”,以此来进行具体分析。 1.1 推荐系统的遗留问题推荐系统的一个最大遗留问题是马太效应。一套虚拟系统,就是现实社会的一个映射,因此,在现实社会中存在的问题,在推荐系统同样存在,如上图所示: - 在内容侧,数百万级的内容池中,可能 Top20%的一级分类内容数量占了整个内容池的 80%左右(哦,2/8?3/7?请不用太过纠结,仅随意构造用于示例说明,下同);
- 在用户消费侧,每天总内容消费量近 xxx 亿级,可能其中 80%消费内容也集中在 Top20%左右的一级分类。
这和 20%的人掌握了全世界 80%以上财富的现象、及原因,本质是一样的。推荐系统,本质也是市场经济体系:供应方(B 侧作者),消费方(C 侧用户),市场(推荐平台)。 因此,当该体系(推荐系统)出现“马太效应”这种合理、但并非合适的现象时,作为该体系中的每一方,当然都有逃脱不了的干系。 1.1.1 C 侧用户:人之惰性人,食五谷杂粮者,非要练就金刚不坏之身,确实是有些难为了。我当然知道,我应该看些有思想/有深度的文章/视频,但如果你天天给我推荐大长腿+大胸妹妹,我能不看吗?? 我看下也就算了,推荐系统还非要认为是我自己想看的,然后继续给我推更长的腿+更大的胸,于是乎,我只能沦陷在此“温柔乡”了。可我知道,这并非我所愿... 1.1.2 B 侧作者:挣钱是硬道理有需求,就杀害:对于作者而言,写诗歌/散文,情怀固然重要,但在现实/钱面前,情怀不过是扯淡。 既然,消费内容的 80%+,都是短/贫/快的无脑娱乐化图文/视频,那么对于真正的优质账号作者自然是致命的:没有生存的环境/土壤,只能是肥的拖瘦,瘦的拖死(要么逃,要么死)。从而使得内容池的 2/8 分化趋势进一步加剧,当然也会加剧消费情况的 2/8 趋势... 1.1.3 推荐平台方:无辜的中间人那么上述的“马太效应”,应该由这场交易的中间方(推荐平台)来背锅吗?当然不能!推荐平台,恰恰只不过是做了它本来该做的事,而已。 既然,推荐系统已经做了它该做的事情,为何结果却并不理想呢?下面从两方面分析:推荐系统是什么? 推荐系统有什么问题? 1.1.3.1 推荐系统是什么上图,是一个基本 &通用的推荐系统架构。 - 最简单的描述: 将用户喜欢的内容推荐给用户。
- 详细描述:根据用户的过往行为历史,来尝试识别用户的兴趣,然后从全体内容池中,筛选出和该画像匹配程度最高的内容,推荐给用户,并收集用户对此的反馈数据,来迭代用户的兴趣画像...,如此不断循环迭代...
1.1.3.2 推荐系统有什么问题推荐系统诞生的初衷,是为了解决海量用户 vs 海量内容的信息过载问题,注重规模效应。本质是以人(消费者)找内容,并且侧重为其中的人服务。也即是说,看似公平的中间人,实际是被消费者牵着在走,而忽略了内容生产方。注重开发利用,而忽略生态环境建设 两个关键点: - 推荐系统认为的“用户喜欢”,不一定等于,用户真的喜欢(案例:大长腿+大胸妹)。用户就像你的女朋友:你很难知道她真的喜欢什么,因她自己都不知道,但你又不得不去尝试知道,因为她是你女票:她的错,不是她的错,是你的错。
- 就算用户真的喜欢,那就一定要满足用户需求吗?整个系统,包括多方:供应方(B 侧号主),消费方(C 侧用户),市场(推荐平台)。一套系统,是一个利益平衡问题,过度侧重其中一方的利益,必然会损害他方利益,进而影响整个系统的健康发展。
总结: - C 侧:小众用户兴趣难以满足!!
- B 侧:影响内容生态!!
1.2 人工干预的必要性在市场经济体系中,市场当然是至关重要,但市场本身是有缺陷的(贪婪/唯利),因此人为的宏观调控也是必须的。 同样,在信息流分发体系中,推荐当然是至关重要,但推荐本身是有缺陷的(伪喜欢/唯消费者),因此人工干预也是必须的。 1.2.1 内部运营干预你隔壁运营组同学的需求: - 比如一些重大新闻,这当然应该成为头条内容
- “xx 巴巴因垄断被罚 182 亿”,这等热点内容,运营同学当然也不会错过
- 对于 BD 耗费人力物力引进的大 V 账号,当然也不能因为用户似乎“不太喜欢”而不给曝光机会 ...
总之,运营需要一个可以人工干预的内容分发渠道,来满足他们的各种日常需求。 1.2.2 B 侧号主干预对于内容生产方的号主,同样有类似上面运营同学的需求。只不过,号主运营的是自己的多篇内容,而运营同学运营的是多个号主的内容。比如: - 号主需要通过购买平台的流量,来扶持自己的账号
- 号主需要相对集中的流量,扶持自己的某一篇文章,以打造爆款
- 号主需要把自己的某一篇文章,定向曝光/投放给满足指定条件的用户群体,比如:一篇深圳健身房的软广,当然不应该曝光给上海的用户 ... 显然,这些需求都是从内容侧发起的,是推荐系统难以解决的需求。
1.3 为什么不是推送 Push 分发以内容找人,粗略等于一个内容发起的 Push 动作(推荐的人找内容,近似用户发起的 Pull 动作)。 Push 分发,在一个产品的初期是很重要的一种分发方式,是拉新的基本手段,比如你常讨厌的红点推送。但由于 Push 操作过于强/硬,影响体验,容易导致用户反弹,因此,不适合长期/大规模发力。 1.4 为什么不是订阅分发订阅分发,如同共产主义,是美好、而不可达到,但可以无限逼近的?如果: - 所有的用户:都能订阅到适量的、真正喜欢的账号
- 所有账号:都能被足够多的,忠诚的粉丝用户所订阅
那么:什么推荐、投放、push...都不再需要了?大同时代已经到来! 但,目前确实还没到来... 二 投放系统是什么相对于我们耳熟能详的推荐系统,投放系统似乎更为陌生?其实,并不然。可以通过下图直观感受下投放的含义: 2.1 生活中的投放投放的字面意思:把某物品投掷出去, 并放置于某处。 三方:商家(外卖) -> 快递小哥 -> 前台妹子(消费者)其中,连接中介是快递小哥,连接的是商家和消费者 三方:作者(小视频) -> 投放系统 -> 前台妹子(消费者)其中,连接中介是投放系统,连接的是文章背后的作者和消费者 一个关键点:不管是射箭的妹子,还是骑手小哥,还是传书飞鸽,他们的起点/出发点都是物品侧。 2.2 广告投放在互联网领域,最早的、最常见的就是广告投放了。电梯、公交、地铁、移动 App...,无处不在,无孔不入,所以我们无时无刻不是消费者,无时无刻不是在被消费。 广告投放的本质,是将平台流量,售卖 给有广告需求的商家。当然,在具体实施时,是一个反向过程:将商家的广告,投放给平台流量(消费者)。 所以,在这场活动中,投放平台方,服务的是商家(广告主),而 C 侧用户只是可以售卖交易的流量而已。 2.3 信息流投放信息流投放,本质上和广告投放是一致的。只是投放的物品有所区别而已,信息流投放的物品,包括图文、视频、广告等多种形态。 在具体实施过程中,也是以内容找人,和推荐系统的以人找内容相反。投放强调的是:从 B 侧->C 侧的过程,和推荐系统以 C 侧需求为出发点相反。更加关注底层的内容生态健康,而非一切为 C 侧消费者服务。 当然,在产品/业务的发展初期,处于快速跑马圈地阶段,我们往往忽略(应该是来不及关注?)生态的健康问题。但,随着产品/业务逐步发展壮大时,曾经重要但不紧急的生态问题,就会变得重要而急迫了,因为这通常会关系到产品的生死存亡。比如随着市场经济迅猛发展的阿里粑粑,一不小心就可能被宏观调控了。 这也是为什么在信息流产品的生命周期里,一开始就必须要一套强大的推荐系统,而投放系统通常在中期阶段才出现的一大原因。 三 如何设计与实现投放系统到此,终于将为什么,是什么,这两个基本的 &&重要的背景问题讲完了。名正,则言顺,因此接下来的不过是具体实施细节,也就变得相对简单了。 3.1 投放系统架构如前所述,投放是连接 B 侧作者,和 C 侧用户的中介。因此,一套广义/完整的投放系统,至少/主要包括以下几部分: - 需求方平台(DSP): 投放主要是为 B 侧服务,因此,DSP 平台是对接内部运营和外部号主的一个需求管理平台。
- 投放中介(TFX):这部分是 DSP 与 SSP 的连接中介,是完成 DSP 投放需求和确保投放效果的核心模块,也是狭义上的投放系统。
- 供应方平台(SSP):投放通过 DSP,将流量售卖给作者。因此,供应,指的是平台流量,即 C 侧用户。这部分主要是对接 C 侧用户请求,为投放提供流量输入。
-
|