首页 > 财经资讯 > 电子商务

信息流战争的新赛点

时间：2018-04-03 16:02:00

半个月前还沉浸在“抖音”高速增长的喜悦中的今日头条，最近却有点焦头烂额。央视、人民日报、第一财经周刊等央媒和核心财经媒体，在上周对今日头条及旗下的抖音产品进行了一轮违规发布广告的曝光以及价值观的批判。

在相关的许多报道中，媒体都或明或暗的强调了一点：信息流推荐技术本身早已被国内外论证了是一个成功的移动互联网产品，但之所以出现劣币驱逐良币的问题还是因为使用这个技术的企业出了问题。

也正因此，不少媒体在引述相关报道的时候都会强调，去年初，今日头条创始人张一鸣在接受《财经》杂志专访时提出的，不认为今日头条应该有价值观这一论调。

这在一定程度道出了今日头条的核心问题，但事实上更为关键的是，如今这个阶段的基于人工智能算法的内容之战，已不仅仅是打破“信息茧房”这么简单。从技术之战开始，这场信息流大战的赛点，已发生了轻微的变化。

技术下一程，要从冰冷的统计学走向有温度的内容尊重

上文准确性所行之事，从宏观层面都是统计学的“花招”。而信息流的下半场竞争，则将更具有尊重内容本身的人文色彩。也即从“量”的上半场进入“质”的下半场。

1、算法不带价值观，但产品要有温度

张一鸣“算法不带价值观”被广为诟病，但从上文的技术推导本身而言，算法可能真的没有价值观，这些冰冷的统计学数据不关注也不可能关注到内容本身。

但同样是推荐系统，网易云音乐在QQ音乐、虾米音乐等一众软件中独树一帜，被广为赞誉。好听的冷门歌曲、年少时听过的磁带、收音机播过的音乐，在恰当的时机跳上来给予用户惊喜。“有温度”的产品收获用户粘性是一种必然，有温度的产品也一定是企业长久发展的必要。

同样是内容产业，信息流莫不如是。

2、“人人平等”要变成“生而不平等”

这里的转化有双重含义，首先是推荐机制不再只局限于“博眼球”的统计学需求指标，从而丢掉了优质内容。其次是打击套路写作，让上百万的内容创作者们实现真正的创作丰富化，而不是束缚于推荐机制的茧房中。

想要实现这种转化，完全寄希望于人工不太现实（虽然百度这些平台都在强调自己的人工投入），最终还是要通过技术本身去甄别内容，打入内容的“内部”，自主判断什么是好文章、什么是好图片、什么是好视频、什么是好音乐、甚至什么是好人（内容源）。

今日头条在公开算法末尾就如何判断内容好坏做了一个章节，但该章节并没有太多骄傲的“技术”宣扬，说明它仍在发力被社会期许的“好内容”。因此，如果说百度或者其他信息流平台下一阶段要彻底超越今日头条，“好内容”将是最合适、最必要的角力点。

百度发力“人工智能皇冠上的明珠”NLP（自然语言处理）或许就是在走这条路。虽然同时强调自己的AI技术，但百度作为综合性科技公司相对头条，在AI的宽度、深度上公认更有优势，在利用自然语言处理技术，对内容的质量、新颖度、情感倾向等进行深度理解和挖掘方面，较今日头条可能更有先机。

百度先于今日头条搞出的“创作大脑”，表面上是为了更好地留住作者，而深层次可能更在于百度想在理解、区分内容好坏方面更先一步。毕竟，AI辅助写作首先需要的就是对知识、对图像的理解，将是锤炼内容识别技术的恰当机会。

无论如何，信息流的技术竞争一定要回到尊重作者、尊重内容的“供给侧竞争”（相对于只关心用户需求的需求侧竞争，它本质上文提及的统计指标集合）上来，让每一个内容个体“生而不平等”，由他评走向自我价值认同。

如果”澳网出线局势深度分析”与“李娜3岁时干的事你绝对不知道”这样的文章不再被同等对待，最终所谓“信息茧房”等表面问题也将迎刃而解。

而这方面，虽然百度已经占得先机，但头条、天天快报甚至手握公认优质内容的微信入局，必将引致一场新的技术恶战。

算法流派众多，但一切归于贝叶斯

基于前文，我们能发现，在信息流推荐中，数据仍然是决胜点，而信息流也必然要更加尊重内容。而从底层技术角度，当我们回到算法的起源，也同样可以印证这些。

以目前主流的算法为例归类分析：基于内容的推荐、协同过滤推荐、基于关联规则的推荐、基于社会化网络分析的推荐等，用通俗的语言即可解释。

1、基于内容的推荐算法

即用户喜欢什么东西，推荐一些相似的东西。该推荐算法简单有效，推荐结果符合人们的认知；无须用户的历史评分信息。但是，该算法必须知道内容的特征，界定“什么才是相似”，比如体育里的篮球、NBA、耐克……如果不能得到足够的信息，则推荐效果较差、结果较单一。

2、协同过滤技术

即把兴趣差不多的用户群体归类，然后给他们推荐相同偏好的内容。它通过协作的方式分析用户之间的喜好，避免特征提取不完全的情况。但存在冷启动问题，无法准确对新用户进行推荐，存在数据稀疏性问题。有从用户出发和从内容出发两种协同，如图所示：

图：从用户出发和从内容出发的协同过滤推荐（来源：CSDN“数据挖掘工人”博客）

3、关联规则推荐

即通过某些技术挖掘大数据，建立内容之间的关联规则，起初用在实体零售，比如经典案例尿不湿与啤酒的搭售。在信息流领域中，主要是用统计学的方式发掘那些表面上看不出关联的内容与内容之间的某些相关性，及相关程度。

4、社会化网络分析

即身边的人喜欢什么，就给该用户推荐类似的内容。例如亲戚、朋友、同学等双边关系，微博关注、微信公众号订阅等单边关系，织就一个由用户组成的节点网络，探索与分析各节点、边的重要程度，利用这些重要关系来进行推荐。

图：社会化网络分析（来源：知乎“社会网络分析”专栏）

上述这些主要的推荐算法，都源于贝叶斯理论。其主要解决的就是根据已发生的事实推断关联事件发生的概率。

而信息流算法核心推荐系统正是通过利用用户的历史行为数据，分析用户的兴趣爱好并构建相应的用户模型，从待推荐的项目中选择与其兴趣偏好相符的项目进行推荐。例如，在一个极简化的模型中，已知一个喜欢李娜的用户喜欢网球的概率为x，那么就可以得出喜欢网球的用户喜欢李娜的概率y，藉此推荐内容。这

种推断的准确性，就是信息流算法能够达到的准确性，其基础框架就是贝叶斯理论。可以看出，不管是基于何种类型的推荐，在算法前的机器学习层面都是由贝叶斯推断一层层、一步步堆积、衍生而来。不管最终构筑成多么庞大的体系，但它们开始的基点却是一样的，这也使得算法推荐容易陷于“信息茧房”的怪圈。

“人人平等”造就信息流“创作茧房”

在业务层面，贝叶斯的特性也不可避免地造就了“创造茧房”现象。而打破“创造茧房”，就唯有跳出当下的贝叶斯框架，靠的就是上文所言的内容尊重，从“人人平等”变成“生而不平等”，最终也给出信息流算法技术演化的应有方向。

1、概率统计基础上的算法，都是“他评体系”

主流算法，就是通过推断个体与个体之间的关系（方式可以有上文提到的多种），参考热度等评价指标，从而有目的进行推荐。例如，对一个喜欢李娜的用户推荐澳网的资讯，在推荐时就已经根据复杂的计算（基础是贝叶斯）。由一个预期的点击率、停留时间、点赞、评论情况计算，计算不达标的，就不会推荐出去。

在今日头条算法发布会上，曹欢欢在讲到今日头条的数据量时，称其有几十亿“向量特征”。所谓向量，指的是带方向，例如喜欢李娜和喜欢网球是两个“原始特征”，而“喜欢李娜→喜欢网球”才构成一个向量特征（带概率数据）。

但事实上，向量不过就是从一个点到另一个点，是点与点之间的数据关系，每一个内容个体（一篇文章、一个短视频等）都被当作一个点存在。是否被推荐，是由各种外围向量关系决定，是典型的“他评体系”（数学上，点已经不可再分割）。

2、“人人平等”后，“创作茧房”成信息流顽疾根源

这意味着，内容和内容，在算法这里是“人人平等”的，一篇精心编撰的图文与一个拼凑热文会被一视同仁，都依据向量特征进行推荐。但这也造成了内容质量的“参差不齐”。

可以说，在当下的算法体系下，内容个体真正缺乏的是“自我认可”，高质量内容源不被重视；算法更多地是“世俗评价”，算法为上，人人都在追求曝光量。

于是，在当前算法模式下，创作导向被冰冷的统计学规则限制，越来越收敛到某些高推荐、高曝光、高点击的范围内（褥羊毛有意为之，或者被环境胁迫），最终形成“创作茧房”。

算法推荐直观上造成了用户层面的“信息茧房”现象，更深层次看，则引发了内容生产者的“创作茧房”问题。

诚然，他评体系确实对增强推荐内容与用户的匹配有重要意义，提升准确性仍然是算法的重要任务，但解决“创作茧房”问题，不再把内容个体当做一个不能分割的点，而把算法扩展到内容的内部，尊重每一个内容，会是下一阶段信息流技术突破的重点。

此为亿邦专栏作者文章，如要转载请签订内容转载协议，联系run@ebrun.com

上一篇：一文详解阿里腾讯背后的竞争版图

下一篇：42岁的中国“羽皇”波司登现状如何？

账户和包装盒都是周大生买回来的金镯子却变成了“金喜缘”
“我姨妈是跟店员确认了是周大生的品牌才购买的，包括手镯的包装盒还有包装袋上都是周大生品牌的包装，回来拿给我们看的时候才发现手镯里面并没有周大生的钢印。”...
Time2024-11-18
买原创设计却看到类似效果图面对指责设计师不认可
面对赵先生的职责，星程空间的设计师程先生很委屈：“装修风格都是依据客户喜好设计的，如今赵先生却在没有看完全部图纸的情况下就说我抄袭，这对我的名誉造成了很大的损害。”...
Time2023-03-01
茶包中喝出大白虫沁晚香称农产品原料没打农药
旗舰店的工作人员表示，除了原料未使用农药外，茶包储存不当也有可能导致茶包生虫，“我们只负责销售，具体会不会是在生产环节产生其他问题，就得找厂家了。”...
Time2022-12-02
农产品上行业务收入每增加1万元，带动农村居民消费支出增加3528元网络零售激活乡村消费
上行，陕西的苹果、广西的沃柑、山东的大葱……来自全国各地的水果、蔬菜、禽肉、海产等土特产品来到城市消费市场，地道滋味广为流传；...
Time2021-05-12
“齐鲁第一高”绿地山东国金中心将于下月正式亮灯
位于济南中央商务区的“山、泉、湖、河、城”五座超高层建筑作为济南新的标志性建筑物，建设进度一直备受广大市民关注。...
Time2021-06-26
新房延期5个月未交付世茂回应尽快解决渗漏问题
2020年底，高新区世茂璀璨公园组织集中交付，可验房过程中，吕先生却发现，自己家中存在诸多质量问题。将这些情况一一反馈给开发商后，吕先生就一直等着房屋再次交付的通知，可5个月过去了，仍杳无音讯。...
Time2021-05-22
中介贴260多万元帮你买房，你信吗
购房者付306万元服务费和定金买“奥体更名房”，苦等近两年却发现上当，更名房变成二手房，中介仍称可以用新房价格购买，但要先把钱打给她...
Time2020-05-07
专业投资客离场，两月内挂牌量增加8000套量价齐跌杭州二手市场回调
近日，国家统计局公布8月70个大中城市价格变动情况，杭州二手房价格环比7月下跌0.1%。这是近9个月来杭州二手房价首次下跌。...
Time2019-09-20

信息流战争的新赛点

推荐准确性的PK，仍将决定于数据而非算法的技巧

技术下一程，要从冰冷的统计学走向有温度的内容尊重

算法流派众多，但一切归于贝叶斯

“人人平等”造就信息流“创作茧房”