焦点人物 探索阅读大数据 成就媒体新格局

探索阅读大数据 成就媒体新格局

——访今日头条算数中心总监赵蕾

更新时间:2017-04-17 09:16:54    作者:杨家惠    来源:大数据周刊    分享到:

创建于2012年的今日头条,在短短4年时间里飞速发展,如今公司员工达3000人左右,拥有6亿多激活用户,每天推送近15万篇文章,这些数据证明今日头条正慢慢渗透到人们的日常生活中,成为用户必用的一款资讯应用。对于一家科技公司来讲,发展到如今的规模实属不易,在公司飞速发展的背后,今日头条是如何用数据精准推送赢得用户喜爱,数据又有哪些应用场景?带着这些好奇与疑问,我们采访了今日头条算数中心总监赵蕾女士,让她带我们走进今日头条的大数据世界。
大数据周刊:今日头条是一款个性化信息推荐引擎产品,它离不开大数据技术,除了用于对用户的精准推荐外,今日头条积累的大数据还有很多潜藏的价值,请问这些价值可以发挥在什么样的场景中呢?
赵蕾:今日头条是个性化推荐的资讯分发平台。和其他互联网产品所积累下来的数据不同,它反映的是资讯生产和资讯消费行为的特点和趋势,今日头条平台上的资讯涵括社会生活各个方面,目前拥有6亿多激活用户,理论上头条的阅读大数据可以对任何行业发言。
大数据周刊:人们从来都只看文章内容,很少关注内容创作者是谁,媒体实验室是今日头条的一款专门服务内容创作者的数据产品,今日头条为何反其道而行,专门研发一款服务内容创作者的平台?你们希望达到什么样的目标?
赵蕾:刚才说到,今日头条是一款资讯分发产品,理所当然我们的数据会首先服务内容创作者。访问媒体实验室,创作者会知道今日头条上哪些文章最热门,哪个关键词最热,这些关键词是因什么而热,哪些关键词对于它的热度贡献最大,什么地域、什么年龄的人更喜欢阅读什么类型的文章等等。以前,一篇文章到底多少人看了并没有直接明确的数据反馈,作者只能自己预估。今天,如果你常做的内容是通过今日头条进行分发,那么就能得到媒体实验室及时反馈的数据。目前有上千家媒体、自媒体在用今日头条的媒体实验室,有的是用于选题前的判断,有的直接把我们的数据用到他们的创作中。有电视台的编导向我们反馈,他现在每天到了办公室,第一件事是看昨天节目的收视率,第二件事就是上媒体实验室平台,看今天的晚间新闻节目应该谈什么话题。我们为创作者提供创作前、创作中、创作后的数据服务,希望中文世界的内容创作者都来用我们的数据。
大数据周刊:大数据行业的发展离不开数据的积累,今日头条已积累了海量数据,请问今日头条是从哪些维度积累数据的?像今日头条拥有如此大的数据量,如何能很好的在数据维度与用户隐私之间取得平衡?
赵蕾:从两个维度积累数据。一是积累文字、图片、视频等各种载体的数据。以文字为例,包括某个关键字的文章,1500字以下的短文章到3000字以上的长文章,具体的阅读数据如何。二是积累用户画像,不同年龄、地域、性别等用户在今日头条上的阅读行为数据。这两个维度可以进行交叉。
今日头条是做智能分发的,通过分析用户的阅读行为,机器来判断用户的阅读偏好,它并没有强制用户填写个人信息,例如性别、年龄等,这些都是机器来判断的。这恰恰可以避免对用户个人隐私的侵犯。
大数据周刊:手机行业一直是很大的市场,前段时间,今日头条算数中心发布了一系列手机行业数据报告,而微博也在做类似的事情,请问用意为何?今日头条的大数据将给手机行业带来怎样影响?
赵蕾:现在是移动端时代,手机是最主要的移动终端,今日头条的用户大多来自移动端。头条现在有6亿多用户,这是一个很大的样本,可以反映手机消费市场的基本情况,各手机品牌和机型在不同年龄地域人群中的分布,换机的流向,我们都能看到。使用不同手机品牌的用户都在阅读什么文章、观看什么视频,他们有哪些兴趣标签,阅读行为和实际消费行为、换机决策有什么关联,我们认为可以进行探索,这些数据可以挖掘出更大的价值,也是前人没有做过的事情。
大数据周刊:算术中心是今日头条的核心部门,研究探索今日头条APP的大量视频和文章,发展至今已颇具规模,任何工作都离不开不断的创新和突破,您认为算数中心目前最大的挑战是什么?
赵蕾:目前算数中心最大的挑战是阅读大数据应用场景的探索,之前没有人做过,像之前没有人给创作者提供可以实时查询的数据产品,媒体实验室就填补了这样的空白,没有太多先例可循也是一件好事,意味着我们有很多的可能性。阅读大数据能跟社会、行业发生何种关联,提供什么价值,这是我们一直思考的问题。
结语:今日头条拥有今天的成绩,离不开大数据和人工智能的支持,核心的数据推算为用户更精准推送喜爱的内容,抓住用户的兴趣点增加了用户对今日头条平台的黏性,从而更好地服务用户。在大数据快速发展的今天,相信会有更多的企业在人工智能和大数据方面进行新的尝试和挑战,为数据的发展注入新鲜血液。
标签
阅读大数据 | 媒体 | 今日头条