大数据颠覆新闻生产方式

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:   关于大数据对新闻生产的影响,过去我们关注怎么样用大数据对用户行为进行分析,对他们进行个性化的服务,或者用大数据进行市场分析调查。但是我们目前有这样一个未被给予太多关注的环节,就是大数据对于新闻报道本身的影响,新闻中一些不管是事实还是相关要素等资源,会在大数据当中发生什么样的变化?    过去所有的新闻都是由专业媒体人员生产的,在大数据时代,未来新闻是不是一定由人或者全部一定由人来生产呢?当物联网和大数据结合在一起的时候,这个答案是否定的。

  关于大数据对新闻生产的影响,过去我们关注怎么样用大数据对用户行为进行分析,对他们进行个性化的服务,或者用大数据进行市场分析调查。但是我们目前有这样一个未被给予太多关注的环节,就是大数据对于新闻报道本身的影响,新闻中一些不管是事实还是相关要素等资源,会在大数据当中发生什么样的变化?

   过去所有的新闻都是由专业媒体人员生产的,在大数据时代,未来新闻是不是一定由人或者全部一定由人来生产呢?当物联网和大数据结合在一起的时候,这个答案是否定的。

  物联网数据所带来的变革,可以使所有的物体都自己开口说话,这不仅仅对我们的健康监测会产生这样的作用,同时这些信息可能会转化为新闻生产的信息。过去新闻专业信息的采集主要是由专业媒体进行,但是将来所有的用户都将会参与到这个环节中,所有可能的物体,你只要愿意,你就可以在物体身上提取数据来为你的内容服务。物联网的基础是有一个传感器,当传感器变成一个信息的产业终端时,可能会带来一种所谓的传感新闻。现在有专门的互联网分享信息平台,未来这些平台也会成为大数据的来源。

     从预测信息的角度来说,传感器在采集一些我们重点观察不到的,或者凭我们个别的记者眼睛观察不到的,更广泛、深层的领域,在新闻和其他信息的传播效果测量方面,传感器的功能也将日益得到开发。针对地理位置或者是今天某一个个体的传感器可以帮助我们做到个性化服务,实际上今天我们手机上的一些设备也是早期的一个开拓者。我们不仅仅依靠几个记者敏锐的头脑观察能力了,我们更需要物联网相关传感器的合作。

    南京大学的一个传媒学院,在前不久启动了一个非常有意思的实验,在观众身上放了一些传感器,测试他看戏剧知道他的情绪,他的兴奋点在什么地方,这就是所谓的机器人新闻。

     他们做的一个叫Narrative   Science的软件(下文有介绍),让很多美国的媒体很关注。这个软件已经开始和我们很多记者日常所做的工作在既定,他们不仅仅是做用户工作做收集,甚至把这些数据自动的放到一个一个的模块里面。比如说,看比赛的时候很多人都会拿出手机来发比赛信息,这些比赛的消息,被Narrative   Science收集起来后,就可以知道这场比赛的过程怎样,比分如何,把这些数据放到关于比赛的模板中,同时让媒体和观众参与,像城市化程度很高的新闻就可以由一个机器人来完成。他们公司一位负责人介绍,这样的新闻在未来可能90%的新闻都是由他们的新闻来完成。首先收集数据,然后到了下一个环节,像人写新闻一样去寻找特定的或者比较有新意的角度,再根据收集到的消息去设计结构,之后变成一条一条的新闻。我们不敢确定在机器人新闻是不是会在将来打破人写的新闻,从理论上来说,在庞大的数据面前,人类越来越依赖机器的时候,实际上新闻的写作,仅依靠数据已经完成了70、80%,所以说新闻由机器来形成也不是不可能的。不管是谁写的新闻,只要提供足够的事实足够的观察,受众是可以接受的。

  大数据和媒体是有两个相应的方面,不管是传感器也好或是机器人也好,都是一个科学概念,现今只存在一些实验,不论这些实验会不会成功,至少这些实验的方向,对我们媒体有启发和借鉴。从另外一个意义上来说,在未来的媒体推广中,人将处于媒体新闻生产中怎样的位置是未可知的,我们需要调整我们的思路和技术手段,同时也需要有更多的对外合作。

  不管怎么样,未来大数据在我们新闻生活中间所扮演的角色一定越来越重要,但并不是说大数据进入到这个领域我们一定要接受它或者我们没有办法阻止数据被采集,数据采集合法性是非常重要的前提,未来怎么样保证数据的隐私,保证数据采集的合法性,是保证大数据的一个前提。

  在这样的时代,我们面临的挑战是非常多元的,虽然不是说技术至上,但是技术是我们今天做一切新媒体的基础。

作者:彭兰,中国人民大学新闻学院教授、新媒体研究所所长

 

附:Narrative Science让计算机像人一样写作

人工智能技术或许比我们大多数人想象中来得更快。

如果说 Siri 企图在信息输入上有所突破,那么 Narrative Science 的努力方向就是更加拟人化的“输出”。过去,计算机“写作”技术只停留在利用庞大文本库所进行的简单拼凑。因此,生成的结果当然不尽如人意。

西北大学教授 Kristian Hammond 联手前 Double Click 管理团队的成员,Stuart Frankel 和西北大学计算机系和新闻系的精英们花费了两年时间在2010年共同研发出了新一代的智能写作软件 Narrative Science,将新闻报道和电脑工程进行了一次新世代的结合。
这个在学校实验室代号为“Stats Monkey”的项目,通过对给定主题的数据分析,会自动选择合适的写作角度,快速“写就”一篇具有标准新闻报道结构的文章。神奇的是,程序甚至可以根据不同的出版社特点用不同的行文风格“写作”。Narrative Science 最初被应用在即时报道西北大学棒球和垒球的比赛中。自此以后,Narrative Science 也被应用在财经报道等领域,包括 Forbes 等网站都已经开始与 Narrative Science 建立了合作伙伴关系。

Hammond 教授认为 Narrative Science 的特别之处就在于满足了人们倾向读故事的心理。在此之前,虽然计算机已经拥有了强大的运算能力,可以图形化复杂的数据,却依然不能根据数据以自然语言输出成一篇人性化的文章。而Narrative Science 就是为解决这个问题而设计的。当前,该程序的写作表现足以达到一位八年级学生的写作水平。

随着技术的持续完善,有业界专家大胆预测,类似计算机记者将在未来二十年内成为普利策(Pulitzer)新闻奖的有力竞争者。虽然 Hammond 教授始终在强调 Narrative Science 是在真正地进行“创作(Composition)” 而非生搬硬套,仍有相当部分人对此技术持保留态度。在这群人中(相当一部分是记者),主要认为再先进的计算机算法始终也无法模仿人类的感性流露,这项技术最终只能生成低质量的数据报告式的文章。

同时,自动化写作也让诸如 Google 等在线搜索公司产生隐忧。如果程序已经能自动生成如此高质量的“拟人化”文章,那么辨别在线垃圾内容的任务将会变得异常艰巨。华盛顿大学人工智能的专家 Oren Etzioni 在谈及这个问题时,毫无掩饰地将 Narrative Science 比作数字化装备竞赛中的核武器。而 Narrative Science 则表示,他们不会将此技术转让/部署到这些网站中。

最后,我们提供了两段文字,其中一段就是 Narrative Science 自动生成的,你能分辨出是哪一段吗?请在下面的留言中给出你的答案。

A: “Michigan held off Iowa for a 7-5 win on Saturday. The Hawkeyes (16-21) were unable to overcome a four-run sixth inning deficit. The Hawkeyes clawed back in the eighth inning, putting up one run.”

B:”The Iowa baseball team dropped the finale of a three-game series, 7-5, to Michigan Saturday afternoon. Despite the loss, Iowa won the series having picked up two wins in the twinbill at Ray Fisher Stadium Friday.”


原文发布时间为:2014-01-10


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
打赏
0
0
0
0
30498
分享
相关文章
MaxCompute产品使用问题之如何为某个用户授予仅对生产表的SELECT权限
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
MaxCompute产品使用合集之开发创建的表无法提交生产是什么导致的
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
MaxCompute产品使用合集之开发创建的表无法提交生产是什么导致的
MaxCompute产品使用合集之怎么将一个Quota的资源优先供给给标准模式的生产库调度使用
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
大数据计算MaxCompute怎么将一个Quota的资源优先供给给标准模式的生产库调度使用?
大数据计算MaxCompute怎么将一个Quota的资源优先供给给标准模式的生产库调度使用?
99 2
基于工业大数据的生产设备部件故障诊断 附完代码+论文(下)
基于工业大数据的生产设备部件故障诊断 附完代码+论文(下)
227 0
基于工业大数据的生产设备部件故障诊断 附完代码+论文(下)
科百科技:运用物联网和大数据颠覆传统农业|科创100人
“十四五”规划强调,坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑。日前,创头条启动了“科创100人”系列报道,希望透过100位科技创新人物的记录,向读者展现科技推动经济发展的进程。 在数字中国战略下,数字化下沉,成为助力国家乡村振兴战略的重要推手。2021全国数字生态创新大赛是全国首个以数字下沉为方向的创新大赛,涌现出诸多数字化赋能乡村振兴的优秀人物,充分展现了数字化与乡村产业融合创新的探索成效。本文系“科创100人”系列报道中,面向2021全国数字生态创新大赛特邀的优秀科创人物报道之一。
522 1
科百科技:运用物联网和大数据颠覆传统农业|科创100人
大数据开发项目-电信项目1-生产数据
通信运营商每时每刻会产生大量的通信数据,例如通话记录,短信记录,彩信记录,第三方服务资费等等繁多信息。数据量如此巨大,除了要满足用户的实时查询和展示之外,还需要定时定期的对已有数据进行离线的分析处理。例如,当日话单,月度话单,季度话单,年度话单,通话详情,通话记录等等+。我们以此为背景,寻找一个切入点
273 0
大数据开发项目-电信项目1-生产数据
科百科技:运用物联网和大数据颠覆传统农业|科创100人
早春,丽水市松阳县的一片茶园里出现两种截然的不同的现象,一边茶叶上结满了霜,而另一边未受霜冻影响仍是绿油油一片。两天后结满了霜的茶叶芽头变成了焦黄色,而另一边未曾结霜的茶叶却苍翠欲滴,生机盎然。

热门文章

最新文章

下一篇
oss创建bucket
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等