首创机器新闻与人工新闻写作实证性研究

原标题:我国首创机器新闻与人工新闻写作之实证性研究

  浙江 付松聚

  今年9月10日,由腾讯财经隆重推出了我国第一个由机器人Dreamwriter自动完成的新闻《8月CPI同比上涨2%创12个月新高》,引起我国新闻传播界一阵不小的骚动。有些新闻工作者看到这篇新闻稿后,脊梁骨感到一丝冰凉,有些人因此预言,机器新闻将会取代新闻记者,成为未来新闻构建的主力军,传统的新闻工作者将面临失业的尴尬境地。笔者认为,机器新闻今后能否取代人工新闻,其核心还是要归结到新闻写作构建方面。

  那么,机器新闻写作与人工新闻写作孰优孰劣?两者之间的差异表现在什么地方?这是本文所要探讨的问题,这也许能回答和解决上述现象的疑问和困惑。

  一、机器新闻写作溯源及其机理

  机器新闻写作的早期雏形大概要算“GoogleNews”了。“Google News”本质上是一款Web新闻聚合器,其首页更新和新闻推荐都不依赖于人工操作,而是由后台的聚合算法实现。时至今日,在中文“Google新闻”页面的下方,仍有“所有新闻的选择、排序、分类和搜索均由电脑程序自动决定”的说明。真正意义上的机器新闻是基于计算机算法的新闻内容生产,不是简单的对已有新闻作品的选择和推荐、聚合,而是彻头彻尾的实现和人一样通过前期新闻采访后进行二度创作新闻稿件。因此,“Google News”仅仅是对人工新闻的再选择,但不能独立进行完整的新闻构建。真正意义上的机器新闻写作源自2014年美联社与Automated Insights(AI)公司达成合作,借助对方的Wordsmith平台来生产“自动化报道”。据悉,这套系统已于六个月前投入使用,每季度能够撰写3000多篇类似的报道,而且这个数字还会不断增加。AI公司的公关经理JamesKotecki表示,Wordsmith平台每周将可以写出上百万篇文章,数据甚至可以达到2000篇/秒。应当说,美国美联社借助Automated Insights(AI)公司Wordsmith平台进行有效的新闻报道开启了机器新闻写作的先河。

  众所周知,新闻写作是新闻工作者经过前期大量的新闻采访活动后再度创作的产物,在文体形式上不同于艺术创作,并有效保障新闻的真实性。机器新闻写作基本上遵循传统的新闻写作范式,无非是前期的新闻采访化为“隐性新闻采访”,借助人工智能(AI)实现从真实公开数据的挖掘、筛选和聚合。从严格意义上来讲,所谓机器新闻写作是一种自然语言生成引擎,利用算法程序,通过采集大量的各种题材以及高质量的数据,建立各种分类的庞大数据库,借助人工智能(AI)实现从数据到知识、见解和建议的提升和跨越,最后由机器自动化生产新闻。

  二、样本选择及比较点。

  为探寻机器新闻写作与人工新闻写作之差异,笔者首先选择了以腾讯财经Dreamwriter和当下主流媒体关于8月CPI新闻报道为样本,新闻体裁都属于消息。主流媒体选取了以《央视财经》《山东商报》、中国广播网三家具有代表性的电视媒体、报纸媒体和网络媒体公开发表的关于8月CPI新闻报道为例,而机器新闻样本选择了腾讯财经Dreamwriter发表的《8月CPI同比上涨2%创12个月新高》为对比样本。

  针对机器新闻和人工新闻两者样本的比较点的选择有很多,本文侧重新闻写作层面,主要从新闻标题、新闻导语、新闻主体、新闻背景等方面进行对比。当然,这种比较点的选择不一定很严谨,但具有一定的可操作性,总体还能够找出两者之间的差异。

  三、结果比较

  1.标题差异

  俗话说:“看书看皮,读报读题。”新闻标题是对新闻内容的高度提炼和概括,是衡量新闻优劣的主要尺度,也是吸引受众阅读新闻的重要传播手段。从所选新闻样本来看,人工新闻标题和机器新闻标题的共性都反映了“8月CPI同比上涨2% ”的主要事实,都抓住了新闻事实的主要核心要素。两者在标题的差异性体现在贴近性方面。总体而言,人工新闻标题的拟定更接地气,对受众具有一定的吸引力。比如《央视财经》拟定的新闻标题为《8月CPI上涨2%创年内涨幅新高到底啥“贵”了?》,这个标题首先点明了“8月CPI同比上涨2% ”的主要事实,更为主要地揭示了CPI上涨背后对民众生活影响的因素,比如涉及柴米油盐价格等都是群众所关注的焦点和核心。中国广播网拟定的标题为《8月CPI同比上涨2%创12个月新高涨幅回“2时代”》,具有一定的生动性,而且存在语义反复、层层印证之功效。

  2.导语差异

  导语是消息写作的重要组成部分,在某种程度上,导语和标题的拟定存在异曲同工之处,也是衡量记者新闻素养的重要因素。美国杰克·海敦在《怎样当好新闻记者》中说:“导语是能否吸引人往下看的关键。”腾讯财经Dreamwriter的导语为“国家统计局周四公布数据显示,8月CPI同比上涨2.0%,涨幅比7月的1.6%略有扩大,但高于预期值1.9%,并创12个月新高”,高度概括性强,既有对7月数据作横向的比较,也有对连续一年的数据梳理的纵向比较,突出了最重要、最新鲜的事实。由于机器新闻属于电脑程序的智能化操作,特别对数据处理具有非常高的运算和排序能力,这是人工新闻所无法做到的。人工新闻导语基本上也反映了“8月CPI同比上涨2% ”的主要事实,主要基于国家统计局的一些统计数字,略显被动。但相对于机器新闻而言,人工新闻导语的形式呈现多元化和丰富化的现象。比如《山东商报》拟定的导语为“猪肉拉着8月的CPI ( 居民消费价格指数)一举跃入‘2时代’。9月10日,国家统计局公布数据显示,8月CPI同比上涨2.0%,涨幅创下12个月来新高,环比则上涨0.5%。值得注意的是,作为通胀衡量标准的CPI同比涨幅,超过了金融机构一年期存款利率,这也意味着居民存款实际负利率的局面已经开启”,采用引语式,生动形象,而且还增补了“居民存款实际负利率”的核心要素,对受众具有一定的吸引力。

  3.主体差异

  主体是新闻的骨干部分,承接导语,有层次地将各种材料作全面的陈述,从而体现新闻的主题思想。腾讯财经Dreamwriter撰写的新闻主体由9个长短不一的自然段构成,主要从国家统计局城市司高级统计师余秋梅、银河证券的分析报告、交通银行金融研究中心预计、民族证券宏观分析师朱启兵、申银万国证券研究所首席宏观分析师李慧勇入手,分析8月CPI上涨表征及其动因和后果。从逻辑关系来看,主要侧重“引经据典”,缺乏深刻的分析,明显有数据堆砌之嫌,可读性较差。有些重要的新闻要素表述不清,给人晦涩之感,不利于新闻的易读性,这对于新闻传播效果有负面的影响。比如主体倒数第二段,虽然采用了客观性的描述性语言,但受众不可能马上明白这一段的实际意思,需要经过思考推理得出“若CPI涨幅超过2%,那么居民存款将面临实际负利率的局面”这个道理。此外,机器新闻引用的数据有可能是过时的数据,间接造成了新闻的部分失真,这可能是机器新闻的硬伤。比如引用银河证券分析报告的部分数据明显存在瑕疵,文中预测“12月份CPI同比涨幅超过2%的可能性较大”,实际上8月份CPI已经公布,这样的预测性分析就显得过时了。而人工新闻在新闻主体部分明显呈现出较强的优势,给人信息量多、立意高、层次逻辑感强的印象,更符合受众的阅读习惯。比如《央视财经》的新闻主体先承接导语,具体描述8月份CPI表征数据,各种专家进行有效的分析,结合国内外大的经济发展背景,把简单的8月份CPI表征数据上升到国家的宏观经济政策,新闻报道从点到面,各种信息纵横交错,新闻立意非常之高,非机器新闻所能做到。

  4.背景资料差异

  新闻背景资料是衡量一个新闻的厚度和质量的重要尺度,运用得好能起到解疑释惑、补充说明和印证新闻主题的作用。腾讯财经Dreamwriter在构建关于8月CPI新闻报道中,也运用到了背景资料,就是关于居民消费价格指数(Consumer Price Index,简称CPI)的说明解释。从消息写作框架来看,有生硬之嫌,而且是多余之笔。而人工新闻能够灵活运用各种背景材料,信手拈来,起到天衣无缝之功效。比如《山东商报》在文中提到“8月份CPI再度上涨,以猪肉为代表的食品功不可没”说法,把相关背景资料有效地融进叙述中,起到了天衣无缝的对接和说明作用。再如《央视财经》针对8月份CPI新闻报道有很多处新闻背景资料的有效穿插,对新闻的深度起到良好的佐证说明。

  四、结论及思考

  通过对比分析,我们可以得出这样的结论:其一,机器新闻写作相对于人工新闻写作在某些方面存在优势。一是表现在新闻的时效性方面。国家统计局发布时间为9点30分,腾讯财经发布时间也是9点30分,几乎做到了同步。而人工新闻要慢半拍,而且有些数据的获取是被动的,完全靠机器新闻来完成。二是在新闻写作的某些环节方面,具有明显的优势。比如机器新闻写作在新闻标题、导语拟定方面也具有很大优势,这主要能借助强大的数据处理技术,及时挖掘出具有亮点的新闻事实。对于人工新闻而言,从大量数据中挖掘出有价值的新闻事实存在一定的难度。

  其二,机器新闻写作相对于人工新闻写作也存在瑕疵和硬伤。机器新闻写作在新闻主体的构建及其结构逻辑安排方面似乎有点力不从心,有明显堆砌数据之感。除此之外,在如何灵活运用新闻背景分析新闻主题方面,做到与新闻主体的无缝连接方面还存在缺点。比如专家分析部分,引用的多是新闻发生前一些预测性内容,没有围绕最新的新闻事实(2%)展开相应的深度解读。而人工新闻写作在新闻的可视性可看性方面明显存在优势,特别是新闻在主体构建逻辑性方面要明显胜于机器新闻写作,更加符合人的思维逻辑,能够最大程度满足受众的需求。特别要强调的是,机器新闻写作由于机器特殊的工作原理,在整理搜索数据方面有可能存在失误,造成新闻的失真现象。

  综上所述,机器新闻写作属于新生事物,在挖掘复杂数据新闻事实有效抓取亮点方面可能比较到位,但在新闻可视性方面以及新闻立意方面存在难度,由此来判断今后能取代人工新闻的结论还为时尚早。

  机器新闻写作并不意味着记者会丧失工作,而是将记者解放出来,专注于做更多注重人性化色彩、体现人类智慧的内容,依靠机器做其擅长的大量数据收集整理、模式化有规律可寻的文字工作。比如Wordsmith这种自动化撰稿机器,非但不会替代新闻记者,还会将新闻记者从传统的新闻生产方式中解放出来,大大提升新闻报道效率。据《2015-2020年中国服务机器人行业发展前景与投资战略规划分析报告》分析,未来服务机器人的需求和应用市场将十分广阔。作为当下的新闻工作者,应当把机器新闻作为一种辅助人工新闻写作的手段,这样在一定程度上,减轻了人类写作过程中的负担。正如国际机器人及智能装备产业联盟首席执行官罗军所说的那样,机器人、3D打印等众多先进技术在智能制造的大背景下,在人工智能技术的推动下,都将发生重大改变。机器人将真正具有接受信息、处理信息、与人交流、与人互动的能力,能够应对许多非固定性模式挑战,传统的机器人将逐渐从单纯的自动化设备演变为人类的高级助手和工具。届时,机器新闻写作必将成为人工新闻写作的利器,开创新闻传播新的篇章。

  (作者单位为浙江越秀外国语学院网络传播学院)

  参考文献:

  ①维基百科:http://zh.wikipedia.org/wiki

  ②井三胖:《美联社用上机器人记者传统记者的末日?》,华商网http://news.china.com/international/1000/20150202/19269428,2015年2月2日。

  ③王思民:《腾讯写稿机器人或抢记者饭碗未来人类工作不保?》,前瞻网http://www.qianzhan.com/analyst/detail/220/150915-9b91bb16.html,2015年9月15日。

亮点直击

游戏与奇观:《最强大脑》的文化分析

《最强大脑》用豪华的道具为观众打造了视觉奇观,通过塑造“英雄”满足了观众的心理期待,并与观众实现情感共振。[详细]

记者视点

新闻报道如何避免侵害逝者权益

在现行法律规定不具体、不完善的情况下,往往使逝者的肖像、姓名等得不到有效保护。如何对逝者延伸的人格权利进行保护显得很有必要。[详细]

2015
年度记者