当前位置:首页 期刊杂志

从大众媒体到个性化媒体:人工智能技术对新闻生产的影响

时间:2024-09-03

□文│黄雅兰

人工智能指由机器等人造物展现出的智能,即人造物对环境、信息等进行感知并在此基础上采取相应的符合其设计目标的行动。从13世纪欧洲哲学家拉蒙·柳利(Romon Llull)最早提出了“逻辑机”的设想,到1955年美国科学家约翰·麦卡锡(John McCarthy)第一次明确提出“人工智能(Artificial Intelligence)”一词并开始严肃探讨如何制造一台模拟人类各方面智能的机器,人工智能开始飞速发展。

近年来,人工智能技术开始进入新闻领域。2010年,美国《洛杉矶时报》率先在其关于城市犯罪的博客报道(Homicide Report)中采用计算机程序自动生成稿件;2014年,美联社开始使用WordSmith平台自动写作公司季度财报,成为第一个采用人工智能写作的世界级新闻媒体。目前,不少全球重要新闻机构,如《福布斯》《纽约时报》、新华社等——也都纷纷尝试将人工智能技术应用于新闻生产。

一、人工智能影响新闻生产的两种方式

狭义地看,由人工智能技术所推动的智能新闻写作浪潮通常被称作“自动化新闻”(Automated Journalism)、“机器人新闻”(Robot Journalism)或“算法新闻”(Algorithmic Journalism),指“在没有人工干预的情况下,使用计算机软件或算法自动生成新闻稿件的过程”;[1]其核心就是通过算法对海量数据进行排序、分类、关联和过滤,并将整理过的数据适配和组合进相应的文章模板之中。目前,这种新闻生产方式已经被较广泛地运用于财经、体育、天气等领域的新闻写作,这些领域通常能够提供可靠的、清晰的、结构化数据资源,并且该领域的新闻报道有着比较稳定的写作风格与结构。在实践中,这种自动化新闻表现出了明显的优势,例如:写作速度更快,能够显著增加新闻报道的数量;出错概率更低,特别是同样的错误一定不会再犯第二遍。此外,诸如Wibbitz等基于人工智能技术的平台还能够将文本直接转化为音频和视频,促进新闻信息的多样化生产,将记者从繁杂的初级劳动中解放出来。

广义地看,人工智能对新闻生产造成的影响已经触及到了各种类型的新闻生产,并影响着新闻线索的获取、写作以及呈现等各个环节;新闻生产过去单纯依靠专业新闻从业者生产内容(Professionally Generated Content,PGC),继增添了用户生产内容(User Generate Content,UGC)外,又将补充进新的由算法生产的内容(Algorithmically Generated Content,AGC),这种人机一体或人机协作将是未来智能新闻生产的主流。因此,美联社把人工智能技术影响下的新闻业称作“增强新闻”(Augmented Journalism),[2]是一种更加准确的表述。

从新闻生产的流程来看,人工智能带来的最显著的变革在于:将新闻用户和传播效果纳入新闻生产——包括新闻线索的发现、新闻作品的写作和呈现——的过程,重塑新闻媒体的“生产流”。

二、新闻线索的多样化:从用户中来,到用户中去

互联网的出现已经在很大程度上改变了新闻工作者获取新闻线索和素材的方式。网民通过智能手机和移动互联网在社交媒体上的信息发布催生了“目击媒体”(eyewitness media),[3]为专业媒体的新闻报道提供了丰富的影像和文字资源。但是,如何在海量信息中去伪存真、去粗取精则成为有效利用目击媒体的关键所在。在常规的事实核查手段之外,人工智能为快速搜集和梳理社交媒体上的可靠信息源和素材提供了有效的途径。

2016年11月,路透社公布了其利用人工智能技术开发的新产品“路透新闻追踪器”(Reuters News Tracer)。[4]此前,新闻工作者对社交媒体的使用过程通常是:新闻事件发生后,在社交媒体上寻找和追踪该事件的当事人或在该领域有影响力的意见领袖,并对相关热门网帖进行梳理和总结。而新闻追踪器能够实时对社交媒体上的海量信息进行监控,及时发现那些有可能发展成为重大新闻的信息,将相关网帖进行分类组合并形成有效信息。例如,包含“爆炸”和“炸弹”的网帖都可能会被归入有关恐怖袭击的主题。

除了发现新闻线索,新闻追踪器还能判断一条网帖究竟是事实陈述还是观点表达,并在此基础上识别出该网帖所指示的新闻事件是否真实、是否是垃圾信息、是否有趣以及是否有新闻价值。该软件的算法设计了40项指标用以对网帖进行评分,这些指标包括:发帖人是否为被验证的用户、发帖人的粉丝数量、网帖是否包含链接、图片以及这条网帖本身的语言风格和结构特征等等。当综合评分达到一定数值,路透社的新闻工作者就会考虑对其进行人工调查或报道;与此同时,这一评分还会随着事态的发展和新的网帖信息的引入而发生变动。而在上述新闻线索的发现过程中,人工调查和评分的自我修正本身也会成为该软件进一步进行“机器学习”和提高准确性的数据资源,算法会越来越学着像记者那样思考。[5]

除了像路透社这样的大型新闻通讯社,美国的网络新闻媒体公司嗡嗡喂(BuzzFeed)也在去年美国的共和党全国代表大会期间推出了类似的工具BuzzBot,用以从社交媒体上搜集有价值的网络信息并且向网民进行个性化推送。[6]此外,诸如谷歌、脸书、推特等互联网巨头正在使用人工智能技术来识别网络虚假消息并及时遏制其大范围传播。

在传统的新闻生产中,新闻线索往往依赖于特定的“线人”或组织,来自具有较鲜明机构化和科层化特征的权威机构,[7]这就在一定程度上将新闻的选题限定在领域,反映特定阶层的价值取向和利益诉求。这样一来,新闻生产就与其源于、服务于以及忠于公民的属性相背离。[8]互联网及社交媒体的出现为“公民新闻”的发展提供了新的契机,技术赋权使得普通网民能够在技术平台上记录生活、各抒己见;而人工智能技术的成熟则能够克服用户生产内容(UGC)体量巨大、良莠不齐和真伪莫辨的缺点,在帮助新闻媒体提升报道质量的同时,让普通公众的声音和诉求真正被纳入新闻生产的过程中,使其兴趣结构、利益诉求和价值立场得以彰显。

三、新闻产品的多样化:个性化写作和呈现

传统媒体时代,个体被纳入统一的“受众”的范畴,而受众接收的则是由专业记者和编辑生产出的单一的、标准化的新闻产品。在互联网时代,从早期的RSS订阅到后来的微博、微信公众号等社交媒体平台,尽管网络用户可以根据自己的兴趣和需求选择新闻来源,定制个性化的新闻阅读方案,但其所面对的新闻文本仍旧是以“大众”为对象的标准化稿件。人工智能技术的引入则能够真正实现新闻生产向个性化的转变。

首先,在人工智能技术的协助下,个体用户的特征得以凸显,从而新闻机构能为其打造个性化的阅读产品。人工智能技术能够通过对不同语料库的语言风格进行学习,生产出适应不同群体表达习惯的稿件,如针对不同地域、年龄阶段、文化程度等。目前,不少媒体机构纷纷试水差异化写作。例如,2015年10月,腾讯的财经写作机器人梦幻写手(Dreamwriter)在报道当年9月的宏观经济走势时,就推出了四篇不同风格的稿件:《常规版:9月份CPI涨幅回落至1.6%》《精要版:9月CPI涨幅回落 降准降息可能性大》《民生版:9月CPI涨幅回落 住房租金保持上涨》和《研判版:9月CPI涨幅回落 货币政策或维持宽松》;[9]从标题到篇幅,从文中引用的具体数据和信源再到遣词造句,四篇稿件都表现出了较大的差异。

腾讯这种有着明确版本指向的差异化写作仅仅是人工智能个性化新闻生产的第一步。在此基础上,人工智能连同大数据技术会收集、统计并分析用户的人口统计学特征、社交关系及其不同终端的网络使用行为等,根据用户的年龄、性别、地域、职业、兴趣偏向、消费能力、社交网络等变量,对新闻的内容结构、语言风格以及谋篇布局等进行自动匹配,从而真正实现“对象化”的新闻生产。

目前,一些新闻媒体已经在对象化的内容生产上迈出了第一步。2015年5月,《纽约时报》推出了题为《成长的最优与最差之地》(The Best and Worst Places to Grow Up)的专题报道,该报道以1996年至2012年间美国的500万儿童成年后的缴税记录为数据源,探讨了一个人的出生地与其随后的经济状况之间的关系,报道以交互式地图和文章相结合的方式呈现出美国2478个乡村的“阶层流动机会”。[10]这种报道形式看上去与当前同样快速发展的数据新闻并无二致,但该报道的特殊之处在于,当网民打开该网站时,网站会根据其当前的IP地址来判断该网民所处地区,交互地图就会呈现出其所在地的相关数据以及该地区与全国平均水平的对比状况。因此,当不同地区的用户打开同一个网页时,看到的将是不同的内容,他们大多不会意识到这是算法编辑的结果,这种“无缝对接”的个性化体验正是智能新闻生产中最关键的问题。除了自动显示网民所处区域的情况外,该报道也支持网民自主选择其他地区查看相关情况。

此外,人工智能技术支持新闻报道根据受众的反馈随时做出调整。这一案例同样来自《纽约时报》,在2015年5月的一篇题为《你来绘图:家庭收入如何影响儿童的大学机遇》(You draw it: how family income predicts children’s college chances)的报道中,网民可以先在一张空白图表中画出自己所猜想的家庭收入和大学入学率的关系图,随后,网页上会生成网民所画曲线和真实曲线的对比图以及其他网民所画曲线的主要趋势,同时自动出具针对每个网民所画曲线的简要的评估报告,并且深入分析家庭收入与大学入学率之间的关系。[11]这篇报道提到,之所以要先“麻烦”网民画出曲线,是希望每个读者都能够认真地思考这两个变量间的关系,这样看到真实情况时才会更加印象深刻。

图1 《纽约时报》“成长的最优与最差之地”报道界面,当网民选择查看其他地区的情况时,重新匹配的文章中那些发生变化的部分就会短暂地显示出黄色阴影。

图2 《纽约时报》“家庭收入如何影响儿童的大学机遇”报道,较细的线为网民自己所画,点状较粗线为真实曲线;图标下方的测验报告则会对网民所画曲线做出评估。

这种互动设计使得新闻产品具备了“游戏化”(gamification)的特征,通过设置问题以及由之而来的竞争和奖惩制度使网民更深度地参与到新闻生产的过程中;[12]而在此基础上对每个网民的表现做出个性化的评估则是让网民产生参与感和卷入感的更关键步骤,人工智能技术所要解决的正是这个“对象化”的问题,从而将互动性和个性化更好地结合在一起。

除了关注用户本身的身份和行为特征,未来的人工智能技术还会使新闻生产更加社交化。根据北京大学新媒体研究院2016年的“手机人——移动互联网全景调查”,将近60%的手机用户认为社交网站/移动客户端第三方应用程序已经成为其主要的新闻资讯来源;使用微博的首要原因就是获取新闻资讯(54.6%),其次才是社交需要(43.6%);而61.4%的用户每次打开微信都会查看朋友圈,这说明,社交网络已经成为网民最重要的新闻信息源和讨论场所。因此,未来的新闻生产应当将用户的社交状况作为重要的自变量加以考虑。

目前,以脸书和推特为代表的社交媒体正在尝试基于用户的社交网络进行新闻推送。2015年5月,脸书推出新闻快读(Instant Articles)功能,新闻媒体可以事先将文章上传到系统中,接着其会快速将这些内容推送给相应用户;而在几次算法更新中,某用户与其他用户的“亲密程度”(Affinity Score)从来都是其考虑的核心变量,即强调的是用户之间的关系亲疏及互动程度,与该新闻的主题内容及优质程度关系不大。[13]目前,尽管人工智能在新闻的社交化方面的尝试仍仅仅局限于推送方面,随着数据库的壮大和算法的革新,新闻生产的社交化也将逐步走入实践领域。

此外,未来的人工智能技术还可以为用户提供动态化的场景化适配。“场景”在移动互联网时代有着至关重要的意义,“对环境的感知和对信息的适配”是移动传播中的核心要素。[14]用户在不同时段、地区和终端使用新闻服务时,会伴随着对新闻报道的不同期待,算法可以根据庞大的数据资源对用户在特定场景中的需求做出预测,生产出相应的稿件并进行推送。

四、结语:从大众媒体到个体化媒体的转型

上文提到了人工智能技术对新闻生产带来的种种变革:无论是选题的多样化还是基于用户自身特点、社交关系及所处场景而实现的智能写作,事实上都是更多地将普通网民的需求和反馈纳入到新闻生产的过程中来。这打破了大众传播时代专业新闻生产机构对新闻的垄断,能够使庞杂无序的个人生产信息被智能化地聚类、排序和匹配,从而激发个人传播能力,能够有效推动公民新闻运动的开展。

此外,在当今大型新闻机构愈发强势的垄断时代,人工智能也为地区性的小型新闻机构创造了新的发展契机。人工智能虽然常常和大数据相提并论,但其更加关注的是用户个性化的需求,地区性媒体以特定区域的受众为其目标,在搜集和获取更精细的地方数据方面有着显著的优势。例如,美国的俄勒冈公共广播公司(Oregon Public Broadcasting)推出了一款叫做余震(Aftershock)的新闻客户端,能够根据来自于俄勒冈地质局以及相关矿产企业提供的实时监测数据、基于用户提供的其所在区域的邮编和街道号向用户推送个体化的地震预测报告。因此,我们或许可以大胆预测,在互联网和人工智能技术的推动下,新闻媒体或将更加回归社区和公民。

注释:

[1]Andreas Graefe.Guide to Automated Journalism.Tow Center for Digital Journalism[EB/OL].http://towcenter.org/research/guide-to-automated-journalism/,2016.

[2]Francesco Marconi, Alex Siegman & Machine Journalist.The Future of augmented journalism: A Guide for Newsrooms in the age of smart machines.Associated Press[EB/OL].https://insights.ap.org/uploads/images/thefuture-of-augmented-journalism_ap-report.pdf.2017

[3]黄雅兰,陈昌凤.“目击媒体”革新新闻生产与把关人角色[J].新闻记者,2016(1)

[4][5]Richardo Bilton.Reuters built its own algorithmic prediction tool to help it spot (and verify) breaking news on Twitter[EB/OL].http://www.niemanlab.org/2016/11/reuters-built-its-own-algorithmic-prediction-tool-tohelp-it-spot-and-verify-breaking-news-on-twitter/.2016

[6]Mat Honan.Meet BuzzBot[EB/OL].https://www.buzzfeed.com/mathonan/meet-buzzbot?utm_term=.paNPGYLBoR#.laxGe2bWx1.2016

[7]Herbert Gans.Sources and Journalists.Deciding What’s News[M].New York: Bintage Books.1979

[8][美]比尔·科瓦奇,汤姆·罗森斯蒂尔.新闻的十大基本原则[M].刘海龙,连晓东,译.北京:北京大学出版社,2011

[9]Dreamwriter.9月份CPI涨幅回落至1.6%[EB/OL].http://finance.qq.com/a/20151014/020228.htm.

[10]The New York Times.The best and worst places to grow up: how your area compares[EB/OL].Retrieved from:https://www.nytimes.com/interactive/2015/05/03/upshot/the-best-and-worst-places-to-grow-up-how-your-areacompares.html

[11]Gregor Aisch, Amanda Cox, & Kevin Quealy.You draw it: how family income predicts children’s college chances[EB/OL].The New York Times.https://www.nytimes.com/interactive/2015/05/28/upshot/you-draw-it-how-familyincome-affects-childrens-college-chances.html?_r=0

[12]Foxman M.Play the News: Fun and Games in Digital Journalism[EB/OL].http://towcenter.org/wp-content/uploads/2015/02/PlayTheNews_Foxman_TowCenter.pdf.2015

[13]方师师.算法机制背后的新闻价值观——围绕“Facebook偏见门”事件的研究[J].新闻记者,2016(9)

[14]罗伯特·斯考伯,谢尔·伊斯雷尔.即将到来的场景时代[M].北京:北京联合出版社,2014

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!