时间:2024-09-03
文/张 炯 廖安安
“大数据”是近年来学界、业界热议的话题,它不仅意味着数据量的爆炸式增长,还预示着基于数据的采集和利用将得到社会各领域的普遍重视。大数据时代的新闻媒体已经开始尝试用数据报道新闻,这些尝试一方面改变了新闻的生产传播方式,另一方面也对传统的新闻学体系带来了影响。数据新闻学作为新闻学发展的新领域、新分支,已经受到世界各国的广泛关注。“数据新闻学”的概念发端于媒体新闻实践,学界目前尚无定论。根据全球第一本专门探讨数据新闻的著作《数据新闻手册》(Data Journalism Handbook)的阐述,我们可以简单地理解为:数据新闻学是基于数据的抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式,其核心就是用数据报道新闻。[1]
数据新闻报道不仅改变了新闻的生产和呈现方式,也对新闻编辑的能力结构和业务素质提出了更高要求。新闻编辑从广义上讲应该包括所有对新闻进行编辑加工的人,即在网络上发布新闻信息的任何一个人。但本文所论述的新闻编辑不是广义上的概念,而是指新闻机构中专门从事编辑工作的人。新闻编辑作为一种职业,其编辑业务随着媒介形态的变化而不断发展,在网络媒介诞生后,新闻编辑工作表现出两种趋势:一是媒介融合,即传统媒体与网络媒体融合、平面媒体与多媒体融合;二是新闻编辑业务与新闻信息采集相融合。[2]在大数据时代,信息数量呈爆炸式增长,信息来源复杂多样,对新闻编辑而言,信息的采集以及对数据进行深层次的挖掘、分析等处理,变得越来越重要。
2012年,《纽约时报》在一篇专栏中指出:“大数据时代已经来临,在商业、经济和其他领域中,决策将更加依赖于数据和分析做出,而非基于经验和直觉。”[3]事实上,大数据也给传媒业带来了深刻的影响,数据新闻学就是在大数据时代兴起的一种跨学科、跨领域的新闻生产方式。然而,就像哥伦比亚大学陶氏数字新闻中心主管艾米莉·贝尔(Emily Bell)所说的那样:“大部分媒体仍不了解数据科学的发展前沿,以及信息传播对信息使用者的影响。”[4]
目前,关于数据新闻学的研究和实践,主要集中于欧美发达国家的几大主流媒体,如英国的《卫报》,美国的《纽约时报》《华盛顿邮报》等。我国的数据新闻起步较晚,但业界和学界也对其进行了一些探索和尝试,比如网易的“数读”、新浪的“图解天下”、搜狐的“数字之道”“图表看新闻”等,都开展了用数据报道新闻的相关业务。还有一些独立的新闻机构(如政见网cnpolitics.org),不仅有静态化的信息图表,还有动态版本。例如,2013年“两会”期间,政见团队与《南方周末》合作,利用HTML5技术制作了“两会究竟是什么”2.0动态版,为受众解读两会相关常识。国内一些高校的新闻传播专业也已经开设相关课程,旨在培养适应大数据时代、能对数据新闻学开展研究和实践的综合性人才。
《信息之美》的作者大卫·麦克坎德莱斯(David McCandless)指出:“在信息爆炸的时代,我们需要一种新的方法,来发现信息的美和乐趣,并将枯燥、抽象的信息变成通俗、有趣、便于理解的语言。数据正变得越来越重要,这并不是因为数据量的巨大,而是我们拥有了工具和能力去分析数据、发现模式并揭示趋势。”[5]可见,新闻编辑能力重构是适应时代变化而做出的积极反应,具体表现在以下两点:
第一,从受众的角度看,每天的报纸、电视、网络等充斥着令人目不暇接的信息,这些来自大众传媒和社交网络的信息耗去了人们许多时间,而数据新闻可以帮助受众在“快餐文化”和“碎片化阅读”的时代节省阅读时间。美国学者关于“读者怎么读报”的调查研究发现,读者阅读版面上3/4的照片和图示,1/2的标题,1/3的提要与图片说明,1/4的文字报道,并且读者更喜欢阅读配有图片的稿件。[6]这些充分说明数据图表、图示等表现形式更能吸引读者,编辑应有意识地为读者提供轻松、易懂、生动、形象的“轻量化阅读体验”。同时,互联网改变了人们对信息和知识获取的传统观念,开放资源Open Access(简称OA)和开放存取的理念深入人心,新闻编辑必须帮助用户查找信息、辨别信息并处理信息,利用数据使简短新闻一目了然,使深度报道更有说服力。
第二,从编辑自身的角度看,使用数据可以使新闻内容化繁为简、化抽象为具体,也可以丰富媒体新闻的表现形式。在引导舆论的层面上,数据新闻能够帮助编辑讲述较为复杂的社会问题,展现清晰的动态关系和发展趋势。斯坦福大学杰夫·麦吉Geoff McGhee教授认为,现在的新闻越来越多地和数据有关,媒体的责任是如何向公众解释复杂难懂的数据,数据可视化专家正在开发工具帮助我们更好地理解和使用数据,媒体工作者的任务是运用数据使新闻报道更加有说服力。[7]在大数据时代,无论是传统媒体还是网络媒体的编辑,都需要更新知识、重塑能力,成为“数据通”。因此,与其用低水平无价值的内容填充版面,不如用数据创造出高浓缩有价值的内容,这样的媒体或媒体人将更有竞争力和更受欢迎。
在传统理论中,能力被认为是具有复杂结构的心理特征的总和,能力结构也多是从智力与心理的角度来进行分析。比如美国心理学家吉尔福特提出的智慧结构论,将能力结构分为操作、内容和产品三个维度,为人类智力结构和心理能力的分析作出了贡献。然而,能力结构不应只局限于心理方面,还应从哲学与人类学的角度来理解。吴飞教授认为,编辑能力具有八个方面的基本内涵,即能力发挥的基础、内容、水平、合理性、效果、载体、价值和作用,并把编辑能力划分为智力能力和工作能力两大块,其中,工作能力又分为一般能力和创造能力。[8]这些理论成果为我们理解大数据时代的编辑能力提供了借鉴,为我们重新勾勒新闻编辑的能力结构奠定了基础。
和传统的报道方式不同,数据新闻报道对编辑提出了更高的要求。它不仅需要编辑具备文字写作、鉴别分析、网络运用等几项基本能力,还需要编辑掌握数据搜集、数据加工和数据可视化呈现等创新能力。在媒体融合的大环境下,编辑多平台运作的能力也将进一步凸显。因此,大数据时代的新闻编辑,需要不断更新知识结构,以适应新环境的变化,如图1所示。
图1 大数据时代的新闻编辑能力结构
日本出版人鹫尾贤也在其《编辑力》一书中提出“编辑力”的概念,认为编辑力是在创意、策划和人际关系中体现出的非凡能力。金石将这一概念细化到新闻学领域,认为编辑力是一种新闻思维与新闻表现能力的外在体现,是具体能力融合而成的业务素质。[9]如今,技术的广泛运用和数据的爆炸式增长,给传统的新闻编辑职能带来了挑战,理解、分析和展示数据的能力将成为编辑力的主要内涵之一。数据新闻学的研究目的在于将新闻思维和数据使用结合起来,将传统表现方式和数据可视化、网络互动结合起来,用最简洁、直观的数据新闻为受众诠释新闻、揭示意义。可见,围绕数据进行学科知识的扩展是编辑力提升的重要途径。比如,数据搜集需要信息检索、网络运用等知识,数据分析需要统计学、计量学等知识,数据展示需要可视化、艺术设计等知识。编辑力在不同历史时期和不同工作阶段有不同的内涵,编辑力的扩展不是一蹴而就的事情,也不是强加于每一位编辑的要求,数据新闻的发展还需要计算机程序员、记者和相关工具软件的支持。
数据既可以是数据新闻的来源,也可以是新闻报道所使用的工具,数据可能出现在新闻报道的任何一个阶段。2009年,《卫报》网站开设“数据商店”,为用户开放数据库并提供大量的公开数据。谷歌的凯瑟琳·赫尔利(Kathryn Hurley)将《卫报》“数据商店”的运营和处理数据的过程概括为三个步骤:数据获取、用数据讲故事、发布并分享数据。根据新闻报道的一般流程,我们将数据新闻报道分为三个阶段,即数据搜集、数据加工和数据呈现,并依照不同阶段的内容来阐述新闻编辑的能力重构。
数据新闻必须以公开的数据为基础,这是新闻编辑开展数据新闻报道的前提。网络为我们提供了海量的数据,但人们又容易迷失在数据的海洋里,新闻编辑有必要通过数据搜集为用户提供有用信息。目前,数据搜集的渠道主要有三种:一是搜索引擎,如谷歌、百度等;二是专业数据库或数据中心;三是网络论坛及其他数据站点。
搜索引擎是常用的数据查找工具,尽管大多数编辑都会使用搜索引擎,但有时候提交的搜索关键词并不能准确反映他们的查询目标,也有一些人不会使用搜索引擎的高级检索功能(比如附加.xls搜索表格数据,附加.mdb搜索Access数据库),这就限制了新闻编辑利用搜索引擎中的数据进行数据新闻的报道。
除了搜索引擎,编辑还要会查找数据库,包括中文和外文数据库、政府和非政府数据库等。现在有越来越多的国家开始建立自己的数据门户,以促进公众和商业机构对政府信息的利用。[10]例如美国政府的数据门户(http://www.data.gov/),拥有98544个数据集(2013年10月),包括联邦政府的数据政策(Data Policy)和大学、组织、部落等非政府机构的数据。另外,统计网站和统计数据库也可以为数据新闻提供大量公开的数据,比如我国国家统计局的“国家数据”(http://data.stats.gov.cn/)、美国及世界各地统计机构导航(http://www.bls.gov/bls/other.htm)等。
新闻编辑还可以通过网络论坛和数据站点来搜集数据,或者通过网络投票与网络调查手段来获取数据。前者以GetTheData问答论坛为代表,后者需要新闻编辑主动设置议题,将调查问卷直接放到网页上或用户的电子邮箱里,获得第一手的资料数据。当然,新闻编辑搜集数据的渠道远不止这些,各类专题网站与在线专题数据库也是不错的选择。譬如艾瑞网的“数据报告”频道,数据来自艾瑞咨询、CNNIC、百度数据研究中心、Comscore、易观国际等专业机构,为用户提供涵盖网络媒体、网络游戏、网络视频、网络广告等内容的相关数据,并定期公布数据排行,为用户的数据采集提供参考。
分散的、隐匿的数据是难以产生价值的,新闻编辑通过对数据的加工处理,可以将零散的数据整合起来,将有用信息从庞杂数据中分析提炼出来,这样就能够为用户提供新的有价值的新闻内容,以及生动的具有可读性的新闻故事。
拥有海量数据对于新闻编辑来说仅仅是第一步,数据新闻是建立在对大量数据加工整理的基础上的。新闻报道在引用数据时容易出现的问题有:数据太多,简单堆砌在一起;数据不够准确;选用的数据不能说明问题等。因此,编辑在处理数据时,首先要去除不必要的干扰数据,删去不准确的数据或数据中的人为误差,保留的数据要做到少而精,并且准确无误。其次要将数据转化为统一的格式,以及对数据进行计算和完备性测试等。[11]对于一些抽象的数据,编辑还可以通过换算、对比等办法将其用活用好。如果是统计图表中的数据,编辑还要考虑数据是否具有可比性,安排是否有条理,并尽量避免文稿中的数据和图表中的数据重复。
新闻编辑在加工数据的过程中还要注意两种数据错误:概念性数据错误和逻辑性数据错误,概念性数据错误又可以分为数学概念不清和专业概念不清导致的错误。[12]比如百分比使用不当,将“50%~60%”写成“50~60%”;以万为单位表示数值区间时将“3万~6万”写成“3~6万”,等等。涉及倍数关系时将增加、缩小了多少倍弄错也是常见的问题,例如,某文章中出现的“洛杉矶将修建世界最高的铁塔,高611米,比巴黎的埃菲尔铁塔高二倍。”如果这句话成立,那么埃菲尔铁塔约高204米,但实际上高320米,因此,正确的说法应是“比巴黎的埃菲尔铁塔高一倍”或者“相当于巴黎的埃菲尔铁塔的两倍”。这些例子已不单是数字使用的问题,而是产生了科学性错误,编辑在进行数据加工时,对这类问题不可掉以轻心。
图2 搜狐新闻“数字之道”网页截图
在数据新闻中,数据代表着新闻报道和研究成果的核心内容,编辑作为出版传播活动的把关人,必须提高警惕,尽可能减少各种数据错误,以保证并提高数据新闻的科学性和准确性。从这一点来看,从事数据新闻加工的编辑与科技期刊的编辑一样,对数据有着更高的敏感性和更高的要求。
谈论数据新闻不得不提到“数据可视化”这个概念,数据可视化涵盖的技术领域非常广泛,涉及计算机编程、图像处理、人机交互等多个方面。在大数据时代,可视化技术将数据和新闻完美结合,以信息图表或动态信息图的方式进行发布,为数据新闻提供了丰富的表现形式。新闻编辑要充分利用来自计算机和艺术界的数据可视化技术,将复杂、抽象、枯燥的数据转化为简单、具体、生动的新闻报道,发掘数据在新闻报道中的潜力。
数据可视化技术不仅扩宽了新闻报道的视角,激发了新闻编辑的兴趣,而且也为那些不善于技术的编辑提供了便利工具。例如ManyEyes网站,为用户提供免费的可视化服务,只要上传相关数据,就可以得到你想要的可视化图表。ManyEyes还提供了数十种最受欢迎的可视化方案,包括用来显示名词使用频率的Word Cloud、显示层次数据的TreeMap,以及可视化人物关系的网络图,等等。谷歌也推出了一项针对可视化数据的新服务谷歌数据融合表(Google Fusion Tables),着重于对数据进行批量操作(分类、筛选、聚合、合并)。借助这些免费的工具软件,新闻编辑即使不是技术专家也能将数据生成各类图表。
当然,对于传统的新闻编辑来说,掌握这些数据处理技术需要一个学习或培训的过程,可以由媒体的技术人员、资深编辑讲解数据新闻的制作步骤,以及各种工具软件的使用方法。此外,要想获得更漂亮的图表或更好的视觉效果,新闻编辑还需要掌握一定的艺术设计技巧,就如同报纸编辑要设计版面,网站编辑要设计网页一样,数据新闻的呈现形式也要讲究色彩搭配、均衡统一等内容。所以说,只有将技术和艺术结合起来,才能真正体现出数据新闻的魅力,如图2所示。
作为新闻学的一门新兴的、重要的分支学科,数据新闻学改变了传统的新闻生产传播方式,也使记者、编辑的角色发生了转变。在传统的新闻生产过程中,记者负责新闻采集(采访),编辑负责新闻加工(编辑),一个主外一个主内,分工明确。而在数据新闻模式中,编辑完全可以依据数据的搜集和整理独立编发新闻,或者在已有新闻的基础上深度挖掘事实,部分承担记者的新闻报道职能。这样一来,编辑和记者的界限将变得越来越模糊,换句话说,在大数据时代,编辑的能力结构和编辑力将得到进一步的扩展。同时,我们也应该看到,数据新闻不是编辑的一己之功,它的数据来源包含着众多媒体人的劳动和付出。新闻编辑要不断探索数据新闻报道的新视角、新方式,为数据新闻学的理论与实践贡献力量,发挥编辑在媒体传播中的积极作用。
[1]方洁,颜冬.全球视野下的“数据新闻”:理念与实践[J].国际新闻界,2013(6):76
[2]蔡雯.新闻编辑学[M].北京:中国人民大学出版社,2010:11
[3]http://www.nytimes.com/2012/02/12/sunday_review/big_datas_impact_in_the_world.html?pagewanted=all
[4]http://www.knightfoundation.org/blogs/knightblog/2012/04/30/emily_bell_how_new_research_effort_will_help_newsrooms_determine_whats_next/
[5][英]大卫·麦克坎德莱斯.信息之美[M].北京:电子工业出版社,2012
[6]Daryl R.Morn.Newspaper Layout &Design[M].Iowa State University Press,2000:28
[7]郭晓科.数据新闻学的发展现状与功能[J].编辑之友,2013(8):87-89
[8]吴飞.编辑学理论研究[M].杭州:浙江大学出版社,2001:135-136
[9]金石.《新周刊》情人节专题背后的编辑力[J].采写编,2009(3):59-60
[10]李希光,张小娅.大数据时代的新闻学[J].新闻传播,2013(1):7-11
[11]文卫华,李冰.大数据时代的数据新闻报道——以英国《卫报》为例[J].现代传播,2013(5):139-142
[12]邝文国,马永祥.普通逻辑在科技期刊数据编辑中的应用[J].编辑学报,2007(12):416-418
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!