当前位置:首页 期刊杂志

大数据思维方式下地方志工作的开拓与创新

时间:2024-04-24

游桃琴

(江西省地方志编纂委员会办公室 江西 南昌 330008)

21世纪以来,信息技术飞速发展,大数据渗透到各个行业和领域,逐渐成为竞争力、创新力和生产力发展的重要手段。大数据技术,让所有社会科学领域能够借由前沿技术的发展从宏观群体走向微观个体。谁能率先实现和占有大数据,谁对大数据的挖掘更为深刻,谁就将抢占未来先机。而这取决于人们对大数据及大数据技术的认知和态度,也就是说,形成与之相适应的思维方式就成为驾驭大数据和实现其价值的关键。建立在大数据平台上,运用大数据思维方式运作的地方志工作将不仅仅是一项工作,而是一项事业。当然,大数据思维方式离不开大数据的支撑,大数据是大数据思维方式出现的源头和赖以生存的基础。从根本上说,大数据思维方式是产生于大数据时代、立足于大数据技术之上的新观念体系。

一、大数据的特点

何为“大数据”?“大数据”通常用来形容一个公司创造的大量非结构化或半结构化数据。互联网行业认为,“大数据”是互联网公司在日常运营中生成、累积的用户网络行为数据。在维克托·迈尔·舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中,“大数据”指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。美国互联网数据中心认为,“大数据”是通过高速捕捉、发现、分析,从大容量数据中获取价值的一种新的技术架构。我国政府还没直接就“大数据”专有名词提出来给予政策支持。不过,工信部发布的物联网“十二五”规划上,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括海量数据存储、数据挖掘、图像视频智能分析,这都是大数据的重要组成部分。在见仁见智的回答中,有一些东西是共同的,而这即是大数据的特点。

整体性。大数据的资料量规模庞大到不能用G或T来衡量,无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助决策的资讯。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,都在以数据的形式追踪人们的日常生活,并将这些数据存储在相应的数据库中。这些数据库以某些相关性相联,构成大数据海量资料量的整体。

多样性。大数据中数据类型繁多,这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。

关联性。大数据中的“数据”与“数字”是具有不同内涵的。一个数字背后的背景数据、评论数据、心情数据等全方位界定了该数据的意义。数据能否被赋予新的价值、实现从数字支撑到数据支撑的顺利转化,理解巨量数据的关联性是至关重要的。发掘这些形态各异、快慢不一的数据流之间的相关性,是大数据做前人之未做、能前人所不能的机会。

开放性。大数据产生速度快、体量庞大,任何单位和个体想垄断占有都不现实,大数据向所有合法用户开放。海量数据本身的价值密度较低,但是经过清洗和“提纯”的数据价值却很高。这就造成大数据可以从多角度、多层面进行组合、筛选,为不同主体所使用。

二、大数据带来思维方式的转变

(一)总体思维

曾经抽样是获取数据的主要手段,大数据时代,随着数据收集、存储、分析技术的突破性发展,更方便、快捷、动态地获得研究对象所有有关数据成为现实。相应地,思维方式也应该从样本思维转向总体思维,才能更全面、系统、客观地反映事物本来面目。

(二)容错思维

小数据时代,信息收集的有限性意味着细微的差错会被放大,甚至可能影响整个结果的准确性,因此对样本精确度的要求是苛刻的。大数据时代,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法利用。当拥有海量即时数据时,数据的绝对精准不再是追求的主要目标,适当忽略微观层面上的精确度,容许一定程度的错误与混杂,反而可以在宏观层面拥有更好的认知和洞察力。

(三)相关思维

小数据时代,人们往往执着于现象背后的因果关系,试图通过有限样本数据来剖析其中的内在规律。大数据时代,人们可以通过大数据技术挖掘出事物之间隐蔽的潜在相关,帮助捕捉现在和预测未来。通过关注线性的相关关系,以及复杂的非线性相关关系,可以看到很多以前不曾注意的联系,还可以掌握以前无法理解的复杂技术和社会动态,相关关系甚至可以超越因果关系,成为我们了解世界的更好视角,而且不易受偏见的影响。

(四)智能思维

自进入信息社会以来,人类社会的自动化、智能化水平得到明显提升,但始终无法取得突破性进展,机器的思维方式仍属于线性、简单、物理的自然思维。大数据技术的发展运用,为机器智能提供契机,推进机器思维方式由自然思维转向智能思维。随着物联网、云计算、社会计算、可视技术等的突破发展,大数据系统也能够自动搜索所有相关的数据信息,并让数据主动“发声”,类似“人脑”一样主动、立体、逻辑地分析数据、做出判断,从而获得具有洞察力和新价值的东西,甚至类似于人类的“智慧”。

三、大数据思维方式下地方志工作的开拓与创新

中华民族有着2000多年编修地方志的优良传统,现存旧志有8000多种、10万多卷。新中国成立后特别是改革开放以来,在党中央、国务院正确领导下,经过各地区各有关部门不懈努力,地方志工作取得巨大成就和丰硕成果,截至 2016年底,已出版7000多部省、市、县三级地方志书,28000多部行业志、部门志、军事志、武警志、专题志、乡镇(街道)志、村(社区)志等,2400多种地方综合年鉴,1100多种专业年鉴。同时,整理出版旧志2800多种,出版各种志鉴理论著作1000多部,发表论文6万多篇。建成各级各类方志馆460多个;建成网站、网页1130个;开通省级方志微信19个,市县方志微信200多个。

***曾在多个场合提出,“高度重视修史修志,把历史智慧告诉人们,激发我们的民族自豪感和自信心,坚定全体人民振兴中华、实现中国梦的信心和决心。”李克强总理在第五次全国地方志工作会议的批示指出,“修志问道,以启未来。”这些精神和指示,都包含了巨大的时代担当和使命追求。我们应该“因时而谋、乘势而上、顺势而为、充分挖掘、开发利用地方志资源”,主动服务大局、服务社会、服务百姓。

思维是行动的先导,环境和条件变了,思维方式就自然要随之而变。当前,大数据思维已经成为影响我们生活方式的新的思维方式,地方志工作也必然要适应新常态,在新的思维方式下开拓和发展自身事业。

(一)建立以大数据整体性为支撑的总体思维

在小数据时代,由于技术条件的限制,人们只能通过把复杂的整体分解多个部分的方法来分析研究事物,并试图用这些部分信息来描述整体特征。而在大数据时代,人们可以利用大数据技术,收集、处理和“提纯”海量数据,主动关注全局,从更广的范围,更高的层次,更深的角度认识事物,形成基于大数据基础上的总体思维。

当前地方志工作割裂问题比较严重。虽然出台了《地方志工作条例》《全国地方志事业发展规划纲要(2015—2020年)》等文件,但还缺乏依法治志体制,难以适应时代需要。且实际工作中,主要通过行政命令和行政手段组织实施,受各单位领导主观意志和人员素质影响较大,区域发展极不平衡。同时,缺乏高效运行条件,处境尴尬。虽然这几年,地方志系统极力主张主动作为,服务社会、服务大局,但“两耳不闻窗外事,一心只编地方志”现象依旧普遍存在,导致地方志生存和竞争力极低。且从领导体制来看,国家层面,地方志未独立设部,附属于社科院,系统内部上下级之间仅是业务指导,无选人用人权,无考核奖惩权。

作为一项事业来说,国家层面,地方志应加强顶层设计,争取尽快立法,取得“话语权”。才能更好地在法律授权范围内,高规格推动地方志事业发展,奖惩分明地促进相关单位领导的重视,吸引有能力的人才加入地方志队伍。同时,要筹谋发展合力,根据当前全国地方志的实际情况和发展趋势,取长补短、扬长避短,统一规划,统筹布局,在全国方志系统内形成一盘棋。省市县层面,要突破思想束缚,争当“活着的精神”,挖掘地方志在文化事业发展中“根”的作用,做出“拳头”产品,主动融入经济社会建设,贡献绵薄之力。

(二)建立以大数据多样性为支撑的容错思维

容错思维,不是纵容错误存在,而是接受不精确的存在,并不断调整纠偏。在大数据时代,由于技术的进步,人们基本可以做到实时、实地采集、传输、处理数据,可以实时准确地把握事物的动态发展变化情况,随时调整决策,纠正错误。

地方志资源最大的优势是以结构化数据的方式存在,无论是新旧志书还是理论研究成果,都是能被传统数据库所容的结构化数据。从横向来看,地方志资源反映本行政区域内自然、政治、经济、文化、社会等方面情况,可谓名副其实的“众手成书”的百科全书。但由于记载时间跨度长,涉及部类环节多,存在出错概率。从纵向来看,地方志资源贯穿中华民族发展的几千年,且因为各种原因出现过时间断层,同一事物在不同历史时期的记载可能出现差异甚至悖逆。

在信息受限的时代,因为缺乏参照,可能发现不了问题。但在大数据时代,信息来源广,更新快,数据分析能力极大提升,使用者发现问题的概率上升。这就需要突破地方志资源以纸质载体为主的限制,实现信息化和数字化。同时,加强与高校、科研院所等单位和机构之间的互通交流,积极“走出去”和“请进来”,借脑思维,利用大数据平台,不断纠偏和实证,获得宏观领域更深刻的认知和把握,突出地方志资源的权威性和客观性、科学性。

(三)建立以大数据关联性为支撑的相关思维

大数据时代,事物各组成要素之间的关系已经不完全是简单的线性因果关系,而更多的是一种非线性的相关关系。通过分析研究数据变化所反映的事物之间的内在联系以及相关关系,可以避免我们的思维方式陷入冗长的因果关系链,较为快捷地发现事物不同要素之间的相互关系和相互影响及相互作用方式,为快捷准确地找到解决复杂问题的方案提供有效的路径。

地方志工作要求基本形成党委领导、政府主持、负责地方志工作的机构(以下简称地方志工作机构)组织实施、社会各界广泛参与的工作体制。当前地方志工作也确实是在党委领导、政府主持、地方志机构组织实施下开展的。但是社会各界参与度还比较欠缺,主要在于地方志忽略民众需求、脱离市场、自修自赏。从文字看,绝大多数志书都是机关企事业单位日常工作的条块分割纪录;照片多是领导开会、视察、接待外宾,大型文艺汇演,风景照;人物多是一定级别领导干部以及高级职称、劳模、英烈为主。地方志书虽强调“述而不作”,但通篇看来歌功颂德、报喜不报忧。

邓小平在视察南方时,曾提出“三个有利于”标准。这一标准,同样适用于也应该是地方志工作的标准,且是唯一标准。地方志工作者要改变常年蹲守办公室闭门造车的现状,在发动全民供稿、众手修志的同时,下到地头田间、街头巷尾、生活一线、生产前沿,保持地方志资源的新颖性和生活性,踏踏实实记录热火朝天的现实生活和人民身影,并从中挖掘历史变迁、时代发展的规律,把历史的智慧告诉人们。这样接地气的地方志书还会没人看、无人读吗?地方志书收录资源的变化,也必然带来受众的变化,改变当前地方志工作“官不官、民不民”的处境,释放地方志的生机和活力。这样的地方志书也才堪当“资政、存史、育人”之大任。

(四)建立以大数据开放性为支撑的智能思维

封闭导致混沌,而开放则会带来生机和活力。大数据的一个鲜明特征就是开放性。从数据来源来看,大数据时代的数据建设对所有的有效数据保持开放;从数据的使用来看大数据时代的数据向所有的合法用户保持开放,任何用户都没有数据特权。这种开放性为人们的智能思维奠定基础,为我们探索掌握现实和未来事物发展的特点规律,智慧思考、超前谋划提供支撑和条件。

地方志工作者非常重视地方志组稿、编辑、出版工作,却忽略了最重要的读者体验,几乎没有关于读者体验的跟踪和反馈。地方志工作者总认为自己拥有一座资源的宝库,不可否认,在大数据平台的支撑、大数据技术的应用下,地方志资源的的确确是一座中国优秀传统文化资源的宝库。但现实是,我们不知道谁需要宝库中的哪些东西?谁想找到宝库的大门却不得?谁对于宝库资源开发有很好的想法?宝库有没有漏洞需要修补?一言以蔽之,我们缺乏对读者行为的把握。仅仅负责提供内容,并想靠内容一个维度影响读者。在新媒体时代,传统内容维度黏性较弱,读者更容易被其他全新的阅读体验所吸引,他们的阅读兴趣随时在发生转移。

大数据时代,地方志工作应抓住这一历史机遇,形成“读者画像”,通过与各种大数据团队的合作、融合,了解读者的兴趣所在,并主动推送新内容不断吸引潜在读者、研究已有读者,增强读者黏性。从而突破当前地方志工作者忙得热火朝天,读者却“把头偏向一边”的自说自话、自娱自乐的现象,营造文本、环境、工作者、读者间的良性互动封闭环,充分发挥地方志为社会服务的作用。为国存史固然是地方志的重要作用之一,但是更需要参与当下的社会建设,为当今时代服务。这就需要解放思想,主动参与大数据时代、拥抱大数据平台。地方志资源都是结构化数据,且横不缺项、纵不断线,这是非常宝贵的资源,只是条块分割严重、规律性需要挖掘。建立相应的保障机制,融合大数据技术,重新分布和整合资源,在兼顾全面的基础上,打破均衡原则,突出地域特色、时代特色,地方志资源完全可以变成平台化的文化产品,并借助所需主体对内容的加工和深度挖掘而分享收益,使地方志更接地气,走进社区、学校、机关、企业等,真真实实为民所用。这也是增加地方志资源利用率的一种思考角度。

结语

***总书记指出,“创新是一个民族进步的灵魂,是一个国家兴旺发达的不竭动力,也是中华民族最深沉的民族禀赋。在激烈的国际竞争中,惟创新者进,惟创新者强,惟创新者胜。”大数据时代已经来临,采集、处理海量数据的平台和技术都已具备。地方志事业要开拓发展,必然要从思想的高度、方法论的深度上进行创新改革,高屋建瓴地锐意进取,才能不负当前好机遇,谱写地方志事业的华美篇章。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!