当前位置:首页 期刊杂志

网络群体性事件的主题特征知识库研究

时间:2024-07-29

黄 炜, 余亚婷 , 王思婷

(1 湖北工业大学管理学院, 湖北 武汉 430068;2 武汉理工大学管理学院, 湖北 武汉 430070)

中国互联网络信息中心(CNNIC)在京发布的《第31次中国互联网络发展状况统计报告》中指出,截至2012年12月底,中国网民规模达到5.64亿,互联网普及率为42.1%,网络信息将传播得更加迅速和广泛[1]。微博、BBS、QQ、MSN等网络社区工具为网民的意见发表提供了平台,但是网络流言、谣言也有了滋生的环境。近年来发生了许多网络群体性事件,给社会稳定和经济发展带来了严重的影响,给各级政府提高社会管理水平增加了难度,如何有效地处置网络群体性事件是亟待解决的问题[2]。网络群体性事件的爆发有其内外界因素,表现出一定的主题特征[3]。本文对网络群体性事件的主题特征进行信息维、主题维、过程维三个维度的分析,构建网络群体性事件的主题特征知识库,对网络群体性事件的发现、传播扩散、预警监控等起到一定的支持作用。

1 网络群体性事件与特征分析

1.1 网络群体性事件

网络群体性事件从概念分析来看,存在广义和狭义之分[4],广义上说,网络群体性事件指在互联网络时代,由某个社会问题引起,以特定网民群体为主体,在理性或非理性状态下,基于某种正当或不正当的利益需求,为了达到一定目的,利用网络交互信息,有组织或无组织的,有序或无序的制造网络舆论,并随事态变化迅速形成网络舆论潮,甚至在某种情况下转变为现实中的暴力或非暴力集群行为的现象[5]。狭义上说,网络群体性事件指在互联网络时代,由某个社会问题引起,主要由网民群体发起,在理性或非理性状态下,基于某种正当或不正当利益需求,为达到一定目的,利用网络交互信息,有组织或无组织、有序或无序的制造网络舆论,随事态变化迅速形成网络舆论潮并转变为现实中的暴力或非暴力集群行为的现象[6]。

网络群体性事件近年来频繁发生,表1列出的是近年来发生的部分网络群体性事件,网络群体性事件涉及了我国物价、社会保障、收入分配、企业舆情、高校舆情等方面,这些事件已经给社会发展带来了不容忽视的影响。

表1 近年来部分网络群体性事件

1.2网络群体性事件特征分析

1.2.1信息维网络群体性事件的信息具有传递性、可共享性、依附性、可处理性、价值相对性、真伪性、时效性等特征。从信息维的时间、内容和形式三个角度分析网络群体性事件的特征。

从时间角度上看,网络群体性事件具有及时性特征,一般是在很短的时间内爆发的,在网络这个开放的环境里,信息的传播比一般大众媒体传播得更加迅速和及时。信息一旦被发布,就通过即时通讯、网络新闻、社交网站等多种途径迅速地被大量转载、评论,进而引发网络群体性事件的发生。相反在短时间没有产生强烈反响的信息往往会被互联网数以万计的信息给淹没。

在其内容上网络群体性事件可以表现为一个群体抗争个人、一个群体抗争另一个群体、网民对某些制度的抗争等[7]。网络审判可以说是一个群体抗争个人的比较典型的表现,网络审判是最常见的一种网络群体事件,其特点是:超出理性讨论的边界,直接使用非理性的语言为目标定罪,网上“审判”通常都是在试图通过语言暴力达到网民心中的正义。我国处于社会转型期,社会结构的不平衡,社会利益分化,贫富差距比较大,一个群体抗争另一个群体在某些方面表现为相对较弱势的群体对比较强势群体的抗争,这形成了网络群体性事件信息内容的矛盾抗争性特征。

在信息形式上,网络群体性事件的信息从原始的网页等文档形式的帖子,到如今社会化网络社区上简单的几句话或微博实时更新上的几个字、几张图片、几段视频等,其表现形式上越来越简洁和直观。

1.2.2主体维网络群体性事件参与的主体在年龄、学历和职业等多方面呈现多元化的特点,根据中国互联网络信息中心(CNNIC)发布的《第31次中国互联网络发展状况统计报告》显示,从年龄结构上来看,网民大多集中在10~50岁,其中20~29 岁的网民占全部网民的30.4%;从学历结构上看,初中及以下学历网民占46.5%;从职业结构上看网民中学生群体占比最高,达到 25.1%[1]。可见网络群体性事件参与的主体仍以青年网民为主,青年人有这个时代赋予的特征,他们追求自由,思想比较开放,但也最容易产生过激行为,缺乏一种成熟的理性思考[8]。这就形成了网络群体性事件主体心理、行为的潜在不稳定与盲从特征。

1.2.3过程维网络群体性事件的发展可分为四个过程。

第一阶段为源事件的导入,即网络群体性事件主题的形成。发起者将现实世界的事件导入到网络虚拟世界。

第二阶段为网络群体性事件的发生。由第一阶段导入的主题在短时间内能引起人们的高度关注,并在网上开展激烈的讨论时,则形成网络群体性事件。

第三阶段为网络群体性事件的发展。针对任何一个事件,人们的意见总是有两面的,以意见不同的两派“意见领袖”为轴心各自形成一个群体,意见的产生是网络群体性事件进一步发展的推手,没有意见的流动则没有事件的运动。舆论就是多数人的声音,当某种意见占上风的时候,它的拥护者会越来越多,进而成为网络群体性事件舆论的中心。当这一舆论形成,网络群体性事件由线下渐渐地向线上转移,这时传统媒体也介入其中,使其影响更加扩散开来。

第四阶段为网络群体性事件的衰退。网络群体性事件有些本身并没有“好”或“坏”的标签,但由于参与者的目的、动机、价值观不同会带来截然不同的社会效果。当网络群体性事件发展到一定阶段时必定有一些相关部门出面制止,当这一事件得到解决,网上网下的讨论也渐渐平息,网络群体性事件也走进其衰退期。

2 网络群体性事件主题特征知识库构建

分析网络群体性事件主题特征和内容语义,建立网络群体性事件主题特征知识库,为网络主题相关信息的清洗、过滤,获取可能发展成为网络群体性事件的源信息,起到至关重要的作用。通过对历年发生的网络群体性事件的分析,得到导致事件快速传播、引起群众围观的核心词汇,把这些词汇统计在一起并加以分析、组织,优化整理形成网络群体性事件的特征知识库。

2.1 知识库的定义

知识库(Knowledge Base)是知识工程中结构化、易操作、易利用、全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合[8]。网络群体性事件的主题特征知识库是基于网络群体性事件内在的特征来进行组建,每一个事件的主题特征词汇就是它的知识片。

2.2 知识库的构建

影响知识库构建的因素主要包括知识发现、知识组织、构建知识库三方面。其中知识发现是指对客观存在的元知识进行认识,形成对特定主体具有一定意义的状态,这是知识库构建的前提。知识组织是在知识发现的基础上对客观知识的无序化状态所实施的一系列有序化组织活动。构建知识库则是进一步在前两者的基础上运用相关性原理、知识体系等方法和模型,形成特定领域内的知识体系,其关系如图1所示[9]。

图 1 知识体系

采用人工建设和计算机辅助构建并存的半自动构建的方法,构建过程主要分为三个阶段。

第一阶段:人工构建。即在网络信息世界里通过人脑意识加工对已经存在知识片进行人工获取,发现需要的元知识,为知识库的构建添砖加瓦。包括定位目标知识库、抽取关键词汇、关联关键词汇、存储关键词4个环节(图2)[10]。

图 2 人工构建

第二阶段:计算机辅助构建。利用计算机来帮助对知识进行组织和用一些方法规则来表示知识形成知识库。

所谓知识表示(Knowledge Representation),就是把知识用计算机可接受的符号并以某种形式描述出来。本文采取语义网络来表示知识。语义网络一般由一些最基本的语义单元组成,这些最基本的语义单元被称为语义基元,可用如下三元组来表示:节点1,弧,节点2,网络的节点表示事物、对象、状态、概念、属性、情况、动作等,连接弧表示节点间的语义关系,节点和弧都必须带有标识。语义网络基本语义联系包括:类属关系、包含关系、属性关系、时间关系、位置关系、相近关系、因果关系、组成关系[11]。如网络群体性事件“温州红十字会女出纳挪用126万公款获刑6年半”。首先确定对象及其属性,可以发现对象有 “温州红十字会”、“女出纳”、“公款”、“126万”、“6年半”;其次,确定对象间的关系,“温州红十字会”是“女出纳”的工作单位,“女出纳”发出“挪用”的动作,“挪用”的对象是“公款”,“公款”的数目是“126万元”,“女出纳”获刑“6年半”。将对象作为节点,对象之间的关系作为弧,连接成语义网络(图3)。

图 3 “温州红十字会女出纳”的语义网络

第三阶段:存储知识库。将网络群体性事件主题特征知识库分为多个子库,有一级关键词库、二级关键词库、关联网络流行词库、网群事件知识库。其中二级词库按研究领域不同又分为社会网络舆情词库、食品安全词库、大学生舆情词库。如图4所示,将组织好的不同类别的知识分别存储在各个知识库中,对于那些比较分散且难以用语义网络组织的知识分散存储在分布计算机环境下的不同节点上。

图 4 网络事件知识库各节点

2.3 知识库的动态管理

初步构建的知识库是不成熟、不完善的,应用过程存在很多局限,需要对其进行不断的优化处理,并实时维护。知识库的动态管理是向知识库添加新知识、 修改知识库中的知识以及根据知识的使用频度对知识的索引级别进行调整的动态机制[12]。网络群体性事件主题特征知识库的动态管理可以分为对词库的添加和优化整理。

1)词库的添加。对于网络爬虫从网上爬下来的网页、帖子等,将其添加到网络事件知识库中,将网络群体事件进行人工分析的词汇添加到相应的词库中。

2)词库的优化整理。将词库中的关键词汇进行建立本体、语义分析,对关键词汇进行设置权值;对网帖进行对比分析,检测权值设置的准确程度;根据权值大小,使用频率高低,对帖子在词库表中建立索引;对于重新获得的词汇,将其与原词汇表进行比较,过滤掉已经有的词汇,将新添加的词汇进行本体语义分析,添加到知识库中;将使用频率低、权值低的帖子和词汇进行删除,以节约知识库的空间以及减少人员的工作量。

3 网络食品安全事件中的知识库实例

近年来,食品安全事件对社会稳定产生了一定的影响,因此建立食品安全事件子库显得十分必要。

建立食品安全知识库的过程中,第一阶段进行人工构建,抽取有关食品安全事件关键词汇,将2005年到2012年之间发生的食品安全事件进行搜索和整理,到目前为止找出了250个事件,其关键词汇有2000多个(图5)。

图 5 2005年到2012年之间的食品安全事件

但整理出来的词汇比较零散,不能表现其具体特征。本文将各种类型的事件进行分析、归纳。比如奶粉事件一直是人们关注的热点,将搜索到的近几年有关奶粉的事件进行归纳,将这类事件导致网络群体性事件爆发的关键词汇进行总结提炼。再如食品添加剂使用不当的事件经常被报道出来,也将这些事件归为一类,将其关键词汇进行归纳。

图 6 食品安全领域本体

图 7 食品安全领域本体代码

第二阶段进行计算机辅助构建,利用protege、jena等软件构造本体,对其进行语义分析和表示。图7为图6部分本体代码。大量的领域专业词汇汇集到一起本身就代表了这个本体的领域特征,便于主题识别。在构建食品安全领域本体的时候,主要是从以往爆发的食品安全事件中提取的词汇,所以对于这些词应给予重视,相应给予较高权值。对关键词汇赋予相应的边界权值,为分析网络群体性事件主题特征的识别提供一定的依据。

5 结束语

网络群体性事件主题特征是针对近几年发生的比较典型的网络群体性事件进行分析总结而成的,它对发现类似事件会起到一定的作用,但是随着社会结构与主题不断地发生变化,网络群体性事件的爆发速度会越来越快,产生形式也多元化,特别是微博的兴起,对网络群体性事件的主题信息获取与知识格式化提出了新挑战,这将是今后研究的方向。

[参考文献]

[1] 中国互联网络信息中心(CNNIC).《第31次中国互联网络发展状况统计报告》[R]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201301/t20130115_38508.htm[2013-04-15].

[2] 范铁中. 快速转型时期我国社会矛盾产生的原因解析[J]. 中国浦东干部学院学报, 2011(6):40-44.

[3] 王伟亮. 群体性突发公共事件与危机传播——以贵州瓮安 “6· 28” 事件为例[J]. 新闻记者, 2008(8):15-19.

[4] 揭 萍, 熊美保. 网络群体性事件及其防范[J]. 江西社会科学, 2007(9):238-242.

[5] 杨久华. 关于当前我国网络群体事件的研究[J]. 北京青年政治学院学报, 2009,18(3):75-80.

[6] 张向阳. 浅析网络群体性事件概念之界定[J]. 金卡工程: 经济与法, 2010, 14(6):135-135.

[7] 杜骏飞. 网络群体事件的类型辨析[J]. 国际新闻界, 2009(7):76-80.

[8] 彭 博. 网络群体性事件的规律分析和防范策略研究[J]. 山东警察学院学报, 2008,1-.

[9] 耿 崇, 庞跃霞, 苏建华. 基于引用关系的知识库建设[J]. 图书馆杂志, 2008,27(8):55-58.

[10] 李耀昌, 刘建准, 姚 伟. 基于知识组织层次模型的知识库构建[J]. 情报理论与实践, 2010(8):29.

[11] 郑金华, 肖松青. 一种实用的知识库模型[J]. 湘潭大学自然科学学报, 1999, 21(3):104-106.

[12] 唐籍涛, 李 飞, 郭昌松. 网络舆情监控中新词识别问题的研究[J]. 计算机技术与发展, 2012(1):31.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!