时间:2024-06-19
严子期,王仪,夏舟波
(1.宁波工程学院 人文与艺术学院,浙江 宁波 315211;2.宁波诺丁汉大学 商学院,浙江 宁波 315100)
2019年底,新冠肺炎疫情爆发并迅速席卷全球,对我国旅游业造成了巨大冲击。2020年,国内游客量为29亿人次,比2019年同期减少30亿人次;国内旅游收入2.23万亿元,同比减少3.50万亿元,下降61.1%;人均每次出游花费774.14元,同比下降18.8%[1]。如何在新冠肺炎疫情可能与人类长期共存的背景下发展旅游业是值得思考的问题。目前国内外学者已做了相关的研究,比如,夏杰长和丰晓旭将此次疫情与2003年非典疫情进行比较,认为新冠肺炎疫情对旅游业的影响更为严重,并对政府和市场提出了相对应的建议[2];刘雷和史小强探索了新冠肺炎疫情下体育旅游行为的影响机制,发现消费者的体育旅游风险感知较高,体育旅游消费行为意向较低[3];吕宛青等着眼于地方,从宏观旅游经济运行、中观旅游业态发展、微观旅游企业发展及旅游资本市场等四个层面,对新冠肺炎疫情给云南省区域旅游发展带来的影响进行分析,并提出相应的恢复发展策略[4]。Vaishar和Štˇastná认为新冠肺炎疫情使得乡村目的地成为游客的新选择,一些目的地在2020年夏季的游客人数与2019年相比有了明显的增长,并指出这种新的方向需要在基础设施、营销和区域合作方面进行投资[5]。El-SAID和AZIZ分析了虚拟旅游在后疫情时期旅游业复苏中的作用,并发现技术接受模型(technology acceptance model,TAM)和保护行动决策模型(protective action decision model,PADM)可以有效预测用户采取虚拟旅游的意图,而这种意图对其访问实际旅游景区的倾向具有正向影响[6]。然而,充分利用游客拍摄的照片大数据进行地方性游客感知及行为影响的研究仍有空白。
摄影作为用户生成内容(user-generated content,UGC)的一种形式,在现代旅游中起着至关重要的作用。照片由于其视觉表现能力,在形成目的地形象和传达信息等方面影响深远且广泛,已成为游客行为调查的有效工具。随着大数据时代的到来,照片大数据以前所未有的数量和细节展示了其提高旅游学术界和旅游行业知识的潜力,特别是与目的地游客行为相关的研究[7]。照片通常含有两层信息——表面信息(如视觉内容、照片标题和标题等),以及元数据(又名可交换图像文件格式,exchangeable image file format,简称EXIF,如曝光设置、拍摄时间、地理坐标等)[8]。进入照片大数据时代后,前期的研究主要集中在分析照片元数据,忽略了其表面的丰富视觉内容[9],可能是因为缺乏相应的照片挖掘和分析技术。本研究通过照片大数据图像识别及分析,结合照片背后的元数据信息,以新冠肺炎疫情作为影响游客行为的主要风险(因影响身体健康的风险因素左右决策最为显著[10]。游客一旦感知到风险,会采取不同的反应,比如及时调整旅行时间和同伴、改变目的地、调整策略等),试图从全局视角描绘首轮疫情前后游客感知及行为的变化情况,以期为目的地规划、旅游资源整合以及更有效地吸引游客提供建议和参考。
将浙江省宁波市作为主要研究城市,因为宁波作为副省级城市、中国东南沿海重要的港口城市以及长江三角洲南翼经济中心,是一个典型的江南水乡兼海港城市。它拥有多种地貌,属亚热带季风气候区,全年适合旅游。它拥有7 000年河姆渡文化,又受越文化影响,占有着丰富的旅游资源,常年吸引着大量游客。
选择国内最大的旅游电子商务平台之一——携程网进行数据收集。携程网从1999年成立至今,服务了全国数百万游客,收集了大量包含视觉内容的游记。
利用携程网采集的照片大数据,遵循现有理论框架,通过计算机深度学习模型和ArcGIS等分析工具,对照片的视觉内容和嵌入信息进行分析,比较游客的感知和行为偏好在疫情前后的变化。首先从宁波市的旅行日记中删除了没有包含照片的游记。其次,以新冠肺炎疫情首次爆发的2020年1月为起始,以同年4月中小学开学为标志来认定首轮疫情控制措施的结束。以此删除了2020年1月1日至3月31日相关的数据。数据收集截止于2021年初第二轮疫情爆发。综上,本研究获取9个月的面板数据,即从2020年4月1日至2020年12月31日。为平衡样本,一并收集2019年4月1日至同年12月31日的数据。
研究采用了CHEN等提出的DeepLabv3+进行场景识别[11],该程序目前已更新了三代。对于DeepLabv3+中采用的神经网络结构,则选择了ResNet[12]用于分类场景识别,它在各种计算机视觉竞赛中取得了不错的成绩。每张照片根据图1中所示的场景识别范例进行图像识别。本文参考了类型学和相关旅游研究文献[13],得出表1中的分类结果,并按照11个感知类别下的150个可识别场景,对图像识别结果进行分类和比较。相关文献已表明DeepLabv3+及其使用的150个场景分类器对于常规旅游照片画面的覆盖性和识别的有效性[14]。在全样本分析前,随机抽取了少量实验样本,结果显示这样的分类方式是有效的。
表1 11个感知类别下的150个可识别场景
图1 场景识别范例
研究过程主要分为四个步骤。第一步,数据收集和预处理。从携程网收集游记和旅游照片,并筛除不符合要求的样本(如图片重复、分辨率太低等)。最终,收集游记155篇(2019年4月—12月:69篇,2020年4月—12月:86篇)。在关于宁波的游记中收集12 244张旅游照片(2019年4月—12月:6330张,2020年4月—12月:5914张)。由于游记与实际旅游时间存在偏差,在数据分析前根据游记中作者提到的实际旅游时间进行相关的校正。第二步,使用DeepLabv3+深度学习模型对每张旅游照片的语义成分进行分割,确定场景。第三步,分析所得数据。基于深度学习模型结果,通过11个类别和单个场景,对比首轮疫情爆发前后游客对旅游场景感知的变化;对比游记和旅行照片的数量变化、同伴选择和人均消费,并使用ArcGIS软件和照片地理标签,进行游客行为分析。第四步,根据数据分析得出结论。
通过两个指标——场景发生率(scenario occurrence rate,SOR)和平均场景比率(average scenario ratio,ASR),研究对比了首轮疫情爆发前后游客的感知及行为的变化。SOR代表某一场景在所有挖掘照片中的出现率(如一张照片中出现该场景则计次1次,以此类推统计出整个数据集中该场景的出现率);而ASR代表该数据集中某一场景的画面大小占整张照片画幅的平均比例(由一张照片中某一特定画面占整张画幅大小除以出现该场景的照片数量得到)。这两个指标都可以反映游客在旅行中的感知和行为,但又有不同。平均场景比率(ASR)表示特定场景的像素占整张照片的比例。它是旅游期间游客注意力分布的典型指标,因为在摄影中,照片中某个场景的比例越大,通常意味着照片拍摄者对此的关注度越高,重点性越强[15]。然而,仅仅呈现特定场景占画面的比率可能会在理解游客感知的变化时产生偏差或误解,因为ASR的数值只能体现单张照片的情况,而无法代表绝大多数游客所拍摄的照片中特定画面的占比大小。因此,本研究用某一特定场景的SOR值加权其像素占整张照片的比例来反映这一场景真正的平均场景比率,使用两个指标也有利于交叉检查结果。
2.1.1 新冠肺炎疫情对游客感知场景类别的影响
根据表1的11个感知类别下的150个可识别场景和表2所示的方差分析结果,可知首轮疫情爆发前后,游客在“建筑和城市空间”“自然现象”“交通”“山与水”和“室内空间与设施”等五个类别上存在统计学意义上的显著性差异(<0.01);而“文化活动与标志”“娱乐”“动植物”“购物”“食物与餐厅”及“其他”等六个类别不存在显著性差异(>0.05)。
表2 方差分析结果
根据场景发生率(SOR),如图2中11类场景的出现率变化(基于SOR)可知,“室内空间与设施”场景出现率在首轮疫情爆发后下降了3.15%,降幅较明显(3.15%);而“交通”(3.41%)、“自然现象”(2.51%)及“山与水”(1.00%)等则增加显著。基于SOR加权ASR的分析,有图3中11类场景的画面占比变化(基于SOR加权ASR)可知,“建筑和城市空间”(3.03%)、“室内空间与设施”(0.61%)类别的平均场景比率减少较多,而“自然现象”(1.98%)、“交通”(1.08%)及“山与水”(1.00%)类别的平均场景比率增加较多。
图2 11类场景的出现率变化(基于SOR)
图3 11类场景的画面占比变化(基于SOR加权ASR)
2.1.2 新冠疫情对游客感知具体场景的影响
针对150个场景,笔者再次利用SOR和ASR两个指标来描述新冠肺炎疫情首轮爆发后游客感知的变化。由图4显示的SOR下降幅度最大的20个场景可知,游客经常拍摄的场景(超过40% SOR)下降幅度较大的有4个,即“植物”(3.36%)、“人”(3.20%)、“地板”(1.89%)及“墙”(1.53%)。同时,“围栏”(2.63%)、“天花板”(2.51%)、“桌”(2.26%)、“岩石”(2.11%)、“草”(2.07%)这5个场景的出现率也显著下降。另一方面,由图5中SOR上升幅度最大的20个场景可知,SOR增加显著的常见场景(超过40%SOR)有3个,即“树”(3.72%)、“建筑”(3.68%)及“天空”(2.51%)。同时,“山”(8.17%)、“水”(4.00%)、“道路”(3.78%)和“海”(3.47%)等场景的出现比例也有明显增长。
图4 SOR下降幅度最大的20个场景
图5 SOR上升幅度最大的20个场景
由图6中ASR下降幅度最大的前20个场景(基于SOR加权)可知,对于ASR下降最多的前5个场景有:“墙”(2.06%)、“植物”(1.38%)、“土地”(0.99%)、“围栏”(0.97%)和“建筑”(0.74%)。由图7中ASR上降幅度最大的前20个场景(基于SOR加权)可知,对于ASR增加最多的前5个场景为“山”(2.07%)、“天空”(1.98%)、“树”(1.48%)、“海”(0.51%)和“道路”(0.48%)。
图6 ASR下降幅度最大的前20个场景(基于SOR加权)
图7 ASR上升幅度最大的前20个场景(基于SOR加权)
从照片发表数量来看,在疫情首次爆发前,游记和照片的数量显示出较为一致的波动:2019年8月为高峰(16篇游记和530张照片),两者间稍显不同的波动则体现在11月(7篇游记和595张照片);在疫情首次爆发后,2020年11月为拍摄高峰(12篇游记和622张照片)。而首轮疫情后,游客的平均出行天数从疫情前的2.62天下降到1.99天,人均消费则从1 340元大幅下降到560元。
依托照片标签,首轮疫情爆发后,作为亲子(9.66%)、朋友(8.14%)、情侣(0.57%)的游客数量有所增加,而独自旅行(6.63%)、夫妻(6.63%)及与父母(5.11%)一起旅行的游客数量有所下降。可以看出,在甬游客倾向于以核心家庭(指由一对夫妇及未婚子女组成的家庭,nuclear family)而不是扩展家庭(在核心家庭基础上还包括其他成员的家庭模式,extended family)的形式旅行,与朋友一起旅行成为了大多数人的选择,而以亲子和情侣的形式出游的人数也有所增加。
参考挖掘出的旅游照片的地理位置信息,通过ArcGIS绘制和分析了游客在宁波各个目的地的足迹(ArcGIS是一种用于创建和使用地图、编辑地理数据和分析地图信息的软件)。图8显示首轮疫情爆发前(左)后(右)在甬游客的足迹分布情况。疫情首轮爆发前后游客的综合足迹分布情况差异并不多,首轮爆发后,游客在奉化溪口和象山的足迹增加,而在慈溪的足迹则稍许减少。从11个场景大类来看,游客足迹则各有变化。游客在“建筑与城市空间”“文化活动与标志”“购物”与“娱乐”等方面的足迹变化集中表现在宁海与奉化溪口的增加,以及慈溪和象山的减少。游客足迹在“室内空间与设施”及“食物与餐厅”等方面变化主要体现在奉化区域的增加。游客在“交通”与“自然现象”等方面的足迹变化表现在慈溪及杭州湾(跨海大桥)等区域增加较为明显。此外,“水与山”“动植物”等方面的游客足迹则有向四明山国家森林公园集中的趋势。
图8 首轮疫情爆发前(左)后(右)在甬游客的足迹分布情况
首轮疫情后,游客对宁波市内旅游景点的选择与疫情前虽有区别,但不十分明显。结合上文可知,疫情首次爆发后在甬游客的感知向“山与水”“交通”和“自然现象”上靠近的趋势与旅游景点的选择变化的相关性并不高。
由照片大数据的分析可知在甬游客平均消费与游玩天数有所下降,更倾向以核心家庭的方式出游,其感知有向“自然现象”及“山与水”等类别转移的趋势,但景点选择变化并不明显。另外,新冠肺炎疫情作为一种包含多种风险因素的综合风险,增加了游客不确定性,并从多个方面影响其行为,尤其是与自然世界的关系。尽管个人对自然联系的感受和评估存在可识别的差异[16]。但多项研究表明,自然关联性[17]是人类生活满意度、整体幸福感、心理幸福感、个人幸福感和主观幸福感的重要标志和预测指标。与自然脱节可能会对环境和人类产生负面影响,例如生物多样性的丧失、对人类心理的影响以及适应环境的速度变慢等[18]。当新冠肺炎疫情在2020年初成为一种风险和不确定性时,游客与自然的关联性受到抑制。在首轮疫情爆发后,游客的行为已表现出他们将部分注意力转移到了自然世界,而游客的自然关联性在各种情况下会随着时间趋于稳定[17],因此这样的转变对旅游业及周边产业的影响可能是深远的。虽然受疫情防控措施的影响,人文类景点如文博场所长期关闭也可能间接导致室外景点照片数量和比例的上升,但无论缘何,新冠肺炎疫情成为一种风险和不确定性后所造成的游客感知和行为改变,将可能对未来的旅游业及游客行为产生长期的影响。
本研究结果对旅游营销和管理提供了一些有价值的参考,受疫情影响,游客注意力有从人造景物向自然相关景物转移的趋势,然而这种转移并未引起游客对旅游景点选择的明显变化。另外,游客的平均游玩天数大幅度下降,更倾向于“两天一夜”的安排。当地旅游部门和相关组织可据此调整策略,开发和完善相关的景点。
本研究通过深度学习技术对照片大数据进行图像识别,结合照片元数据,从全局视角描绘对比首轮疫情前后在甬游客感知及行为的变化,为目的地规划、旅游资源整合及如何更有效地吸引游客提供了建议和参考。研究还认为当自然关联性因疫情受到抑制时,人类寻求幸福的权力、接触自然的机会被剥夺,内心更渴望接近自然。这符合自然关联性以及风险和不确定性的相关概念,相关机构和人员也可据此调整旅游营销策略。本研究还存在一些不足:首先,它还处于大数据理论分析阶段,未来可考虑应用定性访谈来解释背后的原因。其次,以宁波市为研究城市,数据量较典型的旅游城市如三亚、厦门和丽江等稍欠充裕。另外,本研究虽确定了在新冠肺炎疫情首轮爆发后的9个月内游客的感知和行为偏好发生了明显变化,但这种转变是否会持续下去,会持续多久,它们对于游客本身又会带来哪些具体影响,诸如此类的问题期待其他学者参与研究。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!