基于文本分析法的沙漠型5A级旅游景区游客感知与旅游行为研究
Research on tourist perception and tourism behavior of desert scenic spots based on the text analysis method
通讯作者:
收稿日期: 2021-10-31 修回日期: 2021-12-13
基金资助: |
|
Received: 2021-10-31 Revised: 2021-12-13
作者简介 About authors
高冲(1998—),男,陕西西安人,硕士研究生,主要研究方向为风沙地貌学E-mail:
关键词:
Keywords:
本文引用格式
高冲, 董治宝, 姜有根, 王晓枝, 张欣.
Gao Chong, Dong Zhibao, Jiang Yougen, Wang Xiaozhi, Zhang Xin.
0 引言
2020年底,中国北方9个省(自治区)已建成各类包含沙漠旅游资源的景区100余家,5A级景区6家;中国知网(CNKI)可检索相关文章200余篇,研究热点为旅游资源开发[12-14]与景区可持续发展[15-18],驱动因素研究聚焦于旅游资源[11],发展现状聚焦于景区视角[19]。但是现代旅游业以游客为中心、市场为导向,产业结构从“量”的积累转变为重“质”的提升[20]。沙漠旅游资源的定义也从沙漠为载体的事物、活动扩展成为了沙漠旅游资源与沙漠邻近地区的其他资源,将沙漠毗邻地区的其他资源纳入其中[21-22],形成了广义的沙漠旅游,即沙漠旅游是指以沙漠和沙漠毗邻地区的事物、活动为载体,以猎奇、探险、环保、科考、求知等方面的需要为目的进行的一系列旅游活动。沙漠旅游驱动因素的研究也应该聚焦于游客,研究对象应该聚焦于行业5A级景区。因此研究了5A级沙漠型旅游景区在携程网和去哪儿网的评论,得到了沙漠旅游发展现状、游客感知与旅游行为,对中国沙漠型旅游景区的开发与发展提出了建议。
1 研究方法与数据来源
1.1 样本选取
图1
表1 景区基本信息
Table 1
景区名称 | 官方公布日期 | 资源类型 | 资源组合 |
---|---|---|---|
白沙湖景区 | 2017-02-25 | 水域风光 | 沙漠、湖泊、植被 |
胡杨林景区 | 2020-01-07 | 生物风光 | 胡杨、柽柳、沙漠、胡杨节、荒漠 |
鸣沙山月牙泉景区 | 2015-05-20 | 地文景观+水域风光 | 沙漠、泉水、响沙、莫高窟艺术景观 |
响沙湾景区 | 2011-01-10 | 地文景观 | 沙山、响沙、沙湖、敖包、蒙古风情 |
沙湖景区 | 2007-05-08 | 水域风光 | 湖水、芦苇、黄沙、候鸟 |
沙坡头景区 | 2007-05-08 | 地文景观 | 大漠、黄河、治沙奇迹、沙坡鸣钟 |
表2 在线评论基本信息
Table 2
景区名称 | 综合评分 | 好评率/% | 在线评论时间选取范围 | 总评论数 | 有效评论数 |
---|---|---|---|---|---|
白沙湖景区 | 4.5/5 | 70.22 | 2017-02-25—2021-06-30 | 117 | 88 |
胡杨林景区 | 4.7/5 | 85.67 | 2020-01-07—2021-06-30 | 856 | 803 |
鸣沙山月牙泉景区 | 4.9/5 | 95.46 | 2016-06-30—2021-06-30 | 5 854 | 5 714 |
响沙湾景区 | 4.7/5 | 91.45 | 2016-06-30—2021-06-30 | 2 479 | 2 020 |
沙湖景区 | 4.7/5 | 92.30 | 2016-06-30—2021-06-30 | 2 697 | 2 495 |
沙坡头景区 | 4.8/5 | 95.88 | 2016-06-30—2021-06-30 | 4 121 | 3 817 |
选取2016年6月30日至2021年6月30日5年的在线评论,其中白沙湖景区与胡杨林景区将中华人民共和国文化和旅游部正式公布成为5A级景区日期作为评论选取的开始时间。
1.2 研究方法
词频分析(Frequency Analysis)用于统计网络文本特征词出现的频率,发现文本中的核心信息[29]。特征词频率计算公式为:
式中:Pa 为特征词a出现的频率;Na 为特征词a重复出现的次数;N为不重复特征词的出现总次数[30]。
语义网络分析(Sematic Network Analysis)以词频分析为基础,关注的重点是词与词之间的关系。语义网络分析可以识别特征词间的关联和意义,实现对网络文本深层次的分析与解读[31]。共现频率计算公式为:
式中:Pa-b 为特征词a、b共现的频率;Ma-b 为特征词a、b共现的次数;M为不重复特征词的共现总次数。
1.3 研究过程
首先,利用八爪鱼采集器采集5A级沙漠型旅游景区的游客评论16 124条,采集完成后为了保证数据的真实性与有效性,删除广告、宣传及恶意评论内容、图片内容、重复评论以及文字过少(10字以内)内容,共计1 187条,剩余14 937条有效评论。
其次,在python中合并中文停用词库、哈工大停用词库、四川大学机器智能实验室停用词库及自定义停用词获得停用词表,去重后添加到自定义词典,使用jeiba分词工具将14 937条有效评论拆分成最小语义单元,过滤“一半”“公里”“四周”等无实意的词汇,统一“十一”“国庆”“景色”“风景”等同义词汇的表达,得到规范的样本。
2 结果与分析
2.1 词频分析
图2
表3 特征词频率 y=axb 拟合信息
Table 3
景区名称 | 常数项a | 常数项b | 判定系数R2 | 调整后R2 |
---|---|---|---|---|
白沙湖景区 | 5.23292±0.0384 | -0.86039±0.0047 | 0.94634 | 0.9463 |
胡杨林景区 | 4.63357±0.00809 | -0.80062±9.22878E | 0.98991 | 0.98991 |
鸣沙山月牙泉景区 | 4.52557±0.01447 | -0.78265±0.00156 | 0.92641 | 0.92641 |
响沙湾景区 | 4.47925±0.00626 | -0.79498±7.20881E | 0.99195 | 0.99195 |
沙湖景区 | 4.13059±0.0181 | -0.75254±0.0019 | 0.92827 | 0.92825 |
沙坡头景区 | 5.59462±0.01862 | -0.81649±0.00183 | 0.94357 | 0.94356 |
景区评论的特征词频率分布拟合曲线均符合幂函数y=axb,其中常数项a>0且b<0,判定系数调整后R2均大于0.90,表明特征词的频率分布符合幂函数衰减规律,且拟合优度很高。前20%的特征词累计频率分别为53.17%、69.17%、80.77%、74.21%、75.62%、78.36%和84.43%,除白沙湖景区和胡杨林景区外,均接近或超过80%,说明景区游客感知丰富多样,但具有一定的集中性与一致性,白沙湖景区与胡杨林景区可能与样本量有关。
图3
评论的高频词分为旅游资源类高频词、体验项目类高频词、旅游信息类高频词和旅游评价类高频词。
旅游资源类高频词:包括自然资源与人文资源,其中自然资源出现频率较高,例如“沙漠”“胡杨”“沙山”“沙湾”“芦苇荡”“黄河”等;人文资源出现频率较低,例如“金塔”“沙雕”。这说明沙漠型旅游景区的旅游资源由自然资源与人文资源构成,以自然资源为主。
体验项目类高频词:包括“骑骆驼”“滑沙”“羊皮筏子”“冲浪”“缆车”“表演”“玻璃桥”“直升机”等。除了白沙湖景区与胡杨林景区外都出现了“骑骆驼”与“滑沙”,说明这类具有沙漠特色的体验项目给游客留下了深刻印象,结合景区评论数量,说明在大众旅游的时代,以自然资源为核心吸引物的沙漠型旅游景区需要多元发展。
旅游信息类高频词:包括出游伙伴“孩子”“朋友”、出游方式“自驾”“火车”、信息渠道“网上”“攻略”,说明游客的出游方式偏好亲子游与自助游,孩子的旅游体验是亲子游中的关键[35],线上攻略是自助游游客获取信息的重要渠道;行程安排有胡杨林景区的“居延海”“张掖”、鸣沙山月牙泉景区的“莫高窟”、沙湖景区的“沙坡头”,结合“第一次”“下次”,说明市场开始认可沙漠旅游,游客行程安排偏向于景区组合;“导游”“司机”“门票”“套票”“船票”等说明景区工作人员与景区收费会影响游客的旅游体验;“停车场”与游客自助游相关;“排队”“游客”说明排队与客流量会影响游客的旅游体验。
旅游评价类高频词:包括总体评价“不错”“满意”“开心”、景观评价“美丽”、项目评价“好玩”“刺激”以及工作人员评价“热情”“负责”等,结合4.5以上的评分说明,6个沙漠型旅游景区均有正面的整体形象。
沙漠型旅游景区的游客感知差异明显,白沙湖景区评论中“白沙湖”出现频率最高,“湖水”“湖泊”“白沙”等都是自然资源;胡杨林景区评论中“胡杨林”出现频率最高,评论中“二道桥有水,可以拍胡杨林的倒影与日落;四道桥拍摄过电影《英雄》;七道桥的胡杨树形状独特”均与胡杨树有关;鸣沙山月牙泉景区评论中“月牙泉”“骑骆驼”出现的频率远高于其他特征词;响沙湾景区评论中“沙漠”“沙湾”出现的频率远高于其他特征词;沙湖景区评论中“沙湖”“风景”“不错”出现的频率远高于其他特征词;沙坡头景区评论中“沙漠”“黄河”“好玩”出现的频率远高于其他特征词。
2.2 语义网络分析
图4
沙漠型旅游景区的核心资源在游客评价语义网络图中最重要,例如白沙湖景区的“白沙湖”、胡杨林景区的“胡杨林”、鸣沙山月牙泉景区的“月牙泉”“鸣沙山”、响沙湾景区的“沙漠”“沙湾”、沙湖景区的“沙湖”“沙漠”以及沙坡头景区的“沙漠”“黄河”,其中鸣沙山月牙泉景区、响沙湾景区、沙湖景区和沙坡头景区的核心资源均为“沙+水”模式。除白沙湖景区、响沙湾景区外,其余景区共现频率前三的词组均出现了“风景+不错”,其中胡杨林景区与沙湖景区“风景+不错”的共现频率最大,鸣沙山月牙泉景区与沙坡头景区分别是“鸣沙山+月牙泉”、“沙漠+黄河”,说明沙漠型旅游景区核心是较好的自然资源。
由表4—5可知,白沙湖景区的重要特征词都是自然资源,说明在游客感知中白沙湖景区是一个观光型旅游景区;胡杨林景区评论围绕“胡杨林”出现“千年”“不死”“不倒”“不朽”“金色”等描述性特征词,说明在游客感知中胡杨林景区是一个观光型旅游景区;鸣沙山月牙泉景区“骑骆驼”的重要程度超过“鸣沙山”但低于“月牙泉”,说明在游客感知中鸣沙山月牙泉景区是一个具有一定体验功能的观光型旅游景区;响沙湾景区“骑骆驼”“索道”的重要程度超过“风景”,说明在游客感知中响沙湾景区是一个体验性较强的观光型旅游景区。沙湖景区的体验项目类高频词数量与自然资源类高频词相近但重要程度略低,说明在游客感知中沙湖景区是一个以观光为主的综合型旅游景区。沙坡头景区“风景”出现在第三位,但“滑沙”“骑骆驼”“羊皮筏子”“索道”“冲浪”都是体验项目类高频词,说明在游客感知中沙坡头景区是一个以体验为主的综合型旅游景区。
表4 接近中心度前10的特征词
Table 4
序号 | 白沙湖景区 | 胡杨林景区 | 鸣沙山月牙泉景区 | 响沙湾景区 | 沙湖景区 | 沙坡头景区 | 全部景区 |
---|---|---|---|---|---|---|---|
1 | 白沙湖 | 胡杨林 | 月牙泉 | 沙漠 | 沙湖 | 沙漠 | 沙漠 |
2 | 沙漠 | 风景 | 骑骆驼 | 沙湾 | 风景 | 黄河 | 不错 |
3 | 湖水 | 胡杨 | 沙漠 | 不错 | 不错 | 好玩 | 风景 |
4 | 湖泊 | 沙漠 | 鸣沙山 | 门票 | 沙漠 | 不错 | 骑骆驼 |
5 | 白沙 | 七道桥 | 风景 | 骑骆驼 | 游船 | 风景 | 防晒 |
6 | 风景 | 千年 | 不错 | 风景 | 特色 | 索道 | 天气 |
7 | 边境 | 八道桥 | 好玩 | 孩子 | 门票 | 滑沙 | 拍照 |
8 | 湖边 | 美丽 | 门票 | 好玩 | 游客 | 骑骆驼 | 门票 |
9 | 境内 | 四道桥 | 沙山 | 沙子 | 骑骆驼 | 孩子 | 门口 |
10 | 沙丘 | 金色 | 沙子 | 草原 | 沙坡头 | 门票 | 滑沙 |
表5 中间中心度前10的特征词
Table 5
序号 | 白沙湖景区 | 胡杨林景区 | 鸣沙山月牙泉景区 | 响沙湾景区 | 沙湖景区 | 沙坡头景区 | 全部景区 |
---|---|---|---|---|---|---|---|
1 | 白沙湖 | 胡杨林 | 月牙泉 | 沙漠 | 沙湖 | 沙漠 | 沙漠 |
2 | 沙漠 | 风景 | 骑骆驼 | 沙湾 | 风景 | 黄河 | 不错 |
3 | 湖水 | 胡杨 | 沙漠 | 不错 | 不错 | 好玩 | 风景 |
4 | 湖泊 | 沙漠 | 鸣沙山 | 门票 | 沙漠 | 不错 | 骑骆驼 |
5 | 沙丘 | 七道桥 | 风景 | 骑骆驼 | 游船 | 风景 | 防晒 |
6 | 境内 | 千年 | 不错 | 风景 | 特色 | 索道 | 天气 |
7 | 风景 | 八道桥 | 好玩 | 孩子 | 门票 | 滑沙 | 拍照 |
8 | 白沙 | 美丽 | 门票 | 好玩 | 游客 | 骑骆驼 | 门票 |
9 | 边境 | 四道桥 | 沙山 | 沙子 | 开心 | 孩子 | 门口 |
10 | 西北 | 金色 | 沙子 | 开心 | 塞上江南 | 门票 | 滑沙 |
全部景区评论中“风景”与“不错”的共现频率最高,体验项目类高频词“骑骆驼”“滑沙”与“好玩”重要程度较高,说明在游客感知中5A级沙漠型旅游景区兼备了观光与体验两项功能,景区基础是沙漠。“门票”出现在鸣沙山月牙泉、响沙湾、沙湖、沙坡头景区和全部景区的评论中,对应“套票”“收费”“三天”等,说明景区收费是游客较为在意的问题。接近中心度与中间中心度出现“防晒”,“防晒”是游客注意事项中重要的一部分。另外,“边境”“境内”“西北”出现在白沙湖景区接近中心度、中间中心度前10位与景区地处中国西北部、临近哈萨克斯坦有关,结合评论数量说明地理位置是沙漠型旅游景区开发和发展过程中需要考虑的重要因素。“叶子”“游览”“国庆”与“金色”并列胡杨林景区接近中心度、中间中心度第10位,与胡杨树叶子在9月下旬到10月中旬变黄,且国庆节有七天法定假期有关,反映了以植物资源为主要吸引物的景区旅游淡旺季问题。鸣沙山月牙泉景区评论中“莫高窟”的出现与两个景区都在敦煌市有关,景区侧重点不同且莫高窟景区闻名于世是鸣沙山月牙泉景区的优势。响沙湾景区评论程度中心度前10的特征词还有“导游”,“导游”对应“热情”“负责”“工作人员”“服务态度”,说明景区工作人员对游客的游玩体验产生了较大影响;“索道”“套票”“沙岛”“开心”“酒店”“表演”“拍照”“设施”与“草原”并列接近中心度第10位,其中“酒店”对应出现“度假”“休闲”,说明景区具有一定的度假功能。沙湖景区评论程度中心度前10的特征词还有“芦苇荡”“塞上江南”,对应“鸟岛”“生态”“湿地”,说明景区生态给游客留下了深刻印象;接近中心度第10位的“沙坡头”一词与两个景区都在宁夏回族自治区并且旅游类型相似有关[42]。
3 结论与建议
3.1 结论
中国5A级沙漠型旅游景区评论的特征词频率呈“长尾”分布,前50个高频词可以分为旅游资源、体验项目、旅游信息和旅游评价4类。沙漠旅游正在向大众旅游发展,景区发展状况各不相同,其中白沙湖景区、胡杨林景区是观光型旅游景区;鸣沙山月牙泉景区、响沙湾景区是过渡性旅游景区;沙湖景区、沙坡头景区是综合性旅游景区;景区核心吸引物是自然旅游资源,以“沙+水”模式为主,游客感知差异明显,说明景区突出各自核心的旅游资源;游客出游方式倾向于亲子游和自助游,孩子的旅游体验是亲子游中的关键,线上攻略是自助游游客获取信息的重要渠道,行程规划倾向于目的地景区组合,景区效率、收费、服务态度、游客数量与基础设施会影响游客的旅游体验。
3.2 建议
顺应大众旅游时代,合理开发沙漠资源。通过词频分析发现,游客评论多次出现“第一次”“下次”等词汇,同时出现了“不错”“开心”“好玩”等积极评价词汇,说明沙漠旅游正在大众化发展,游客开始接受这一小众的旅游形式;旅游景观类高频词以自然景观为主,说明相较于人文景观,自然景观是沙漠型旅游景区开发与发展的基础,因此具有独特沙漠旅游资源并具有开发条件的地区应该重视该资源的开发。
秉持全域旅游思想,重视景区间协调发展。自助游游客偏好在线上攻略中获取旅游信息,并安排目的地景区组合型的旅游行程;例如胡杨林景区评论出现的“居延海”“张掖”、鸣沙山月牙泉景区评论出现的“莫高窟”与沙湖景区评论出现的“沙坡头”,其中莫高窟景区与鸣沙山月牙泉景区侧重点不同且闻名于世,有利于鸣沙山月牙泉景区的发展,而沙坡头景区与沙湖景区均为“水沙结合型”旅游资源,存在景区间的竞争关系,因此开发沙漠型旅游景区时要重视景区间的协调发展,避免雷同景区的集中出现。
积极适应市场需求,综合发展景区功能。白沙湖景区与胡杨林景区都是观光型景区,同时白沙湖景区地理位置特殊,距离东南沿海市场较远;胡杨林景区受到景区核心资源胡杨树的最佳观赏时间影响,发展落后于其余景区,说明以自然景观资源为核心吸引物的沙漠型旅游景区也应该综合发展,拓展景区休闲类项目与体验类项目。
完善景区基础设施,提高景区服务质量。分析发现游客偏好亲子游与自助游,景区应该考虑亲子游对儿童使用的基础设施的特殊要求,在自助游游客获取旅游信息的线上攻略投放信息。另外,评论多次提到景区效率、服务态度与游客数量,因此提高景区员工效率,通过及时公布游客分布信息、引流等方式避免游客在景区扎堆,减少游客排队时间。
参考文献
我国北方沙漠旅游资源开发问题探讨
[J].
创建沙产业保护生态环境的几个问题初探
[J].
沙漠旅游资源评价及风沙地貌地质公园开发与保护研究
[D].
基于LAC理论的沙漠型景区旅游环境容量研究:以宁夏沙湖旅游区为例
[J].
宁夏沙湖景区生态旅游环境容量
[J].
Core-periphery structure of destination image:concept,evidence and implication
[J].
A semantic network model for measuring engagement and performance in online learning platforms
[J].
装配式建筑与BIM集成研究的学术热点及演进趋势:基于CiteSpace与Ucinet的文献计量可视化分析
[J].
Centrality in social networks:I.conceptual clarification
[J].
/
〈 |
|
〉 |
