时间:2024-05-04
刘愉
摘要:本文通过国内主流网购平台收集用户购买陶瓷产品后的评价信息,将评价内容作为研究对象。应用数据挖掘技术,分析评价内容中的情感分布、偏好。词频分析中外观类的词频最高,所占比例为43.3%。说明顾客对陶瓷的艺术性、观赏性、装饰性考虑的比较多。这也符合现代社会人们追求个性的特点。研究表明,质量、包装两个词汇的紧密程度最高,陶瓷具有易碎,体积大、不易搬运等特性,所以许多顾客会担忧商品会有破损、瑕疵等问题。建议陶瓷生产企业注重好的创意,在商品的外观上满足顾客个性化需求。在包装上要考虑坚固性、密封性。在质量上提升产品的耐用度和做工精细度。
关键词:陶瓷产品;评价内容;数据挖掘;词频
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2020)28-0255-03
1 引言
近年来,随着互联网技术的高速发展,陶瓷行业的规模不断扩大,用户需求不断增多。传统的线下产品销售方式无法满足行業日新月异的变化。陶瓷企业需要结合电子商务的特点,开拓线上市场,发掘新的陶瓷产品的销售渠道,达到多渠道相互交融。截至2019年6月,我国网络购物用户规模达6.39亿,较2018年底增长2871万,占网民整体的74.8%;手机网络购物用户规模达6.22亿,较2018年底增长2989万,占手机网民的73.4%。用户在网购的过程中,会产生许多的行为数据,如浏览、点击、交易、评价等数据。其中商品的可量化或定性评价,最能直观地反映用户对到手的商品性价比、质量等。本文以用户购买后对商品的评价作为分析用户偏好的主要研究对象。对数据分析处理,发现其中隐含的有价值的信息。为相关陶瓷企业提供生产决策。
2 商品评价数据的采集与处理
网络购物市场规模巨大,其中天猫和京东作为国内主要的电商平台,无论是用户数量还是商品数量都领先于其他电商平台。电商平台中,每件商品都会有用户的评价数据,其中包含了用户昵称、评价内容、发表评价时间、评价图片、颜色、尺码等等。我们对它们进行采集、整理和归类。本文主要使用Python数据爬虫技术来获取天猫、京东用户的相关商品评价信息,作为研究数据源,提取出评价内容作为主要研究对象。采集完数据后,我们要对采集的数据进行处理,对数据采用数据清洗,删除无效数据等操作。对评价数据中的评价内容进行文本分析。使用文本处理工具,便于我们观察和得出结论。
2.1 客户评价数据采集
由于各平台的店铺很多,并且各个店铺对陶瓷产品的类型划分有所差异。假设我们无规律随意获取平台数据,将会给后期数据的整理分类带来很大的困扰。于是,我们首先现在各平台,输入“日用陶瓷”,再根据综合、人气、新品、销量、价格、数据是否真实等条件。综合考虑,挑选出排名比较靠前具有代表性的商家店铺。店铺选取步骤如图1所示。
本文从天猫、京东各挑选出三个店铺,从这些店铺中获得顾客评价信息数据样本。将店铺中某些商品评价数据采集,商品有景德镇骨瓷餐具、韩式竹叶厨房陶瓷套装等。然后将数据保存至json文件。包括评价时间、评价星级、评价昵称、评价内容、评价图片、点赞数、评论数等等。其中评价内容是用户收到商品后的客观反映,对分析用户的偏好最具参考价值。将所有的评价内容都保存为csv文件。
为了提高结果的准确性,评价内容必须具有实际参考意义。此处,我们定义一个参数Q:
如果Q值大于20%,说明选取的该商品评论中重复评论占比例较大,对最后的分析结果准确性影响很大。我们选择Q值小于20%的商品作为研究的数据样本。最终我们得到所有评价内容数据样本,京东9080条,天猫14551条。
2.2 评价数据预处理
通过数据采集中的Q值标准,我们已经得到了用于研究的数据样本。我们需要对这些评价内容的样本数据进行预处理。将评价中包括空评价、评价内容过短的、重复评价等无效数据进行过滤。字符不超过5个的评价我们认定为过短评价。评价内容完全一致的认定为重复评价。经过数据预处理后,我们得到天猫有效评价内容数据10929条.京东有效评价内容为9080条。经过数据预处理后的数据存储为CSV文件,用于数据分析。部分数据如图2所示。
3 结果与分析
3.1 情感分析研究
情感分析是对带有感情色彩的词语进行分析、处理、归纳和推理。本文研究对象是评价内容的文本,它可以表达出用户的主观倾向性。文本中反馈的情感信息可以判断出商品是否受消费者喜爱。并且可以通过某些含有情绪的词语,找出影响消费者情绪的特征。
对所有评价数据分析后得,积极情绪为17688条,占比89.37%;中性情绪为1461条,占比7.46%;消极情绪为643条,占比3.17%。其中积极情绪和消极情绪分段的统计结果如下表1:
以上可以反映出大多数的购买者对这些商品整体的评价是好的。评价内容中含有如”颜色漂亮”“釉色干净”“质量好”快递速度快‘等积极情绪描述。还有一些消极情绪的描述“小瑕疵”“黑点”“凸起”等,反映出部分商品不足的地方。
3.2 社会网络和语义网络分析
在语义网络中,每一个节点和弧都必须有标志,用来说明它所代表的实体或语义。词汇之间连线越多的词,代表着它和其他词汇的联系越紧密。所有商品评价内容社会网络语义和网络分析如图3所示:
在这些评价内容中,我们不难发现中心的词汇有“质量”、“包装”、“物流”、“服务”等。这些词汇在评价中经常出现,并且与其他词汇关系紧密。将词汇连接强度排名前10的提取出来。如表2:
从表中可以清晰地看出“质量—包装”连接强度为953,“破损—包装”连接强度为869,“满意—包装”连接强度为843,“漂亮—包装”连接强度765,排名前4。表明在所有评价中,包装与其他词汇的关系最为紧密。可以很清晰地看到客户比较在意包装,这可能和陶瓷这类商品的属性特征有关。陶瓷商品大部分易碎、具有一定重量、体积大、不易搬运,快递运输过程中会有点麻烦。坚固的包装可以防止商品破损变形,在运输过程中抗震抗摔性更强,顾客更加放心。漂亮的包装可以吸引顾客的眼球,爱美之心人皆有之,商品更能得到顾客的青睐。
3.3 偏好分析
采集的所有评价数据,在经过数据处理后,对评价内容文本,进行了分词处理,然后进行词频统计分析。本文取词频排名前45的词汇,统计结果如表3。
经过仔细的研究和查阅资料。本文将这些词汇主要划分为五大类:“质量”“外观”“物流”“服务”“其他”。在词频排名前45的词汇中,与前四类相关的词汇所占比例比较大,所以用这四类总结概括,其他词频相对较少的词汇都归为“其他”类。最终我们得出:外观类词频最多,所占比例为43.3%;其次是质量类,所占比例为23.4%;然后是物流类,所占比例17.1%;接着是服务类:所占比例为9.9%;最后其他类,所占比例6.3%。
对主要的类别进行分析:
外观类:所有评论中外观类词汇出现的频率最高,现在的顾客的消费习惯已经更注重商品的外在设计。商品的颜色、花纹、款式等是否有新意,是否能博取顾客的眼球越来越重要了。有创意的产品,可以提升商品的价值。商品的外观融入更多的元素,结合更多的文化,更能满足现代社会人们的精神追求。
质量类:质量的内容比较抽象,表示产品的优劣程度和耐用程度的好壞。做工精细、细腻等是质量的重要保证。根据前面社会网络和语义网络分析,购买和质量的连接强度值远远大于其他几个类词汇;并且结合具体评价内容数据,可知顾客往往会因为商品的耐用度等考虑再次购买。质量的好坏对客户忠诚度的影响很大。
4 结论与建议
4.1 结论
根据对评价内容做出的分析可知,在社会网络和语义网络分析中,可以发现“包装”这个中心词汇,非常重要,和其他词汇的紧密性排名靠前,顾客比较在意。因为陶瓷具有易碎、体积大、重量大、不易搬运等特征,商品容易出现意外损坏、摩擦产生瑕疵、受潮受污染等情况,这对包装的坚固性、密封性是一种考验。并且包装精美的陶瓷商品更能赢得顾客的好感。偏好分析中,外观类词汇所占比例为43.3%,得出顾客最在乎陶瓷商品的外观,商品的颜色、风格、图案、花纹等都是顾客关注的方面。商品的外观设计尤为重要,现在的顾客更容易被外观新颖的商品所吸引。这也符合现在人们对个性化的追求。而对于吸引顾客是否会再次购买的最重要因素包括商品的质量即商品的耐用度、做工精细程度等。质量好的商品,客户的忠诚度更高。
4.2 建议
4.2.1 商品包装
因为陶瓷商品的特性,顾客比较在意包装。陶瓷企业或者商家应该在商品的包装上下功夫。首先应该强化包装的坚固性和密封性。找抗震抗摔等材料做外壳,让商品在整个运输过程中避免受损变形。另一方面,包装具有美化的功能,对顾客视觉上有一定的冲击,容易留下对产品的最初印象。同时精美的包装能提升产品的档次,得到顾客的赞许。
4.2.2 商品外观设计
根据顾客当前的消费习惯,找到迎合顾客的商品外观甚至引领潮流的外观设计。外观设计方面要注重好的创意,对市场上流行的颜色、花纹、图案等方面进行再创新,可以多元文化相互融合,可以加入时代特性,可以添加多种元素风格,例如中国风、民族风等。提升产品的艺术性、观赏性、装饰性等。体现商品的内在价值,让商品既有艺术性,又有实用性,最大程度上地满足客户的个性化需求。
4.2.3 商品耐用度
满足客户的个性化追求的同时,也要保证商品的耐用度。探索研发新材料新技术,提高做工的精细度,减少商品的瑕疵,做好质量把控。
【通联编辑:李雅琪】
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!