游戏开发论坛

 找回密码
 ????
搜索
查看: 4795|回复: 1

分析苹果应用评价中出现频率最高的词汇

[复制链接]

1万

主题

1万

帖子

2万

积分

管理员

中级会员

Rank: 9Rank: 9Rank: 9

积分
20505
发表于 2013-5-29 02:04:49 | 显示全部楼层 |阅读模式

作者:Igor


Appfigure最近深入观察了应用商店中用户评价信息,并从中发现了一些有趣的结果。


数据

尽管这个市场上存在多种语言的用户评价,但我们在此仅以英文用户评价为例。多数文本分析工具是基于英语而创建,因此英文评价内容更易于分析,并且这也是Appfigure最熟悉的语言。


我们决定针对来自下列英语国家的iOS和Mac App Store用户评价进行分析:美国、加拿大、英国、澳大利亚、新西兰。我们的样本约为2500万条用户评价。


可视化所有数据

下一步我们就要确定如何分析并呈现如此多内容。经过一番头脑风暴之后,我们采用了一个简单而有效的方法:词汇云。我们将2500万条评价导入混合器,就产生了以下结果:



all_ios_reviews_word_cloud1(from appfigures)


我们意外地发现这一词汇云极具积极性。作为应用开发者,我们非常清楚用户有多挑剔,并认为其评价不会那么热情洋溢,甚至更具批判性。所以我们再次运行了数据,但还是得到了同样的结果。“好棒”、“大爱”、“有趣”、“不错”等词汇的出现频率远超过“差劲”、“没用”、“浪费”、“糟糕”等消极词汇。


其他发现

不能因为某个词具有积极或消极性,就认为该评价句子中就不存在其他修饰性的词语。虽然人类进化令我们得以鉴别微妙的语言,但计算机却还无法实现这一点。因此我们又开捣鼓数据,看看我们是否能够更为了解每个词语的语境。


我们先根据星级划分用户评价,发现星级(1-5颗星)通常可以准确反映用户评价的整体感情色彩。


我们再次借助混合器,创造了5星评价的词汇云:



five_star_ios_reviews_word_cloud(from appfigures)


并将其与仅有1星评价的词汇云进行对比:



one_star_ios_reviews_word_cloud(from appfigures)


很显然,在极为消极的评价中不太可能出现“大爱”、“好看”等词汇,在此颇为盛行的是“崩溃”、“浪费”等消极词汇。我们还对比了2星与4星评价,发现正如我们所料,这其中也有一些积极与消极词汇用量的变化。


添加颜色

我们再次进行了一些疯狂的尝试:我们根据出现频率为每个词汇分配“积极”分数或“消极”分数。然后重新创造了原始词汇云,令高分值的词汇显示为绿色,低分值的显示为红色,介于中性的呈现灰白色。



all_ios_reviews_colored_word_cloud(from appfigures)


我们无法确定这种试验性的分析可以得出什么结论,但其结果无疑极具准确性。我们很惊讶地发现这一算法十分可行,它让所有消极评价的词汇都呈现红色,而显眼的积极词汇则呈现绿色。


由此可见,我们原先认为用户评价都十分挑剔和苛刻的想法是错的,第一个词汇云就很能说明问题:iOS和Mac App Store用户评价中的正能量远超过负能量。


来自:游戏邦

0

主题

24

帖子

606

积分

高级会员

Rank: 4

积分
606
发表于 2013-5-29 08:53:07 | 显示全部楼层
不错,做文本分析的一个简单例子。
您需要登录后才可以回帖 登录 | ????

本版积分规则

????|????|????|????|?????? ( ?ICP?17032699?-3 )

GMT+8, 2025-5-26 06:23

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表