第7节 语言分布和地域问题

倾听工具面临的另一难题是语言归属问题。法国人倾向于在后缀为.fr 的域上写作,而且他们只用法语写。但是假若你正在加拿大管理一个倾听项目,你该如何在有效地过滤掉在法国发布的法语评论的同时保留下在加拿大发布的法语评论呢?特别是在一个像推特这样的全球平台?说英语的人会让 事情混淆得更严重,因为他们发布在 .com 域上的内容可能和他们在本地域上 发布的内容一样。因此,确定这些英语帖子和评论来自哪一部分是控制倾听机 器面临的严峻挑战。IP 地址、拼写(如“colour”vs“color”)或参考地方语 境可以帮助机器,但实际上,机器需要进一步的人工参与,以帮助其分类。即 使这样,也极难确定这是一个爱尔兰用户在美国网站留下的评论,或准确判定这是一个住在伦敦的澳大利亚人的推文还是一个住在香港的新西兰人的部分活 动!各品牌和产品在多个市场出现,地球村的形成使这一切变得尤为复杂。

对于美国市场这不是什么大问题,因为它有规模。来自其他国家的原样 内容的数量未必影响美国的结果,但如英国、爱尔兰、澳大利亚和新加坡这 些小一点儿的说英语国家的市场结果可能会大大受到美国“污染”的影响(或是因缺少可确认结果数量规模而受到阻碍)。全面解决这个问题的必由途 径之一是重新建立共同数据资源。从一个位置详细的网站和配置文件基地出 发,接着进一步手动标记网站和用户并将其加入倾听数据库。倾听工具不是要浏览所有信息并努力确定位置,而是只浏览那些位置已预先确定的网站。 这就缩小了可以用于短期分析的对话的潜在规模和劳动密集型进程,但是在 许多情况下,我们寻找的是具有代表性的数据。

实际上,只有一件事比没有信息更糟糕,那就是拥有错误信息。当网上 社交倾听工具过剩而其数量仍在继续增加时,就有必要考虑更多因素而不仅 仅是价格。数据方法、数据规模及提供数据分析的质量,这些都是关键因素。从长远来看,现在买入一个便宜系统,然后按照错误数据行事,比投资 买进一个机器加人工的解决方案花费更高。随着人工参与(了解业务、知道 目标的人士认为),经过一段时间,机器可以学习。没有人类理智检验,仅凭机器情感分析也许永远都无法做到真正可信赖和有用。

但数据整理的复杂特性不应该让我们对倾听感到泄气,因为倾听可以应用于若干领域。从对产品设计和策略的洞察力,到对品牌周围声音的辨别, 到风险管理解决方案(详见第九章),再到衡量(详见第十章),社交倾听利 用反馈回路,产生的结果可以提高公司的实际业绩。

最新书评 查看所有书评
发表书评 查看所有书评
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 密码: 验证码:
Baidu
map