社交媒体里的情报“金矿”,我们是这么挖掘的
(本文首发于福布斯中国 Forbes China)
作者:张亮(Leon Zhang),群邑集团竞立媒体 (MediaCom) 中国区社交媒体总经理
.
Twitter 曾经有一句口号,叫“the pulse of the planet”(世界的脉搏)。这个描述放大来看用来形容整个社交媒体是很贴切的。
每时每刻,社交媒体上都有无数来自真实的用户(和品牌)发出的声音。这就像是一个实时更新的情报“金矿”,如果能够善加开发,对于品牌及个人决策都能起到很好的支持,甚至在国家、政治、军事等层面都可以起到重要作用。
品牌可以用来了解最及时的消费者喜好、竞品最新近的动作、网友对自己产品的反馈、是否有潜在的公关危机等;而个人也可以用来做很多事情,比如了解自己的偶像近期的动态、追的剧别人都是怎么讨论的、近期有什么火爆的话题可以用作饭桌谈资等。
那么问题来了,现在这个信息过载的世界,很多时候并不是信息不够,而是信息量太大。怎样从这浩如烟海的社交数据中更好地“把脉”并挖掘出我们需要的情报呢?
.
常见的解决方案之一是基于关键词和爬虫技术的社交聆听(Social Listening),用于搜集数据并用可视化的方式进行呈现以便于分析,而市场上也已经有很多成熟专业的社交聆听公司,比如国外的MeltWater、Brandwatch,国内的AdMaster、Datastory、CIC等。
对于品牌而言,一种方法是直接“买报告”(请人把脉),请社交聆听公司直接提供持续监测报告或一次性诊断报告服务,比较适合中到重度需求(对报告深度和精度要求高,类似于去医院体检或者请专业医师诊断);
另一种方法是“买工具”(自己把脉),结合具体每个公司或个人的需求,购买现成的工具或者量身定制开发,比较适合轻度和高频需求(就像每天自己用血压计量一量血压一样,没必要每天都去医院)。
以竞立媒体 (MediaCom) 正在使用的定制化社交聆听系统 SLCC(Social Listening Command Center) 为例。当时我负责整套定制系统的功能需求和架构设计,并由专业的技术数据合作伙伴进行定制开发。这套解决方案应该是具有一定的普适性和参考性的。
类似于我们这样的广告媒介营销公司,对社交情报的3种常见需求情境如下:
.
1. 支持比稿和策略规划,相当于消费者洞察和竞品调研的工具;
2. 营销活动效果评估,作为活动结案报告的一部分,从社交舆情变化角度检验活动效果;
3. 指导媒介和KOL购买选择,帮助找到更贴近品牌活动需求的媒介渠道和KOL。
.
与公关公司不同的是,持续舆情监测和公关危机预警并不是我们的主营业务,所以这部分并没有作为系统的主要功能。涉及到这部分需求以及深度报告需求,一般还是需要找专业的社交聆听分析公司来进行。
针对以上需求我们进行了功能模块的取舍和设计,结合需求情境进行了定制化处理,最终和合作伙伴敲定的功能模块如下:
.
一、 声量趋势
- 指定时间段内的、提及某关键词的声量曲线趋势
- 支持多关键词对比,用于支持竞品对比
- 支持定点“下钻”,比如发现某一天声量变化异常,可以点击当天从而查看当天相关内容的所有维度的分析
二、 情感分布
- 正面、中性与负面声量的占比
三、 平台分布
- 在各社交平台上的声量分布情况(微博、微信、论坛、新闻等)
四、 用户画像(用微博上提及某关键词的用户群作为样本数据,因为很多其它平台的这部分用户数据不开放,抓不到)
- 性别分布
- 地域分布
- 年龄分布
五、 意见领袖 (Top KOL)
- 提及某关键词的、按照粉丝量从高到低的KOL
- 提及某关键词的用户共同关注最多的KOL,按共同关注量从高到低排名
六、 热词词云
- 提及某关键词的社交内容中同时还提到了哪些关键词,按照提及频率高低体现为关键词大小,支持词云格式和列表格式
七、 原始数据
- 相关的原始社交内容,分平台,按互动量或发布时间排序
.
而针对碰到的四个挑战(应该也是类似社交情报需求中经常会遇到的),解决方案如下:
.
(一)如何实现实时回溯?
很多社交聆听工具是不支持实时回溯的,简单来说,就是从设置好关键词抓取的那一瞬间开始,系统才开始抓取相关社交数据,往前的时间的数据是没有的。
显然这种情况无法应对代理公司比稿提案和做策略的节奏,我们不可能设置个关键词,等2周后再来分析,并且还只有2周的数据,样本量也不够。
但如果要实时登录到系统里,实时能看到过去的信息,就意味着需要不停地抓取几乎全网所有社交信息并存储在服务器上,支持随时调用。对于类似微博这样的海量信息平台而言,数据存储成本极高且会造成极大浪费。
解决方法是随机样本库(panel)。数据技术合作伙伴有亿级的用户随机样本库,并且不停地在抓取这亿级用户发出的公开内容并存储到服务器上。这样,这个样本库就可以随时调用支持实时回溯,并且因为是随机且有足够大的样本量,基本可以代表整体用户的趋势。
.
(二)如何保证系统快速响应?
虽然已经采用了样本库的方式,但当查询的时间区间较大时,数据量仍然很大,仍然会影响系统响应速度。因此,系统里加入了一个开关,支持“快速查询”和“完整查询”两种方式。
快速查询是在样本库基础上再次抽样形成一个更小的样本库,虽然准确度可能会不如完整样本库,但当时间区间较大时,样本量仍然是有保证的,而且主要也是用于快速交叉比对和参考;
而如果对系统响应时间要求没那么高时,可以继续使用“完整查询”功能,这样可以得到相对更准确和全面的信息。
.
(三)如何实现多维度交叉分析?
什么叫交叉分析?简单来说,就是同时满足多个条件下的社交情报分析。比如,品牌发现近1个月讨论自己的某款男用爆款商品,女性声量占比显著增加,就可以单独对比分析女性和男性用户在近1个月讨论的内容话题中互动量最大的是哪些,就有机会顺藤摸瓜发现一些线索。
比如也许女性用户发现这款商品用作送给男朋友的礼物非常适合,而且有大V现身说法助阵,导致在姐妹圈中种草并引发了讨论。此时就可以考虑下一波营销活动可以针对给男朋友送礼这个话题来展开。
上述多因素交叉分析的需求,在我们团队日常作业中经常会遇到。因此,为了方便操作,我们直接加入了“一键点击下钻”功能,比如在性别饼图中,点击女性,所有其它图表模块(舆情趋势、平台分布、话题词云等)都会跟着改变为女性用户对应的,这样就很方便快速分析。
.
(四)如何指导KOL选择?
主要是通过两个模块和逻辑来实现:
1. 基础模块:基于“关键词提及+互动量”的逻辑来实现。简单来说,就是某一段时间内,提及某关键词的用户中的那些KOL,按照KOL影响力(粉丝量)从高到低排序。
2. 高级模块:基于“共同关注”的逻辑来实现,这也是我们认为是行业未来终极发展方向的一个KOL筛选思路,“受众出发”的逻辑——
a) 目标受众实际关注哪些KOL,我们就应该买哪些KOL,而不是凭主观猜测;
b) 目标受众共同关注最多的KOL,反过来对于目标受众的覆盖面更大,可能更值得考虑。
我们这套系统中的一大亮点功能就在于此。受限于数据的开放性,目前主要是基于微博平台。实现过程如下:
a) 目标受众样本库:基于对目标受众的理解,敲定某个或多个关键词,锁定一批内容,进而找到这批内容背后的发布者作为样本库。比如,手机品牌,可以考虑使用“手机型号名 + 评测”类似这样的关键词,来锁定一批潜在目标受众(至少是相关用户);
b) 系统分析这批用户都关注了哪些用户,按照共同关注量从高到低进行排序;
c) 形成一个用户清单,人工再排除掉其中的非KOL的用户(比如“微博钱包”的被共同关注量很高、但并不是KOL),就生成了一个KOL候选人名单。
以上只是“电脑”的筛选,还需要“人脑”的进一步处理。有了上述初步的KOL候选清单,团队还会按照常规KOL筛选的思路,结合价格、档期、内容调性、合作难度等再做进一步筛选,从而指导最终的KOL采买选择。
.
这样,一套定制化的社交情报系统就成型了,去除了不需要的功能(比如舆情异常自动邮件预警等),针对核心需要的功能(如KOL筛选支持)深入定制,从而在控制成本的同时满足需求。相当于定制了一套轻量化的“体检仪器”,可供随时的、轻量级的体检(情报挖掘)使用。
参考类似的思路,有条件的品牌都可以考虑自己搭建或者请自己的营销代理伙伴搭建一套属于自己的定制化社交情报系统,实时关注自己的“身体情况”,用实时数据指导及时决策。
.
作者:张亮(Leon Zhang),群邑集团竞立媒体 (MediaCom) 中国区社交媒体总经理,中国传媒大学专业讲师,福布斯中国撰稿人
引用地址: http://digimarketing.cn/?p=2688