发布时间:2021-08-30作者:DataStory 数说故事
社媒时代,KOL对于品牌营销的重要性可以写几万字。但是,当重要性成为共识以后,就开始卷起来了。
过去,只有数据统计分析,对于KOL的品牌推广影响力预测确实有点不切实际。但当数据量足够大,并且遇到懂它的大数据处理技术,结合人工智能,KOL的品牌推广影响力确实可以通过科学的方法进行预测。
数说故事与香港城市大学共建的“AI联合实验室”(下面简称“AI联合实验室”),突破传统统计分析的能力边界,基于数说故事丰富海量的社媒数据,利用人工智能、大数据挖掘分析、算法等技术,研究如何预测KOL品牌推广影响力。小红书和抖音的KOL影响力有什么显著的差异,又有哪些相同点?数说故事的商业专家和香港城市大学的研究人员针对KOL影响力预测,目前已经取得了第一阶段的研究成果。
基于目前的数据范围,直观假设如果一个KOL发文的互动量越大,该内容起到的影响就越大。所以,在研究中,“AI联合实验室”把KOL发文影响力列为Y值,并以KOL的特征数据与过往互动量作为因变量X,利用机器学习的方法,结合不同的算法模型,测试不同变量对于KOL发文互动量的预测准确度。因变量X_i由该KOL本身的特征指标,如粉丝数、发文数、视频数、被收藏数,抖音平台的性别、城市等数据,和第i篇之前的发文的互动数据(评论数、点赞数、收藏数)构成。“AI联合实验室”使用了简单的线性回归模型、随机回归树模型和梯度提升树XGBoost等来构建测试集和训练集。
x1表示的是KOL粉丝量特征,该变量P值为0.358,表明它对因变量互动量的预测影响不显著,可以认为KOL粉丝量和其发文互动量关联不大。譬如,同一个KOL发文波动量是比较大,如下图的博主,互动量差异可达几十倍;同时,同一粉丝量等级的博主,互动量差异也可以非常大。但很多广告主,通常都会以粉丝量作为第一筛选项选择KOL,就会导致把很多优质的KOL被排除在候选清单内了。
▲ 同一粉丝量等级的博主,互动量差异也可以非常大
我们把小红书的发文类型分为普通、视频、未知3个类别变量,根据回归模型中的回归系数判断其影响程度。结果显示(上图)视频笔记(x49)相对于普通笔记(x47),回归系数(蓝框)差异明显,且呈现正向影响,即视频笔记的互动量显著高于普通笔记。
使用线性回归的研究方法,我们将历史前5天的评论、点赞、收藏作为自变量,分析他们对于因变量第6天互动量的回归结果是否显著,以及观察系数来确定赞评藏的正负影响。通过模型输出的结果,我们发现不管正向或者负向,使用历史点赞、收藏、评论对未来互动量进行预测的效果是显著。从P值(右红框)可以看出,除了x6不显著,其余变量均显著。整体上点赞、评论数高而收藏数相对较低的发文互动量越高。观察回归系数(左红框),负向的变量(x3,x9,x12,x15)均表示的是历史收藏数。
除了KOL的特征数据和互动数据外,KOL的发文内容也是我们的重点研究对象。首先,我们会对KOL进行聚类,将自身特征相似的KOL放在一起分析内容,尽量减少不同群组KOL间的差异,排除其他因素的干扰。然后,从每类KOL的高互动内容中提取关键词及其重要性,使用关键词及其重要性预测互动量,寻找显著的关键词。最后按照品类、成分、内容形式等细分方面具体分析不同的关键词。
针对小红书平台,使用处理连续特征的KMeans聚类方法给KOL分组,剔除掉最后两类个数较少,不具备代表性的KOL类别,共有3类KOL,从分组统计的特征值来看,其刚好可以表示头、腰、尾三部分KOL。
使用什么方法对KOL发文内容进行分析,显得尤为重要!“AI联合实验室”使用了基于词频的TF-IDF技术,提取一个句子中的关键词并计算其重要性得分。
“AI联合实验室”会利用算法抽取所有KOL发文的关键词,结合KOL的聚类结果,对KOL发文句子中关键词及其重要性得分提取后,会把KOL发帖内容中的关键词标记为特征向量X,去预测这些发帖最后的互动量y,并分析在这个过程中对预测起显著作用的维度及其对应的词语,这样就得到了对该类KOL而言,能提高发文互动量的相关词语。
在小红书的结果中,不同类别KOL发文主要的词语差异集中在品类和功效这两方面,如在品类方面,头部KOL的优势品类有乳膏、雨伞、甲胶油等,而腰部KOL的优势品类有茶包、短裙、化妆棉等,尾部KOL则擅长唇膜、唇纹方面的产品营销。
在平台方和营销节点的引导下,所有KOL呈现相同的场景变化趋势,但在同一时期,不同类型的KOL的高互动量关键词也表现出明显的差异。例如,在今年2月,如果从功效分类去看,“卸妆、美甲、保持身材、瘦身”等词可以为头部KOL带来更高的互动量;“淡化、磨皮、直发、变白”等词则为腰部KOL带来更高的互动量;“修容、卷发、显嫩、晕染、阴影”等词则为尾部KOL带来更高的互动量。
但如果从品类上看,同样也是2月的时间里,头部和腰部KOL的重要性关键词比较一致,对尾部KOL的互动量重要性更高的关键词与头部和腰部相比,差异就很大了。
想知道抖音的研究结果与小红书有什么不一样吗?请填写表单,获取完整的研究报告吧!
微信扫描二维码
微博扫描二维码