数说故事CTO李旭日:数说故事AI商业知识图谱全新升级发布

发布时间:2020-09-11作者:DataStory

格物致知2020第二届数据智能营销论坛暨第三届CMO增长峰会已在上海圆满落幕,数说故事是本次大会的首席合作伙伴。数说故事CTO李旭日在会上发表了主题演讲《数说故事AI商业知识图谱全新升级发布》,揭开数说故事AI商业知识图谱的神秘面纱,知识图谱有何魔力,如何应用于商业场景来释放更多价值潜能呢?


▲ 数说故事CTO-李旭日



以下是数说故事CTO李旭日演讲实录:


大家下午好,非常荣幸能有机会给大家分享数说故事在知识图谱领域的一些进展。


首先想跟大家分享一下知识图谱的基本概念,知识图谱有四个基本的概念:实体、本体、关系、属性。对应到大家熟悉的词云图会更容易理解,词云图的关键词实际上就等同于知识图谱的实体;我们再给这些关键词进一步做分类,比如分成品牌、品类、明星等等,所分的这些类别实际上就是知识图谱的本体;如果我们进一步知道某个明星代言了哪个品牌,这就形成了一个关系;实体可以有各自的属性,比如一个品牌实体的社媒声量就是属性的一种。






知识图谱的发展历程


知识图谱最早起源于科研领域,SCI论文的发表曾经在学生生涯困扰我们很久,这个SCI就是知识图谱的鼻祖。


随着语义网络以及语义本体的提出,知识图谱逐渐具备雏形。知识工程的提出进一步将知识图谱的构建规范成知识抽取知识验证知识表示知识推理这四个过程。


2012年前,我们把知识图谱所涉及的技术称作“语义网络”,2012年,谷歌提出知识图谱的概念,使用大规模知识图谱提取,提升搜索引擎的质量。




从整个技术发展的角度来看,目前知识图谱已经进入成熟期,各行各业已经积累了非常丰富的行业数据以及行业经验。我们下一个重点思考的方向,是如何有效地将技术与行业结合起来,真正解决现实中的商业问题。


在将知识图谱真正应用到商业问题的进程中,数说故事做了两件事:


第一,构建数说故事知识图谱平台,帮助品牌快速搭建自己的知识图谱,降低使用知识图谱这项技术的门槛;


第二,基于数说全量库多年积累的海量数据,搭建了开放商业知识图谱垂直知识图谱



数说故事知识图谱平台


数说故事知识图谱平台的架构,内置了包括知识提取知识融合知识计算等等一系列算法和工具。数说故事知识图谱管理平台,可以帮助管理知识图谱中的本体、实体、关系、属性




知识提取会用到大量的知识学习以及语料的数据。但在数说故事的知识图谱平台,不需要你了解类似于GPT-3一样复杂的机制,就可以一键生成模型、一键发布算法


在数说故事的知识图谱平台,你可以方便快捷地上传想训练的原始数据集,并在平台上直接标注出本体、实体以及关系,完成初始模型训练;当模型达到临界值、期望值以后,可以在数说故事的知识图谱平台上一键生成模型、一键发布算法。数说故事的知识图谱平台还会自动提示你,基于当前的训练数据所训练而成的模型准确率召回率分别是多少。





数说故事的数据处理平台,就像一个流水工厂,可以任意组织数据和训练好的算法。如果你输入的是医疗数据,它输出的就是医疗知识图谱。





数说故事开放商业知识图谱


利用数说故事知识图谱平台,结合数说故事内部接近千亿的海量商业数据以及消费者的数据,构建了一个专门服务于品牌企业的开放性商业知识图谱。目前整个知识图谱已经收录了两千多万的实体、80多亿的关系,这些都是品牌企业关注的关于消费者认知竞争态势方面的知识。




在基于数说故事知识图谱平台搭建的开放性实体属性挖掘系统Mamba Search任意搜索一个品牌,(点击此处查看Mamba Search的专题介绍)就可以看到这个品牌下面有什么品类、品类下面有什么产品、代言人是谁;也可以看到品牌的成立时间、创始人是谁、融资情况如何。


除了品牌以外,通过Mamba Search还可以进行更多自由探索,每一个实体都可以一层一层向下深挖。





我们可以把知识图谱的技术应用于产品创新,智能识别本品和竞品的产品原料、成分,还有消费者目前最看好的功效、包装、口感等信息,将这些概念组合就进入到了产品原型阶段。




举个例子,针对健身场景下的减肥人群,通过数说故事开放性知识图谱不断挖掘品牌数据,找到这些概念进行组合:以姜为原料,玻璃制包装,熬制的工艺,偏柠檬味的口感等等,最终生成这样一个气泡水产品的初始概念。




以上就是我想介绍的数说故事AI商业知识图谱的内容,再来回顾一下,数说故事做的两个事情:第一,搭建了数说故事知识图谱平台,它能使得构建知识图谱的时间,从一年缩短到半年乃至于三个月,甚至更短;第二,训练了一个专门服务于品牌企业的商业知识图谱,它能为品牌提供消费者认知、竞争情报等各个方面的信息,达到开箱即用。


在本次大会上,数说故事重磅发布了《数字化商业应用蓝图2020》,围绕品牌、产品、渠道、用户四大场景,为企业描绘了一幅纵览数字化生态的应用蓝图。该蓝图包含五大部分——品牌加购指南、爆品创新指南、渠道精耕指南、用户运营指南数说中台。如需获取高清版,请关注数说故事公众号,回复“蓝图”领取。


本次数说故事D3智能营销论坛的每场主题演讲及圆桌讨论环节,正陆续在“数说故事”公众号推出演讲实录,请持续关注!

如需获取会议资料,请扫描下方二维码,添加数说小助手sara领取。



微信扫描二维码

微博扫描二维码