DS AI TALK | 数字化浪潮下,如何重新定义AI的商业价值?

发布时间:2021-07-27作者:DataStory 数说故事

数说故事,始终坚持以技术创新引领行业发展,与世界各地顶尖机构和高校紧密合作,以粤港澳大湾区为中心辐射全球,为企业数字化转型赋能。


“DS AI TALK”是由数说故事组织、汇集AI领域内顶尖大咖的系列活动,聚焦AI前沿技术,赋能商业增长,7月21-23日数说故事携手知名AI大咖连线直播,7月30日,珠海横琴AI TALK线下圆桌会数说故事视频号与您相约,不见不散!


7月21日,数说故事创始人兼CEO徐亚波博士连线AI大咖周明博士,围绕数字化浪潮下,如何重新定义AI的商业价值?”展开探讨,以下为精选对话内容实录:



澜舟科技是创新工场孵化的一家认知智能公司。针对商业场景的数字化转型,基于大数据、知识图谱和行业模型,立足于自然语言处理、技术、信息检索、推理和商业洞见等技术,提供新一代的信息检索、知识推理和商业洞见技术和相关产品。


千百亿的模型,是创业团队和中等公司都承受不起的。澜舟科技此次推出的孟子模型,使用十亿参数就能完成千亿甚至万亿参数的水平,刷新了投入记录。


澜舟科技自主研发的中文语言模型——孟子轻量型模型在中文语言理解评测CLUE榜单上登顶第一,刷新业界记录。


孟子模型可以处理多语言多模态,而且支持多种语言的理解和文本的生成,能适应不同领域、不同场景。它的训练集包括互联网各种各样的网页,社区新闻、电子商务、金融等领域的语料。

周明:


第一个,我们坚持的是小而精的轻量化训练,可以实现在同等模型规模下,超过已有的一些大模型。比如说模型结构上,我们把语言学课程融入其中,提升模型对语言学知识的建模能力,并用知识图谱增强模型,使得 AI模型具有知识表达和知识推理的能力。


第二个,在微调领域,我们在数据增强、知识蒸馏、迁移训练、训练优化等方面进行探索,进一步提升语言模型的能力。比如知识蒸馏,基于teacher-student的自蒸馏来提升训练效率;迁移训练,由易到难训练下游的模型。


第三个,我们的模型很小,有很强的领域适配能力和场景适应能力,可以快速定制和应用,模型是基于T5的方式来做端对端的训练方式,而且还适配了BERT方式的架构,它既能理解也能生成,所以能覆盖很多的业务场景。支持机器翻译、文本生成等,适配法律、金融、营销等领域。


周明:


第一个,垂直行业机器翻译。比如汽车、营销、金融、农业、石油等各种领域的翻译,有了预训练模型,就可以快速切入到新的领域进行学习。


第二个,文本自动生成。可控文本生成是指基于用户特征,比如什么样的人喜欢什么样的产品、什么样的品牌等信息,模型可以快速生成相应的营销文案。


第三个,行业搜索引擎。基于孟子模型进行训练,构建行业数据的知识图谱,形成信息收集和行业搜索能力,随之普及到整个行业之中。比如可以支持工程师找资料、归纳、形成报表、对比规划。

徐亚波:


我觉得离开三角关系去谈 AI落地都是伪需求,所谓三角关系,就是需求、能力、成本这三者的高度匹配。


过往6年,数说故事服务了500多家品牌客户,在服务过程中,我们发现,企业应用AI遇到的挑战往往都是由于没有把三角关系处理好。要么是一个非常好的需求,但当前的AI能力跟不上;要么是这个需求很好,技术能力也不错,但是成本过高。做商业应用,一定需要懂AI技术的人在中间非常冷静地进行评估。

徐亚波:


其一,目前AI在商业端主要两大类应用,一类是大脑类应用,所有的企业都希望拥有一个企业大脑,把各种各样的知识形成网络,支持商业决策;另一类是端的应用,在终端跟C端消费者接触时,能够大规模并且个性化提供内容和服务,就像今日头条智能匹配用户的内容推荐。这些应用在未来都会越来越发达。


其二,所有AI应用将变得越来越轻量级,很多应用都会放在端上,使之越来越普及。数说故事现有产品的更新也都是朝着这个方向迭代,逐步完成轻量级智能化应用的迭代和移动端的开发。


期待数说故事与澜舟科技的合作,一定会在人工智能的领域做出最好的成绩!


7月30日上午,数说故事将在珠海横琴举办数说故事大湾区总部成立仪式,在AI TALK线下圆桌会,权威大咖将论道AI前沿科技,对话商业AI的价值与前景。


7月30日11:40,锁定数说故事视频号,AI大咖为您解读商业AI的价值与前景!关注数说故事视频号,点击【预约】按钮,即可在直播前收到提醒,免费收看直播。


微信扫描二维码

微博扫描二维码