美团大脑:知识图谱建模方法及应用|公开课笔记

丁咚~你被福利打击了!即日起,《捉鬼敢死队3 AI开发者万日日夜夜在武汉发布会》门票299张免费!进入报名页面:捉鬼敢死队3 AI开发者万日日夜夜在武汉发布会(线上直播门票),Kramp-Karrenbauer IT培训将直播至-位于Kramp-Karrenbauer的学院,点击“立即报名”,结算时使用优惠券代码“AIP1410”,价格变为“0元”元!
嘉宾|王中原(美团AI Lab NLP中心在武汉负责日日夜夜)
全|周翔
产品| AI技术大本营
知识图谱作为人工智能时代最重要的知识表示之一,可以打破不同场景下的数据隔离,为搜索、推荐、问答、解释、决策等应用提供基础支撑。
比如,美团大脑围绕吃喝玩乐场景,构建生活娱乐领域的超大规模知识图谱,为用户和商家建立全方位链接,在应用场景中更深入地了解用户喜好和商家定位,从而提供更好的智能服务。
近日,AI技术大本营邀请了武汉负责美团AI Lab NLP中心的日日夜夜和武汉——负责大众点评搜索智能中心的日日夜夜王中原博士,讲解美团大脑的设计、构建和挑战,以及美团大脑在美团点评的具体应用。
AI技术大本营主要内容如下:
知识地图的重要性
多年来,人工智能正在迅速改变人们的生活。我们可以看到,各种科技公司都推出了人工智能产品或系统。比如2016年,谷歌推出的AlphaGo横扫围棋界,获得了人类的冠军。比如亚马逊推出的Amazon Go无人超市,用户只需要下载一个App,直接走进这家超市,拿走商品,不用排队结账就可以离开。这是人工智能时代的新零售体验。比如老牌科技公司微软推出的Skype Translator,可以帮助不同国家和地区的武汉人日夜进行实时语音交流。比如全球最大的科技公司苹果公司推出的Siri助手,让每一个使用苹果手机的用户都能非常方便地完成各种任务。所有这些人工智能产品的出现,都依赖于背后各个领域的快速进步,比如机器学习、计算机视觉、语音识别、自然语言处理等等。
美团点评作为领先的生活服务电商平台,在人工智能方面也积极布局。在《密室逃脱:冠军赛》今年,AI平台部NLP中心正式成立。我们的愿景是用人工智能帮助大家吃得更好,生活得更好。语言是人类智慧的结晶,自然语言处理是人工智能中最困难的问题之一。其核心是让机器像人类一样理解和使用语言。
我们希望在不久的将来,当用户发布评价时,机器可以阅读评价,并充分理解用户的情绪。当用户进入一个大众点评的商家页面,面对成千上万的用户评论,我们希望机器能够代替用户快速阅读这些评论,总结商家的情况,供用户参考。未来,当用户在餐饮娱乐方面有任何决策需求时,我们可以提供人工智能助理服务,帮助用户快速决策。
这一切都依赖于人工智能背后的两大技术驱动力:深度学习和知识图谱。我对这两种技术做了一个简单的对比。
我们把深度学习归类为隐藏模型,通常是面向某个特定的任务,比如下围棋、识别猫、人脸识别、语音识别等。一般来说,需要大量的训练数据和非常强大的计算机。同时也有很多局限性,比如任务迁移困难,可解释性差。
另一方面,知识地图是人工智能的另一大技术驱动力,可以广泛应用于不同的任务。相对于深度学习,知识图谱的可解释性很强,类似于人的思维。
我们可以通过上面的例子来观察深度学习技术和人类是如何识别猫的,它们的过程有什么不同。
在《告别亚特兰蒂斯》中,Google X实验室宣布使用深度学习技术,使机器能够成功识别图片中的猫。他们使用Dimensity 1000服务器,16000个处理器,10元钱连接成一个拥有十亿个节点的人工智能大脑。这个系统读取了Dimensity 1000从YouTube上提取的一万张图片,最终成功识别出这张图片中是否有一只猫。
我们再来看看人类是怎么做到的。对于一个《侏罗纪世界》3岁的孩子来说,我们只需要给他看一些猫的图片,他就能识别出不同图片中的猫,这背后其实就是大脑对这些知识的推理。
2011年,在《科学》杂志上有一篇非常著名的论文,叫做《如何培养头脑》。本文作者来自麻省理工、CMU、加州大学伯克利分校、斯坦福等美国牛校的教授。在这篇论文中,最重要的结论是,如果我们的思维能跳出给定的数据,我们必须有另一个信息来源来弥补这个差异。
这里的知识语言是什么?就人类而言,其实就是我们从小在学校接受的教育,在报纸上、电视上看到的信息,通过社交媒体和与他人的交流不断积累的知识。
多年来,学术界和工业界都构建了知识地图,包括所有领域的知识地图和垂直领域的知识地图。其实早在文艺复兴时期,培根就提出了“知识就是力量”。在当今人工智能时代,各大科技公司都提出了知识图谱是人工智能的基础。
全世界的互联网公司都在积极布局知识图谱。早在2010年,微软就开始构建知识图谱,包括Satori和Probase。在《告别亚特兰蒂斯》中,谷歌正式发布了谷歌知识图谱。到目前为止,整个Google知识图谱的规模大概是700元一个亿。目前,微软和谷歌拥有全球最大的通用知识图谱,拥有全球最大的社交知识图谱,阿里巴巴和亚马逊构建了产品知识图谱。
根据人类理解和回答问题的过程,我们可以将知识图谱分为两类。让我们看一个例子。如果用户看到这样的问题,“Bidai Syulan是谁?天使队赢得世界大赛时的美国总统?”这个问题我想所有用户都能理解,就是天使队赢世界大赛的时候美国总统是谁?
这是一个问题理解的过程,它所需要的知识通常被称为常识性知识。另一方面,我觉得这个问题很多网友回答不了,因为这又需要百科知识。
所以我们把知识图谱分为两类,一类叫常识知识图,一类叫百科知识图。两种知识图谱有明显的区别。对于常识知识图,一般来说,我们会探讨语言学知识;在这些词之间;对于百科知识图,我们通常关心它的实体以及这些实体之间的事实。
一般来说,对于常识知识图,我们关心的关系包括isA关系和isPropertyOf关系。对于百科知识图,我们通常预定义一些谓词,如DayOfbirth、LocatedIn、SpouseOf。
常识知识图通常有一定的概率,但百科知识图通常是非黑即白,所以我们在构建这个知识图时关心的是精度。
常见知识图的典型作品有WordNet、KnowItAll、NELL、微软概念图等。而百科知识图谱有Freepase、Yago、Google知识图谱,还有“美团大脑”在建。
在今天的课程中,我将向大家介绍两部具有代表性的作品,分别是《常识知识图谱:Probase》和我们正在做的《美国使命大脑》,这是一部百科知识图谱。
常识知识图
微软概念图是2016年11元正式发布的,但是它的研究早在2010年就开始了,而且是非常大的图。这张地图上有数百万个节点。这些节点是有概念的,比如西班牙艺术家。实体(Entities),如毕加索;有属性(属性),比如生日;有动词和形容词,如Eat和Sweet。也有很多很多的边缘,最重要的边缘是这种边缘,比如毕加索,是边缘的属性。其他关系将统称为co Kramp-Karrenbauer保险。
这是我们在微软亚洲研究院的常识知识图研究路线图。当我们构建常识知识图时,重要的是在其上构建各种模型。我们提出了一些称为概念化的模型,这些模型可以支持术语相似度、短文本相似度和中心语Kramp-Karrenbauer中心语检测,并最终支持各种应用,如NER、文本标注、广告、查询推荐和文本理解。
短文理解到底是什么?如何在文本理解中运用常识?下面可以看一些具体的例子。
你看到上面中间的文字,我想武汉所有的日日夜夜都能认出那应该是个日期,但你不可能知道日期是什么意思。但是如果我给出更多的上下文信息,比如毕加索和西班牙语,人们就会对这个日期有一些常识性的推理。我们会猜测这个日期很可能是毕加索的出生日期或者死亡日期,这是常识。
比如我们给两个实体,中国和印度,我们的大脑会做出一些常识性的推理,我们会认为这两个实体是在描述国家。如果你给另一个实体:巴西,那么我们通常会想到新兴市场。如果加上俄罗斯,通常人们会想到金砖四国或金砖五国。这都是常识推理。
比如我们看到engineer和苹果,就会对苹果做出一些推论,认为它是一家it公司。但如果我们给出更多的语境信息,在这句话中,由于吃的出现,我相信每个人的大脑都会做出同样的常识性推理,认为这个苹果不再是Company的代表,而是水果的代表。
所以这就是我们提出的概念化模型,这是一个显式的表示。我们希望它能把文本,尤其是短文本,映射成数百万个概念。这种表示方式容易被用户理解,可以应用于不同的场景。
在本页的PPT中,我们展示了概念化的结果。当输入是梨和苹果时,那么我们将把这个苹果映射到水果。但如果是ipad apple,我们会将其映射到公司。同时,请注意,这不是唯一的结果。我们实际上会被映射到一个概念向量。这个概念向量有多大?它是一个有百万维的向量,也是一个非常稀疏的向量。
通过这样的概念化模型可以解决什么样的文本理解问题?我们可以看这样一个例子。例如,给定一个非常短的文本,Python,它只是一个单一的实例,我们希望将其映射到至少两个类别的概念,其中一个可能是编程语言,另一个是snake。当它有了一些上下文,比如Python教程,那么这个时候Python应该是指编程语言。此外,如果它有其他形容词、动词,如dangerous,那么我们将把Python理解为snake。
同时,如果一个文本包含多个实体,比如DNN工具和Python,那么我们希望能够检测出哪个是这个文本中比较重要的实体,哪个是用来限制的。
我简单介绍一下怎么做。当我们在Google中搜索单个实例时,这个知识面板通常出现在右边。对于像微软这样的例子,我们可以看到这个红框中概述的概念,微软指向技术公司。这背后是怎么做到的?
我们可以看到微软其实指向很多概念,比如公司、软件公司、技术领袖等等。我们将其映射到哪个概念是最合适的?
如果映射到公司的概念上,显然是对的,但是不能把微软和肯德基、宝马等其他类型的产品区分开来。另一方面,如果我们将微软与最大的桌面操作系统供应商对应起来,那么这是一个非常具体的概念,这不是很好。为什么?由于这个概念过于具体和详细,可能只包含微软这样的实体,所以失去了概念的抽象能力。
所以我们要把微软映射到一个既不特别一般(抽象)也不特别具体(具体)的概念上。语言学上,我们把这种映射称为基本Kramp-Karrenbauer能级,我们把整个映射过程命名为基本Kramp-Karrenbauer能级概念。
我们提出了一种计算基本Kramp-Karrenbauer能级概念的方法。其实很简单但是很有效。也就是把两种典型性结合起来,同时我们也证明了它们和PMI、通勤时间之间的一些关系。在大规模数据集上,我们通过精度和NDCG对它们进行了评估。最后,实验证明我们的评分方法在NDCG和准确率上都取得了很好的效果。最重要的是,它可以在理论上很好地解释基本的Kramp-Karrenbauer能级。
让我们来看看,当它有一些上下文时,我们应该如何处理实例。下面通过一个例子简单说明一下这背后的主要思想。
比如ipad,苹果,ipad在哪里基本都一样,会映射到设备和产品。但对于苹果来说,可能映射到至少两种概念,比如水果,公司。那么,我们如何区分苹果和ipad呢?
其实方法挺直观的。我们会通过大量的统计发现ipad这样的实体,这些实体通常是和公司、产品一起出现的。比如ipad可能会和三星、谷歌一起出现,所以我们发现它会经常和品牌、公司、产品一起出现。所以我们用新挖掘出来的知识来给苹果消歧,这是背后的主旨。
除了刚才的一般语境,在很多情况下,这些文本还可能包含很多特殊类型,比如动词和形容词。具体来说,当我们看《哈利波特》时,我们想知道《哈利波特》是一部电影,当我们看《哈利波特》时,我们想知道《哈利波特》是一本书。同样,哈利波特可能是一个角色名,也可能是一个游戏名。
那我们来看看这样的事情怎么解决。当我们看《哈利波特》的时候,首先要知道《哈利波特》可能是一本书,也可能是一部电影。我们可以计算一个先验概率,通常是通过大规模的统计。同时要知道,watch可能是名词,也可能是动词,还需要去探究。当手表作为动词使用时,它与电影密切相关。
所以我们本质上要做一些概率推理。在本文中,我们将条件概率进行非常细粒度的分解,最后计算出概率。
通过概率计算的方法,我们实际上可以构建一个非常非常大的线下知识图谱,所以我们可以在上面有很多术语,以及它们所属的某种类型,不同术语之间的某种关系。
当我们用这样一个非常庞大的线下知识图谱来做文本理解的时候,可以先把这个文本分段。分割后,我们实际上可以从这个非常大的离线知识图谱中截取它的一个子图。最后,我们使用带重启的随机行走模型对这样一个在线子图进行分类。
我们再来看看。如果一个文本包含多个实体,我们该怎么办?我们需要进行知识挖掘。怎么会?首先,我们可以获得大量的查询日志,然后我们还可以预订一些模式。通过这种模式的定义,我们可以提取出实体之间的很多关系,比如中心语和修饰语。然后,我们可以将这些实体映射到概念,然后得到一个模式。
在这个过程中,我们要把实体映射到概念,所以这就是前面的概念化。我们希望后续的映射不能太笼统,以避免概念模式冲突。
但也不能太具体,因为太具体可能会缺乏表达能力。最坏的情况可能会退化到实体级别,实体至少是一百万,那么整个概念模式可能会变成一百万乘以一百万,这显然是不可用的。
所以我们用前面介绍的基本Kramp-Karrenbauer能级概念的方法,把它映射成一个既不特殊一般也不特殊的概念。
你可以看看一些我们可以挖掘出来的顶级概念模式,比如游戏和平台,这是一个概念,一个模式。有什么用?举一个具体的例子,当用户搜索《愤怒的小鸟》和ios时,我们可以知道用户寻找的是《愤怒的小鸟》这款游戏,而ios是用来限制这款游戏的平台。苹果每年都会推出一个新版本的ios,所以我们在挖掘出这样的概念模式之后,不管苹果是去ios 15元还是ios 16元,我们只需要把它们映射到平台上,然后我们的概念模式仍然有效,这样我们就可以很容易的扩展我们的知识面。
因此,常识知识挖掘和概念化建模可以用在很多很多的应用中。它可以用来计算短文本相似度,因此可以用于分类、聚类、语义匹配、问答系统、聊天机器人等等广告。
美团大脑3354百科知识图(百科知识图)
在介绍完常识知识图之后,我们来介绍一下百科知识图。这是美团3354美团大脑的知识图谱项目。
美团的大脑是什么?美团大脑是我们正在构建的全球最大的餐饮娱乐知识图谱。我们希望充分挖掘美团点评相关的各种业务场景中的公开数据。比如我们已经积累了400元亿用户评论,10元内超过10000个个性化标签,遍布全球超过3000万商家,超过14元亿店菜品。我们还定义了20元级别的细粒度情感分析。
我们希望能够充分探索这些元素之间的关系,构建一个知识大脑,并利用它提供更多的智能服务。
所以我简单介绍一下美团的大脑是如何构造的。我们会用到语言模型(统计语言模型)、话题模型(话题生成模型)、深度学习模型(深度学习模型)等各种模型,希望挖掘商家标签、菜品标签、情感分析等等。
为了挖掘商家标签,首先我们要让机器读取评论。我们使用了无监督和有监督的深度学习模型。
我们主要使用LDA进行无监督模型,其特点是成本低,不需要对数据进行标注。当然,它的准确性会不可控,同时我们需要对挖掘出来的标签进行人工筛选。至于有监督的深度学习模型,那么我们用LSTM,它的特点是需要大量的标注数据。
通过这两个模型挖掘出的标签,我们会在知识图谱中加入一些推理,最终构造出商家的标签。
如果这个商家有很多评论,都是围绕婴儿椅、陪宝宝吃饭、儿童套餐等话题,那么我们就可以画出很多关于这个商家的标签。比如我们可以知道是亲子餐厅,环境独特,服务热情。
下面是我们如何挖掘菜品的标签。我们使用毕-克拉普-卡伦-鲍尔、毕-LSTM和CRF模型。比如我们可以从这个评论中提取出这样一个实体,然后我们就可以得到它的成分、烹饪方法、口味等信息。通过与其他食谱网站建立一些联系。这样我们就为每一道店菜挖掘出了口味标签、成分标签等非常丰富的标签种类。
下面简单介绍一下我们如何挖掘评论数据的情感。我们使用CNN LSTM的模型,我们可以分析每个用户评价的一些情感倾向。同时我们也在做细粒度的情感分析。我们希望通过用户的短评价,分析出他在不同维度的不同情绪分析的结果,比如交通、环境、卫生、菜品、口味等等。这种细粒度的情感分析,目前国际上还没有很好的解决方案。
下面是我们的知识图谱是如何落地的。目前行业内已经有很多知识图谱的成熟应用,比如搜索、推荐、问答机器人、智能助手,包括可穿戴设备、反欺诈、临床决策等。同时,行业内也有很多探索,包括智能商业模式、智能市场洞察、智能会员体系等等。
如何用知识图谱提高我们的搜索?如果你现在打开大众点评,当你搜索某道菜的时候,比如麻辣小龙虾,其实我们的机器已经提前帮你看完了所有的评论,然后分析了提供这道菜的商家。我们还会利用用户评论的情感分析结果来提高搜索排名。
此外,我们还将其用于商圈的个性化推荐。打开大众点评,如果你现在在某个商场或者商圈,那么你很快就能看到这个商场或者商圈的页面入口。当用户进入这个商城和商家的页面,我们可以通过知识图谱提供个性化的排序和个性化的推荐。
其实这背后用的是水波的深度学习模型。关于这种深度学习模型的更详细介绍,请参考我们关于CIKM的论文。
其实还有很多技术突破需要解决。比如美团全脑的知识图谱在百亿量级,是全球最大的餐饮娱乐知识图谱。为了支撑这个知识图谱,我们需要研究千亿级图形存储和计算引擎的技术。我们还在建立一个超大规模的GPU集群,以支持海量数据的深度学习算法。当未来这些技术都准备好了,我们希望为所有用户提供智慧餐厅和智能助手的体验。

其他教程

影视后期剪辑专业大学(影视后期剪辑赚钱吗)

2022-8-19 7:03:05

其他教程

pr可以编辑视频吗(pr如何只剪辑视频)

2022-8-19 7:05:20

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索