常识性概念图谱建设以及在美团场景中的应用

常识性概念图谱,是环绕常识性概念树立的实体以及实体之间的联络,一起侧重美团的场景构建的一类常识图谱。本文介绍了美团常识性概念图谱构建的Schema,图谱制造中遇到的应战以及制造进程中的算法实践,究竟介绍了一些现在人工智能换脸鞠婧祎郑爽常识性概念图谱在事务上的前端面试题使用。

一、引言

在天然言语处理中app是什么意思,咱们常常思考,怎样样才调做好天然言语的了解作业。对咱们人类来说,了解某一个天然言语的文本信息,一般都是经过当时的信息,相关自己大脑中存储的相关信息,究竟了解信息。例如“他不喜欢吃苹果,可是喜欢吃冰淇淋”,人在了解的时分相关出大脑中的认知信息:苹果appetite,甜的,口感有点脆;冰淇淋,比苹果甜,口感软糯、冰凉,夏天能解暑appetite;小孩更喜欢吃甜食和冰淇淋。所以结合这样的常识,会推理出更喜欢冰淇淋的若干原因。可是现在许多天然言语了解的作业仍是调集在信息的层面,现在的了解作业前端开发相似于一个贝叶斯概率,从已知的练习文本中寻找契合条android软件开发件的最大化文本信息。

在天然言语处理中做到像人相同去了解文本android平板电脑价格是天然言语处理的终极政策,所以现在越来越多的研讨上,引入了一些额定的常识,帮助机器做好天然言语文本的了解作业。单纯的文本信息只是外部客观事实的表述,常识则是在文本信息根底之上对外部客观事实的概括和总approach结,所以在天然言语处理中参与辅佐的常识信息,让天然言语了解的更好。

树立常识体系则是一种直接的办法,能够帮助天然言语了解得更准确。常识图谱就是环绕这个思维提出,期望经过给机器显性的常识,让机器能够前端结构像人相同进行推理了解。所以在2012年Googleandroid手机 正式提出了常识图谱(Knowledge Graph)的概念,它android平板电脑价格的初衷是为了优化查找引擎回来的作用,增强android是什么手机牌子用户的查找质量及领会。

常识性概念图谱建造以及在美团场景中的使用

二、常识性概念图谱介绍

常识性概念图谱就是树立概念与概念之间的联络,帮助天然言语文本的了解。一起咱们的常识性概念图谱侧重美团场景,帮助前进美团场景中的查找、推荐、Feeds流前端等的作用。

依照了解的需求,首要是三个维度的了解才华:

  1. 是什么,概念是什么,树立中心概念是什么的相联络统。例如“修补洗衣机”,“修补人工智能专业”是什么,“洗衣机”是什么前端
  2. 什么样,中心概念某一方面的特征,对中心android的drawable类概念某一方面的细化。android软件开发“带露台的android手机餐厅”、“亲子游乐园”、“生果千层appstore蛋糕”中“带露台”、“亲子”、“生果千层”这些都是中心概前端开发是干什么的念某一个方面的特征,所以需求树立中心概念对应特征以及特征值之间的前端面试题相关前端学什么人工智能工作方向及远景
  3. 给什么,处理查找概念和接受概念之间的Gap,例如“阅览”、“逛街”、“遛娃”等没有清楚对应的供给概念,所以树立查找和供给概念之间的相关网络,处理这一类问题。

总结下来,包括“是什么”的概念Taxonomy体系结构,“什么样”的概念特征联络,“给什么”的概念接受联络。一起POI(Point of Interesting)、SPU(SAndroidtandard Product Unit)、团单作为美团场景中的application实例,需求和图谱中的概念树立联接。

常识性概念图谱建造以及在美团场景中的使用

从制造政策启航,拆解全体常识性概念图谱制造作业,拆分为三类节点和四类联络,具体内容如下。

2.1 图谱三类节点

Taxonomy节点:在概念图谱中,了解一个概念需求合理的常识体系,预界说好的Taxonomy常识体系作为了解的根底,在预界说的体系中分为两类节点:榜首类在美团场景中能够作为中心品类呈现的appreciate,例如,食材、项目、场所;另一类是作为对中心品类限制办法呈现的,例如,颜色、办法、风人工智能专业大学排名格。这两类的节点的界说都能帮助查找、推荐等的了解。现在预界说的Taxonomy节点如下图所示:

常识性概念图谱建造以及在美团场景中的使用

原子概念节点:组成图谱最小语义单元节点,有独立语义的最小粒度词语,例如网红、狗咖、脸部、补水等。界说的原android软件开发子概念,悉数需求挂靠到界说的Taxonomy节点人工智能工作方向及远景之上。

复合人工智能专业大学排名概念节点:由原子概念以及对应特征组合而成的概念节点,例如脸部补水、面部补水等。复合概念需求和其对应的中心词概念树立上下位联络。

2.2 图谱四类联络

同义/上下位联络:语义上的同义/上下位联络,例如脸部补水-syn-面部补水等。界说人工智能专业大学排名的Taxonomy体系也是一种上下前端开发是干什么的位的联络,所以归并到同义/上下位联络里。

常识性概念图谱建造以及在美团场景中的使用

概念特征联络:是典型的CPV(Concept-Property-Value)联络,从各个特征维度来描绘和界说概念,例如火锅-口味-不辣,火锅-标准人工智能论文-单人等,示例如下:

常识性概念图谱建造以及在美团场景中的使用

概念特征联络android软件开发包括两类。

预界说概念特征:现在咱们预界说典型的概念特征如下:

常识性概念图谱建造以及在美团场景中的使用

翻开androidstudio装置教程型概念特征:除了咱们自己界说的公共的概念特征外,咱们还从文本中挖掘一些特定的特征词,补偿一些特定的特征词。例如,姿势、主题、舒适度、口碑等。

概念接受联络android手机这类联络首要树立用户查找概念和美团接受概念之间的链接,例如踏春-场所-植物园,减压-项目-拳击等。

概念承人工智能专业大学排名受联络以「工作」为中心,界说了「场所」、「物品」、「人群」、「时刻」、「成效」等能够满意用户需求appointment的一类供给概念。以工作“美白”为例,“美白”作为用户的需求,能够有不同的供给概念能够满意,例如美容店、水appetite光针android手机等。现在,界说的几类接受联络如下图所apple示:

常识性概念图谱建造以及在美团场景中的使用

POI/SPU-概念联络:POI作为美团场景中的实例,实例-概念的联络作为常识图谱中究竟的一站,常常是比较能发挥常识人工智能图谱在事务上价值的当地。在查找、推荐等事务场景,究竟的意图是能够展现出契合用户需求的POI,所以树立POI/SPU-概念的联络是整个美团场景常识性概念图谱重要的一环,也是比较有价值的数据。

三、常识性概念图谱构建

图谱构建整前端结构体结构如下图所示:

常识性概念图谱建造以及在美团场景中的使用

3.1 概念挖掘

常识性概念图谱的各种联络都是环绕概念构建,这些概念的挖掘是常识性概念图谱制造的榜首环。依照原子概念和复合概念两品种型,别离选用相应的办法进行挖掘。

3android手机.1.1 原子概念挖掘

原子概念候选来人工智能自于Query、UGC(User Generated Conten前端结构t)、团单等文本分词后的最小片段,原前端和后端哪个薪酬高子概念的判别标准是需求满意盛行性、有含义、无缺性三个特性的要求。

  1. 盛行性,一个概念android平板电脑价格应是某个或某些语料内盛行度较高的词,该特性首要经过频率类特征衡量,如“桌本杀”这个词查找量很低且UGC语猜中频率也很低,不满意盛行性要求。
  2. 有含义,一个概念应是一个有人工智能专业大学排名含义的词,该特性首要经过语义特征衡量,如“阿猫”、“阿狗”一般只表一个单纯的称谓而无其他实践含义。
  3. 无缺性,一个概念应是一个无缺的词,人工智能技能使用该特性首要经过独立检索占比(该词作为Query的查找量/包括该词的Query的总查找量)衡android下载量,如“儿童设”是一个过错的分androidstudio装置教程词候选,在UGC中频率较高,但独立检索占比低。

依据原子概念以上的特性,结合人工标明以及规矩主动结构的练习数据练习XGBoost分类模型对原子概前端结构念是否合理进行判别。

3.1.2 复合概念挖掘

复合概念候选来自于原子概念的组合,因为触及组合,复合概念的判前端开发别比原子概念判别更为凌乱。复合概念要求在保证深度学习无缺语义的一起,application在美团站内也要有必定的认知。依据问题的类型,选用Wide&Deep的模型Android结构,Deep侧担任语义的判别,Wide侧引入站内的信息。

常识性概念图谱建造以及在美团场景中的使用

该模型结构有以下两个特征,对复合概念的合理性进行更准确的判别:

  1. Widandroid的drawable类e&Deep模型结构:将离散特征与深度模型结合起来判别复合概念是否合理。
  2. Graph Embedding特征:引入词组分配间的相关信息,如“食物”能够与“人群”、android软件开发“烹饪办法”、“质量”等进行分配。

3.2 概念上下位联络挖掘

在获取概念之后,android体系还需求了解一个概念“是什么”,一appreciate方面经过人工界说的Taxonomy常识体系中的上下位联络进行了解,另一方面经过概念间的上下位联络进行了解。

3.2.前端开发是干什么的1 概念-TAPPaxonomy间上下位联络

概念-Taxonomy间上下位联络是经过人工界说的前端开发需求学什么常识体系了解一个概念是什么,因为Taxonomy类型是人工界说好的类型,能够把这个问题人工智能的界说转化成一个分前端技能类问题。一起,一个概念在Taxonomy体系中或许会有多个类型,如“青柠鱼”既是一种“动物”,也归于“食材”的范畴,所以这儿究竟把这个android的drawable类问题作为一个Entity Typing的使命来处理,将概念及其对应上下文作为模型输入,并将不同Taxonomy类别放在同一空间中进行判别,appear具体的模型结构如前端技能下图所示:

常识性概念图谱建造以及在美团场景中的使用

3.2.2 概念-概念间上下位联络

常识体系经过人工界说的类型来了解一个概念是什么,但人前端结构工界说的类型始终是有限的,假如上位词不在人工界说的类型中,这样的上下位联络则没办法了解。如能够经过概念-Taxonomy联络了解“西洋乐器”、“乐器”、“二胡”人工智能之父都是一种“物品”,但没办法获取到“西洋乐器”和“乐器”、“二胡”和“乐器”之间的上下位联络。依据以上的问题,关于概念-概念间存在的上Android下位联络,现在选用如下两种办法进行挖掘:

依据词法规矩的办法:首要处理原子概念和复合概念间的appear上下位联络,运用候选联络对在词法上的包括联络(如西洋前端开发需求学什么乐器-乐器)app是什么意思挖掘上下位联络。

依据上下文判别的办法:词法规矩能够处理在词法上存在包括联络的上下位联络对的判别approach。关于不存在词法上的包括联络的上下位联络对,如“二胡-乐器”,首要需求进行上下位联络发现,抽取出“二胡-乐器”这样的联络候选,再进行上下位联络判别,判别“二胡-乐器”是一个合理的上下位联络对。考虑到人在阐明一个政策时会对这个方人工智能专业针的类型进行相关介绍,如在对“二胡”这个概念进行阐明时会说到“二胡是一种传统乐器”,从这样的阐明性文本中appearance,既能够将“二胡-乐器”这样的联络候选对抽取出来,也能一起完成这个人工智能论文联络候选对是否合理的判别。这儿在上下位联络挖掘上分为候选联络描绘抽取以及上下位联络分类两部分:

  1. 候选联络描绘抽取:两个概念从归于相同的Taxonomy类型是一个候选概念对是上下位前端和后端哪个薪酬高联络对的必要条件,如“二胡”和“乐器”都归于Taxonomy体系中界说的“物品”,依据概念-Taxono前端开发是干什么的my上下位联络的作用,关于待挖掘上下位联络的概念,找到跟它Taxonandroid手机omy类型一起前端技能的候选概念组成候选APP联络对,然后在文本中依据候选联APP络对的共现挑选出用作上下位联络分类的候选联络描绘句。
  2. 上下前端面试题位联络分类:在获取到候选联络描绘句后,需求结合上下文对上下位联络是否合理进行判别,这儿将两个概念在文中的初步方位和中止方位用特别符号符号出来,并以两个概念在文中初步方位符号处的向量拼接起来作为两者联络的标明,依据这个标appearance明对上下位联络进行分类,向量标明运用BERT输出的作用,具体的模型结构如下图所示:

常识性概念图谱建造以及在美团场景中的使用

在练习数据结构上,因为上下位联络表述的句子十分稀疏,许多共现的句子并没有清楚的标明出候选联络对是否具有上下位联络,运用已有上下Android位联络选用长途监督办法进行练习数据构建不可行,所以直接运用人工标明的练习集对模型进行练习。因为人工标明android手机的数量比较有限,量级在千等级,这儿结合Google的半监督学习算法UDA(Unsupervised Data Augmentation)对模型作用进行前进appreciate,究竟Precision能够抵达90%+,具体政策见表1:

常识性概念图谱建造以及在美团场景中的使用

3.3 概念android下载装置特征联络挖掘

概念含有的特app是什么意思色可appearance以依照特征是否通用划分为公共特征和翻开特征。公共特征是由人工界说的、大多数概念都含有的特征,例如价位、风格、质量等。翻开特征指某些特定的概念才含有的特征,例如,“植发”、“美睫”和“剧本杀”别离含有翻开特征“密度”、“翘度”和“逻辑”。翻开特征的数量远远多于公共特征。针对这两android什么意思种特征联络,咱们别离选用以下两种办法进行挖掘。

3.3.1appreciate 依据复合概念挖掘公共特征联络

因为公共特征的通用性,公共特征联络(appleCPV)中的Value一般和Concept以人工智能之父复合概念的方式组合呈现,例如,平价商场、日式照料、赤色电影高清。咱们将联络挖掘使命转化为依存剖析和细粒度NER使命(可参看《美团查找人工智能论文中NER技能的探求与实践》一文),依存剖析辨认出复合概念中的中心appointment实体和润饰成分,细粒前端和后端哪个薪酬高度NER判别出具体特征值。例如,给定复合概念「赤色电影高清」,依存剖析人工智能换脸鞠婧祎郑爽辨认出「电影」这个中心概念,「赤色」、「高清」是「电影」的特征,细粒度NER猜人工智能换脸鞠婧祎郑爽测出特征值别离为「风格(Style)」、「质量点评(高清)」。

依存剖析和细粒度NER有可人工智能工作方向及远景以相互运用的信息,例如“结业公仔”,「时刻(Time)」和「产品人工智能(Product))」的实体类型,与「公仔」是中心词的依存信息,能够相互促进练习,因而将两个使命联合学习appreciate。可是因为前端面试题两个使命之间的相关程度并不清楚,存在较大噪声,运用Meta-L前端技能STM,将Feature-Level的联合学习优化为Function-Level的apple联合学习,将硬同享变为动态同享,下降两个使命之间噪声影响人工智能专业

模型的全体架构如下所示:

常识性概念图谱建造以及在美团场景中的使用

现在,概念润饰联络全体准确率在85%左右。

3.3.2 依据打appointment开特征词挖掘特定特征联络

翻开特征词和特征值的application挖掘

翻开特征联络需求挖掘不同概念特有的特征和特征值,它的难点在于翻开特征和翻开特征值的辨认。经过查询数据发现,一些通用的特征值(例如:好、坏、高、低、多、少),一般和特征分配呈现(例如:环境好、温度高、人流量大)。所以人工智能专业大学排名咱们选用一种依据模板的Bootstrapping办法主动从用户谈论中挖掘特征和特征值,挖掘流程如下:

常识性概念图谱建造以及在美团场景中的使用

在挖掘了翻开特征词和特征值之后,翻开特征联络的挖掘拆分为「概念-特征」二APP元组的挖掘和「概念-特征-特征值」三元组的挖掘。

概念-特征的挖掘

前端开发是干什么的概念-特征」二元组的挖掘,即判别人工智能专业概念Concept是否含有特征Property。挖掘进程如下:

  • 依据概念和特征在UGC中的共现特征,运用TFIDF变种算法挖掘概念对应的典型特征作为候选。
  • 将候选概念特征结构为简略的天然表android下载装置述句,运用通畅度言语模型appstore判别句子的通畅度,保存通畅度高的概念特征。

概念-特征-特征值的appstore挖掘

在得到「概念-特征」二元组后,挖掘对应特征值的进程如下:

  • 种子挖掘。依据共现特征和言语模型从UGC中挖掘种子三元组。
  • 模板挖掘。运用种子三元组从UGC中构建适宜的模板(例如,“水温是否适宜,是选人工智能专业择游泳馆的重要标准。”)。
  • 联络生成。运用种子三元组填充模板,练习掩码言语模型用于联络生成。

常识性概念图谱建造以及在美团场景中的使用

现在,翻开范畴的概念特征联络准确率在80%左右。

3.4 概念接受android软件开发APP络挖掘

概念接受联络是树立用户查找概念和美团接受概念之间的相关。例如,当用户查找“郊游”时,实在的意图是期望寻找“适宜郊游的当地”,因而渠道经过“人工智能的界说郊野公园”、“植物园”等概念进行接受。联络的挖掘需求从0到1进行,所以整个概念接受联络挖掘依据不同阶段的挖掘关键规划了不同的挖掘算法,能够人工智能专业大学排名分为三个阶段:①初期的种子挖掘;②中期的深度判别模型挖掘;③后期的联络人工智能专业补全。具体介绍如下。

3.4.1 依据共现特征挖掘种子数据

为了处理联络appetite抽取使命中的冷启动问题,业界一般选用Bootsandroid软件开发trapping的办法,经过人工设定的少量种子和模板,主动从语猜中扩大数据。可是,Bootstrapping办法不只受限于模板的质量,而且使用于美团的场景中有appetite着天然缺陷。美团语料的首要来历是用户谈论,而用户谈论的表述十分口语化及多样化,很难规划通用而且有用的模板。因前端和后端哪个薪酬高此,咱们丢掉依据模板的办法,而是依据实体间的共现特征以及类目特征,构建了一前端开发是干什么的个三元比照学习网络,主动从非结构化的文本中挖掘实体联络之间潜在的相关性信息。

具体来说,咱们查询到不同商户类目下用户谈论中实体的分布差异较大。例如,美食类目下的UGC常常触及到“聚餐”、“点菜”android是什么手机牌子、“餐厅”;健身类目下的UGC常常触及到“瘦身”、“私教”、“健身房”;而“装修”、“大厅”等通用实体在各个类目下都会呈现。因而,咱们构建了三元比照学习网络,使得同类目下的用户谈论标明接近,不同类意图用户谈论标明远离。与Word2Vec等预android什么意思练习词向量体系相似,经过该比照学习策略得到的词向量层天appreciate然包括丰富的联络信息。在猜测时,关于任意的android手机用户查找概念,能够经过核算其与android平板电脑价格悉数接受概念之间的语义相似度,辅以查找事务上的计算特征,得到一批高质量的种子数据。

常识性概念图谱建造以及在美团场景中的使用

3android的drawable类.4.2 依据种子数据练习深度前端面试题模型

预练习言语模appstore型近两年来在NLandroid的drawable类P范畴取得了很大的发展,依据大型的预练习模型微调轻贱使命,是NLP范畴十分盛行的做法。因而,在联络挖掘中期,人工智能概念股咱们选用依据BERT的联appstore络判别模型(参看《美团BERT的探求和实践》一文),运用BERT预练习时学到的许多言语本身的常识来帮助联络抽取使命。

模型结构如下图所示。首要,依据实体间的共现特征得到候选实体对,召回包括候选实体对的用户谈论;然后,沿用MTB论文中的实体符号办法,在两个实体的初步方位和完apple前端面试题方位别离刺进特别的标志符号,经过BERT建模之后,将两个实体初步方位的特别符号拼接起来作为联络标明;究竟,将联络标明输入Softmax层判别实体间是否含有联络。

常识性概念图谱建造以及在美团场景中的使用

3.4.Android3 依据已有的图approach谱结构进行联络补全

经过上述两个阶段,现已从非结构化的文本信息中构建出了一个初具规划的概念接受联络的图谱。可是由android软件开发于语义模型的局限性,当时图谱中存前端结构在许多的三元组缺失。为了进一步丰富概念图谱,补全缺失的联络信息,咱们使用常识图谱链接猜测中的TransE算法以及图神经网络等技能,对已有的概念图谱进行补全。

为了充分运用已知前端学什么图谱的结构信息,咱们android是什么手机牌子选用依据联络的图注意力神经网络(RGATandroid手机,Relational Graph Aandroidstudio装置教程ttention Network)来建模图结构信息。RGAT运用联络注意力机制,克服了传统GCN、GAT无法建模边类型的缺陷,更appetite适用于建模概念图谱此类异构网络。在运用RGAT得到实体稠密嵌入之后,我人工智能论文们运APP用Traandroid软件开发nsE作为损失函数。TransE将三元组(h,r,t)中的r视为从h到t的翻译向量,并约好h+r≈t。该办法被广泛适用于常识图谱补全使命傍边,显示出极强appreciate的鲁棒性和可拓展性。

具体细节如下图所示,RGAT中每层结点的特征由街坊结点特征的均值以及邻边特征的均值加权拼接而成,经过联络注意力机制,不同的结点和边具有不同的权重系数。在得到究竟一层的结点和边特征后,咱们运用Tra前端和后端哪个薪酬高nsE作为练习政策,对练习会合的每对前端开发三元组(h,r,t),最小化||h+r=t||。在猜测时,关于每个头实体和每种联络,图谱悉数结点apple作为候选尾实体与其人工智能论文核算距离,得到究竟的尾实体。

常识性概念图谱建造以及在美团场景中的使用

application在概念接受联络全体准确率90%左右。

3.5 POI/SPU-概念联络制造

树立图谱概念和美团实例之android下载间的相关,会运用到POAndroidI/SPU称谓、类目、用户谈论等多个维度的信息。树立相关的前端学什么难点在于怎样从多样化的信息中获取与图谱概念相关的信息。因而,咱们经过近义词召回实例下悉数与概念语义相关的子句,然后运用判别模型判别概念与子句的相关程度。具体流程如下:

  • 近义词application聚类。关于待打标前端技能的概念,依据图谱近义词数据,获取概念的多种表述。apple
  • 候选子句生成。依据近义词聚类的作用,从商户称谓、团单称appstore号、用户谈论等多个来历中人工智能概念股召回候选子句。
  • 判别模型。运用概念-文本相关判android是什么手机牌子别模型(如下图所示)判别概android软件开发念和子句是否匹配。

常识性概念图谱建造以及在美团场景中的使用

  • 打标作用。调整阈值,得到究竟的判别作用。

四、使用实践

4.1 到综品类词图谱制造

美团到综事务包括常识范畴较广,包括亲子、教育、approach医美、休android是什么手机牌子闲文娱等,一起每个范畴都包括更多小的子范畴,所以针对不同的范畴制造范畴内的常识图人工智能概念股谱,能够辅佐做好查找召回、挑选、推荐等事务。

在常识性概念图谱中除了常识性概念数据,一起也包括美团场景数据,以及根底算法才华的沉积,因而approach能够凭借常识性图谱才华,帮助制造到综品类词的图谱数据。

凭借常识性图谱,补偿缺少的品类词数appreciate据,构建合理的品类词图谱,帮助经过查找改写,POI打标等办法前进查找召回。现在在教育范畴,图谱规划从起先的1000+节点扩appstore展到appreciate2000+,一起近义词从千等级扩展到2万+,取得了不错的作用。

品类词图谱制造流程如下图所示:

常识性概念图谱建造以及在美团场景中的使用

4.2 点评查找引导前端结构

点评查找SUG推荐,在引导用户认知的人工智能技能使用一起帮助减少用户完结查找的时刻Android,前进查找功率。所以在SUG推荐上需求集前端结构合两个方面的政策:①前端帮助丰富用户前端结构的认知,从对点评的POI、类目查找添加天然文本查找的认知;②精细化用户查找需求,当用户在查找一些比较泛的品类词时前端和后端的差异,帮助细化用户的查找需求。

在常识性概念图谱中,树立了很丰富的概念以及对应特征及其特征值的联络,经过一个相比照较泛的Queryapp是什么意思,能够生成对应细化的Query。例如蛋糕,能够经过口味这个特征,人工智能的界说产出草莓蛋糕、芝士蛋糕,经过标准这个人工智能工作方向及远景特征,产出6寸蛋糕、袖珍蛋糕等等。

查找引导词Query产出示例如android体系下图所示:

常识性概念图谱建造以及在美团场景中的使用

4.3 到综医美内容打标

在医美内容展现上,用户一般会对某一特人工智能论文定的医美服务内前端工程师容感兴approach趣,所以在产品形状上会供给一些不同的服务标签,帮助用户挑选准确的医美内容,精准触达用户需求。可是在标签和医美内容进行相关时,相关过错较多,用户挑选后常常看到不契合自android下载装置己需求的内容。前进打标的准确率能够帮助用户更调集自己的需求。

凭借图谱的概念-POI打标才华和概念-UGCAndroid的打标联络,前进标签-内容的准确率。经过图谱才华打标,在准确率和召回率上均有明显前进。

  • 准确率:经过概念-appointment内容打标算法,相比于关键词匹配,准确率从51%进android下载装置步到91%。
  • 召回率:经过概念同义挖掘,召回率从77%前进到91%。

常识性概念图谱建造以及在美团场景中的使用

五、appear总结与展望

咱们对常识性概念图谱制造作业以及在美团场景中的运用情况进行了具体的介绍。在整个常识性概念图谱中,依照事务需求包括三类节点和四类的联络,别离介绍了概念挖掘算法、不同品种的联络挖掘算法。

现在,咱们常识性概念图谱有200万+的概念,300万+的概念之间的联络,包括上下位、同义android什么意思、特征、接受等联络,POI-概念的联络不包括在内。现在,全体联络准确率在90%左右,而且还在不断优化算法,扩大联络的一起前进准确率。后续咱们的常识性概念图谱还会继续完善,期望可android手机以做到精而全。

参看材料

  • [1] Onoe Y, Durrett G. Interpretable entity representations throappearanceugh large-scale typing[J]. arXiv preprint arXiv:2005.00147, 2020.
  • [2] Bosselut A, Rashkin H, Sap M, et al. Comet: Commonsappointmentense transformers for automatic knowledge graph construction[J]. arXiv preprint arXiv:1906.05317, 2019前端和后端哪个薪酬高.
  • [3] Soares L B, FitzGerald N, Ling J, et al. Matching the人工智能 blanks: Distributional similarity for relation learning[J]. arXiv preprint arandroid下载Xiv前端学什么:1906.03158, 2019.
  • [4] Peng H, Gao T, H人工智能概念股an X, et al. Lear人工智能专业ning from context or names? an empirical study on neural relation extraction[J]. arXiapp是什么意思v preprinandroid是什么手机牌子t arXiv:2010.01923, 2020.
  • [5] Jiang, Zhengbao, et al. “How can we know what language models knoappreciatewAndroid?.” Transactions of the Association for Computational Linguistics 8 (2020): 4androidstudio装置教程23-438.
  • [6] Li X L, Liang P. Prefix人工智能概念股-Tuning: Optimizing Continuo前端学什么us Prompts for Generation[J]. aappreciaterXiv preprint arXiv:2101.00190, 2021.
  • [7] Malaviya, Chaitanya, et al. “Commonsense knowledge base completion with structural and semantic context.” Proceedings of the AAAI Conference on Artificial Iappetitentelligence. Vol. 34. No. 03. 2020.
  • [8] 李涵昱android手机, 钱力, 周鹏飞. “面向产品谈论文本的情感剖析与appetite挖掘.” 情报科学 35.1 (2017): 5前端开发需求学什么1-55.
  • [9] 闫波, 张也, 宿红毅 等.appstore 一种依据用户谈论的产品特征聚类办法.
  • [10] Wang, Chengyu, Xiaofeng He, and Aoying Zh人工智能ou. “Open relation extractappointmention for chinese noun phrases.” IEEE Transactions on Knowledge and Data Engineering (2019).
  • [11] Li, Feng-Lin, et al. “AliMeKG: Domain Knowledge Graph Construction and Application in E-commerce.” Proceedings of the 29th ACM International Conference on Information & Knowledge Management. 2020.
  • [12] Yang, Yaosheng, et al. “Distantly supervised ner witapplicationh partial annandroid体系ota前端和后端哪个薪酬高tion lea深度学习rning and reinforcement learning.” Proceedi人工智能的界说ngs of the 27th International Conference on Computational Lingu前端和后端哪个薪酬高isandroid手机tics. 2018.
  • [13] Luo X, Liu L, Yang Y, et前端开发 al. AliCoCo: Alib前端和后端的差异aba e-commerce cognitive concept net[C]//Proceedings of the 2020 ACM SIGMOD International Co前端面试题nference on Management of Dataapp是什么意思. 2020: 313-327.
  • [14] Devlin J, Chang M W,人工智能专业 Lee K, et al.android体系 Bert: Pre-tr人工智能换脸鞠婧祎郑爽aining o前端技能f deep bidirandroid什么意思ectional transformers for language understanding[J]. arXiv preprint arXiv:1810.04805, 2018.
  • [15] Cheng H T, Koc L, Harmse人工智能概念股n J, et aandroid是什么手机牌子l. Wide & deep learning for recommender systems[C]//Proceedings of the 1st workshop on deep learning for recommender systems. 2016: 7-10.
  • [16] Liu J, Shang J, Wang C, et al. Mining quality phrases fro人工智能技能使用m massive text corpora[C]app是什么意思//Proceedings of the 2015 ACM SIGMOD International Conference on Management of Data. 2015: 1729-1744.
  • [17] Shen J, Wu Z, Lei D, et al. Hiexpan: Task-guided ta人工智能专业xonomy construction by hierarchical tree expansion[C]//Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018: 2180-2189.
  • [18] Huang J, Xie Y, Meng Y,android下载 et al. Corel: Seed-guided topi深度学习cal taxonomy construction by concept learning and relation transferring[C]//Proceedings of the 26th ACM SIGKDD InternaAPPtional Conference on Knowledge Discovery & Data Mining. 2020: 1928-1936APP.
  • [1人工智能专业9] Liu B, Guo W, Niu D, et al. A user-centered concept mining system for query and document understanding at tencent[C]//applePr人工智能论文oceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery &amp人工智能技能使用; Data Minandroid什么意思ing. 2019: 1831-18android手机41.
  • [20]approach Choi人工智能论文 Eappointment, Levy O, Choi Y, et al前端开发是干什么的. Ultra-fine entity typin前端开发是干什么的g[J]. arXiv preprint arXiv:1807.04905, 2018.
  • [21] Xie Q, Dai Z, Hovy E, et a前端开发l. Un前端学什么supervised data augmentation for consistency training[J]. ar人工智能论文Xiv preprint arXiv:1904.12848, 2019.
  • [22] Maoapp是什么意思 X, Wang W, Xu H, et al. Relational Reflection Entitandroid什么意思y Alignment[人工智能论文C]//Proc人工智能专业大学排名eedings of the 29th ACM International Conference on Information & Knowledge Management. 2020: 1095-1104.
  • [23] Chen J, Qiu X, L前端开发需求学什么iu P, et al. Meta multi-task learning forandroid体系 seque人工智能技能使用专业nce modeling[C]//Proceedings of the AAAI Conference on前端技能 Artificial Intelligence. 2018, 32(1).

作者简介

宗宇、豪杰、慧敏、福宝、徐俊、谢睿、武威等,均来自美团查找与NLP部-NLP中心android下载人工智能

招聘信息

美团查找与NLP部/NLP中心是担任美团人工智能技能研制的中心团队,使命是打造世界一流的前端学什么天然言语处理中心技能和服务才华,依托NLP(天然言语处理)、Deep Learning(深度学习前端工程师)、Knowledge Graph(常识图谱)等技能,处理美团海量文本数据,为美团各项事务供给智能的文本语义了解服务。

NLP中心长时刻招聘天然言语处理算法专家/机器学习算法专家,感兴趣的同学能够approach将简历发送至wangzongyu02@meituan.com。

| 本文系美团技能团队出品,著作权归属美团。欢迎出于同享和交流等非商业目android下载装置的转载或运用本文内容,敬APP请注明“内容转载自美团技能团队”。本文未经许可,不得进行商业性转载或许运用。android是什么手机牌子任何商用行为,请发送邮件至tecAPPh@meituan.com央求授权。

阅览美团技能团队更多技能文章合集

前端 | 算法 | 后端 | 数据 | 安全 | 运维 | iOS | Android | 检人工智能换脸鞠婧祎郑爽

| 在群众号菜单栏对话框回复【2020年货】、【2019年货】、【2018年货】、【2017年货】等关键词,可检查美团技能团队历年技能文章人工智能论文合集。

常识性概念图谱建造以及在美团场景中的使用

|android是什么手机牌子 本文系美团approach技能团队出品,著作权归属美团。欢迎出于同享和交流等非商业意图转载或运用本文内容,敬请注明appetite“内容转载自美团技能APP团队”。Android本文未经许可,不得进行商业性转载或许运用。任何商用行为,请发送邮件至tech@meituan.com央求授权。

发表评论

提供最优质的资源集合

立即查看 了解详情