常识图谱(Knowledge Graph),在图书情报界称为常识域可视化或常识范畴映射地图,是显现常识开展进程与结构联系的一系列各种不同的图形,用 可视化技术描述常识资源及其载体,发掘、剖析、 构建、制作和显现常识及它们之间的彼此联络。 常识图谱是经过将应用数学、 图形学、信息可视化技术、 信息科学等学科的理论与办法与计量学引文剖析、共现剖析等办法结合,并利用可视化的图谱形象地展现学科的核心结构、开展前史、 前沿范畴以及全体常识架构达到多学科交融意图的现代理论。它能为学科研讨供给切实的、有价值的参考。

简介

常识图谱由于其数据包含实体、特点、联系等,常见的联系型数据库诸如MySQL之类不能很好的体现数据的这些特点,因此常识图谱数据的存储一般是选用图数据库(Graph Databases)。而Neo4j是其中最为常见的图数据库。

安装

首先在 neo4j.com/download/ 下载 Neo4J。Neo4J分为社区版和企业版,企业版在横向扩展、权限操控、运行性能、HA等方面都比社区版好,合适正式的生产环境,一般的学习和开发选用免费社区版就好。

在Mac或许Linux中,安装好jdk后,直接解压下载好的Neo4J包,运行bin/neo4j start即可。

运用

Neo4J供给了一个用户友爱的web界面,能够进行各项配置、写入、查询等操作,而且供给了可视化功能。相似ElasticSearch一样,我个人十分喜爱这种开箱即用的规划。

打开浏览器,输入http://127.0.0.1:7474/browser/,如下图所示,界面最上方便是交互的输入框

Neo4J 快速入门

Cypher 查询言语

Cypher 是Neo4J的声明式图形查询言语,允许用户不必编写图形结构的遍历代码,就能够对图形数据进行高效的查询。Cypher的规划意图相似SQL,合适于开发者以及在数据库上做点对点形式(ad-hoc)查询的专业操作人员。其具备的才能包含: – 创立、更新、删去节点和联系 – 经过形式匹配来查询和修改节点和联系 – 管理索引和约束等。

删去数据库中以往的图,保证一个空白的环境进行操作:

MATCH (n) DETACH DELETE n

MATCH 是匹配操作,而小括号 () 代表一个节点 node(可理解为括号相似一个圆形),括号里面的 n 为标识符。

创立一个人物节点:

CREATE (n:Person {name:'Quintion Tang'}) RETURN n

CREATE 是创立操作,Person 是标签,代表节点的类型。花括号 {} 代表节点的特点。这条句子的意义便是创立一个标签为 Person 的节点,该节点具有一个name 特点,特点值是 Quintion

如图所示,在Neo4J的界面上能够看到创立成功的节点。

Neo4J 快速入门

持续来创立更多的人物节点,下列句子分别履行:

CREATE (n:Person {name:'Ezra Tillman'}) RETURN n
CREATE (n:Person {name:'Dante Carter'}) RETURN n
CREATE (n:Person {name:'Christopher Mcclure'}) RETURN n
CREATE (n:Person {name:'Ruby Rocha'}) RETURN n
CREATE (n:Person {name:'Imelda Hardin'}) RETURN n

接下来创立区域节点

CREATE (n:Location {city:'Miami', state:'FL'})
CREATE (n:Location {city:'Boston', state:'MA'})
CREATE (n:Location {city:'Lynn', state:'MA'})
CREATE (n:Location {city:'Portland', state:'ME'})
CREATE (n:Location {city:'San Francisco', state:'CA'})

能够看到,节点类型为Location,特点包含 citystate

接下来创立联系

MATCH (a:Person {name:'Christopher Mcclure'}),
      (b:Person {name:'Ruby Rocha'}) 
MERGE (a)-[:FRIENDS]->(b)

这儿的方括号 [] 即为联系,FRIENDS 为联系的类型。留意这儿的箭头 -> 是有方向的,表明是从a到b的联系。 如图,Christopher Mcclure 和 ‘Ruby Rocha’ 之间树立了 FRIENDS 联系,经过Neo4J的可视化很明显的能够看出:

联系添加特点

MATCH (a:Person {name:'Imelda Hardin'}),
      (b:Person {name:'Ezra Tillman'}) 
MERGE (a)-[:FRIENDS {since:2022}]->(b)

在联系中,相同的运用花括号 {} 来添加联系的特点,这儿给 FRIENDS 联系添加了 since 特点,特点值为 2022,表明他们树立朋友联系的时间。

接下来添加更多的联系

MATCH (a:Person {name:'Imelda Hardin'}), (b:Person {name:'Quintion Tang'}) MERGE (a)-[:FRIENDS {since:2018}]->(b)
MATCH (a:Person {name:'Christopher Mcclure'}), (b:Person {name:'Imelda Hardin'}) MERGE (a)-[:FRIENDS {since:2016}]->(b)
MATCH (a:Person {name:'Ezra Tillman'}), (b:Person {name:'Dante Carter'}) MERGE (a)-[:FRIENDS {since:2016}]->(b)
MATCH (a:Person {name:'Ruby Rocha'}), (b:Person {name:'Quintion Tang'}) MERGE (a)-[:MARRIED {since:2012}]->(b)

树立不同类型节点之间的联系-人物和地址的联系

MATCH (a:Person {name:'Quintion Tang'}), (b:Location {city:'Boston'}) MERGE (a)-[:BORN_IN {year:1988}]->(b)

这儿的联系是 BORN_IN,表明出世地,相同有一个特点,表明出世年份。

树立更多人的出世地

MATCH (a:Person {name:'Ruby Rocha'}), (b:Location {city:'Boston'}) MERGE (a)-[:BORN_IN {year:1981}]->(b)
MATCH (a:Person {name:'Christopher Mcclure'}), (b:Location {city:'San Francisco'}) MERGE (a)-[:BORN_IN {year:1980}]->(b)
MATCH (a:Person {name:'Imelda Hardin'}), (b:Location {city:'Miami'}) MERGE (a)-[:BORN_IN {year:1980}]->(b)
MATCH (a:Person {name:'Dante Carter'}), (b:Location {city:'Lynn'}) MERGE (a)-[:BORN_IN {year:1990}]->(b)

至此,常识图谱的数据已经刺进结束,能够开端做查询了。咱们查询下一切在 Boston 出世的人物

MATCH (a:Person)-[:BORN_IN]->(b:Location {city:'Boston'}) RETURN a,b

成果如下:

Neo4J 快速入门

查询一切对外有联系的节点

MATCH (a)-->() RETURN a

Neo4J 快速入门

留意这儿箭头的方向,返回成果不含任何区域节点,由于区域并没有指向其他节点(只是被指向)

查询一切有联系的节点

MATCH (a)--() RETURN a

成果如下:

Neo4J 快速入门

查询一切对外有联系的节点,以及联系类型

MATCH (a)-[r]->() RETURN a.name, type(r)

成果如下:

Neo4J 快速入门

查询一切有结婚联系的节点

MATCH (n)-[:MARRIED]-() RETURN n

创立节点的时候就建好联系

CREATE (a:Person {name:'Jonah Johns'})-[r:FRIENDS]->(b:Person {name:'Herman Rosa'})

查找某人的朋友的朋友

MATCH (a:Person {name:'Quintion Tang'})-[r1:FRIENDS]-()-[r2:FRIENDS]-(friend_of_a_friend) RETURN friend_of_a_friend.name AS fofName

返回 Quintion Tang 的朋友的朋友:

Neo4J 快速入门

添加/修改节点的特点

MATCH (a:Person {name:'Imelda Hardin'}) SET a.age=34
MATCH (a:Person {name:'Ruby Rocha'}) SET a.age=32
MATCH (a:Person {name:'Christopher Mcclure'}) SET a.age=44
MATCH (a:Person {name:'Quintion Tang'}) SET a.age=25

这儿,SET 表明修改操作

删去节点的特点

MATCH (a:Person {name:'Quintion Tang'}) SET a.test='test'
MATCH (a:Person {name:'Quintion Tang'}) REMOVE a.test

删去特点操作首要经过 REMOVE

删去有联系的节点

MATCH (a:Person {name:'Quintion Tang'})-[rel]-(b:Person) DELETE a,b,rel

删去重复的节点和联系

# 删去联系
match (n)-[r:FRIENDS]-()  detach delete r
# 删去节点
MATCH(n:'Quintion Tang') detach delete n
# 删去重复的联系和节点
MATCH (a)-[r:key_app]->(b) WITH a, b, TAIL (COLLECT (r)) as rr WHERE size(rr)>0 FOREACH (r IN rr | DELETE r)

总结

本文从介绍、安装和体验简略的查询,了解常识图谱(Knowledge Graph)的表现形式。