本文介绍如何基于Java编程环境连接和操作图数据库GDB。这是以常驻服务形式操作图数据库GDB的常用形式。
前提条件
图数据库GDB实例需要与ECS虚拟机处于同一个VPC中。
安装Maven
添加具有Maven程序包的存储库。
wget http://repos.fedorapeople.org/repos/dchen/apache-maven/epel-apache-maven.repo\ -O /etc/yum.repos.d/epel-apache-maven.repo
设置该存储库的版本号。
sudo sed -i s/\$releasever/6/g /etc/yum.repos.d/epel-apache-maven.repo
下载并安装Maven。
sudo yum install -y apache-maven
安装Java
安装JDK 8.0。
sudo yum install java-1.8.0-devel
如果您的ECS实例上有多个Java版本,请将Java8设置为默认运行。
sudo /usr/sbin/alternatives --config java 共有 4 个提供“java”的程序。 选项 命令 ----------------------------------------------- *+ 1 java-1.8.0-openjdk.x86_64 (/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.191.b12-1.el7_6.x86_64/jre/bin/java) 2 java-1.8.0-openjdk.x86_64 (/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.191.b12-0.el7_5.x86_64-debug/jre/bin/java) 3 java-1.7.0-openjdk.x86_64 (/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.191-2.6.15.4.el7_5.x86_64/jre/bin/java) 4 /usr/lib/jvm/jre-1.6.0-openjdk.x86_64/bin/java
编写Java客户端代码
创建gdb-gremlin-test的目录。
mkdir gdb-gremlin-test; cd gdb-gremlin-test
创建pom.xml文件,并写入如下内容。
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd"> <modelVersion>4.0.0</modelVersion> <groupId>com.gdb.alibaba</groupId> <artifactId>GdbGremlinExample</artifactId> <packaging>jar</packaging> <version>1.0-SNAPSHOT</version> <name>GdbGremlinExample</name> <url>http://maven.apache.org</url> <dependencies> <dependency> <groupId>org.apache.tinkerpop</groupId> <artifactId>gremlin-driver</artifactId> <version>3.4.3</version> </dependency> </dependencies> <build> <plugins> <plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-compiler-plugin</artifactId> <version>2.0.2</version> <configuration> <source>1.8</source> <target>1.8</target> </configuration> </plugin> <plugin> <groupId>org.codehaus.mojo</groupId> <artifactId>exec-maven-plugin</artifactId> <version>1.3</version> <configuration> <mainClass>com.gdb.alibaba.Test</mainClass> <complianceLevel>1.8</complianceLevel> </configuration> </plugin> </plugins> </build> </project>
创建目录并新建文件。
mkdir -p src/main/java/com/gdb/alibaba/; touch src/main/java/com/gdb/alibaba/Test.java
编写测试程序。
package com.gdb.alibaba; import org.apache.tinkerpop.gremlin.driver.Cluster; import org.apache.tinkerpop.gremlin.driver.Client; import org.apache.tinkerpop.gremlin.driver.Result; import org.apache.tinkerpop.gremlin.driver.ResultSet; import java.util.List; import java.util.Map; import java.util.HashMap; import java.io.File; public class Test { public static void main( String[] args ) { try { if(args.length != 1) { System.out.println("gdb-remote.yaml path needed"); return; } String yaml = args[0]; // 1. 初始化客户端,客户端包含连接池,线程安全,支持多线程并发 Cluster cluster = Cluster.build(new File(yaml)).create(); Client client = cluster.connect().init(); // 2. 发送gremlin请求到GDB服务端,根据业务逻辑定制 String dsl = "g.addV(yourlabel).property(propertyKey, propertyValue)"; Map<String,Object> parameters = new HashMap<>(3); parameters.put("yourlabel","area"); parameters.put("propertyKey","wherence"); parameters.put("propertyValue","shenzheng"); ResultSet results = client.submit(dsl,parameters); List<Result> result = results.all().join(); result.forEach(p -> System.out.println(p.getObject())); // 3. 关闭客户端,完成所有gremlin请求清理资源 client.close(); cluster.close(); } catch (Exception e) { System.out.println(e.getMessage()); } } }
说明SDK中client包含有连接池,支持多线程并发。业务上可以全局维护一个client,不需要每次请求都新建,等所有图数据库GDB请求处理完或者应用退出时再关闭。
创建gdb-remote.yaml文件,该文件为Java客户端与GDB图数据库建立连接的配置文件,其他详细配置请参考SDK使用。
hosts: [ ${gdbHost} ] port: 8182 username: ${username} password: ${password} serializer: { className: org.apache.tinkerpop.gremlin.driver.ser.GraphBinaryMessageSerializerV1, config: { serializeResultToString: false } }
其中,示例参数说明如下:
参数
说明
${gdbHost}
GDB的连接地址,例如
gds-bp*******************.graphdb.rds.aliyuncs.com
。${username}
GDB的数据库账号。
${password}
GDB数据库账号对应的密码。
进入gdb-gremlin-test主目录,编译并执行Java程序。
mvn compile exec:java -Dexec.args="/home/apache-tinkerpop-gmlin-console-3.4.0/conf/gdb-remote.yaml"
执行结果如下:
v[ba8f60b7-0786-4014-a4e2-451f09b79878]
显式配置客户端
如果您需要集中管理配置,而不是使用单独的GDB配置文件,可以通过Driver提供的API对客户端进行显式配置,示例代码如下:
// 1. 初始化客户端,客户端包含连接池,线程安全,支持多线程并发
// Cluster cluster = Cluster.build(new File(yaml)).create();
// Client client = cluster.connect().init();
// 显式配置客户端
Cluster.build(${gdbHost}).port(${gdbPort}).
serializer(Serializers.GRAPHBINARY_V1D0).
maxConnectionPoolSize(8).
minConnectionPoolSize(8).
maxContentLength(65536).
credentials(${username}, ${password}).create();
client = cluster.connect().init();
其中,示例参数说明如下:
参数 | 说明 |
| GDB的连接地址,例如 |
| GDB的端口号,例如 |
| GDB的数据库账号。 |
| GDB数据库账号对应的密码。 |
更多客户端常用配置参数如下:
参数 | 默认值 | 说明 |
connectionPool.maxContentLength | 65536 | 消息最大字节数。请求返回的数据量较大时需要增大该参数的值,否则可能出现返回结果无法处理的错误。 |
connectionPool.maxSize | 8 | 连接池最大连接数。并发较大的情况下建议增加最大连接数。 |
connectionPool.minSize | 2 | 连接池最小连接数。 |
更多dsl样例
本文中以上示例内容是适用参数化的方式,通过dsl g.addV(yourlabel).property(propertyKey, propertyValue)
和参数map
添加的点。以下内容将结合具体的图的点、边结构来进行更多的dsl示例。关于图的点、边结构的介绍,请参见ThinkerPop文档。
以下dsl示例需要改造成参数化的调用方式,您可以使用硬编码方式来进行范例讲解:
//DSL硬编码:
dsl = "user_defined_dsl";
//比如:g.addV('sand131_id_5_99').property(id,'sand131_id_5_99').property('name','sand131_name_5_99')
ResultSet results = client.submit(dsl);
|
|
v
//参数化脚本:
String dsl ="g.addV(vertex).property(id,vertex).property('name',vertex)";
Map<String, Object> parameters = new HashMap<>();
parameters.put("vertex","sand131_id_5_99"); //填写dsl语句中的vertex参数
ResultSet results = client.submit(dsl, parameters,timeoutInMillis);
示例步骤如下:
删除指定label的点、边。
g.E().hasLabel('gdb_sample_knows').drop() g.E().hasLabel('gdb_sample_created').drop() g.V().hasLabel('gdb_sample_person').drop() g.V().hasLabel('gdb_sample_software').drop()
添加顶点,为其设置id、property。
g.addV('gdb_sample_person').property(id, 'gdb_sample_marko').property('age', 28).property('name', 'marko') g.addV('gdb_sample_person').property(id, 'gdb_sample_vadas').property('age', 27).property('name', 'vadas') g.addV('gdb_sample_person').property(id, 'gdb_sample_josh').property('age', 32).property('name', 'josh') g.addV('gdb_sample_person').property(id, 'gdb_sample_peter').property('age', 35).property('name', 'peter') g.addV('gdb_sample_software').property(id, 'gdb_sample_lop').property('lang', 'java').property('name', 'lop') g.addV('gdb_sample_software').property(id, 'gdb_sample_ripple').property('lang', 'java').property('name', 'ripple')
修改或新增age属性。
g.V('gdb_sample_marko').property('age', 29)
建立关系,设置属性weight。
g.addE('gdb_sample_knows').from(V('gdb_sample_marko')).to(V('gdb_sample_vadas')).property('weight', 0.5f) g.addE('gdb_sample_knows').from(V('gdb_sample_marko')).to(V('gdb_sample_josh')).property('weight', 1.0f) g.addE('gdb_sample_created').from(V('gdb_sample_marko')).to(V('gdb_sample_lop')).property('weight', 0.4f) g.addE('gdb_sample_created').from(V('gdb_sample_josh')).to(V('gdb_sample_lop')).property('weight', 0.4f) g.addE('gdb_sample_created').from(V('gdb_sample_josh')).to(V('gdb_sample_ripple')).property('weight', 1.0f) g.addE('gdb_sample_created').from(V('gdb_sample_peter')).to(V('gdb_sample_lop')).property('weight', 0.2f)
查询所有点或指定label的点数量。
g.V().count() g.V().hasLabel('gdb_sample_person').count()
查询指定条件的顶点(>29岁的人,按name降序排列所有人)。
g.V().hasLabel('gdb_sample_person').has('age', gt(29)) g.V().hasLabel('gdb_sample_person').order().by('name', decr)
关联查询(获取marko 认识的人, marko认识的人created的software)。
g.V('gdb_sample_marko').outE('gdb_sample_knows').inV().hasLabel('gdb_sample_person') g.V('gdb_sample_marko').outE('gdb_sample_knows').inV().hasLabel('gdb_sample_person').outE('gdb_sample_created').inV().hasLabel('gdb_sample_software')
删除关系、顶点。
g.V('gdb_sample_marko').outE('gdb_sample_knows').where(inV().has(id, 'gdb_sample_josh')).drop() g.V('gdb_sample_marko').drop()
您也可以进行其他测试,详细的Gremlin查询语句,请参见TinkerPop的Gremlin文档。