configuration for remote HBase cluster #96

mrauter · 2016-12-16T13:27:51Z

Maybe a stupid question but how can I configure the HBase connector to a Zookeeper/HBase Cluster which is not running on localhost?

`[2016-12-16 14:03:42,449] INFO Process identifier=hconnection-0x25a855e1 connecting to ZooKeeper ensemble=localhost:2181 (org.apache.hadoop.hbase.zookeeper.RecoverableZooKeeper:120)

[2016-12-16 14:03:59,391] ERROR ZooKeeper exists failed after 4 attempts (org.apache.hadoop.hbase.zookeeper.RecoverableZooKeeper:277)`

I couldn't find the setting for this

stheppi · 2016-12-16T15:07:50Z

@mrauter HBaseConfiguration.create() will get the configuration from the hbase-site.xml (it typically sits on your /etc/hbase/conf and you need to add it to the connector classpath). This is the best practice for connecting to Hbase as opposed to calling the #set on the configuration with the required settings. Your hbase-site.xml should/would have all the values pointing to the remote Hbase

artiship · 2017-11-17T08:59:32Z

@stheppi

hbase-site.xml

<configuration>
  <property>
    <name>hbase.zookeeper.quorum</name>
    <value>192.168.1.101</value>
    <description>The directory shared by region servers.</description>
  </property>
</configuration>

Add hbase-site.xml to CLASSPATH

export CLASSPATH=$CLASSPATH:/opt/hbase-site.xml

Restart confluent connect

bin/confluent stop connect
bin/confluent start connect

Start hbase connector as example :
http://docs.datamountaineer.com/en/latest/hbase.html

➜  bin/connect-cli create hbase-sink < conf/hbase-sink.properties

#Connector name=`hbase-sink`
name=person-hbase-test
connector.class=com.datamountaineer.streamreactor.connect.hbase.HbaseSinkConnector
tasks.max=1
topics=hbase-topic
connect.hbase.column.family=d
connect.hbase.kcql=INSERT INTO person SELECT * FROM hbase-topic PK firstName, lastName
#task ids: 0

But View log found that hbase still connect to localhost rather than 192.168.1.101 which configured in hbase-site.xml.

bin/confluent log connect

[2017-11-17 16:13:08,541] INFO Process identifier=hconnection-0x4107c3fd connecting to ZooKeeper ensemble=localhost:2181 (org.apache.hadoop.hbase.zookeeper.RecoverableZooKeeper:120)

And then the task throw exception:

[2017-11-17 16:44:55,196] INFO Setting connector hbase-sink-test state to STARTED (org.apache.kafka.connect.runtime.Worker:541)
[2017-11-17 16:44:55,203] INFO SinkConnectorConfig values: 
        connector.class = com.datamountaineer.streamreactor.connect.hbase.HbaseSinkConnector
        key.converter = null
        name = hbase-sink-test
        tasks.max = 1
        topics = [hbase-topic]
        transforms = null
        value.converter = null
 (org.apache.kafka.connect.runtime.SinkConnectorConfig:223)
[2017-11-17 16:44:55,203] INFO EnrichedConnectorConfig values: 
        connector.class = com.datamountaineer.streamreactor.connect.hbase.HbaseSinkConnector
        key.converter = null
        name = hbase-sink-test
        tasks.max = 1
        topics = [hbase-topic]
        transforms = null
        value.converter = null
 (org.apache.kafka.connect.runtime.ConnectorConfig$EnrichedConnectorConfig:223)
[2017-11-17 16:44:55,204] INFO Setting task configurations for 1 workers. (com.datamountaineer.streamreactor.connect.hbase.HbaseSinkConnector:52)
[2017-11-17 16:44:58,273] INFO 127.0.0.1 - - [17/Nov/2017:08:44:58 +0000] "GET /connectors/hbase-sink-test/status HTTP/1.1" 200 161  5 (org.apache.kafka.connect.runtime.rest.RestServer:60)
[2017-11-17 16:48:04,619] ERROR Failed to get region location  (org.apache.hadoop.hbase.client.AsyncProcess:420)
org.apache.hadoop.hbase.client.NoServerForRegionException: Unable to find region for John\x0ASmith in person after 35 tries.
        at org.apache.hadoop.hbase.client.ConnectionManager$HConnectionImplementation.locateRegionInMeta(ConnectionManager.java:1329)
        at org.apache.hadoop.hbase.client.ConnectionManager$HConnectionImplementation.locateRegion(ConnectionManager.java:1199)
        at org.apache.hadoop.hbase.client.AsyncProcess.submit(AsyncProcess.java:410)
        at org.apache.hadoop.hbase.client.AsyncProcess.submit(AsyncProcess.java:359)
        at org.apache.hadoop.hbase.client.BufferedMutatorImpl.backgroundFlushCommits(BufferedMutatorImpl.java:238)
        at org.apache.hadoop.hbase.client.BufferedMutatorImpl.flush(BufferedMutatorImpl.java:190)
        at org.apache.hadoop.hbase.client.HTable.flushCommits(HTable.java:1498)
        at org.apache.hadoop.hbase.client.HTable.put(HTable.java:1094)
        at com.datamountaineer.streamreactor.connect.hbase.writers.HbaseWriter$$anonfun$insert$1$$anonfun$1.apply$mcV$sp(HbaseWriter.scala:104)
        at com.datamountaineer.streamreactor.connect.hbase.writers.HbaseWriter$$anonfun$insert$1$$anonfun$1.apply(HbaseWriter.scala:104)
        at com.datamountaineer.streamreactor.connect.hbase.writers.HbaseWriter$$anonfun$insert$1$$anonfun$1.apply(HbaseWriter.scala:104)
        at scala.util.Try$.apply(Try.scala:192)
        at com.datamountaineer.streamreactor.connect.hbase.writers.HbaseWriter$$anonfun$insert$1.apply(HbaseWriter.scala:104)
        at com.datamountaineer.streamreactor.connect.hbase.writers.HbaseWriter$$anonfun$insert$1.apply(HbaseWriter.scala:75)
        at scala.collection.immutable.Map$Map1.foreach(Map.scala:116)
        at com.datamountaineer.streamreactor.connect.hbase.writers.HbaseWriter.insert(HbaseWriter.scala:75)
        at com.datamountaineer.streamreactor.connect.hbase.writers.HbaseWriter.write(HbaseWriter.scala:64)
        at com.datamountaineer.streamreactor.connect.hbase.HbaseSinkTask$$anonfun$put$2.apply(HbaseSinkTask.scala:83)
        at com.datamountaineer.streamreactor.connect.hbase.HbaseSinkTask$$anonfun$put$2.apply(HbaseSinkTask.scala:83)
        at scala.Option.foreach(Option.scala:257)
        at com.datamountaineer.streamreactor.connect.hbase.HbaseSinkTask.put(HbaseSinkTask.scala:83)
        at org.apache.kafka.connect.runtime.WorkerSinkTask.deliverMessages(WorkerSinkTask.java:435)
        at org.apache.kafka.connect.runtime.WorkerSinkTask.poll(WorkerSinkTask.java:251)
        at org.apache.kafka.connect.runtime.WorkerSinkTask.iteration(WorkerSinkTask.java:180)
        at org.apache.kafka.connect.runtime.WorkerSinkTask.execute(WorkerSinkTask.java:148)
        at org.apache.kafka.connect.runtime.WorkerTask.doRun(WorkerTask.java:146)
        at org.apache.kafka.connect.runtime.WorkerTask.run(WorkerTask.java:190)
        at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
        at java.util.concurrent.FutureTask.run(FutureTask.java:266)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
        at java.lang.Thread.run(Thread.java:745)

artiship · 2017-11-18T13:45:25Z

@stheppi Can hbase sink support specifying hbase connection in connector properties rather in hbase-site.xml.

* Update google-cloud-core, ... to 2.43.0 * Update logback-classic, logback-core to 1.5.8 --------- Co-authored-by: Scala Steward <[email protected]>

stheppi closed this as completed Dec 16, 2016

artiship mentioned this issue Nov 17, 2017

Kafka connect HBase: java.lang.NoClassDefFoundError: Could not initialize class org.apache.hadoop.hbase.util.ByteStringer #321

Closed

lanbotdeployer pushed a commit that referenced this issue Sep 12, 2024

Chore/dep upgrades (#96)

42fa2c8

* Update google-cloud-core, ... to 2.43.0 * Update logback-classic, logback-core to 1.5.8 --------- Co-authored-by: Scala Steward <[email protected]>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

configuration for remote HBase cluster #96

configuration for remote HBase cluster #96

mrauter commented Dec 16, 2016 •

edited

Loading

stheppi commented Dec 16, 2016

artiship commented Nov 17, 2017

artiship commented Nov 18, 2017

configuration for remote HBase cluster #96

configuration for remote HBase cluster #96

Comments

mrauter commented Dec 16, 2016 • edited Loading

stheppi commented Dec 16, 2016

artiship commented Nov 17, 2017

artiship commented Nov 18, 2017

mrauter commented Dec 16, 2016 •

edited

Loading