Kafka2HdfsWithGobblin

Apache gobblin from kafka to hdfs ingestion sample.

Before you get started please read https://gobblin.readthedocs.io/en/latest/Getting-Started/ . I listed some important steps to build and run gobblin binaries.

1. Unpackage the gobblin tgz file.

tar -xvf apache-gobblin-incubating-sources-0.13.0.tgz

2. If not exists copy gradle-wrapper.jar(my repo contains this jar) into gradle/wrapper directory than build

./gradlew :gobblin-distribution:buildDistributionTar

3. Get a file named apache-gobblin-incubating-bin-0.13.0.tar.gz from build/gobblin-distribution/distributions/ directory and unpack it.

cp apache-gobblin-incubating-bin-0.13.0.tar.gz /home/you/gobblin/
cd /home/you/gobblin/
tar -xvf apache-gobblin-incubating-bin-0.13.0.tar.gz

4. cd to the unpacked Gobblin distribution bin directory and enter gobblin-env.sh file, add this line:

HADOOP_BIN_DIR=${HADOOP_HOME}/bin

5. Run gobblin-standalone.sh file with parameters like this.

First start the service

/home/engin/gobblin/gobblin-dist/bin/gobblin-standalone.sh start --conf /home/engin/gobblin/deneme --workdir /home/engin/gobblin/deneme/wd

After job execution stop it

/home/engin/gobblin/gobblin-dist/bin/gobblin-standalone.sh stop --conf /home/engin/gobblin/deneme --workdir /home/engin/gobblin/deneme/wd

Notes

I recommend to check nohup.out file in working directory to get failure details after execution step. And another file conf/gobblin->standalone.properties contains file:// file path definitions.

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
README.md		README.md
apache-gobblin-incubating-sources-0.13.0.tgz		apache-gobblin-incubating-sources-0.13.0.tgz
denemeJobFile.pull		denemeJobFile.pull
gradle-wrapper.jar		gradle-wrapper.jar
metrics-core-3.1.0.jar		metrics-core-3.1.0.jar
metrics-graphite-3.1.0.jar		metrics-graphite-3.1.0.jar

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

apache-gobblin-incubating-sources-0.13.0.tgz

apache-gobblin-incubating-sources-0.13.0.tgz

denemeJobFile.pull

denemeJobFile.pull

gradle-wrapper.jar

gradle-wrapper.jar

metrics-core-3.1.0.jar

metrics-core-3.1.0.jar

metrics-graphite-3.1.0.jar

metrics-graphite-3.1.0.jar

Repository files navigation

Kafka2HdfsWithGobblin

About

Releases

Packages

enginunal/Kafka2HdfsWithGobblin

Folders and files

Latest commit

History

Repository files navigation

Kafka2HdfsWithGobblin

About

Topics

Resources

Stars

Watchers

Forks