GDH

Running big data components on kubernetes

Required

kubernetes cluster v1.18+
kubectl with cluster admin role on linux

Config

Planning Nodes for Service Deployment, eg:
namespace: bigdata

node services

node1 nn1 rm1 dn nm

node2 nn2 rm2 dn nm

node3 zk dn nm kafka

node4 zk dn nm kafka

node5 zk dn nm kafka
Modify the configuration file config.sh to suit your plan

Deploy

./installl.sh

Service default port

service	ports
zookeeper	2181
journalnode	8485 8480
namenode	8020 9870
resourcemanager	8088
histroyserver	10020 19888
hive	9083 10000 10002
spark	12222 10000
trino	8082
clickhouse	8123
kafka	9092

Known Issues

namenode failover not implemented

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
Dockerfile		Dockerfile
clickhouse		clickhouse
hadoop		hadoop
hive		hive
kafka		kafka
spark		spark
trino		trino
zookeeper		zookeeper
LICENSE		LICENSE
README.md		README.md
config.sh		config.sh
install.sh		install.sh
uninstall.sh		uninstall.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

GDH

Required

Config

Deploy

Service default port

Known Issues

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

node	services
node1	nn1 rm1 dn nm
node2	nn2 rm2 dn nm
node3	zk dn nm kafka
node4	zk dn nm kafka
node5	zk dn nm kafka

Folders and files

Latest commit

History

Repository files navigation

GDH

Required

Config

Deploy

Service default port

Known Issues

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages