Connecting to Spark via JDBC/ODBC Thrift Server

For Legacy Support Purposes Only

This page will walk you through connecting to JDBC via Thrift Server to use for querying to your Spark cluster.

Setting Up Your Environment

Provision a cluster with Cassandra
Set up a Spark Client (but changing the configuration to “AMI: Ubuntu Server 167.04 LTS (HVM), SSD Volume Type”).
Configure Client Network Access

Ensure that your Spark client machine has Java 8 installed and selected as the preferred Java version.

sudo apt update
sudo apt install openjdk-8-jdk

1 2	sudo apt update sudo apt install openjdk-8-jdk

wget https://archive.apache.org/dist/spark/spark-2.1.1/spark-2.1.1-bin-hadoop2.7.tgz
tar -xf spark-2.1.1-bin-hadoop2.7.tgz

1 2	wget https://archive.apache.org/dist/spark/spark-2.1.1/spark-2.1.1-bin-hadoop2.7.tgz tar -xf spark-2.1.1-bin-hadoop2.7.tgz

./start-thriftserver.sh --master spark://<spark_master_IP1>:7077,<spark_master_IP2>:7077,<spark_master_IP3>:7077

1	./start-thriftserver.sh --master spark://<spark_master_IP1>:7077,<spark_master_IP2>:7077,<spark_master_IP3>:7077

Start beeline (included with Spark):

./bin/beeline

1	./bin/beeline

Once Beeline starts, connect to the Thrift Server:

!connect jdbc:hive2://localhost:1000

1	!connect jdbc:hive2://localhost:1000

Username: ubuntu
Password: <empty> (just press enter when prompted).

Now run your queries as you wish!

Getting started with Spark Jobserver and Instaclustr

Instaclustr Spark with SSL configured Apache Cassandra Cluster

Schedule your 1:1 session with one of our open source experts