scala source code of SQLAggregationScala

Project: infinispan-spark (GitHub Link)

infinispan-spark-master
- src
  - main
    - resources
      - META-INF
        services
        org.apache.spark.sql.sources.DataSourceRegister
    - scala
      - org
        infinispan
        spark
        sql
        InfinispanDataSource.scala
        package.scala
        SchemaProvider.scala
        InfinispanRelation.scala
        ObjectMapper.scala
        rdd
        InfinispanJavaRDD.scala
        InfinispanIterator.scala
        FilteredCustomInfinispanRDD.scala
        InfinispanRDD.scala
        InfinispanPartition.scala
        RDDFilters.scala
        Splitter.scala
        FilteredQueryInfinispanRDD.scala
        RemoteCacheManagerBuilder.scala
        PreferredServerBalancingStrategy.scala
        CacheLifecycle.scala
        stream
        InfinispanInputDStream.scala
        package.scala
        InfinispanJavaDStream.scala
        package.scala
        config
        ConnectorConfiguration.scala
        serializer
        JBossMarshallingSerializer.scala
  - test
    - resources
      - generate-keys.sh
      - truststore_client.jks
      - log4j.properties
      - keystore_server.jks
      - ca.jks
      - hive-site.xml
      - keystore_client.jks
      - infinispan-secure.xml
    - scala
      - org
        infinispan
        spark
        suites
        DatasetWithScalaEntitySuite.scala
        PropertiesSuite.scala
        DistributedSuite.scala
        CacheLifecycleSuite.scala
        LocalitySuite.scala
        WriteSuite.scala
        WriteWithProtoSuite.scala
        HiveContextSuite.scala
        NonClusteredSuite.scala
        CustomFilterRDDSuite.scala
        CustomSplitterSuite.scala
        JavaStreamApiSuite.scala
        StreamingFailOverSuite.scala
        DataFormatSuite.scala
        SQLSuite.scala
        RDDRetrievalTest.scala
        FilterByQueryProtoSuite.scala
        JavaApiSuite.scala
        JavaProtobufSuite.scala
        DataSetSuite.scala
        PartitionSuite.scala
        RDDFailOverSuite.scala
        ReplicatedSuite.scala
        FilterByQueryProtoAnnotationSuite.scala
        StreamingSuite.scala
        test
        FailOver.scala
        StreamingUtils.scala
        RemoteTest.scala
        JavaSparkStream.scala
        InfinispanServer.scala
        ClusterSample.scala
        FixedPartitionsSplitter.scala
        InfinispanClient.scala
        WordCache.scala
        Spark.scala
        DatasetAssertions.scala
        SparkStream.scala
        JavaSpark.scala
        SampleFilters.scala
        UsersCache.scala
        TestingUtil.scala
        XMLUtils.scala
        RunnersCache.scala
        NonClusteredSecureSuites.scala
        domain
        Tweet.scala
        Marshallers.scala
        User.scala
        LogEntry.scala
        NonClusteredSuites.scala
        ClusteredSuites.scala
    - java
      - org
        infinispan
        spark
        JavaStreamApiTest.java
        JavaApiTest.java
        domain
        Person.java
        Address.java
        Runner.java
        JavaProtobufTest.java
- examples
  - twitter
    - src
      - main
        resources
        stopWords.txt
        scala
        org
        infinispan
        spark
        examples
        twitter
        WordCountScala.scala
        SQLAggregationScala.scala
        Sample.scala
        StreamProducerScala.scala
        StreamConsumerScala.scala
        util
        TwitterDStream.scala
        java
        org
        infinispan
        spark
        examples
        twitter
        WordCountJava.java
        Tweet.java
        StreamProducerJava.java
        StreamConsumerJava.java
        SQLAggregationJava.java
    - run-clusters.sh
    - spark-shell.sh
    - README.md
    - run-job.sh
    - .gitignore
    - docker-compose.yml
  - snippets
    - src
      - main
        scala
        Samples.scala
        java
        FilterByDeployedFilter.java
        FilterByPreBuiltQuery.java
        CustomSplitter.java
        CreatingDStream.java
        WriteArbitraryRDD.java
        FilterByIckle.java
        User.java
        DatasetSample.java
        SparkSQL.java
        CacheAdminSample.java
        DifferentFormats.java
        CreatingRDD.java
- LICENSE
- project
  - build.properties
  - Versions.scala
  - Deps.scala
  - Publishing.scala
  - assembly.sbt
  - plugins.sbt
- sbt
- .travis.yml
- README.md
- build.sbt
- .gitignore
- version.sbt

package org.infinispan.spark.examples.twitter

import org.apache.log4j.{Level, Logger}
import org.apache.spark.SparkContext
import org.apache.spark.sql.SparkSession
import org.infinispan.spark.examples.twitter.Sample.{getSparkConf, usage}
import org.infinispan.spark.rdd.InfinispanRDD

/**
  * This demo will group tweets by country and print the top 20 countries, using Spark SQL support.
  *
  * @author gustavonalle
  */
object SQLAggregationScala {

   def main(args: Array[String]) {
      if (args.length < 1) {
         usage("SQLAggregationScala")
      }

      Logger.getLogger("org").setLevel(Level.WARN)
      val infinispanHost = args(0)

      // Reduce the log level in the driver
      Logger.getLogger("org").setLevel(Level.WARN)

      // Create Spark Context
      val conf = getSparkConf("spark-infinispan-rdd-aggregation-scala")
      val sc = new SparkContext(conf)

      // Populate infinispan properties
      val config = Sample.getConnectorConf(infinispanHost)

      // Create RDD from infinispan data
      val infinispanRDD = new InfinispanRDD[Long, Tweet](sc, config)

      // Create a SQLContext, register a data frame and a temp table
      val valuesRDD = infinispanRDD.values
      val sparkSession = SparkSession.builder().config(conf).getOrCreate()
      val dataFrame = sparkSession.createDataFrame(valuesRDD, classOf[Tweet])
      dataFrame.createOrReplaceTempView("tweets")

      // Run the Query, collect and print results
      sparkSession.sql("SELECT country, count(*) as c from tweets WHERE country != 'N/A' GROUP BY country ORDER BY c desc")
        .collect().take(20).foreach(println)

   }

}