java source code of SparkStreamingSqlAnalyse

sylph-master
- src
  - license
    - LICENSE-HEADER.txt
  - checkstyle
    - facebook_checks.xml
- sylph-main
  - src
    - main
      - java
        ideal
        sylph
        main
        SylphMaster.java
        util
        PropertiesUtil.java
        service
        JobEngineImpl.java
        JobEngineManager.java
        OperatorLoader.java
        SqliteDbJobStore.java
        JobManager.java
        server
        SylphContextImpl.java
        ServerMainConfig.java
        SylphBean.java
    - test
      - java
        JansiTest.java
  - build.gradle
- sylph-spi
  - src
    - main
      - java
        ideal
        sylph
        spi
        RunnerContext.java
        utils
        JsonTextUtil.java
        GenericTypeReference.java
        PluginConfigFactory.java
        ConnectorStore.java
        job
        JobEngine.java
        EtlFlow.java
        JobContainer.java
        JobContainerAbs.java
        JobEngineHandle.java
        SqlFlow.java
        Flow.java
        JobStore.java
        JobConfig.java
        ContainerFactory.java
        EtlJobEngineHandle.java
        Job.java
        exception
        StandardErrorCode.java
        SylphException.java
        ErrorCode.java
        ErrorType.java
        RunnerContextImpl.java
        Runner.java
        model
        JobInfo.java
        EdgeInfo.java
        ConnectorInfo.java
        NodeInfo.java
        GraphAppUtil.java
        NodeLoader.java
        SylphContext.java
    - test
      - java
        ideal
        sylph
        spi
        utils
        JsonTextUtilTest.java
        GraphAppUtilTest.java
        PluginConfigFactoryTest.java
        job
        SqlFlowTest.java
        TestConfigs.java
        NodeLoaderTest.java
        model
        ConnectorInfoTest.java
        OperatorManagerTest.java
  - build.gradle
- gradle
  - wrapper
    - gradle-wrapper.properties
- sylph-runners
  - flink
    - src
      - main
        resources
        log4j.properties
        java
        ideal
        sylph
        runner
        flink
        sql
        AsyncFunctionHelper.java
        JoinContextImpl.java
        FlinkSqlParser.java
        udf
        RowGet.java
        JsonParser.java
        TimeUtil.java
        UDFJson.java
        ArrayAgg.java
        engines
        StreamSqlBuilder.java
        FlinkStreamSqlEngine.java
        FlinkEnvFactory.java
        FlinkMainClassEngine.java
        StreamSqlUtil.java
        FlinkStreamEtlEngine.java
        FlinkContainerFactory.java
        etl
        FlinkRecord.java
        FlinkNodeLoader.java
        FlinkTransFrom.java
        FlinkSink.java
        SylphFsCheckpointStorage.java
        FlinkRunner.java
        table
        SylphTableSource.java
        SylphTableSink.java
        FlinkJobConfig.java
        yarn
        YarnJobDescriptor.java
        FlinkConfiguration.java
        FlinkYarnJobLauncher.java
        local
        MiniExecutor.java
        FlinkBean.java
      - test
        resources
        stream_test.sql
        java
        ideal
        sylph
        runner
        flink
        engines
        FlinkStreamSqlActuatorTest.java
        sqlTest
        TableSqlTest.java
        JsonPathUdfTest.java
        TestStreamMode.java
        JoinTest.java
    - build.gradle
  - spark
    - src
      - main
        java
        ideal
        sylph
        runner
        spark
        kafka
        SylphKafkaOffset.java
        udf
        TimeUtil.java
        SparkSubmitEngine.java
        Stream2EtlEngine.java
        SparkAppMain.java
        SparkStreamingSqlEngine.java
        SparkRunner.java
        SparkStreamingSqlAnalyse.java
        StructuredStreamingSqlEngine.java
        JobHelper.java
        SparkJobConfig.java
        structured
        StructuredNodeLoader.java
        SQLHepler.java
        yarn
        SylphSparkYarnClient.java
        SparkAppLauncher.java
        StructuredStreamingSqlAnalyse.java
        StreamEtlEngine.java
        sparkstreaming
        DStreamUtil.java
        StreamNodeLoader.java
        SparkRecord.java
        SqlAnalyse.java
        SparkContainerFactory.java
      - test
        java
        ideal
        sylph
        runner
        spark
        SparkJobConfigTest.java
    - build.gradle
    - conf
      - log4j.properties
  - build.gradle
- sylph-parser
  - src
    - main
      - java
        ideal
        sylph
        parser
        calcite
        TableName.java
        JoinInfo.java
        CalciteSqlParser.java
        SqlParserException.java
        antlr
        AstBuilder.java
        StatementSplitter.java
        tree
        CreateStreamAsSelect.java
        Property.java
        ColumnDefinition.java
        SelectQuery.java
        LongLiteral.java
        QualifiedName.java
        Identifier.java
        DoubleLiteral.java
        Statement.java
        Node.java
        CreateFunction.java
        CreateTable.java
        BooleanLiteral.java
        NodeLocation.java
        TableElement.java
        InsertInto.java
        StringLiteral.java
        WaterMark.java
        Proctime.java
        Literal.java
        Expression.java
        ParsingException.java
        AntlrSqlParser.java
        CaseInsensitiveStream.java
      - antlr
        ideal
        sylph
        parser
        antlr4
        SqlBase.g4
    - test
      - java
        ideal
        sylph
        parser
        antlr
        tree
        StringLiteralTest.java
  - build.gradle
- sylph-docs
  - src
    - main
      - docs
        source
        en
        page
        process.md
        user.md
        faq.md
        index.md
        docs
        intro
        quickstart.md
        etl.md
        index.md
        architecture.md
        batch-join.md
        faq
        deploy.md
        debug.md
        contributing.md
        wechat.md
        start.md
        advanced
        plugin_api.md
        plugin_manager.md
        framework.md
        core
        server-isoloton.md
        fetch-server.md
        framework.md
        plugin.md
        basics
        setup.md
        structure.md
        online.md
        service.md
        mock.md
        deployment.md
        _data
        menu.yml
        sidebar.yml
        languages.yml
        api
        index.md
        zh-cn
        page
        process.md
        user.md
        faq.md
        index.md
        fekey
        quickstart.md
        index.md
        docs
        intro
        quickstart.md
        deploy.md
        etl.md
        index.md
        batch-join.md
        faq
        deploy.md
        debug.md
        contributing.md
        wechat.md
        start.md
        advanced
        plugin_api.md
        plugin_manager.md
        framework.md
        core
        server-isoloton.md
        fetch-server.md
        framework.md
        plugin.md
        basics
        setup.md
        structure.md
        online.md
        service.md
        mock.md
        deployment.md
        _config.yml
        themes
        docs
        layout
        partial
        header.swig
        footer.swig
        aside.swig
        head.swig
        post.swig
        page.swig
        index.swig
        layout.swig
        source
        images
        feature3.svg
        feature1.svg
        logo-new.svg
        github.svg
        banner.jpg
        sylph
        logo-animate.js
        feature2.svg
        logo.svg
        js
        mobile-aside.js
        css
        page
        page.less
        index.less
        partial
        main.less
        mobile.less
        footer.less
        var.less
        toc.less
        nav.less
        vendor
        normalize.less
        github-markdown.less
        highlight-github.less
        index.less
        lib
        renderer.js
        languages
        en.yml
        zh-cn.yml
        scripts
        helpers.js
        yarn.lock
        package.json
  - build.gradle
  - README.md
- sylph-web
  - src
    - main
      - java
        ideal
        sylph
        controller
        ControllerApp.java
        utils
        JsonFormatUtil.java
        ProxyUtil.java
        LogAppender.java
        WebApplication.java
        JettyServer.java
        AuthAspect.java
        AppExceptionMapper.java
        action
        JobManagerResource.java
        LoginController.java
        EtlResource.java
        PluginManagerResource.java
        ServerLogResource.java
        ServerConfig.java
        selvet
        WebAppProxyServlet.java
        ProxyAllHttpServer.java
      - webapp
        src
        Menu.js
        ServerLog.js
        lib
        AnsiColors.js
        EditableTable.js
        Login.js
        codeMirror.css
        StreamingEtl.js
        App.js
        App.css
        ConnectorList.js
        index.css
        StreamingSql.js
        ConnectorManager.js
        JobList.js
        index.js
        posts.js
        logo.svg
        public
        favicon.ico
        manifest.json
        index.html
        README.md
        package.json
    - test
      - java
        ideal
        sylph
        controller
        utils
        JsonFormatUtilTest.java
  - build.gradle
- gradlew.bat
- LICENSE
- gradlew
- sylph-api
  - src
    - main
      - java
        ideal
        sylph
        etl
        impl
        ListCollector.java
        SinkContext.java
        Schema.java
        api
        RealTimePipeline.java
        Source.java
        TransForm.java
        RealTimeTransForm.java
        Sink.java
        RealTimeSink.java
        JoinOperator.java
        Plugin.java
        Field.java
        Collector.java
        SourceContext.java
        Record.java
        PluginConfig.java
        Operator.java
        join
        JoinContext.java
        SelectField.java
        annotation
        Name.java
        Version.java
        Description.java
    - test
      - java
        ideal
        sylph
        etl
        api
        SinkTest.java
  - build.gradle
- sylph-base-jdbc
  - src
    - main
      - java
        ideal
        sylph
        plugins
        jdbc
        JdbcRealTimeSink.java
        JdbcAsyncJoin.java
        JdbcUtils.java
  - build.gradle
- sylph-cli
  - src
    - main
      - java
        ideal
        sylph
        cli
        LineReader.java
        QueryResult.java
- build.gradle
- .travis.yml
- README.md
- settings.gradle
- sylph-base-kafka
  - src
    - main
      - java
        ideal
        sylph
        plugins
        kafka
        flink
        KafkaSourceConfig.java
        JsonDeserializer.java
  - build.gradle
- sylph-dist
  - src
    - data
      - data.db
    - jobs
      - etl_demo
        job.flow
        job.type
      - streamSql_demo
        job.flow
        job.type
      - sql_test1
        job.flow
        job.type
      - json
        job.flow
        job.type
      - hdfs_test
        job.flow
        job.type
      - join_test
        job.flow
        job.type
    - bin
      - sylph
      - sylph.bat
      - launcher
    - etc
      - sylph
        logback.xml
        sylph-env.sh
        sylph.properties
        sylph-log4j.properties
        sylph-env.bat
  - build.gradle
- sylph-yarn
  - src
    - main
      - java
        ideal
        sylph
        runtime
        yarn
        YarnJobContainer.java
        YarnModule.java
        local
        Kernel32.java
        LocalContainer.java
  - build.gradle
- build.sh
- sylph-connectors
  - sylph-kudu
    - src
      - main
        java
        ideal
        sylph
        plugins
        kudu
        Plugin.java
        KuduSink.java
      - test
        java
        ideal
        sylph
        plugins
        kudu
        KuduSinkTest.java
    - build.gradle
  - spark-kafka
    - src
      - main
        java
        ideal
        sylph
        plugins
        kafka
        spark
        JsonSchema.java
        StructuredKafkaSource.java
        KafkaSourceConfig.java
        Plugin.java
        SocketSource.java
        util
        DStreamUtil.java
        structured
        KafkaSourceUtil.java
        KafkaSource.java
    - build.gradle
  - flink-kafka08
    - src
      - main
        java
        ideal
        sylph
        plugins
        kafka
        flink
        KafkaBaseSource.java
        Plugin.java
        KafkaSource08.java
    - build.gradle
  - sylph-elasticsearch5
    - src
      - main
        java
        ideal
        sylph
        plugins
        elasticsearch5
        ClientFactory.java
        ElasticsearchSinkConfig.java
        Plugin.java
        Elasticsearch5Sink.java
    - build.gradle
  - sylph-hbase
    - src
      - main
        java
        ideal
        sylph
        plugins
        hbase
        util
        BytesUtil.java
        ColumUtil.java
        HbaseHelper.java
        exception
        TableNotFoundException.java
        ColumMappingException.java
        HbaseSink.java
        tuple
        Tuple2.java
        Tuple.java
    - build.gradle
  - spark-kafka08
    - src
      - main
        java
        ideal
        sylph
        plugins
        kafka
        spark
        JsonSchema.java
        Plugin.java
        KafkaSource08.java
        KafkaOffsetCommitter.java
        StructuredKafkaSource08.java
        KafkaSourceConfig08.java
    - build.gradle
  - flink-kafka09
    - src
      - main
        java
        ideal
        sylph
        plugins
        kafka
        flink
        KafkaBaseSource.java
        utils
        KafkaProducer.java
        IProducer.java
        SimplePartitioner.java
        Plugin.java
        KafkaSink09.java
        KafkaSource09.java
    - build.gradle
  - sylph-elasticsearch6
    - src
      - main
        java
        ideal
        sylph
        plugins
        elasticsearch6
        ClientFactory.java
        ElasticsearchSinkConfig.java
        Plugin.java
        Elasticsearch6Sink.java
      - test
        java
        ideal
        sylph
        plugins
        elasticsearch6
        Elasticsearch6SinkTest.java
    - build.gradle
  - flink-kafka
    - src
      - main
        java
        ideal
        sylph
        plugins
        kafka
        flink
        TestSource.java
        KafkaBaseSource.java
        Plugin.java
        KafkaSource.java
      - test
        java
        ideal
        sylph
        plugins
        kafka
        flink
        KafkaSourceTest.java
    - build.gradle
  - sylph-clickhouse
    - src
      - main
        java
        ideal
        sylph
        plugins
        clickhouse
        TestCKSource.java
        ClickHouseAsyncJoin.java
        Plugin.java
        ClickHouseSink.java
    - build.gradle
  - build.gradle
  - sylph-mysql
    - src
      - main
        java
        ideal
        sylph
        plugins
        mysql
        PrintSink.java
        TestTrans.java
        MysqlAsyncJoin.java
        Plugin.java
        MysqlSink.java
      - test
        java
        ideal
        sylph
        plugins
        mysql
        MysqlSinkTest.java
    - build.gradle
  - flink-hdfs2
    - src
      - main
        java
        ideal
        sylph
        plugins
        hdfs2
        Plugin.java
        NoneCodec.java
        HdfsSink2.java
    - build.gradle
  - sylph-hdfs
    - src
      - main
        java
        ideal
        sylph
        plugins
        hdfs
        utils
        CommonUtil.java
        ParquetUtil.java
        MemoryUtil.java
        txt
        TextTimeParser.java
        TextFileFactory.java
        Plugin.java
        parquet
        ApacheParquet.java
        FileWriter.java
        ParquetFactory.java
        HDFSFactory.java
        factory
        TimeParser.java
        HDFSFactorys.java
        HdfsSink.java
      - test
        java
        ideal
        sylph
        plugins
        hdfs
        utils
        ParquetUtilTest.java
    - build.gradle

/*
 * Copyright (C) 2018 The Sylph Authors
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */
package ideal.sylph.runner.spark;

import com.github.harbby.gadtry.ioc.Bean;
import com.github.harbby.gadtry.ioc.IocFactory;
import ideal.sylph.etl.Schema;
import ideal.sylph.etl.SinkContext;
import ideal.sylph.etl.SourceContext;
import ideal.sylph.parser.antlr.tree.CreateFunction;
import ideal.sylph.parser.antlr.tree.CreateStreamAsSelect;
import ideal.sylph.parser.antlr.tree.CreateTable;
import ideal.sylph.parser.antlr.tree.InsertInto;
import ideal.sylph.parser.antlr.tree.SelectQuery;
import ideal.sylph.parser.antlr.tree.WaterMark;
import ideal.sylph.runner.spark.kafka.SylphKafkaOffset;
import ideal.sylph.runner.spark.sparkstreaming.DStreamUtil;
import ideal.sylph.runner.spark.sparkstreaming.StreamNodeLoader;
import ideal.sylph.spi.ConnectorStore;
import org.apache.spark.api.java.function.ForeachFunction;
import org.apache.spark.rdd.RDD;
import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SparkSession;
import org.apache.spark.sql.types.DataType;
import org.apache.spark.sql.types.StructType;
import org.apache.spark.streaming.StreamingContext;
import org.apache.spark.streaming.api.java.JavaDStream;
import org.apache.spark.streaming.api.java.JavaStreamingContext;
import org.apache.spark.streaming.dstream.DStream;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import scala.reflect.ClassTag$;

import java.lang.reflect.ParameterizedType;
import java.lang.reflect.Type;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Optional;
import java.util.function.Consumer;
import java.util.function.UnaryOperator;
import java.util.stream.Collectors;

import static com.github.harbby.gadtry.base.MoreObjects.checkState;
import static ideal.sylph.runner.spark.SQLHepler.checkQueryAndTableSinkSchema;
import static ideal.sylph.runner.spark.SQLHepler.getSparkType;
import static ideal.sylph.runner.spark.SQLHepler.getTableSchema;
import static ideal.sylph.runner.spark.SQLHepler.schemaToSparkType;
import static java.util.Objects.requireNonNull;

public class SparkStreamingSqlAnalyse
        implements SqlAnalyse
{
    private static final Logger logger = LoggerFactory.getLogger(SparkStreamingSqlAnalyse.class);

    private final JobBuilder builder = new JobBuilder();
    private final StreamingContext ssc;
    private final ConnectorStore connectorStore;
    private final Bean sparkBean;
    private final boolean isCompile;

    public SparkStreamingSqlAnalyse(StreamingContext ssc,
            ConnectorStore connectorStore,
            boolean isCompile)
    {
        this.ssc = ssc;
        this.connectorStore = connectorStore;
        this.sparkBean = binder -> {
            binder.bind(StreamingContext.class, ssc);
            binder.bind(JavaStreamingContext.class, new JavaStreamingContext(ssc));
        };
        this.isCompile = isCompile;
    }

    @Override
    public void finish()
    {
        builder.build();
    }

    @Override
    public void createStreamAsSelect(CreateStreamAsSelect statement)
    {
        throw new UnsupportedOperationException("this method have't support!");
    }

    @Override
    public void createTable(CreateTable createTable)
    {
        final String tableName = createTable.getName();
        Schema schema = getTableSchema(createTable);
        final StructType tableSparkType = schemaToSparkType(schema);

        final Map<String, Object> withConfig = createTable.getWithConfig();
//        final String driverClass = (String) withConfig.get("type");

        switch (createTable.getType()) {
            case SOURCE:
                SourceContext sourceContext = new SourceContext()
                {
                    @Override
                    public Schema getSchema()
                    {
                        return schema;
                    }

                    @Override
                    public String getSourceTable()
                    {
                        return tableName;
                    }

                    @Override
                    public Map<String, Object> withConfig()
                    {
                        return withConfig;
                    }
                };
                createSourceTable(sourceContext, tableSparkType, createTable.getWatermark());
                return;
            case SINK:
                SinkContext sinkContext = new SinkContext()
                {
                    @Override
                    public Schema getSchema()
                    {
                        return schema;
                    }

                    @Override
                    public String getSinkTable()
                    {
                        return tableName;
                    }

                    @Override
                    public Map<String, Object> withConfig()
                    {
                        return withConfig;
                    }
                };
                createSinkTable(sinkContext, tableSparkType);
                return;
            case BATCH:
                throw new UnsupportedOperationException("The SparkStreaming engine BATCH TABLE have't support!");
            default:
                throw new IllegalArgumentException("this driver class " + withConfig.get("type") + " have't support!");
        }
    }

    public void createSourceTable(SourceContext sourceContext, StructType tableSparkType, Optional<WaterMark> optionalWaterMark)
    {
        final String driverClass = (String) sourceContext.withConfig().get("type");
        IocFactory iocFactory = IocFactory.create(sparkBean, binder -> binder.bind(SourceContext.class).byInstance(sourceContext));
        StreamNodeLoader loader = new StreamNodeLoader(connectorStore, iocFactory);

        checkState(!optionalWaterMark.isPresent(), "spark streaming not support waterMark");
        UnaryOperator<JavaDStream<Row>> source = loader.loadSource(driverClass, sourceContext.withConfig());
        builder.addSource(source, tableSparkType, sourceContext.getSourceTable());
    }

    public void createSinkTable(SinkContext sinkContext, StructType tableSparkType)
    {
        final String driverClass = (String) sinkContext.withConfig().get("type");
        IocFactory iocFactory = IocFactory.create(sparkBean, binder -> binder.bind(SinkContext.class, sinkContext));
        StreamNodeLoader loader = new StreamNodeLoader(connectorStore, iocFactory);

        UnaryOperator<Dataset<Row>> outputStream = dataSet -> {
            checkQueryAndTableSinkSchema(dataSet.schema(), tableSparkType, sinkContext.getSinkTable());
            loader.loadRDDSink(driverClass, sinkContext.withConfig()).accept(dataSet.javaRDD());
            return null;
        };
        builder.addSink(sinkContext.getSinkTable(), outputStream);
    }

    @Override
    public void createFunction(CreateFunction createFunction)
            throws Exception
    {
        //todo: 需要字节码大法加持
        Class<?> functionClass = Class.forName(createFunction.getClassString());
        String functionName = createFunction.getFunctionName();
        List<ParameterizedType> funcs = Arrays.stream(functionClass.getGenericInterfaces())
                .filter(x -> x instanceof ParameterizedType)
                .map(ParameterizedType.class::cast)
                .collect(Collectors.toList());
        //this check copy @see: org.apache.spark.sql.UDFRegistration#registerJava
        checkState(!funcs.isEmpty(), "UDF class " + functionClass + " doesn't implement any UDF interface");
        checkState(funcs.size() < 2, "It is invalid to implement multiple UDF interfaces, UDF class " + functionClass);
        Type[] types = funcs.get(0).getActualTypeArguments();
        DataType returnType = getSparkType(types[types.length - 1]);

//                UDF1<Object, Object> udf1 = (a) -> null;
//                UDF2<Object, Object, Object> udf2 = (a, b) -> null;
//
//                UDF2 ae = AopFactory.proxyInstance(udf2)
//                        .byClass(UDF2.class)
//                        .whereMethod((java.util.function.Function<MethodInfo, Boolean> & Serializable) methodInfo -> methodInfo.getName().equals("call"))
//                        .around((Function<ProxyContext, Object> & Serializable) proxyContext -> {
//                            TimeUtil.FromUnixTime fromUnixTime = (TimeUtil.FromUnixTime) functionClass.newInstance();
//                            Method method = functionClass.getMethod("eval", proxyContext.getInfo().getParameterTypes());
//                            return method.invoke(fromUnixTime, proxyContext.getArgs());
//                        });

        builder.addHandler(sparkSession -> {
            sparkSession.udf().registerJava(functionName, functionClass.getName(), returnType);
        });
        //throw new UnsupportedOperationException("this method have't support!");
    }

    @Override
    public void insertInto(InsertInto insert)
    {
        String tableName = insert.getTableName();
        String query = insert.getQuery();
        builder.addHandler(sparkSession -> {
            Dataset<Row> df = sparkSession.sql(query);
            builder.getSink(tableName).apply(df);
        });
    }

    @Override
    public void selectQuery(SelectQuery statement)
    {
        builder.addHandler(sparkSession -> {
            Dataset<Row> df = sparkSession.sql(statement.toString());
            df.foreach((ForeachFunction<Row>) row -> System.out.println(row.mkString(",")));
            //df.show();
        });
    }

    private class JobBuilder
    {
        private final List<Consumer<SparkSession>> handlers = new ArrayList<>();
        private UnaryOperator<JavaDStream<Row>> source;
        private StructType schema;
        private String sourceTableName;

        private final Map<String, UnaryOperator<Dataset<Row>>> sinks = new HashMap<>();

        public void addSource(UnaryOperator<JavaDStream<Row>> source, StructType schema, String sourceTableName)
        {
            checkState(this.source == null && this.schema == null && this.sourceTableName == null, "sourceTable currently has one and only one, your registered %s", this.sourceTableName);
            this.source = source;
            this.schema = schema;
            this.sourceTableName = sourceTableName;
        }

        public void addSink(String name, UnaryOperator<Dataset<Row>> sink)
        {
            checkState(sinks.put(name, sink) == null, "sink table " + name + " already exists");
        }

        public UnaryOperator<Dataset<Row>> getSink(String name)
        {
            return requireNonNull(sinks.get(name), "sink name not find");
        }

        public void addHandler(Consumer<SparkSession> handler)
        {
            handlers.add(handler);
        }

        public void build()
        {
            JavaDStream<Row> inputStream = source.apply(null);
            SparkSession spark = SparkSession.builder().config(inputStream.context().sparkContext().getConf()).getOrCreate();

            if (isCompile) {
                logger.info("isCompile mode will checkDStream()");
                checkDStream(spark, sourceTableName, schema, handlers);
            }

            DStream<?> firstDStream = DStreamUtil.getFirstDStream(inputStream.dstream(), SylphKafkaOffset.class);
            logger.info("source table {}, firstDStream is {}", sourceTableName, firstDStream);
            inputStream.foreachRDD(rdd -> {
                Dataset<Row> df = spark.createDataFrame(rdd, schema);
                df.createOrReplaceTempView(sourceTableName);
                //df.show()
                //if kafka0.10+ if("DirectKafkaInputDStream".equals(firstDStream.getClass().getSimpleName())) {}
                if (firstDStream instanceof SylphKafkaOffset) { //
                    RDD<?> kafkaRdd = DStreamUtil.getFirstRdd(rdd.rdd()); //rdd.dependencies(0).rdd
                    if (kafkaRdd.count() > 0) {
                        handlers.forEach(x -> x.accept(spark)); //执行业务操作
                    }
                    //val offsetRanges = kafkaRdd.asInstanceOf[HasOffsetRanges].offsetRanges
                    //firstDStream.asInstanceOf[CanCommitOffsets].commitAsync(offsetRanges)
                    ((SylphKafkaOffset<?>) firstDStream).commitOffsets(kafkaRdd);
                }
                else {
                    handlers.forEach(x -> x.accept(spark));
                }
            });
        }
    }

    /**
     * 预编译sql 而不是等到运行时，才发现错误
     * Precompiled sql instead of waiting for the runtime to find the error
     */
    private static void checkDStream(
            SparkSession spark,
            String sourceTableName,
            StructType sourceSchema,
            List<Consumer<SparkSession>> handlers
    )
    {
        RDD<Row> rdd = spark.sparkContext().<Row>emptyRDD(ClassTag$.MODULE$.<Row>apply(Row.class));
        Dataset<Row> df = spark.createDataFrame(rdd, sourceSchema);
        df.createOrReplaceTempView(sourceTableName);
        handlers.forEach(x -> x.accept(spark));
        spark.sql("drop view " + sourceTableName);
    }
}