java source code of DataDrivenImportJob

Project: aliyun-maxcompute-data-collectors (GitHub Link)

aliyun-maxcompute-data-collectors-master
- odps-sqoop
  - NOTICE.txt
  - src
    - test
      - oraoop
        table_tst_product.xml
        pkg_tst_product_gen.pbk
        table_tst_product_subpart.xml
        table_tst_product_part.xml
        create_users.sql
        table_tst_product_part_iot.xml
        table_tst_product_special_chars.xml
        pkg_tst_product_gen.psk
      - checkstyle.xml
      - fi-site.xml
      - findbugsExcludeFile.xml
      - aop
        build
        aop.xml
        org
        apache
        sqoop
        fi
        ProbabilityModel.java
        FiConfig.java
        mapreduce
        db
        SqlServerImportAspect.aj
        SqlServerExportAspect.aj
      - com
        cloudera
        sqoop
        metastore
        TestSavedJobs.java
        SmokeTests.java
        TestBoundaryQuery.java
        orm
        TestClassWriter.java
        TestParseMethods.java
        ThirdPartyTests.java
        hbase
        HBaseImportAddRowKeyTest.java
        HBaseImportTypesTest.java
        HBaseImportTest.java
        HBaseImportNullTest.java
        HBaseTestCase.java
        HBaseQueryImportTest.java
        HBaseUtilTest.java
        tool
        TestToolPlugin.java
        TestSplitBy.java
        TestColumnTypes.java
        TestAllTables.java
        testutil
        MockResultSet.java
        InjectableConnManager.java
        SeqFileReader.java
        ExplicitSetMapper.java
        CommonArgs.java
        ReparseMapper.java
        ExportJobTestCase.java
        HsqldbTestServer.java
        LobAvroImportTestCase.java
        InjectableManagerFactory.java
        BaseSqoopTestCase.java
        ManagerCompatTestCase.java
        DirUtil.java
        ImportJobTestCase.java
        TestAvroExport.java
        TestExport.java
        TestSqoopOptions.java
        TestMultiMaps.java
        TestExportUpdate.java
        TestParquetImport.java
        TestMerge.java
        lib
        TestBlobRef.java
        TestFieldFormatter.java
        TestBooleanParser.java
        TestLargeObjectLoader.java
        TestClobRef.java
        TestRecordParser.java
        TestAvroImport.java
        TestAvroImportExportRoundtrip.java
        util
        TestSubstitutionUtils.java
        TestOptionsFileExpansion.java
        TestIncrementalImport.java
        TestAppendUtils.java
        TestWhere.java
        odps
        OdpsTestCase.java
        OdpsExportTest.java
        OdpsImportTest.java
        io
        TestLobFile.java
        TestNamedFifo.java
        TestSplittableBufferedWriter.java
        TestCodecMap.java
        TestMultiCols.java
        hive
        TestHiveImport.java
        TestTableDefWriter.java
        manager
        SQLServerManagerImportManualTest.java
        OracleExportTest.java
        OracleManagerTest.java
        SQLServerManagerExportManualTest.java
        CubridManagerExportTest.java
        MySQLCompatTest.java
        OracleLobAvroImportTest.java
        TestSqlManager.java
        PostgresqlExportTest.java
        PGBulkloadManagerManualTest.java
        MySQLAllTablesTest.java
        CubridManagerImportTest.java
        ManualMySQLTests.java
        OracleCompatTest.java
        DirectMySQLTest.java
        DB2ManagerImportManualTest.java
        MySQLAuthTest.java
        TestHsqldbManager.java
        PostgresqlImportTest.java
        OracleUtils.java
        OracleFreeFormQueryTest.java
        MySQLFreeFormQueryTest.java
        JdbcMySQLExportTest.java
        DirectPostgreSQLExportManualTest.java
        DirectMySQLExportTest.java
        MySQLLobAvroImportTest.java
        MySQLTestUtils.java
        TestFreeFormQueryImport.java
        TestCompression.java
        TestQuery.java
        mapreduce
        db
        TestTextSplitter.java
        TestDataDrivenDBInputFormat.java
        TestIntegerSplitter.java
        MapreduceTests.java
        TestImportJob.java
        AllTests.java
        TestParquetExport.java
        TestConnFactory.java
        TestTargetDir.java
      - org
        apache
        sqoop
        tool
        TestMainframeImportTool.java
        hcat
        HCatalogImportTest.java
        HCatalogTestUtils.java
        HCatalogExportTest.java
        TestHCatalogBasic.java
        TestSqoopOptions.java
        TestAutoResetMapper.java
        util
        TestMainframeFTPClientUtils.java
        TestSqoopJsonUtil.java
        TestExportUsingProcedure.java
        credentials
        TestPassingSecurePassword.java
        TestBigDecimalExport.java
        validation
        AbortOnFailureHandlerTest.java
        AbsoluteValidationThresholdTest.java
        RowCountValidatorImportTest.java
        manager
        sqlserver
        SQLServerParseMethodsManualTest.java
        SQLServerSplitByManualTest.java
        SQLServerHiveImportManualTest.java
        SQLServerDatatypeImportDelimitedFileManualTest.java
        SQLServerQueryManualTest.java
        SQLServerMultiColsManualTest.java
        MSSQLTestData.java
        SQLServerMultiMapsManualTest.java
        ManagerCompatExport.java
        MSSQLTestUtils.java
        SQLServerDatatypeExportSequenceFileManualTest.java
        SQLServerManagerManualTest.java
        SQLServerWhereManualTest.java
        MSSQLTestDataFileParser.java
        SQLServerDatatypeImportSequenceFileManualTest.java
        SQLServerDatatypeExportDelimitedFileManualTest.java
        netezza
        NetezzaImportManualTest.java
        NetezzaTestUtils.java
        DirectNetezzaHCatImportManualTest.java
        DirectNetezzaExportManualTest.java
        DirectNetezzaHCatExportManualTest.java
        NetezzaExportManualTest.java
        TestSqlManager.java
        cubrid
        CubridAuthTest.java
        CubridTestUtils.java
        CubridCompatTest.java
        oracle
        OracleCallExportTest.java
        OraOopOracleQueriesTest.java
        TestOraOopUtilities.java
        OraOopTestCase.java
        TimestampDataTest.java
        ImportTest.java
        OraOopTestConstants.java
        util
        OracleDataDefinition.java
        RowIdGenerator.java
        FloatGenerator.java
        BytesGenerator.java
        HadoopFiles.java
        OracleData.java
        IntervalYearMonthGenerator.java
        BlobGenerator.java
        TimestampGenerator.java
        CharGenerator.java
        BigDecimalGenerator.java
        URIGenerator.java
        BinaryFloatGenerator.java
        OraOopTestDataGenerator.java
        OracleTableDefinition.java
        IntervalDaySecondGenerator.java
        NCharGenerator.java
        OraOopTestUtils.java
        BinaryDoubleGenerator.java
        OracleIncrementalImportTest.java
        TestOraOopDataDrivenDBInputFormat.java
        SystemImportTest.java
        OracleConnectionFactoryTest.java
        TestOraOopJdbcUrl.java
        ExportTest.java
        TestOracleTable.java
        mysql
        MySqlCallExportTest.java
        TestMainframeManager.java
        mapreduce
        sqlserver
        SqlServerUpsertOutputFormatTest.java
        mainframe
        TestMainframeDatasetInputFormat.java
        TestMainframeImportJob.java
        TestMainframeDatasetFTPRecordReader.java
        TestMainframeDatasetInputSplit.java
        db
        TestBigDecimalSplitter.java
        TestTextSplitter.java
        TestIntegerSplitter.java
        TestDBConfiguration.java
        TestJdbcExportJob.java
        accumulo
        TestAccumuloQueryImport.java
        TestAccumuloImport.java
        TestAccumuloUtil.java
        AccumuloTestCase.java
        TestBigDecimalImport.java
      - checkstyle-noframes.xsl
      - checkstyle-java-header.txt
    - java
      - com
        cloudera
        sqoop
        Sqoop.java
        metastore
        JobStorageFactory.java
        JobStorage.java
        hsqldb
        AutoHsqldbStorage.java
        HsqldbMetaStore.java
        HsqldbJobStorage.java
        JobData.java
        orm
        AvroSchemaGenerator.java
        TableClassName.java
        ClassWriter.java
        CompilationManager.java
        hbase
        PutTransformer.java
        ToStringPutTransformer.java
        HBasePutProcessor.java
        HBaseUtil.java
        tool
        JobTool.java
        ListDatabasesTool.java
        ExportTool.java
        MergeTool.java
        CreateHiveTableTool.java
        SqoopTool.java
        ImportTool.java
        MetastoreTool.java
        EvalSqlTool.java
        BaseSqoopTool.java
        ToolDesc.java
        HelpTool.java
        VersionTool.java
        ListTablesTool.java
        ToolPlugin.java
        CodeGenTool.java
        ImportAllTablesTool.java
        cli
        ToolOptions.java
        RelatedOptions.java
        SqoopParser.java
        lib
        ClobRef.java
        BlobRef.java
        FieldMappable.java
        LargeObjectLoader.java
        FieldMapProcessor.java
        BooleanParser.java
        FieldFormatter.java
        ProcessingException.java
        SqoopRecord.java
        DelimiterSet.java
        LobSerializer.java
        LobRef.java
        BigDecimalSerializer.java
        JdbcWritableBridge.java
        RecordParser.java
        util
        NullAsyncSink.java
        SubprocessSecurityManager.java
        ErrorableAsyncSink.java
        AsyncSink.java
        DirectImportUtils.java
        JdbcUrl.java
        LoggingAsyncSink.java
        AppendUtils.java
        TaskId.java
        ResultSetPrinter.java
        ErrorableThread.java
        ExitSecurityException.java
        RandomHash.java
        Jars.java
        LoggingUtils.java
        FileListing.java
        ImportException.java
        StoredAsProperty.java
        OptionsFileUtil.java
        Executor.java
        PerfCounters.java
        ExportException.java
        ClassLoaderStack.java
        config
        ConfigurationConstants.java
        ConfigurationHelper.java
        SqoopOptions.java
        io
        LobReaderCache.java
        SplittingOutputStream.java
        UnsupportedCodecException.java
        CodecMap.java
        SplittableBufferedWriter.java
        NamedFifo.java
        FixedLengthInputStream.java
        LobFile.java
        hive
        HiveImport.java
        TableDefWriter.java
        HiveTypes.java
        manager
        ConnManager.java
        ImportJobContext.java
        Db2Manager.java
        HsqldbManager.java
        DirectMySQLManager.java
        ExportJobContext.java
        DirectPostgresqlManager.java
        SqlManager.java
        MySQLUtils.java
        SQLServerManager.java
        CatalogQueryManager.java
        DefaultManagerFactory.java
        MySQLManager.java
        GenericJdbcManager.java
        OracleManager.java
        ManagerFactory.java
        PostgresqlManager.java
        InformationSchemaManager.java
        mapreduce
        DelegatingOutputFormat.java
        MySQLRecordExportMapper.java
        UpdateOutputFormat.java
        MySQLTextExportMapper.java
        ExportJobBase.java
        MergeRecord.java
        db
        DBOutputFormat.java
        OracleDataDrivenDBInputFormat.java
        DBRecordReader.java
        BooleanSplitter.java
        FloatSplitter.java
        DataDrivenDBInputFormat.java
        OracleDBRecordReader.java
        DBSplitter.java
        BigDecimalSplitter.java
        DateSplitter.java
        OracleDateSplitter.java
        DataDrivenDBRecordReader.java
        DBInputFormat.java
        DBConfiguration.java
        TextSplitter.java
        OracleDataDrivenDBRecordReader.java
        IntegerSplitter.java
        MergeRecordMapper.java
        RawKeyTextOutputFormat.java
        SequenceFileImportMapper.java
        TextImportMapper.java
        MySQLExportMapper.java
        AvroOutputFormat.java
        MySQLDumpInputFormat.java
        CombineShimRecordReader.java
        HBaseImportJob.java
        AvroInputFormat.java
        AvroExportMapper.java
        ExportBatchOutputFormat.java
        MySQLExportJob.java
        OracleUpsertOutputFormat.java
        ExportOutputFormat.java
        AvroRecordReader.java
        AvroJob.java
        ImportJobBase.java
        MySQLDumpImportJob.java
        ExportInputFormat.java
        AsyncSqlOutputFormat.java
        MySQLDumpMapper.java
        JdbcUpsertExportJob.java
        SQLServerExportOutputFormat.java
        AsyncSqlRecordWriter.java
        AvroImportMapper.java
        OracleExportOutputFormat.java
        JdbcUpdateExportJob.java
        MergeJob.java
        SequenceFileExportMapper.java
        JdbcExportJob.java
        AutoProgressMapper.java
        NullOutputCommitter.java
        HBaseImportMapper.java
        MergeTextMapper.java
        TextExportMapper.java
        MergeReducer.java
        DataDrivenImportJob.java
        MergeMapperBase.java
        JobBase.java
        ConnFactory.java
      - org
        apache
        sqoop
        Sqoop.java
        avro
        AvroUtil.java
        metastore
        JobStorageFactory.java
        JobStorage.java
        hsqldb
        AutoHsqldbStorage.java
        HsqldbMetaStore.java
        HsqldbJobStorage.java
        JobData.java
        orm
        AvroSchemaGenerator.java
        TableClassName.java
        ClassWriter.java
        CompilationManager.java
        hbase
        PutTransformer.java
        ToStringPutTransformer.java
        HBasePutProcessor.java
        HBaseUtil.java
        tool
        JobTool.java
        ListDatabasesTool.java
        ExportTool.java
        MergeTool.java
        CreateHiveTableTool.java
        SqoopTool.java
        ImportTool.java
        MetastoreTool.java
        EvalSqlTool.java
        BaseSqoopTool.java
        MainframeImportTool.java
        ToolDesc.java
        HelpTool.java
        VersionTool.java
        ListTablesTool.java
        ToolPlugin.java
        CodeGenTool.java
        ImportAllTablesTool.java
        cli
        ToolOptions.java
        RelatedOptions.java
        SqoopParser.java
        lib
        ClobRef.java
        BlobRef.java
        FieldMappable.java
        LargeObjectLoader.java
        FieldMapProcessor.java
        BooleanParser.java
        FieldFormatter.java
        ProcessingException.java
        SqoopRecord.java
        DelimiterSet.java
        LobSerializer.java
        LobRef.java
        BigDecimalSerializer.java
        JdbcWritableBridge.java
        RecordParser.java
        util
        NullAsyncSink.java
        MainframeFTPClientUtils.java
        password
        CredentialProviderHelper.java
        CredentialProviderPasswordLoader.java
        PasswordLoader.java
        CryptoFileLoader.java
        FilePasswordLoader.java
        SubprocessSecurityManager.java
        ErrorableAsyncSink.java
        AsyncSink.java
        DirectImportUtils.java
        PostgreSQLUtils.java
        JdbcUrl.java
        LoggingAsyncSink.java
        FileUploader.java
        AppendUtils.java
        TaskId.java
        ResultSetPrinter.java
        ErrorableThread.java
        CredentialsUtil.java
        ExitSecurityException.java
        SqlTypeMap.java
        SubstitutionUtils.java
        RandomHash.java
        Jars.java
        LoggingUtils.java
        FileListing.java
        ImportException.java
        StoredAsProperty.java
        SqoopJsonUtil.java
        OptionsFileUtil.java
        Executor.java
        PerfCounters.java
        ExportException.java
        ClassLoaderStack.java
        config
        ConfigurationConstants.java
        ConfigurationHelper.java
        odps
        OdpsTunnelWriter.java
        OdpsSqoopRecordReader.java
        OdpsUtil.java
        OdpsWriter.java
        OdpsRowDO.java
        OdpsConstants.java
        OdpsUploadProcessor.java
        OdpsRecordBuilder.java
        SqoopOptions.java
        io
        LobReaderCache.java
        SplittingOutputStream.java
        UnsupportedCodecException.java
        CodecMap.java
        SplittableBufferedWriter.java
        NamedFifo.java
        FixedLengthInputStream.java
        LobFile.java
        validation
        AbortOnFailureHandler.java
        Validator.java
        ValidationContext.java
        ValidationFailureHandler.java
        RowCountValidator.java
        AbsoluteValidationThreshold.java
        ValidationException.java
        ValidationThreshold.java
        LogOnFailureHandler.java
        hive
        HiveImport.java
        TableDefWriter.java
        HiveTypes.java
        HiveConfig.java
        manager
        ConnManager.java
        MainframeManager.java
        ImportJobContext.java
        Db2Manager.java
        HsqldbManager.java
        DirectMySQLManager.java
        ExportJobContext.java
        DirectNetezzaManager.java
        DirectPostgresqlManager.java
        SqlManager.java
        MySQLUtils.java
        SQLServerManager.java
        CatalogQueryManager.java
        DefaultManagerFactory.java
        oracle
        OracleTablePartitions.java
        OraOopLog.java
        OraOopConnManager.java
        OraOopDBInputSplit.java
        OraOopLogFactory.java
        OracleTableColumn.java
        OraOopOracleQueries.java
        OraOopOutputFormatUpdate.java
        OracleTableColumns.java
        OracleTable.java
        OraOopLogMessage.java
        OracleConnectionFactory.java
        OraOopGenerics.java
        OraOopDataDrivenDBInputFormat.java
        OraOopDBRecordReader.java
        OraOopConstants.java
        OracleActiveInstance.java
        OraOopOutputFormatBase.java
        OraOopOracleDataChunk.java
        OraOopManagerFactory.java
        OraOopOracleDataChunkExtent.java
        OracleTablePartition.java
        OraOopOracleDataChunkPartition.java
        OraOopJdbcUrl.java
        OraOopUtilities.java
        OraOopOutputFormatInsert.java
        OracleVersion.java
        MySQLManager.java
        CubridManager.java
        GenericJdbcManager.java
        PGBulkloadManager.java
        OracleManager.java
        ManagerFactory.java
        HdfsManager.java
        NetezzaManager.java
        PostgresqlManager.java
        InformationSchemaManager.java
        mapreduce
        MergeReducerBase.java
        MergeAvroMapper.java
        sqlserver
        SqlServerExportBatchOutputFormat.java
        SqlServerRecordReader.java
        SqlServerInputFormat.java
        SqlServerUpsertOutputFormat.java
        DelegatingOutputFormat.java
        MySQLRecordExportMapper.java
        SqoopMapper.java
        UpdateOutputFormat.java
        ParquetJob.java
        CombineFileSplit.java
        mainframe
        MainframeDatasetInputFormat.java
        MainframeDatasetFTPRecordReader.java
        MainframeDatasetInputSplit.java
        MainframeConfiguration.java
        MainframeImportJob.java
        MainframeDatasetRecordReader.java
        MainframeDatasetImportMapper.java
        MySQLTextExportMapper.java
        CombineFileInputFormat.java
        ExportJobBase.java
        hcat
        SqoopHCatUtilities.java
        SqoopHCatInputSplit.java
        SqoopHCatExportMapper.java
        SqoopHCatExportFormat.java
        SqoopHCatOdpsExportMapper.java
        SqoopHCatImportHelper.java
        SqoopHCatRecordReader.java
        SqoopHCatImportMapper.java
        SqoopHCatExportHelper.java
        HBaseBulkImportJob.java
        MergeRecord.java
        db
        Db2DBRecordReader.java
        SQLServerDBInputFormat.java
        netezza
        NetezzaExternalTableHCatImportMapper.java
        NetezzaExternalTableExportMapper.java
        NetezzaJDBCStatementRunner.java
        NetezzaExternalTableTextImportMapper.java
        NetezzaExternalTableImportMapper.java
        NetezzaDBDataSliceSplitter.java
        NetezzaExternalTableHCatExportMapper.java
        NetezzaExternalTableRecordExportMapper.java
        NetezzaExternalTableTextExportMapper.java
        DBOutputFormat.java
        OracleDataDrivenDBInputFormat.java
        Db2DataDrivenDBInputFormat.java
        DBRecordReader.java
        BooleanSplitter.java
        FloatSplitter.java
        DataDrivenDBInputFormat.java
        OracleDBRecordReader.java
        DBSplitter.java
        BigDecimalSplitter.java
        DateSplitter.java
        Db2DataDrivenDBRecordReader.java
        SQLFailureHandler.java
        OracleDateSplitter.java
        SQLServerConnectionFailureHandler.java
        DataDrivenDBRecordReader.java
        BasicRetrySQLFailureHandler.java
        DBInputFormat.java
        NTextSplitter.java
        DBConfiguration.java
        TextSplitter.java
        OracleDataDrivenDBRecordReader.java
        IntegerSplitter.java
        SQLServerDBRecordReader.java
        MergeRecordMapper.java
        netezza
        NetezzaExternalTableInputSplit.java
        NetezzaDataDrivenDBInputFormat.java
        NetezzaExternalTableExportJob.java
        NetezzaExternalTableInputFormat.java
        NetezzaExternalTableImportJob.java
        DBWritable.java
        RawKeyTextOutputFormat.java
        CombineFileRecordReader.java
        SequenceFileImportMapper.java
        TextImportMapper.java
        MySQLExportMapper.java
        SQLServerUpdateDBExecThread.java
        AvroOutputFormat.java
        MySQLDumpInputFormat.java
        CombineShimRecordReader.java
        SqoopReducer.java
        ProgressThread.java
        cubrid
        CubridUpsertOutputFormat.java
        HBaseImportJob.java
        AvroInputFormat.java
        AvroExportMapper.java
        ExportBatchOutputFormat.java
        mysql
        MySQLUpsertOutputFormat.java
        MySQLExportJob.java
        JdbcCallExportJob.java
        OracleUpsertOutputFormat.java
        ExportCallOutputFormat.java
        ExportOutputFormat.java
        odps
        HdfsOdpsImportJob.java
        OdpsExportMapper.java
        OdpsImportJob.java
        OdpsExportInputFormat.java
        OdpsSplitter.java
        OdpsImportMapper.java
        ParquetExportMapper.java
        AvroRecordReader.java
        AvroJob.java
        postgresql
        PGBulkloadExportReducer.java
        PostgreSQLCopyExportJob.java
        PGBulkloadExportJob.java
        PostgreSQLCopyExportMapper.java
        PGBulkloadExportMapper.java
        AccumuloImportJob.java
        ParquetImportMapper.java
        ImportJobBase.java
        MySQLDumpImportJob.java
        ExportInputFormat.java
        SQLServerResilientUpdateOutputFormat.java
        AsyncSqlOutputFormat.java
        MySQLDumpMapper.java
        JdbcUpsertExportJob.java
        MergeAvroReducer.java
        SQLServerExportOutputFormat.java
        HBaseBulkImportMapper.java
        AsyncSqlRecordWriter.java
        AvroImportMapper.java
        OracleExportOutputFormat.java
        JdbcUpdateExportJob.java
        MergeJob.java
        SequenceFileExportMapper.java
        AccumuloImportMapper.java
        SQLServerAsyncDBExecThread.java
        JdbcExportJob.java
        AutoProgressMapper.java
        NullOutputCommitter.java
        HBaseImportMapper.java
        MergeTextMapper.java
        SQLServerExportDBExecThread.java
        ParquetExportMapper.java
        GenericRecordExportMapper.java
        TextExportMapper.java
        MergeReducer.java
        DataDrivenImportJob.java
        SQLServerResilientExportOutputFormat.java
        MergeMapperBase.java
        JobBase.java
        AutoProgressReducer.java
        ConnFactory.java
        accumulo
        ToStringMutationTransformer.java
        AccumuloUtil.java
        AccumuloConstants.java
        MutationTransformer.java
        AccumuloMutationProcessor.java
    - scripts
      - tool-script.sh.template
      - relnotes.py
      - write-version-info.sh
      - write-version-info.cmd
      - create-tool-scripts.sh
      - tool-script.cmd.template
      - rat-violations.sh
      - create-tool-scripts.cmd
      - hudson
        run-code-quality.sh
        test-config.sh
        run-tests.sh
      - run-perftest.sh
    - perftest
      - README-perftest.txt
      - ExtConnFactoryTest.java
      - ExportStressTest.java
      - LobFileStressTest.java
      - LobFilePerfTest.java
      - ExtFactory.java
    - docs
      - sip
        INDEX.txt
        sip-6.txt
        sip-3.txt
        sip-4.txt
        README.txt
        sip-1.txt
        sip-2.txt
      - Makefile
      - web
        html.xsl
        images
        README
        callouts
        index.txt
        header.xsl
        breadcrumbs.xsl
        docbook.css
        footer.xsl
      - user
        hive-args.txt
        list-tables.txt
        eval-purpose.txt
        hbase-args.txt
        version.txt
        import-all-tables-purpose.txt
        metastore-purpose.txt
        mainframe-common-args.txt
        codegen-args.txt
        export.txt
        validation.txt
        import-all-tables.txt
        basics.txt
        input-formatting.txt
        validation-args.txt
        input-args.txt
        distributed-cache.txt
        output-formatting-args.txt
        export-purpose.txt
        import-mainframe.txt
        job-purpose.txt
        accumulo-args.txt
        hbase.txt
        preface.txt
        hive.txt
        connecting.txt
        hcatalog.txt
        input-formatting-args.txt
        connecting-to-mainframe.txt
        tools.txt
        import.txt
        merge-purpose.txt
        codegen-purpose.txt
        import-purpose.txt
        saved-jobs.txt
        output-args.txt
        help.txt
        codegen.txt
        controlling-input-format.txt
        list-databases.txt
        create-hive-table.txt
        common-args.txt
        hive-notes.txt
        intro.txt
        controlling-output-format.txt
        output-formatting.txt
        compatibility.txt
        support.txt
        import-mainframe-purpose.txt
        accumulo.txt
        eval.txt
        troubleshooting.txt
        connectors.txt
        SqoopUserGuide.txt
        create-hive-table-purpose.txt
      - dev
        compiling.txt
        SqoopDevGuide.txt
        preface.txt
        plugin-arch.txt
        api-reference.txt
        intro.txt
      - man
        hive-args.txt
        hbase-args.txt
        sqoop-metastore.txt
        codegen-args.txt
        sqoop-version.txt
        sqoop-eval.txt
        sqoop-create-hive-table.txt
        input-args.txt
        sqoop-import.txt
        sqoop-merge.txt
        sqoop-import-mainframe.txt
        sqoop-import-all-tables.txt
        sqoop-codegen.txt
        sqoop-list-databases.txt
        sqoop-export.txt
        import-args.txt
        sqoop-list-tables.txt
        mainframe-connection-args.txt
        sqoop.txt
        database-independent-args.txt
        output-args.txt
        common-args.txt
        import-common-args.txt
        sqoop-help.txt
        sqoop-job.txt
      - .gitignore
  - build.xml
  - COMPILING.txt
  - ivy
    - libraries.properties
    - sqoop.xml
    - sqoop-test.xml
    - ivysettings.xml
  - pom.xml
  - testdata
    - DatatypeTestData-import-lite.txt
    - DatatypeTestData-export-lite.txt
    - hive
      - scripts
        partitionImport.q
        createOverwriteImport.q
        createOnlyImport.q
        customDelimImport.q
        fieldWithNewlineImport.q
        incrementalHiveAppendEmpty.q
        numericImport.q
        dateImport.q
        fieldWithNewlineReplacementImport.q
        incrementalHiveAppend10.q
        incrementalHiveAppend20.q
        normalImport.q
        failingImport.q
      - bin
        hive.cmd
        hive
    - hcatalog
      - conf
        hive-log4j.properties
        log4j.properties
        hive-site.xml
  - lib
    - .gitignore
  - README.txt
  - package.xml
  - .gitattributes
  - ivy.xml
  - CHANGELOG.txt
  - README.md
  - pom-old.xml
  - sqoop-patch-review.py
  - bin
    - start-metastore.sh
    - sqoop
    - stop-metastore.sh
    - sqoop.cmd
    - .gitignore
    - configure-sqoop
    - configure-sqoop.cmd
  - .gitignore
  - LICENSE.txt
  - conf
    - sqoop-env-template.cmd
    - sqoop-env-template.sh
    - sqoop-site-template.xml
    - oraoop-site-template.xml
    - .gitignore
- flume-plugin
  - src
    - main
      - resources
        log4j.properties
      - java
        com
        aliyun
        datahub
        flume
        sink
        Configure.java
        DatahubConfigConstants.java
        DatahubSink.java
        DatahubReader.java
        DatahubSource.java
        DatahubWriter.java
        serializer
        OdpsEventSerializer.java
        OdpsRegexEventSerializer.java
        OdpsDelimitedTextSerializer.java
  - pom.xml
  - package.xml
  - odps_example.conf
  - README.md
- pom.xml
- LICENSE
- common
  - src
    - main
      - java
        maxcompute
        data
        collectors
        common
        maxcompute
        RecordUtil.java
        MaxcomputeUtil.java
        datahub
        RecordUtil.java
        DatahubUtil.java
  - pom.xml
- odps-data-carrier
  - resources
    - style.css
    - console
      - lib
      - plugins
        sql
        lib
        plugin.ini
        resource
        lib
        plugin.ini
        public
        lib
        plugin.ini
        mr
        lib
        plugin.ini
        tunnel
        lib
        plugin.ini
        dship
        lib
        plugin.ini
        auth
        lib
        plugin.ini
        xflow
        lib
        plugin.ini
      - bin
        odpscmd.bat
        odpscmd
      - conf
        odps_config.ini
  - pom.xml
  - data-transfer-hive-udtf
    - src
      - main
        java
        com
        aliyun
        odps
        datacarrier
        transfer
        OdpsDataTransferUDTF.java
        FlexibleOdpsDataTransferUDTF.java
        OdpsConfig.java
        converter
        HiveLongObjectConverter.java
        HiveBooleanObjectConverter.java
        HiveStructObjectConverter.java
        HiveDoubleObjectConverter.java
        HiveObjectConverter.java
        HiveTimeStampObjectConverter.java
        HiveByteObjectConverter.java
        HiveDateObjectConverter.java
        HiveCharObjectConverter.java
        HiveVarCharObjectConverter.java
        HiveIntegerObjectConverter.java
        HiveFloatObjectConverter.java
        HiveShortObjectConverter.java
        AbstractHiveObjectConverter.java
        HiveMapObjectConverter.java
        HiveBinaryObjectConverter.java
        HiveListObjectConverter.java
        HiveStringObjectConverter.java
        HiveDecimalObjectConverter.java
    - pom.xml
  - meta-carrier
    - src
      - main
        java
        com
        aliyun
        odps
        datacarrier
        metacarrier
        HiveMetaCarrier.java
    - pom.xml
  - network-measurement-tool
    - src
      - main
        java
        com
        aliyun
        odps
        datacarrier
        network
        Endpoint.java
        main.java
        Endpoints.java
    - pom.xml
  - data-carrier-commons
    - src
      - main
        java
        com
        aliyun
        odps
        datacarrier
        commons
        IntermediateDataManager.java
        MetaManager.java
        DirUtils.java
        Constants.java
        risk
        Risk.java
        GeneratedStatement.java
    - pom.xml
  - bin
    - odps_ddl_runner.py
    - meta-carrier
    - hive_udtf_sql_runner.py
    - meta-processor
  - meta-processor
    - src
      - main
        java
        com
        aliyun
        odps
        datacarrier
        metaprocessor
        HiveTypeTransformer.java
        MetaProcessor.java
        report
        HiveDatabaseDivision.java
        ReportBuilder.java
        SummaryDivision.java
        HiveTableDivision.java
        TypeTransformer.java
        TypeTransformResult.java
    - pom.xml
  - build.sh
- ogg-plugin
  - tool.sh
  - src
    - main
      - resources
        javaue.properties
        log4j.properties
        datahupwriter.prm
        configure.xml
      - java
        com
        aliyun
        odps
        ogg
        handler
        datahub
        Constant.java
        operations
        DeleteOperationHandler.java
        OperationHandler.java
        UpdateOperationHandler.java
        OperationHandlerManager.java
        InsertOperationHandler.java
        BadOperateWriter.java
        util
        JsonHelper.java
        BucketPath.java
        ConfigureReader.java
        RecordBuilder.java
        DataHubWriter.java
        HandlerInfoManager.java
        DatahubHandler.java
        modle
        DirtyRecordInfo.java
        Configure.java
        ColumnMapping.java
        TableMapping.java
        PluginStatictics.java
    - test
      - resources
        log4j.properties
        configure_no_active_shard.xml
        configure_datahub_handler.xml
        configure_miss_topic.xml
        configure_datahub_writer.xml
        configure_datahub_error.xml
        configure_field_error.xml
        configure_miss_default_datahub.xml
        configure.xml
        configure_miss_map.xml
        configure_miss_default_oracle.xml
        configure_topic_error.xml
      - java
        com
        aliyun
        odps
        ogg
        handler
        datahub
        DataHubBlobTest.java
        DatahubHandlerTest.java
        ConfigureReaderTest.java
        BadOperateWriterTest.java
  - pom.xml
  - datahub_lib
  - lib
  - package.xml
  - ggjava
    - resources
      - classes
        log4j-trace.properties
        logback-default.xml
        log4j-default.xml
        logback-trace.xml
        logging-trace.properties
        log4j-default.properties
        log4j-debug.properties
        logback-debug.xml
        logging-debug.properties
        VM_global_library.vm
      - logging.properties
      - lib
        optional
        logback
        ReadMe-logback.txt
      - config
        ggue-context.xml
        ggue.properties
        jps-config-jse.xml
      - ReadMe.txt
    - lib
      - ReadMe.txt
    - run.sh
    - docs
  - README.md
- kettle-plugin
  - src
    - main
      - resources
        images
        OdpsInput.svg
        OdpsOutput.svg
        com
        aliyun
        pentaho
        di
        trans
        steps
        odpsinput
        messages
        messages_en_US.properties
        odpsoutput
        messages
        messages_en_US.properties
      - java
        com
        aliyun
        odps
        OdpsField.java
        pentaho
        di
        trans
        steps
        odpsinput
        OdpsInputData.java
        OdpsInputMeta.java
        OdpsInput.java
        odpsoutput
        OdpsOutputMeta.java
        OdpsOutput.java
        OdpsOutputData.java
        odps
        OdpsMeta.java
        ui
        trans
        steps
        odpsinput
        OdpsInputDialog.java
        odpsoutput
        OdpsOutputDialog.java
  - kettle_lib
  - pom.xml
  - package.xml
  - README.md
- hive_data_transfer_udtf
  - src
    - main
      - java
        odps
        data
        dump
        MaxComputeDataTransferUDTFMultiPart.java
        MaxComputeDataTransferUDTF.java
        OdpsConfig.java
  - odps.conf
  - pom.xml
- .travis.yml
- README.md
- .gitignore

/**
 * Licensed to the Apache Software Foundation (ASF) under one
 * or more contributor license agreements.  See the NOTICE file
 * distributed with this work for additional information
 * regarding copyright ownership.  The ASF licenses this file
 * to you under the Apache License, Version 2.0 (the
 * "License"); you may not use this file except in compliance
 * with the License.  You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

package org.apache.sqoop.mapreduce;

import java.io.File;
import java.io.IOException;
import java.sql.SQLException;

import org.apache.avro.Schema;
import org.apache.commons.io.FileUtils;
import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapreduce.InputFormat;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.OutputFormat;
import org.apache.hadoop.mapreduce.lib.output.SequenceFileOutputFormat;
import org.apache.sqoop.mapreduce.hcat.SqoopHCatUtilities;

import com.cloudera.sqoop.SqoopOptions;
import com.cloudera.sqoop.config.ConfigurationHelper;
import com.cloudera.sqoop.lib.LargeObjectLoader;
import com.cloudera.sqoop.manager.ConnManager;
import com.cloudera.sqoop.manager.ImportJobContext;
import com.cloudera.sqoop.mapreduce.ImportJobBase;
import com.cloudera.sqoop.mapreduce.db.DBConfiguration;
import com.cloudera.sqoop.mapreduce.db.DataDrivenDBInputFormat;
import com.cloudera.sqoop.orm.AvroSchemaGenerator;
import org.kitesdk.data.Datasets;
import org.kitesdk.data.mapreduce.DatasetKeyOutputFormat;

/**
 * Actually runs a jdbc import job using the ORM files generated by the
 * sqoop.orm package. Uses DataDrivenDBInputFormat.
 */
public class DataDrivenImportJob extends ImportJobBase {

  public static final Log LOG = LogFactory.getLog(
      DataDrivenImportJob.class.getName());

  @SuppressWarnings("unchecked")
  public DataDrivenImportJob(final SqoopOptions opts) {
    super(opts, null, DataDrivenDBInputFormat.class, null, null);
  }

  public DataDrivenImportJob(final SqoopOptions opts,
      final Class<? extends InputFormat> inputFormatClass,
      ImportJobContext context) {
    super(opts, null, inputFormatClass, null, context);
  }

  @Override
  protected void configureMapper(Job job, String tableName,
      String tableClassName) throws IOException {
    if (isHCatJob) {
      LOG.info("Configuring mapper for HCatalog import job");
      job.setOutputKeyClass(LongWritable.class);
      job.setOutputValueClass(SqoopHCatUtilities.getImportValueClass());
      job.setMapperClass(SqoopHCatUtilities.getImportMapperClass());
      return;
    }
    if (options.getFileLayout() == SqoopOptions.FileLayout.TextFile) {
      // For text files, specify these as the output types; for
      // other types, we just use the defaults.
      job.setOutputKeyClass(Text.class);
      job.setOutputValueClass(NullWritable.class);
    } else if (options.getFileLayout()
        == SqoopOptions.FileLayout.AvroDataFile) {
      final String schemaNameOverride = null;
      Schema schema = generateAvroSchema(tableName, schemaNameOverride);
      try {
        writeAvroSchema(schema);
      } catch (final IOException e) {
        LOG.error("Error while writing Avro schema.", e);
      }

      AvroJob.setMapOutputSchema(job.getConfiguration(), schema);
    } else if (options.getFileLayout()
        == SqoopOptions.FileLayout.ParquetFile) {
      JobConf conf = (JobConf)job.getConfiguration();
      // Kite SDK requires an Avro schema to represent the data structure of
      // target dataset. If the schema name equals to generated java class name,
      // the import will fail. So we use table name as schema name and add a
      // prefix "codegen_" to generated java class to avoid the conflict.
      final String schemaNameOverride = tableName;
      Schema schema = generateAvroSchema(tableName, schemaNameOverride);
      String uri = getKiteUri(conf, tableName);
      ParquetJob.WriteMode writeMode;

      if (options.doHiveImport()) {
        if (options.doOverwriteHiveTable()) {
          writeMode = ParquetJob.WriteMode.OVERWRITE;
        } else {
          writeMode = ParquetJob.WriteMode.APPEND;
          if (Datasets.exists(uri)) {
            LOG.warn("Target Hive table '" + tableName + "' exists! Sqoop will " +
                "append data into the existing Hive table. Consider using " +
                "--hive-overwrite, if you do NOT intend to do appending.");
          }
        }
      } else {
        // Note that there is no such an import argument for overwriting HDFS
        // dataset, so overwrite mode is not supported yet.
        // Sqoop's append mode means to merge two independent datasets. We
        // choose DEFAULT as write mode.
        writeMode = ParquetJob.WriteMode.DEFAULT;
      }
      ParquetJob.configureImportJob(conf, schema, uri, writeMode);
    }

    job.setMapperClass(getMapperClass());
  }

  private String getKiteUri(Configuration conf, String tableName) throws IOException {
    if (options.doHiveImport()) {
      String hiveDatabase = options.getHiveDatabaseName() == null ? "default" :
          options.getHiveDatabaseName();
      String hiveTable = options.getHiveTableName() == null ? tableName :
          options.getHiveTableName();
      return String.format("dataset:hive:/%s/%s", hiveDatabase, hiveTable);
    } else {
      FileSystem fs = FileSystem.get(conf);
      return "dataset:" + fs.makeQualified(getContext().getDestination());
    }
  }

  private Schema generateAvroSchema(String tableName,
      String schemaNameOverride) throws IOException {
    ConnManager connManager = getContext().getConnManager();
    AvroSchemaGenerator generator = new AvroSchemaGenerator(options,
        connManager, tableName);
    return generator.generate(schemaNameOverride);
  }

  private void writeAvroSchema(final Schema schema) throws IOException {
    // Generate schema in JAR output directory.
    final File schemaFile = new File(options.getJarOutputDir(), schema.getName() + ".avsc");

    LOG.info("Writing Avro schema file: " + schemaFile);
    FileUtils.forceMkdir(schemaFile.getParentFile());
    FileUtils.writeStringToFile(schemaFile, schema.toString(true));

    // Copy schema to code output directory.
    try {
      FileUtils.moveFileToDirectory(schemaFile, new File(options.getCodeOutputDir()), true);
    } catch (final IOException e) {
      LOG.debug("Could not move Avro schema file to code output directory.", e);
    }
  }

  @Override
  protected Class<? extends Mapper> getMapperClass() {
    if (options.getHCatTableName() != null) {
      return SqoopHCatUtilities.getImportMapperClass();
    }
    if (options.getFileLayout() == SqoopOptions.FileLayout.TextFile) {
      return TextImportMapper.class;
    } else if (options.getFileLayout()
        == SqoopOptions.FileLayout.SequenceFile) {
      return SequenceFileImportMapper.class;
    } else if (options.getFileLayout()
        == SqoopOptions.FileLayout.AvroDataFile) {
      return AvroImportMapper.class;
    } else if (options.getFileLayout()
        == SqoopOptions.FileLayout.ParquetFile) {
      return ParquetImportMapper.class;
    }

    return null;
  }

  @Override
  protected Class<? extends OutputFormat> getOutputFormatClass()
      throws ClassNotFoundException {
    if (isHCatJob) {
      LOG.debug("Returning HCatOutputFormat for output format");
      return SqoopHCatUtilities.getOutputFormatClass();
    }
    if (options.getFileLayout() == SqoopOptions.FileLayout.TextFile) {
      return RawKeyTextOutputFormat.class;
    } else if (options.getFileLayout()
        == SqoopOptions.FileLayout.SequenceFile) {
      return SequenceFileOutputFormat.class;
    } else if (options.getFileLayout()
        == SqoopOptions.FileLayout.AvroDataFile) {
      return AvroOutputFormat.class;
    } else if (options.getFileLayout()
        == SqoopOptions.FileLayout.ParquetFile) {
      return DatasetKeyOutputFormat.class;
    }

    return null;
  }

  /**
   * Build the boundary query for the column of the result set created by
   * the given query.
   * @param col column name whose boundaries we're interested in.
   * @param query sub-query used to create the result set.
   * @return input boundary query as a string
   */
  private String buildBoundaryQuery(String col, String query) {
    if (col == null || options.getNumMappers() == 1) {
      return "";
    }

    // Replace table name with alias 't1' if column name is a fully
    // qualified name.  This is needed because "tableName"."columnName"
    // in the input boundary query causes a SQL syntax error in most dbs
    // including Oracle and MySQL.
    String alias = "t1";
    int dot = col.lastIndexOf('.');
    String qualifiedName = (dot == -1) ? col : alias + col.substring(dot);

    ConnManager mgr = getContext().getConnManager();
    String ret = mgr.getInputBoundsQuery(qualifiedName, query);
    if (ret != null) {
      return ret;
    }

    return "SELECT MIN(" + qualifiedName + "), MAX(" + qualifiedName + ") "
        + "FROM (" + query + ") AS " + alias;
  }

  @Override
  protected void configureInputFormat(Job job, String tableName,
      String tableClassName, String splitByCol) throws IOException {
    ConnManager mgr = getContext().getConnManager();
    try {
      String username = options.getUsername();
      if (null == username || username.length() == 0) {
        DBConfiguration.configureDB(job.getConfiguration(),
            mgr.getDriverClass(), options.getConnectString(),
            options.getFetchSize(), options.getConnectionParams());
      } else {
        DBConfiguration.configureDB(job.getConfiguration(),
            mgr.getDriverClass(), options.getConnectString(),
            username, options.getPassword(), options.getFetchSize(),
            options.getConnectionParams());
      }

      if (null != tableName) {
        // Import a table.
        String [] colNames = options.getColumns();
        if (null == colNames) {
          colNames = mgr.getColumnNames(tableName);
        }

        String [] sqlColNames = null;
        if (null != colNames) {
          sqlColNames = new String[colNames.length];
          for (int i = 0; i < colNames.length; i++) {
            sqlColNames[i] = mgr.escapeColName(colNames[i]);
          }
        }

        // It's ok if the where clause is null in DBInputFormat.setInput.
        String whereClause = options.getWhereClause();

        // We can't set the class properly in here, because we may not have the
        // jar loaded in this JVM. So we start by calling setInput() with
        // DBWritable and then overriding the string manually.
        DataDrivenDBInputFormat.setInput(job, DBWritable.class,
            mgr.escapeTableName(tableName), whereClause,
            mgr.escapeColName(splitByCol), sqlColNames);

        // If user specified boundary query on the command line propagate it to
        // the job
        if (options.getBoundaryQuery() != null) {
          DataDrivenDBInputFormat.setBoundingQuery(job.getConfiguration(),
                  options.getBoundaryQuery());
        }
      } else {
        // Import a free-form query.
        String inputQuery = options.getSqlQuery();
        String sanitizedQuery = inputQuery.replace(
            DataDrivenDBInputFormat.SUBSTITUTE_TOKEN, " (1 = 1) ");

        String inputBoundingQuery = options.getBoundaryQuery();
        if (inputBoundingQuery == null) {
          inputBoundingQuery = buildBoundaryQuery(splitByCol, sanitizedQuery);
        }
        DataDrivenDBInputFormat.setInput(job, DBWritable.class,
            inputQuery, inputBoundingQuery);
        new DBConfiguration(job.getConfiguration()).setInputOrderBy(
            splitByCol);
      }
      if (options.getRelaxedIsolation()) {
        LOG
          .info("Enabling relaxed (read uncommitted) transaction "
             + "isolation for imports");
        job.getConfiguration()
          .setBoolean(DBConfiguration.PROP_RELAXED_ISOLATION, true);
      }
      LOG.debug("Using table class: " + tableClassName);
      job.getConfiguration().set(ConfigurationHelper.getDbInputClassProperty(),
          tableClassName);

      job.getConfiguration().setLong(LargeObjectLoader.MAX_INLINE_LOB_LEN_KEY,
          options.getInlineLobLimit());

      if (options.getSplitLimit() != null) {
        org.apache.sqoop.config.ConfigurationHelper.setSplitLimit(
          job.getConfiguration(), options.getSplitLimit());
      }

      LOG.debug("Using InputFormat: " + inputFormatClass);
      job.setInputFormatClass(inputFormatClass);
    } finally {
      try {
        mgr.close();
      } catch (SQLException sqlE) {
        LOG.warn("Error closing connection: " + sqlE);
      }
    }
  }
}