java source code of SequenceFile

Project: sparkResearch (GitHub Link)

sparkResearch-master
- src
  - main
    - java
      - spark
        Lombda.java
        SparkApplication.java
- chapter13
  - src
    - main
      - java
        LoadJdbc.java
  - pom.xml
- chapter17
  - src
    - main
      - java
        SparkStreamDemo.java
  - pom.xml
  - chapter17.iml
  - target
    - maven-archiver
      - pom.properties
    - maven-status
      - maven-compiler-plugin
        compile
        default-compile
        createdFiles.lst
        inputFiles.lst
        testCompile
        default-testCompile
        inputFiles.lst
- chapter7
  - src
    - main
      - java
        SaprkFile.java
        SequenceFile.java
        CsvFile.java
  - chapter7.iml
  - pom.xml
- chapter23
  - src
    - main
      - java
        v1
        SpamEmail.java
  - pom.xml
  - chapter23.iml
- pom.xml
- chapter10
  - src
    - main
      - java
        dataset
        DataSetApplication.java
        Person.java
        global.java
  - pom.xml
- chapter21
  - src
    - main
      - java
        v1
        KafkaStreaming.java
  - pom.xml
  - chapter21.iml
- chapter5
  - src
    - main
      - java
        spark
        SparkApplication.java
  - chapter5.iml
  - pom.xml
- seclover
  - src
    - main
      - resources
        application.yml
      - java
        JosnApplication
        JsonData.java
        JdbcUtil
        ConnectUtil.java
  - pom.xml
- LICENSE
- chapter8
  - src
    - main
      - java
        BroadCastParam.java
        Accumulator.java
        AttackAccumulator.java
        JavaBean.java
        TestMerge.java
  - chapter8.iml
  - pom.xml
  - target
    - classes
      - META-INF
        chapter8.kotlin_module
- kafka-test
  - src
    - main
      - java
        v1
        KafkaConsumers.java
        KafkaProducers.java
        Constant
        ConstantProducer.java
        ConstantConsumer.java
  - pom.xml
  - target
    - classes
      - META-INF
        kafkatest.kotlin_module
- chapter4
  - src
    - main
      - java
        spark
        RddAvg.java
        Chapter4.java
        Application.java
  - pom.xml
- chatper11
  - src
    - main
      - java
        RefiectDataFrme.java
        datasource
        Test.java
        DataSources.java
        CustomDataFrame.java
  - pom.xml
- chapter3
  - src
    - main
      - java
        spark
        LogError.java
  - pom.xml
  - target
    - classes
      - spark
        LogError$ContainsError.class
        LogError$1.class
        LogError.class
        LogError$ContainsErrorDev.class
- chapter2
  - src
    - main
      - java
        spark
        SparkApplication.java
  - pom.xml
- sparkResearchMvn.iml
- text.json
- README.md
- chapter19
  - src
    - main
      - java
        StateLess.java
        CountByWindow.java
        Join.java
        ReduceByKeyAndWindow.java
        Window.java
        tools
        ConnectionPool.java
  - pom.xml
  - chapter19.iml
- .idea
  - compiler.xml
  - inspectionProfiles
    - Project_Default.xml
  - uiDesigner.xml
  - misc.xml
  - workspace.xml
  - vcs.xml
- target
  - classes
    - spark
      - Lombda.class
      - Lombda$1.class
      - SparkApplication.class
    - META-INF
      - sparkResearchMvn.kotlin_module
- .gitignore
- chapter6
  - src
    - main
      - java
        pair
        PairRdd.java
        JoinParirRDD.java
  - pom.xml
- chapter9
  - src
    - main
      - java
        SparkSqlApplication.java
  - pom.xml

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.SequenceFileOutputFormat;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.PairFunction;
import scala.Tuple2;

/**
 * Created by 張燿峰
 * SeqnenceFile操作案例
 *
 * @author 孤
 * @date 2019/3/22
 * @Varsion 1.0
 */
public class SequenceFile {

    protected static void run(JavaSparkContext sparkContext) {
        JavaPairRDD<Text, IntWritable> javaPairRDD = sparkContext.sequenceFile("url", Text.class, IntWritable.class);
        JavaPairRDD<String, Integer> pairRDD = javaPairRDD.mapToPair(new sequenceToConvert());
        //写
        pairRDD.saveAsHadoopFile("url",Text.class,IntWritable.class,SequenceFileOutputFormat.class);
    }


    static class sequenceToConvert implements PairFunction<Tuple2<Text, IntWritable>, String, Integer> {

        @Override
        public Tuple2<String, Integer> call(Tuple2<Text, IntWritable> textIntWritableTuple2) {
            return new Tuple2<>(textIntWritableTuple2._1.toString(), textIntWritableTuple2._2.get());
        }
    }

}