java source code of MyVariantDatasetTest

Project: mmtf-spark (GitHub Link)

mmtf-spark-master
- src
  - main
    - resources
      - files
        1stp.cif.gz
        3hdb.pdb.gz
        test
        1HV4.mmtf.gz
        1STP.mmtf
        4HHB.mmtf.gz
      - log4j2.xml
    - java
      - edu
        sdsc
        mmtf
        spark
        datasets
        PdbjMineDataset.java
        SecondaryStructureSegmentExtractor.java
        SecondaryStructureExtractor.java
        QuaternaryStructureDataset.java
        GroupInteractionExtractor.java
        G2SDataset.java
        MyVariantDataset.java
        AdvancedSearchDataset.java
        PdbToUniProt.java
        PolymerSequenceExtractor.java
        package-info.java
        SecondaryStructureElementExtractor.java
        SwissModelDataset.java
        demos
        UniProtDemo.java
        SecondaryStructureSegmentDemo.java
        PdbMetadataDemo.java
        InteractionAnalysisSimple.java
        SwissModelDemo.java
        SiftsDataDemo.java
        DrugBankDemo.java
        AtpInteractionAnalysis.java
        PdbDrugBankMapping.java
        package-info.java
        PdbLigandDemo.java
        InteractionAnalysisAdvanced.java
        CustomReportDemo.java
        DSSPDemo.java
        SecondaryStructureElementDemo.java
        MutationToStructureDemo.java
        PdbToUniProtMappingDemo.java
        CustomReportService.java
        UniProt.java
        DrugBankDataset.java
        JpredDataset.java
        ml
        DatasetBalancer.java
        DatasetRegressor.java
        SequenceNgrammer.java
        JavaRDDToDataset.java
        SparkMultiClassClassifier.java
        package-info.java
        demos
        ProteinFoldDatasetCreator.java
        PdbSequenceToWord2Vec.java
        SecondaryStructureWord2VecEncoder.java
        SwissProtSequenceToWord2Vec2.java
        SecondaryStructureBlosum62Encoder.java
        package-info.java
        SecondaryStructurePropertyEncoder.java
        SecondaryStructureElementsWord2VecEncoder.java
        SecondaryStructureOneHotEncoder.java
        SecondaryStructureWord2VecModelEncoder.java
        SecondaryStructureShiftedWord2VecEncoder.java
        ProteinSequenceEncoder.java
        DatasetClassifier.java
        SparkRegressor.java
        utils
        ColumnarStructure.java
        InteractionCenter.java
        DsspSecondaryStructure.java
        BiojavaAligner.java
        AtomInteraction.java
        OutlierDetector.java
        StructureToAllInteractions.java
        package-info.java
        CoordinationGeometry.java
        ExhaustiveAligner.java
        StructureToAtomInteractions.java
        ColumnarStructureX.java
        webfilters
        CustomReportQuery.java
        AdvancedQuery.java
        Pisces.java
        ChemicalStructureQuery.java
        BlastClusters.java
        WildType.java
        package-info.java
        SequenceSimilarity.java
        demos
        KeywordSearch.java
        KinaseSearch.java
        SequenceSimilarityDemo.java
        WildTypeQuery.java
        package-info.java
        CreateRepresentativeSet.java
        AuthorSearchDemo.java
        PdbjMineSearch.java
        applications
        PdbRedoToMmtf.java
        package-info.java
        CreatePdbToUniProtMappingFile.java
        WaterInteractions.java
        DatasetFileConverter.java
        mappers
        StructureToInteractingResidues.java
        StructureToBioJava.java
        StructureToProteinDimers.java
        StructuralAlignmentMapper.java
        StructureToSecondaryStructureSegments.java
        StructureToBioassembly.java
        StructureToPolymerSequences.java
        StructureToBioassembly2.java
        package-info.java
        demos
        MapToBioAssembly2.java
        MapToTuple4.java
        MapToBioJava.java
        MapToCathDomains.java
        MapToBioAssembly.java
        package-info.java
        MapReduceExample.java
        MapToProteinDimers.java
        PolyPeptideChainStatistics.java
        StructureToSecondaryStructureElements.java
        StructureToPolymerChains.java
        StructureToCathDomains.java
        filters
        ContainsDSaccharideChain.java
        PolymerComposition.java
        ContainsGroup.java
        SecondaryStructure.java
        ContainsSequenceRegex.java
        Rfree.java
        ContainsRnaChain.java
        Resolution.java
        ExperimentalMethods.java
        NotFilter.java
        package-info.java
        ContainsLProteinChain.java
        demos
        FilterByReleaseDate.java
        FilterByDepositionDate.java
        FilterBySequenceRegex.java
        FilterExclusivelyByLProteins.java
        FilterByRFree.java
        FilterByExperimentalMethods.java
        package-info.java
        FilterProteinDnaComplexes.java
        FilterByGroups.java
        FilterByPolymerChainType.java
        NotFilterExample.java
        FilterByResolution.java
        OrFilter.java
        ReleaseDate.java
        ContainsPolymerChainType.java
        DepositionDate.java
        Rwork.java
        ContainsDProteinChain.java
        ContainsAlternativeLocations.java
        ContainsDnaChain.java
        io
        RepartitionHadoopSequenceFile.java
        MmtfReader.java
        HadoopUpdate.java
        package-info.java
        MmtfWriter.java
        demos
        ReadMmtfReduced.java
        MmtfBenchmark.java
        PerformHadoopUpdate.java
        MmcifToMmtfFull.java
        ReadLocalMmtf.java
        ReadMmtfFull.java
        DownloadMmtfFiles.java
        TraverseStructureHierarchy.java
        package-info.java
        ReadLocalMmtfHadoopFile.java
        WriteMmtfFullUncompressed.java
        RosettaToMmtfFull.java
        WriteMmtfCustom.java
        PdbToMmtfFull.java
        MmtfImporter.java
        FullToReducedSequenceFile.java
        interactions
        GroupInteractionExtractor.java
        ExcludedLigandSets.java
        InteractionFilter.java
        package-info.java
        demos
        PolymerInteractionFingerprintDemo.java
        LigandInteractionFingerprintDemo.java
        AnalyzeWaterInteractions4.java
        Metalnteractions.java
        LigandInteractionFingerprint.java
        InteractionFingerprinter.java
        PolymerInteractionFingerprint.java
        alignments
        StructureAligner.java
        package-info.java
        demos
        DemoAllVsAll.java
        package-info.java
        DemoQueryVsAll.java
        webservices
        AdvancedQueryService.java
        package-info.java
        PiscesDownloader.java
  - test
    - java
      - edu
        sdsc
        mmtf
        spark
        datasets
        MyVariantDatasetTest.java
        SecondaryStructureExtractorTest2.java
        QuaternaryStructureDatasetTest.java
        SequenceSegmentsExtractorTest.java
        PolymerSequenceExtractorTest.java
        PdbjMineDatasetTest.java
        DrugBankDatasetTest.java
        SecondaryStructureExtractorTest.java
        G2SDatasetTest.java
        AdvancedQueryDatasetTest.java
        ml
        DatasetBalancerTest.java
        utils
        ColumnarStructureTest.java
        CoordinationGeometryTest.java
        OutlierDetectorTest.java
        ColumnarStructureXTest.java
        webfilters
        AdvancedQueryTest.java
        BlastClustersTest.java
        PdbjMineSearchTest.java
        ChemicalStructureQueryTest.java
        WildTypeTest.java
        PiscesTest.java
        CustomReportQueryTest.java
        mappers
        StructureToCathDomainsTest.java
        StructureToProteinDimersTest.java
        StructureToBioassemblyTest.java
        StructureToBioJavaTest.java
        StructureToPolymerChainsTest.java
        filters
        SecondaryStructureTest.java
        ContainsDnaChainTest.java
        ReleaseDateFilterTest.java
        ResolutionFilterTest.java
        ExperimentalMethodsTest.java
        ContainsLProteinChainTest.java
        DepositionDateFilterTest.java
        ContainsDSaccharideChainTest.java
        ContainsAlternativeLocationsTest.java
        PolymerCompositionTest.java
        ContainsGroupTest.java
        RfreeFilterTest.java
        ContainsSequenceRegexTest.java
        ContainsDProteinChainTest.java
        ContainsRnaChainTest.java
        RworkFilterTest.java
        OrFilterTest.java
        io
        MmtfImporterTest.java
        MmtfReaderTest.java
        MmtfWriterTest.java
        interactions
        InteractionFilterTest.java
        PolymerInteractionFingerprintTest.java
        webservices
        CustomReportServiceTest.java
- pom.xml
- LICENSE
- .travis.yml
- README.md
- CODE_OF_CONDUCT.md
- .gitignore
- docs
  - MacOsInstallation.md
  - WindowsInstallation.md

package edu.sdsc.mmtf.spark.datasets;

import static org.junit.Assert.*;

import java.io.IOException;
import java.util.Arrays;
import java.util.List;

import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SparkSession;
import org.junit.After;
import org.junit.Before;
import org.junit.Test;

public class MyVariantDatasetTest {
    private SparkSession spark;

    @Before
    public void setUp() throws Exception {
        spark = SparkSession.builder().master("local[*]").appName(MyVariantDatasetTest.class.getSimpleName()).getOrCreate();
    }

    @After
    public void tearDown() throws Exception {
        spark.close();
    }

    @Test
    public void test1() throws IOException {
        List<String> uniprotIds = Arrays.asList("P00533"); // EGFR
        Dataset<Row> ds = MyVariantDataset.getVariations(uniprotIds);
        assertTrue(ds.count() > 7000);
    }
    
    @Test
    public void test2() throws IOException {
        List<String> uniprotIds = Arrays.asList("P15056"); // BRAF
        String query = "clinvar.rcv.clinical_significance:pathogenic OR clinvar.rcv.clinical_significance:likely pathogenic";
        Dataset<Row> ds = MyVariantDataset.getVariations(uniprotIds, query);
        assertEquals(1, ds.filter(
                "variationId = 'chr7:g.140501287T>C'"
                + " AND uniprotId = 'P15056'").count());
    }
}