java source code of AuthorityAnalysis

Project: metadata-qa-marc (GitHub Link)

metadata-qa-marc-master
- solr-functions
- setdir.sh.template
- src
  - main
    - resources
      - pica-schema.json
      - log4j2.properties
      - marc
        marc-structure.txt
        standard-identifier.csv
    - java
      - de
        gwdg
        metadataqa
        marc
        Extractable.java
        MarcPositionalControlField.java
        Control005.java
        Control003.java
        Validatable.java
        utils
        CodeGenerator.java
        BasicStatistics.java
        LineSeparatedMarcReader.java
        FrbrFunctionLister.java
        SubfieldParser.java
        MarcTagLister.java
        marcspec
        SubSpec.java
        MARCspec.java
        Field.java
        SubTerm.java
        exception
        InvalidMARCspecException.java
        Position.java
        Positions.java
        Subfield.java
        MARCspecParser.java
        legacy
        MarcSpec.java
        ComparisonString.java
        pica
        PicaSubfield.java
        PicaReader.java
        PicaplusTag.java
        PicaLine.java
        OccurrenceRage.java
        PicaTagDefinition.java
        TagHierarchy.java
        MarcCacheWrapper.java
        keygenerator
        PositionalControlFieldKeyGenerator.java
        DataFieldKeyGenerator.java
        MapToDatafield.java
        ControlFieldStructureVisualization.java
        ReadMarc.java
        alephseq
        AlephseqLine.java
        AlephseqMarcReader.java
        CodeFileReader.java
        unimarc
        UnimarcConverter.java
        MarcRecord.java
        SimpleControlField.java
        Control008.java
        Control006.java
        Control007.java
        Utils.java
        MarcControlField.java
        codes
        StandardIdentifier.java
        CodeReader.java
        X035aSystemControlNumber.java
        MarcJsonCalculatorFacade.java
        cli
        ClassificationAnalysis.java
        ThompsonTraillCompleteness.java
        utils
        RecordIterator.java
        MongoImporter.java
        Schema.java
        MappingToJson.java
        ElasticsearchKeyGenerator.java
        MappingToHtml.java
        MappingToMarkdown.java
        MarcJsonToSolr.java
        MongoKeyGenerator.java
        parameters
        MarcToSolrParameters.java
        ValidatorParameters.java
        ThompsonTraillCompletenessParameters.java
        CommonParameters.java
        NetworkAction.java
        SerialScoreParameters.java
        MappingParameters.java
        CompletenessParameters.java
        FormatterParameters.java
        NetworkParameters.java
        SerialScore.java
        processor
        MarcFileProcessor.java
        Validator.java
        NetworkAnalysis.java
        Completeness.java
        AuthorityAnalysis.java
        MarcToSolr.java
        spark
        ParallelValidator.java
        FunctionalAnalysis.java
        Formatter.java
        datastore
        MarcSolrClient.java
        MarcMongodbClient.java
        MarcElasticsearchClient.java
        DataField.java
        MarcSubfield.java
        analysis
        ThompsonTraillAnalysis.java
        AuthorithyAnalyzer.java
        SerialScores.java
        NetworkAnalyzer.java
        ThompsonTraillScores.java
        SerialFields.java
        ClassificationStatistics.java
        Serial.java
        AuthorityStatistics.java
        ThompsonTraillFields.java
        ClassificationAnalyzer.java
        Range.java
        Code.java
        MarcField.java
        MarcFactory.java
        Control001.java
        Leader.java
        MarcFieldExtractor.java
        model
        SolrFieldType.java
        validation
        ValidationErrorFormat.java
        ValidationErrorType.java
        ValidationErrorFormatter.java
        ValidationError.java
        definition
        ControlFieldDefinition.java
        tags
        tags25x
        Tag263.java
        Tag250.java
        Tag257.java
        Tag258.java
        Tag255.java
        Tag256.java
        Tag270.java
        Tag260.java
        Tag254.java
        Tag264.java
        tags76x
        Tag767.java
        Tag773.java
        Tag774.java
        Tag776.java
        Tag760.java
        Tag772.java
        Tag770.java
        Tag787.java
        Tag780.java
        Tag765.java
        Tag786.java
        Tag775.java
        Tag762.java
        Tag777.java
        Tag785.java
        tags01x
        Tag088.java
        Tag020.java
        Tag035.java
        Tag055.java
        Tag084.java
        Tag047.java
        Tag013.java
        Tag080.java
        Tag025.java
        Tag043.java
        Tag051.java
        Tag041.java
        Tag018.java
        Tag040.java
        Tag015.java
        Tag037.java
        Tag066.java
        Tag016.java
        Tag027.java
        Tag060.java
        Tag026.java
        Tag085.java
        Tag042.java
        Tag083.java
        Tag050.java
        Tag074.java
        Tag061.java
        Tag045.java
        Tag036.java
        Tag070.java
        Tag086.java
        Tag082.java
        Tag044.java
        Tag033.java
        Tag048.java
        Tag071.java
        Tag046.java
        Tag032.java
        Tag031.java
        Tag038.java
        Tag017.java
        Tag072.java
        Tag030.java
        Tag028.java
        Tag034.java
        Tag052.java
        Tag024.java
        Tag022.java
        Tag010.java
        tags84x
        Tag880.java
        Tag886.java
        Tag882.java
        Tag883.java
        Tag850.java
        Tag852.java
        Tag856.java
        Tag887.java
        Tag885.java
        Tag884.java
        tags6xx
        Tag651.java
        Tag656.java
        Tag600.java
        Tag611.java
        Tag658.java
        Tag655.java
        Tag654.java
        Tag630.java
        Tag647.java
        Tag610.java
        Tag662.java
        Tag648.java
        Tag653.java
        Tag657.java
        Tag650.java
        nkcrtags
        Tag976.java
        Tag964.java
        Tag968.java
        Tag984.java
        Tag925.java
        Tag996.java
        Tag591.java
        Tag901.java
        Tag911.java
        Tag926.java
        Tag952.java
        Tag930.java
        Tag590.java
        Tag903.java
        Tag908.java
        Tag904.java
        Tag979.java
        Tag969.java
        Tag970.java
        Tag900.java
        Tag981.java
        Tag928.java
        Tag910.java
        Tag975.java
        Tag902.java
        Tag956.java
        Tag924.java
        Tag967.java
        package-info.java
        Tag982.java
        Tag912.java
        Tag931.java
        Tag920.java
        Tag966.java
        Tag929.java
        Tag983.java
        Tag978.java
        Tag993.java
        Tag998.java
        Tag905.java
        sztetags
        Tag680.java
        Tag090.java
        Tag591.java
        Tag950.java
        Tag952.java
        Tag092.java
        Tag949.java
        Tag695.java
        Tag596.java
        Tag699.java
        Tag093.java
        Tag951.java
        package-info.java
        Tag595.java
        Tag598.java
        Tag503.java
        tags1xx
        Tag111.java
        Tag130.java
        Tag100.java
        Tag110.java
        genttags
        Tag591.java
        Tag922.java
        package-info.java
        Tag920.java
        tags80x
        Tag800.java
        Tag811.java
        Tag810.java
        Tag830.java
        tags70x
        Tag751.java
        Tag720.java
        Tag711.java
        Tag753.java
        Tag710.java
        Tag730.java
        Tag752.java
        Tag700.java
        Tag758.java
        Tag754.java
        Tag740.java
        tags20x
        Tag222.java
        Tag247.java
        Tag243.java
        Tag246.java
        Tag242.java
        Tag245.java
        Tag210.java
        Tag240.java
        fennicatags
        Tag976.java
        Tag907.java
        Tag977.java
        Tag901.java
        Tag930.java
        Tag903.java
        Tag971.java
        Tag960.java
        Tag995.java
        Tag909.java
        Tag908.java
        Tag904.java
        Tag972.java
        Tag979.java
        Tag019.java
        Tag902.java
        Tag579.java
        Tag932.java
        package-info.java
        Tag961.java
        Tag906.java
        Tag931.java
        Tag790.java
        Tag933.java
        Tag905.java
        TagCategory.java
        holdings
        Tag866.java
        dnbtags
        Tag925.java
        Tag591.java
        Tag926.java
        Tag930.java
        Tag932.java
        Tag924.java
        package-info.java
        Tag249.java
        Tag259.java
        Tag931.java
        Tag889.java
        Tag689.java
        tags5xx
        Tag538.java
        Tag585.java
        Tag522.java
        Tag540.java
        Tag561.java
        Tag555.java
        Tag552.java
        Tag545.java
        Tag536.java
        Tag567.java
        Tag563.java
        Tag544.java
        Tag505.java
        Tag511.java
        Tag534.java
        Tag516.java
        Tag565.java
        Tag588.java
        Tag520.java
        Tag525.java
        Tag526.java
        Tag541.java
        Tag547.java
        Tag506.java
        Tag530.java
        Tag581.java
        Tag546.java
        Tag584.java
        Tag504.java
        Tag513.java
        Tag550.java
        Tag518.java
        Tag586.java
        Tag521.java
        Tag562.java
        Tag501.java
        Tag580.java
        Tag510.java
        Tag535.java
        Tag515.java
        Tag583.java
        Tag524.java
        Tag542.java
        Tag500.java
        Tag502.java
        Tag533.java
        Tag507.java
        Tag514.java
        Tag556.java
        Tag508.java
        tags4xx
        Tag410.java
        Tag411.java
        Tag490.java
        Tag400.java
        Tag440.java
        oclctags
        Tag366.java
        Tag090.java
        Tag936.java
        Tag911.java
        Tag092.java
        Tag891.java
        Tag012.java
        Tag539.java
        Tag019.java
        Tag851.java
        package-info.java
        Tag912.java
        Tag029.java
        Tag994.java
        Tag938.java
        Tag096.java
        tags3xx
        Tag381.java
        Tag362.java
        Tag366.java
        Tag307.java
        Tag370.java
        Tag365.java
        Tag310.java
        Tag336.java
        Tag306.java
        Tag377.java
        Tag384.java
        Tag382.java
        Tag352.java
        Tag346.java
        Tag344.java
        Tag348.java
        Tag338.java
        Tag345.java
        Tag351.java
        Tag388.java
        Tag337.java
        Tag357.java
        Tag347.java
        Tag300.java
        Tag355.java
        Tag342.java
        Tag321.java
        Tag380.java
        Tag386.java
        Tag383.java
        Tag343.java
        Tag363.java
        Tag385.java
        Tag340.java
        control
        Control001Definition.java
        Control005Definition.java
        LeaderDefinition.java
        Control007Definition.java
        Control003Definition.java
        Control008Definition.java
        Control006Definition.java
        FRBRFunction.java
        PositionalControlField.java
        DataFieldDefinition.java
        Parser.java
        Validator.java
        SubfieldDefinition.java
        SourceSpecificationType.java
        CompilanceLevel.java
        MarcVersion.java
        ValidatorResponse.java
        controltype
        Control007Category.java
        ControlType.java
        Control008Type.java
        controlsubfields
        Control006Subfields.java
        tag007
        Tag007soundRecording13.java
        Tag007electro06.java
        Tag007soundRecording01.java
        Tag007map04.java
        Tag007electro03.java
        Tag007tactile01.java
        Tag007electro04.java
        Tag007video07.java
        Tag007projected05.java
        Tag007motionPicture06.java
        Tag007remoteSensing00.java
        Tag007soundRecording07.java
        Tag007remoteSensing04.java
        Tag007unspecified00.java
        Tag007remoteSensing03.java
        Tag007nonprojected02.java
        Tag007electro13.java
        Tag007globe00.java
        Tag007projected03.java
        Tag007globe01.java
        Tag007microform03.java
        Tag007motionPicture03.java
        Tag007motionPicture09.java
        Tag007motionPicture07.java
        Tag007microform10.java
        Tag007motionPicture13.java
        Tag007map00.java
        Tag007soundRecording03.java
        Tag007remoteSensing05.java
        Tag007electro10.java
        Tag007tactile06.java
        Tag007motionPicture11.java
        Tag007tactile00.java
        Tag007map05.java
        Tag007nonprojected03.java
        Tag007microform05.java
        Tag007video01.java
        Tag007kit01.java
        Tag007projected08.java
        Tag007microform00.java
        Tag007electro11.java
        Tag007motionPicture10.java
        Tag007microform06.java
        Tag007projected04.java
        Tag007text01.java
        Tag007remoteSensing06.java
        Tag007microform09.java
        Tag007motionPicture01.java
        Tag007video00.java
        Tag007motionPicture17.java
        Tag007electro09.java
        Tag007electro01.java
        Tag007motionPicture04.java
        Tag007motionPicture12.java
        Tag007video03.java
        Tag007electro12.java
        Tag007projected01.java
        Tag007motionPicture15.java
        Tag007soundRecording06.java
        Tag007electro05.java
        Tag007nonprojected05.java
        Tag007map07.java
        Tag007video06.java
        Tag007soundRecording11.java
        Tag007music00.java
        Tag007soundRecording12.java
        Tag007nonprojected00.java
        Tag007motionPicture08.java
        Tag007video04.java
        Tag007common00.java
        Tag007remoteSensing01.java
        Tag007map01.java
        Tag007microform11.java
        Tag007tactile05.java
        Tag007microform12.java
        Tag007motionPicture16.java
        Tag007motionPicture00.java
        Tag007globe05.java
        Tag007projected06.java
        Tag007globe04.java
        Tag007soundRecording05.java
        Tag007remoteSensing09.java
        Tag007music01.java
        Tag007projected00.java
        Tag007map06.java
        Tag007video08.java
        Tag007tactile09.java
        Tag007projected07.java
        Tag007soundRecording08.java
        Tag007text00.java
        Tag007soundRecording10.java
        Tag007motionPicture14.java
        Tag007kit00.java
        Tag007soundRecording04.java
        Tag007motionPicture05.java
        Tag007nonprojected01.java
        Tag007microform01.java
        Tag007electro00.java
        Tag007video05.java
        Tag007remoteSensing07.java
        Tag007tactile03.java
        Tag007soundRecording09.java
        Tag007microform04.java
        Tag007map03.java
        Tag007globe03.java
        Tag007unspecified01.java
        Tag007nonprojected04.java
        Tag007remoteSensing08.java
        Tag007soundRecording00.java
        ControlSubfieldList.java
        LeaderSubfields.java
        tag006
        Tag006map16.java
        Tag006visual17.java
        Tag006book07.java
        Tag006music06.java
        Tag006computer06.java
        Tag006visual16.java
        Tag006computer11.java
        Tag006book13.java
        Tag006continuing06.java
        Tag006music07.java
        Tag006continuing04.java
        Tag006book11.java
        Tag006music16.java
        Tag006continuing08.java
        Tag006book01.java
        Tag006continuing12.java
        Tag006continuing16.java
        Tag006book14.java
        Tag006map12.java
        Tag006book05.java
        Tag006computer05.java
        Tag006book16.java
        Tag006map05.java
        Tag006visual12.java
        Tag006book17.java
        Tag006visual01.java
        Tag006music04.java
        Tag006all00.java
        Tag006music03.java
        Tag006computer09.java
        Tag006continuing02.java
        Tag006map14.java
        Tag006continuing17.java
        Tag006continuing05.java
        Tag006music05.java
        Tag006visual05.java
        Tag006map01.java
        Tag006book06.java
        Tag006visual11.java
        Tag006map11.java
        Tag006continuing07.java
        Tag006music01.java
        Tag006book12.java
        Tag006continuing11.java
        Tag006music13.java
        Tag006continuing01.java
        Tag006mixed06.java
        Tag006map08.java
        Control008Subfields.java
        tag008
        Tag008continuing19.java
        Tag008visual28.java
        Tag008all35.java
        Tag008music30.java
        Tag008music22.java
        Tag008book29.java
        Tag008map29.java
        Tag008music18.java
        Tag008all07.java
        Tag008computer23.java
        Tag008music20.java
        Tag008all00.java
        Tag008map31.java
        Tag008visual34.java
        Tag008visual22.java
        Tag008continuing33.java
        Tag008all15.java
        Tag008music24.java
        Tag008book28.java
        Tag008music23.java
        Tag008continuing23.java
        Tag008map33.java
        Tag008continuing34.java
        Tag008book34.java
        Tag008map25.java
        Tag008book23.java
        Tag008visual33.java
        Tag008continuing18.java
        Tag008computer28.java
        Tag008continuing21.java
        Tag008book24.java
        Tag008book18.java
        Tag008book30.java
        Tag008book22.java
        Tag008book33.java
        Tag008continuing28.java
        Tag008visual18.java
        Tag008all39.java
        Tag008all38.java
        Tag008continuing22.java
        Tag008music21.java
        Tag008music33.java
        Tag008visual29.java
        Tag008all06.java
        Tag008continuing24.java
        Tag008map28.java
        Tag008all11.java
        Tag008continuing25.java
        Tag008map22.java
        Tag008map18.java
        Tag008mixed23.java
        Tag008book31.java
        Tag008computer26.java
        Tag008continuing29.java
        Tag008computer22.java
        leader
        Leader00.java
        Leader12.java
        Leader21.java
        Leader11.java
        Leader22.java
        Leader19.java
        Leader05.java
        Leader06.java
        Leader20.java
        Leader10.java
        Leader17.java
        Leader08.java
        Leader09.java
        Leader18.java
        Leader07.java
        Control007Subfields.java
        TagDefinitionLoader.java
        Cardinality.java
        general
        validator
        SubfieldValidator.java
        FieldValidator.java
        ISBNValidator.java
        ClassificationReferenceValidator.java
        ISSNValidator.java
        RecordValidator.java
        Tag054AValidator.java
        LinkType.java
        indexer
        FieldIndexer.java
        subject
        SchemaFromInd2AndSubfield2.java
        SchemaFromInd1OrIfEmptyFromSubfield2.java
        SubjectIndexer.java
        SchemaFromInd1OrIf7FromSubfield2.java
        ClassificationSchemes.java
        SchemaFromSubfield2.java
        SchemaFromInd2For055OrIf7FromSubfield2.java
        codelist
        MusicalCompositionSourceCodes.java
        ResourceActionTermSourceCodes.java
        AvailabilityStatusCodeSourceCodes.java
        MusicalInstrumentsOrVoicesCodes.java
        OrganizationCodes.java
        MusicalInstrumentationAndVoiceSourceCodes.java
        CountrySourceCodes.java
        ContentAdviceClassificationSourceCodes.java
        SubjectCategoryCodeSourceCodes.java
        CitationSchemeSourceCodes.java
        NationalBibliographyNumberSourceCodes.java
        MusicalIncipitSchemeSourceCodes.java
        DateSourceCodes.java
        ElectronicAccessMethodsCodeList.java
        NameAndTitleAuthoritySourceCodes.java
        PriceTypeCodeSourceCodes.java
        ThematicIndexCodeSourceCodes.java
        HoldingSchemeSourceCodes.java
        FunctionTermSourceCodes.java
        CopyrightAndLegalDepositNumberSourceCodes.java
        DescriptionConventionSourceCodes.java
        TaxonomicClassificationSourceCodes.java
        LanguageCodes.java
        TemporalTermSourceCodes.java
        ClassificationSchemeSourceCodes.java
        AuthenticationActionCodes.java
        CurriculumObjectiveTermAndCodeSourceCodes.java
        AbbreviatedTitleSourceCodes.java
        oclc
        TypeOfDateOrPublicationStatus.java
        Regularity.java
        Frequency.java
        FormOfItem.java
        GeographicAreaCodes.java
        OccupationTermSourceCodes.java
        RelatorCodes.java
        StandardIdentifierSourceCodes.java
        CountryCodes.java
        LanguageCodeAndTermSourceCodes.java
        FormatSourceCodes.java
        GeographicAreaSourceCodes.java
        CartographicDataSourceCodes.java
        FingerprintSchemeSourceCodes.java
        GenreFormCodeAndTermSourceCodes.java
        CodeList.java
        SubjectHeadingAndTermSourceCodes.java
        AccessRestrictionTermSourceCodes.java
        Tag76xSubfield7PositionsGenerator.java
        FieldLinkAndSequenceNumberParser.java
        Linkage.java
        parser
        Control008All00DateParser.java
        LinkageParser.java
        YYYYMMDDDateParser.java
        ParserException.java
        RecordControlNumberParser.java
        SubfieldContentParser.java
        Indicator.java
        ControlSubfieldDefinition.java
        ControlField.java
        ControlValue.java
        MarcStructureDefinitionReader.java
    - assembly
      - release.xml
  - test
    - resources
      - multiline.txt
      - pica
        pica-tags-2013.csv
        pica-schema-extra.json
        pica-schema.json
        pica-tags-1993.csv
      - alephseq
        alephseq-example.txt
      - marctxt
        010000011.mrctxt
      - general
        0001-01.mrc
        sub-test-marc.json
        marc-structure.txt
        marc2.json
        csv-test.csv
        000-line-seperated.mrc
        BooksAll.2014.part01-0001.mrc
        marc-record-formatted.json
      - unimarc
        unimarc.mrctxt
        README.md
      - marc
        nkcr-sample-records.txt
        standard-identifier.csv
    - java
      - de
        gwdg
        metadataqa
        marc
        CodeTest.java
        ValidationErrorTypeTest.java
        Control005Test.java
        utils
        FrbrFunctionListerTest.java
        BasicStatisticsTest.java
        marcspec
        MARCSpecTest.java
        MARCspecParserTest.java
        legacy
        MarcSpecTest.java
        parser
        MARCspecParser1_fieldSpecTest.java
        MARCspecParser2_characterSpecTest.java
        MARCspecParser7_abbreviationTest.java
        MARCspecParser5_indicatorSpecTest.java
        MARCspecParser3_subfieldSpecTest.java
        MARCspecParser6_subSpecTest.java
        MARCspecParser4_indexTest.java
        SubfieldParserTest.java
        TagHierarchyTest.java
        LineReaderTest.java
        pica
        PicaReaderTest.java
        PicaTagDefinitionTest.java
        PicaLineTest.java
        keygenerator
        DataFieldKeyGeneratorTest.java
        ControlFieldKeyGeneratorTest.java
        CodeFileReaderTest.java
        alephseq
        AlephseqLineTest.java
        AlephseqMarcReaderTest.java
        MarcTagListerTest.java
        ReadMarcTest.java
        code
        CodeReaderTest.java
        Control003Test.java
        ControlValueTest.java
        Control008Test.java
        MarcIteratorTest.java
        MarcFactoryTest.java
        cli
        ClassificationAnalysisTest.java
        parameters
        ValidatorParametersTest.java
        CommonParametersTest.java
        FormatterParametersTest.java
        Validating006.java
        MarcToSolrParametersTest.java
        ThompsonTraillCompletenessParametersTest.java
        FunctionalAnalysisTest.java
        IndexingTest.java
        LeaderTest.java
        MarcJsonCalculatorTest.java
        datastore
        MarcMongodbClientTest.java
        MarcElasticsearchClientTest.java
        ValidationErrorTest.java
        Control006Test.java
        MarcRecordTest.java
        UtilsTest.java
        ControlSubfieldTest.java
        analysis
        AuthorithyAnalyzerTest.java
        ThompsonTraillAnalysisTest.java
        ThompsonTrailFieldsTest.java
        ClassificationAnalyzerTest.java
        SerialTest.java
        MarcFieldExtractorTest.java
        Control007Test.java
        MarcFieldTest.java
        definition
        tags
        tags25x
        Tag260Test.java
        tags01x
        Tag040Test.java
        Tag090Test.java
        Tag045Test.java
        tags84x
        Tag880Test.java
        tags6xx
        Tag650Test.java
        Tag610Test.java
        tags20x
        Tag245Test.java
        tags4xx
        Tag490Test.java
        oclctags
        Tag029Test.java
        tags3xx
        Tag300Test.java
        SubfieldDefinitionTest.java
        Control00XSubfieldsTest.java
        LeaderSubfieldsTest.java
        Control006SubfieldsTest.java
        controlsubfields
        tag007
        Tag007nonprojected02Test.java
        Control008SubfieldsTest.java
        TagDefinitionLoaderTest.java
        general
        LanguageCodesTest.java
        validator
        ISSNValidatorTest.java
        ClassificationReferenceValidatorTest.java
        ISBNValidatorTest.java
        FieldLinkAndSequenceNumberParserTest.java
        indexer
        subject
        SchemaFromInd1OrIf7FromSubfield2Test.java
        SchemaFromInd1OrIfEmptyFromSubfield2Test.java
        ClassificationSchemesTest.java
        SchemaFromInd2AndSubfield2Test.java
        SchemaFromSubfield2Test.java
        SubjectIndexerTest.java
        parser
        RecordControlNumberParserTest.java
        Control008All00DateParserTest.java
        LinkageParserTest.java
        Control007SubfieldsTest.java
        DataFieldTest.java
        X035aSystemControlNumberTest.java
        Control001Test.java
        ValidationTest.java
- completeness
- classifications
- index
- serial-score
- formatter
- pom.xml
- LICENSE
- common-script
- common-variables
- validator
- authorities
- docker
  - supervisord.conf
- .travis.yml
- network-analysis
- README.md
- functional-analysis
- scripts
  - bnpl.sh
  - frequency-range-v1.R
  - evaluate-details.R
  - mokka.sh
  - bayern.sh
  - szte.sh
  - nfi.sh
  - bzbw.sh
  - columbia.sh
  - run-all.sh
  - tib.sh
  - gbv.sh
  - tt-histogram-from-no-ids.R
  - evaluate.R
  - harvard.sh
  - frequency-range-per-types-all.R
  - sfpl.sh
  - marc-history.R
  - gent.sh
  - tt-histogram.R
  - michigan.sh
  - frequency-range.R
  - toronto.sh
  - functional-analysis-results.R
  - network-transform.R
  - loc.sh
  - stanford.sh
  - rism.sh
  - mtak.sh
  - marc-elements.R
  - serial-score-histogram.R
  - frequency-range-per-types.R
  - completeness.R
  - cerl.sh
  - dnb.sh
  - functional-analysis.R
- tt-completeness
- Dockerfile
- .gitignore
- prepare-solr
- docker-compose.yml
- metadata-qa.sh

package de.gwdg.metadataqa.marc.cli;

import de.gwdg.metadataqa.marc.MarcRecord;
import de.gwdg.metadataqa.marc.Utils;
import de.gwdg.metadataqa.marc.analysis.AuthorithyAnalyzer;
import de.gwdg.metadataqa.marc.analysis.AuthorityStatistics;
import de.gwdg.metadataqa.marc.cli.parameters.CommonParameters;
import de.gwdg.metadataqa.marc.cli.parameters.ValidatorParameters;
import de.gwdg.metadataqa.marc.cli.processor.MarcFileProcessor;
import de.gwdg.metadataqa.marc.cli.utils.RecordIterator;
import de.gwdg.metadataqa.marc.cli.utils.Schema;
import org.apache.commons.cli.Options;
import org.apache.commons.cli.ParseException;
import org.apache.commons.lang3.StringUtils;
import org.marc4j.marc.Record;

import java.io.BufferedWriter;
import java.io.IOException;
import java.io.Serializable;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.*;
import java.util.logging.Logger;

import static de.gwdg.metadataqa.marc.Utils.count;

public class AuthorityAnalysis implements MarcFileProcessor, Serializable {

  private static final Logger logger = Logger.getLogger(AuthorityAnalysis.class.getCanonicalName());

  private final Options options;
  private CommonParameters parameters;
  private Map<Integer, Integer> histogram = new HashMap<>();
  private Map<Boolean, Integer> hasClassifications = new HashMap<>();
  private boolean readyToProcess;
  private static char separator = ',';
  AuthorityStatistics statistics = new AuthorityStatistics();

  public AuthorityAnalysis(String[] args) throws ParseException {
    parameters = new ValidatorParameters(args);
    options = parameters.getOptions();
    readyToProcess = true;
  }

  public static void main(String[] args) {
    MarcFileProcessor processor = null;
    try {
      processor = new AuthorityAnalysis(args);
    } catch (ParseException e) {
      System.err.println(createRow("ERROR. ", e.getLocalizedMessage()));
      // processor.printHelp(processor.getParameters().getOptions());
      System.exit(0);
    }
    if (processor.getParameters().getArgs().length < 1) {
      System.err.println("Please provide a MARC file name!");
      processor.printHelp(processor.getParameters().getOptions());
      System.exit(0);
    }
    if (processor.getParameters().doHelp()) {
      processor.printHelp(processor.getParameters().getOptions());
      System.exit(0);
    }
    RecordIterator iterator = new RecordIterator(processor);
    iterator.start();
  }

  @Override
  public CommonParameters getParameters() {
    return parameters;
  }

  @Override
  public void processRecord(Record marc4jRecord, int recordNumber) throws IOException {

  }

  @Override
  public void processRecord(MarcRecord marcRecord, int recordNumber) throws IOException {
    AuthorithyAnalyzer analyzer = new AuthorithyAnalyzer(marcRecord, statistics);
    int count = analyzer.process();
    count((count > 0), hasClassifications);
    count(count, histogram);
  }

  @Override
  public void beforeIteration() {

  }

  @Override
  public void fileOpened(Path path) {

  }

  @Override
  public void fileProcessed() {

  }

  @Override
  public void afterIteration(int numberOfprocessedRecords) {
    printAuthoritiesBySchema();
    printAuthoritiesByRecords();
    printAuthoritiesHistogram();
    printAuthoritiesSubfieldsStatistics();
  }

  private void printAuthoritiesBySchema() {
    Path path = Paths.get(parameters.getOutputDir(), "authorities-by-schema.csv");
    try (BufferedWriter writer = Files.newBufferedWriter(path)) {
      writer.write(createRow("id", "field", "location", "scheme", "abbreviation", "abbreviation4solr", "recordcount", "instancecount"));
      statistics.getInstances()
        .entrySet()
        .stream()
        .sorted((e1, e2) -> {
            int i = e1.getKey().getField().compareTo(e2.getKey().getField());
            if (i != 0)
              return i;
            else {
              i = e1.getKey().getLocation().compareTo(e2.getKey().getLocation());
              if (i != i)
                return i;
              else
                return e2.getValue().compareTo(e1.getValue());
            }
          }
        )
        .forEach(
          entry -> printSingleClassificationBySchema(writer, entry)
        );
    } catch (IOException e) {
      e.printStackTrace();
    }
  }

  private void printSingleClassificationBySchema(BufferedWriter writer, Map.Entry<Schema, Integer> entry) {
    Schema schema = entry.getKey();
    int instanceCount = entry.getValue();
    int recordCount = statistics.getRecords().get(schema);
    try {
      writer.write(createRow(
        schema.getId(),
        schema.getField(),
        schema.getLocation(),
        '"' + schema.getSchema().replace("\"", "\\\"") + '"',
        schema.getAbbreviation(),
        Utils.solarize(schema.getAbbreviation()),
        recordCount,
        instanceCount
      ));
    } catch (IOException ex) {
      ex.printStackTrace();
      System.err.println(schema);
    } catch (NullPointerException ex) {
      ex.printStackTrace();
      System.err.println(schema);
    }
  }

  private void printAuthoritiesByRecords() {
    Path path;
    path = Paths.get(parameters.getOutputDir(), "authorities-by-records.csv");
    try (BufferedWriter writer = Files.newBufferedWriter(path)) {
      writer.write(createRow("records-with-authorities", "count"));
      hasClassifications
        .entrySet()
        .stream()
        .sorted((e1, e2) ->
          e2.getValue().compareTo(e1.getValue()))
        .forEach(
          e -> {
            try {
              writer.write(createRow(e.getKey().toString(), e.getValue()));
            } catch (IOException ex) {
              ex.printStackTrace();
            }
          }
        );
    } catch (IOException e) {
      e.printStackTrace();
    }
  }

  private void printAuthoritiesHistogram() {
    Path path = Paths.get(parameters.getOutputDir(), "authorities-histogram.csv");
    try (BufferedWriter writer = Files.newBufferedWriter(path)) {
      writer.write(createRow("count", "frequency"));
      histogram
        .entrySet()
        .stream()
        .sorted((e1, e2) -> {
          return e1.getKey().compareTo(e2.getKey());
        })
        .forEach(
          entry -> {
            try {
              writer.write(createRow(entry.getKey(), entry.getValue()));
            } catch (IOException e) {
              e.printStackTrace();
            }
          }
        );
    } catch (IOException e) {
      e.printStackTrace();
    }
  }


  private void printAuthoritiesSubfieldsStatistics() {
    Path path = Paths.get(parameters.getOutputDir(), "authorities-by-schema-subfields.csv");
    try (BufferedWriter writer = Files.newBufferedWriter(path)) {
      // final List<String> header = Arrays.asList("field", "location", "label", "abbreviation", "subfields", "scount");
      final List<String> header = Arrays.asList("id", "subfields", "count");
      writer.write(createRow(header));
      statistics.getSubfields()
        .entrySet()
        .stream()
        .sorted((e1, e2) ->
          e1.getKey().getField().compareTo(e2.getKey().getField()))
        .forEach(
          schemaEntry -> printSingleSchemaSubfieldsStatistics(writer, schemaEntry)
        );
    } catch (IOException e) {
      e.printStackTrace();
    }
  }

  private void printSingleSchemaSubfieldsStatistics(BufferedWriter writer, Map.Entry<Schema, Map<List<String>, Integer>> schemaEntry) {
    Schema schema = schemaEntry.getKey();
    Map<List<String>, Integer> val = schemaEntry.getValue();
    val
      .entrySet()
      .stream()
      .sorted((count1, count2) -> count2.getValue().compareTo(count1.getValue()))
      .forEach(
        countEntry -> {
          List<String> subfields = countEntry.getKey();
          int count = countEntry.getValue();
          try {
            writer.write(createRow(
              schema.getId(),
              // schema.field,
              // schema.location,
              // '"' + schema.schema.replace("\"", "\\\"") + '"',
              // schema.abbreviation,
              StringUtils.join(subfields, ';'),
              count
            ));
          } catch (IOException ex) {
            ex.printStackTrace();
          }
        }
      );
  }

  private static String createRow(List<String> fields) {
    return StringUtils.join(fields, separator) + "\n";
  }

  private static String createRow(Object... fields) {
    return StringUtils.join(fields, separator) + "\n";
  }

  @Override
  public void printHelp(Options options) {

  }

  @Override
  public boolean readyToProcess() {
    return readyToProcess;
  }
}