java source code of TextLineWriter

Project: newsleak (GitHub Link)

newsleak-master
- bower.json
- public
  - images
    - favicon.ico
    - logo_der_spiegel.jpg
  - partials
    - expandNode.html
    - document.html
    - histogramX.html
    - document_list.html
    - histogram.html
    - keywordNetwork.html
    - history.html
    - header.html
    - network.html
    - metadata.html
    - editNode.html
    - mergeNodes.html
    - search.html
    - settings.html
    - about.html
- LICENSE
- project
  - scalastyle-config.xml
  - build.properties
  - plugins.sbt
- init-repo.sh
- package-lock.json
- .bowerrc
- documentation
  - publish_to_gh-pages.sh
  - resources
    - _gen
      - assets
        js
        js
        bundle.js_3d041b08546090308b2e5d3a88088713.json
        bundle.js_3d041b08546090308b2e5d3a88088713.content
        script.js_d3f53f09220d597dac26fe7840c31fc9.content
        script.js_d3f53f09220d597dac26fe7840c31fc9.json
        css
        css
        style.css_d3f53f09220d597dac26fe7840c31fc9.content
        bundle.css_3d041b08546090308b2e5d3a88088713.content
        style.css_d3f53f09220d597dac26fe7840c31fc9.json
        bundle.css_3d041b08546090308b2e5d3a88088713.json
  - content
    - team.md
    - devsetup.md
    - install.md
    - about.md
    - demo.md
    - news
      - 2018-10-31-paper-accepted-at-emnlp-2018-conference.markdown
      - 2018-08-13-paper-accepted-at-socinfo-2018-conference-in-st-petersburg.markdown
      - 2019-07-01-newsleak2-finish.markdown
      - 2016-11-08-newsleak-demo-spiegel.markdown
      - 2016-02-23-requirements-management.markdown
      - 2016-01-25-science-data-journalsim-newsleak.markdown
      - 2016-09-20-paper-accepted-vis-2016.markdown
      - 2016-04-08-the-science-behind-newsleak-i-language-technology.markdown
      - 2016-08-16-newsleak-acl-2016.markdown
      - 2016-07-08-interactive-visualization.markdown
      - 2018-11-18-newsleak-at-wissenswerte-2018.markdown
      - 2018-05-26-presentation-at-eijc18-dataharvest-conference.markdown
      - 2017-11-07-funding-extension.markdown
      - 2016-05-23-paper-accepted-acl-2016.markdown
      - 2018-06-04-newsleak-2-0-pre-release-software-demo.markdown
      - 2015-11-25-we-made-it.markdown
      - 2016-10-31-newsleak-vip.markdown
      - 2016-04-26-newsleaks-impact-on-science.markdown
      - 2016-06-09-paper-accepted-skill-2016.markdown
      - 2018-03-05-dataharvest-conference-eijc18.markdown
      - _index.md
    - impressum.md
    - documentation.md
    - _index.md
  - themes
    - ananke
      - src
        webpack.config.js
        package.json
        readme.md
        js
        main.js
        css
        _hugo-internal-templates.css
        main.css
        _styles.css
        _tachyons.css
        postcss.config.js
        _code.css
        _social-icons.css
      - i18n
        de.toml
        en.toml
        fr.toml
      - images
      - CHANGELOG.md
      - LICENSE.md
      - data
        webpack_assets.json
      - theme.toml
      - README.md
      - package.json
      - layouts
        _default
        single.html
        list.html
        terms.html
        baseof.html
        taxonomy.html
        robots.txt
        page
        single.html
        post
        list.html
        summary-with-image.html
        summary.html
        404.html
        index.html
        shortcodes
        form-contact.html
        partials
        site-favicon.html
        svg
        new-window.svg
        gitlab.svg
        twitter.svg
        mastodon.svg
        linkedin.svg
        instagram.svg
        facebook.svg
        github.svg
        youtube.svg
        medium.svg
        site-navigation.html
        site-footer.html
        tags.html
        page-header.html
        i18nlist.html
        summary-with-image.html
        site-scripts.html
        menu-contextual.html
        new-window-icon.html
        social-follow.html
        summary.html
        site-header.html
      - exampleSite
        content
        about
        _index.md
        post
        chapter-6.md
        chapter-4.md
        chapter-1.md
        chapter-5.md
        chapter-3.md
        chapter-2.md
        _index.md
        contact.md
        _index.md
        config.toml
        static
        images
        esmeralda.jpg
        Victor_Hugo-Hunchback.jpg
        Pope-Edouard-de-Beaumont-1844.jpg
      - .gitignore
      - static
        images
        dist
        js
        app.3fc0f988d21662902933.js
        css
        app.955516233bcafa4d2a1c13cea63c7b50.css
      - archetypes
        default.md
    - universal
      - i18n
        zh.yaml
        da.yaml
        ja.yaml
        ru.yaml
        de.yaml
        nl.yaml
        id.yaml
        it.yaml
        ca.yaml
        fr.yaml
        cs.yaml
        es.yaml
        en.yaml
        sv.yaml
        pt-br.yaml
      - images
      - LICENSE
      - theme.toml
      - README.md
      - package.json
      - layouts
        _default
        single.html
        list.html
        page
        single.html
        404.html
        index.html
        partials
        carousel.html
        page.html
        sidebar.html
        breadcrumbs.html
        testimonials.html
        nav.html
        head.html
        recent_posts.html
        see_more.html
        footer.html
        clients.html
        contact.html
        features.html
        top.html
        widgets
        tags.html
        categories.html
        search.html
        scripts.html
        map.html
        archetypes
        default.md
      - exampleSite
        content
        blog
        hugo-is-for-lovers.md
        creating-a-new-theme.md
        linked-post.md
        go-is-for-lovers.md
        migrate-from-jekyll.md
        faq.md
        contact.md
        config.toml
        data
        carousel
        features.yaml
        multipurpose.yaml
        design.yaml
        customizable.yaml
        clients
        5.yaml
        3.yaml
        2.yaml
        4.yaml
        1.yaml
        6.yaml
        features
        seo.yaml
        uiux.yaml
        consulting.yaml
        email.yaml
        print.yaml
        webdesign.yaml
        testimonials
        5.yaml
        3.yaml
        2.yaml
        4.yaml
        1.yaml
        .gitignore
        static
        img
        carousel
        favicon.ico
        clients
        testimonials
        person-1.jpg
        person-4.jpg
        person-2.jpg
        banners
        banner-3.jpg
        banner-2.jpg
        banner-4.jpg
      - static
        img
        main-slider2.jpg
        men.jpg
        home-try.jpg
        detailsquare.jpg
        slide3.jpg
        blog-medium.jpg
        product3.jpg
        blog-recent-3.jpg
        page-2.jpg
        blog-avatar2.jpg
        detailsquare2.jpg
        slide2.jpg
        slide6.jpg
        portfolio-8.jpg
        portfolio-7.jpg
        page-3.jpg
        banner.jpg
        favicon.ico
        portfolio-6.jpg
        main-slider4.jpg
        detailbig2.jpg
        banner2.jpg
        product4.jpg
        fixed-background-2.jpg
        blog-recent.jpg
        detailbig1.jpg
        main-slider1.jpg
        main-slider3.jpg
        portfolio-3.jpg
        portfolio-2.jpg
        product2.jpg
        portfolio-5.jpg
        slide4.jpg
        blog-recent-2.jpg
        slide5.jpg
        slide1.jpg
        page-1.jpg
        detailsquare3.jpg
        detailbig3.jpg
        blog.jpg
        product1.jpg
        blog-avatar.jpg
        portfolio-4.jpg
        basketsquare.jpg
        blog2.jpg
        js
        front.js
        owl.carousel.min.js
        respond.min.js
        gmaps.init.js
        hpneo.gmaps.js
        css
        animate.css
        style.red.css
        style.blue.css
        owl.carousel.css
        style.violet.css
        style.default.css
        owl.theme.css
        style.marsala.css
        style.turquoise.css
        custom.css
        style.pink.css
        style.green.css
      - archetypes
        default.md
  - config.toml
  - config.toml.universal
  - data
    - carousel
      - features.yaml
      - multipurpose.yaml
      - design.yaml
      - customizable.yaml
    - clients
      - 5.yaml
      - 3.yaml
      - 2.yaml
      - 4.yaml
      - 1.yaml
      - 6.yaml
    - features
      - seo.yaml
      - uiux.yaml
      - consulting.yaml
      - email.yaml
      - print.yaml
      - webdesign.yaml
    - testimonials
      - 5.yaml
      - 3.yaml
      - 2.yaml
      - 4.yaml
      - 1.yaml
  - README.md
  - layouts
    - partials
      - footer-extra.html
  - config.toml.dot
  - static
    - img
      - carousel
      - favicon.ico
      - clients
      - 2016
        02
        2016_02_02_cafe_05-300x225.jpg
        2016_02_02_cafe_05-150x150.jpg
        2016_02_02_cafe_05-1024x768.jpg
        2016_02_02_cafe_05-768x576.jpg
        04
        01
        11
        IMG_1163-150x150.jpg
        VIP-1024x680.jpeg
        IMG_1164-768x576.jpg
        IMG_1163-768x576.jpg
        VIP-150x150.jpeg
        IMG_1175-300x225.jpg
        VIP-768x510.jpeg
        IMG_1164-1024x768.jpg
        IMG_1171-1024x768.jpg
        IMG_1163-1024x768.jpg
        IMG_1164-300x225.jpg
        IMG_1171-300x225.jpg
        IMG_1175-1024x768.jpg
        IMG_1175-768x576.jpg
        VIP-300x199.jpeg
        IMG_1163-300x225.jpg
        IMG_1171-768x576.jpg
        IMG_1175-150x150.jpg
        IMG_1171-150x150.jpg
        IMG_1164-150x150.jpg
        03
        08
        acl-newsleak-01-768x405.jpg
        acl-newsleak-10-150x150.jpg
        acl-newsleak-02-150x150.jpg
        acl-newsleak-03-150x150.jpg
        acl-newsleak-03-768x576.jpg
        acl-newsleak-01-300x158.jpg
        acl-newsleak-10-768x576.jpg
        acl-newsleak-12-150x150.jpg
        acl-newsleak-02-768x576.jpg
        acl-newsleak-01-150x150.jpg
        acl-newsleak-03-1024x768.jpg
        acl-newsleak-02-1024x768.jpg
        acl-newsleak-12-768x576.jpg
        acl-newsleak-02-300x225.jpg
        acl-newsleak-01-1024x540.jpg
        acl-newsleak-10-1024x768.jpg
        acl-newsleak-12-300x225.jpg
        acl-newsleak-10-300x225.jpg
        acl-newsleak-03-300x225.jpg
        acl-newsleak-12-1024x768.jpg
        06
        www.GIFCreator.me_Io0FHw-570x1024.gif
        yourcompany.jpg
        logo-draft_tritanopia-150x138.jpg
        www.GIFCreator.me_fVOqUg-167x300.gif
        logo-draft_protanopia.jpg
        www.GIFCreator.me_fVOqUg-768x1380.gif
        logo-draft.jpg
        logo-draft_achromatopsia-300x92.jpg
        logo-draft_achromatopsia.jpg
        logo-draft_tritanopia-300x92.jpg
        yourcompany-150x150.jpg
        www.GIFCreator.me_Io0FHw-150x150.gif
        www.GIFCreator.me_fVOqUg-570x1024.gif
        www.GIFCreator.me_fVOqUg-150x150.gif
        logo-draft_tritanopia.jpg
        logo-draft_protanopia-300x92.jpg
        logo-draft_protanopia-150x138.jpg
        yourcompany-155x300.jpg
        www.GIFCreator.me_Io0FHw-167x300.gif
        logo-draft_achromatopsia-150x138.jpg
        logo-draft-150x138.jpg
        logo-draft-300x92.jpg
        www.GIFCreator.me_Io0FHw-768x1380.gif
      - testimonials
        person-1.jpg
        person-4.jpg
        person-2.jpg
      - VIP-300x199.jpeg
      - banners
        banner-3.jpg
        banner-2.jpg
        banner-4.jpg
    - CNAME
    - media
      - corporate_design
        header
        tud_aufstellung.jpg
        Interdisziplinaer.jpg
        informatik_computer_2d.gif
        dyn_lectures.jpg
        dyn_news.jpg
        netzwerke.jpg
        verbunden_bleiben.jpg
        studieren_header.jpg
        schloss_2004.jpg
        Studenten_Computer.gif
        studieren_h05.jpg
        Frau-im-Park.jpg
        schloss_haupteingang_2004.jpg
        dyn_piezomotor.jpg
        cd_grafiken
        gris_favicon.ico
        zum_seitenanfang_ie6.gif
        Thumbs.db
        grislogo.gif
        icons_fuer_barrierefrei
        drucken1.gif
        email.gif
        sitemap2.gif
        untermenue.gif
        abmelden.gif
        impressum1.gif
        anmelden.gif
        externer_link.gif
        zum_seitenanfang_ie6.gif
        interner_link.gif
        impressum.gif
        pdf.gif
        cd_styles
        tu_bildschirm.css
        _bildschirm.css
        druck_nsl.css
        startseite.css
        __bildschirm.css
        default_nsl.css
        default.css
        druck_vc.css
        tu_default.css
        bildschirm_nsl.css
        bildschirm.css
        tu_startseite.css
        bildschirm_vc.css
        default_vc.css
        be_slide.js
        Xbildschirm.css
        tu_druck.css
        druck.css
        gc_skripte
        oeffne_fenster.js
        klappboxen.js
        be_slide3.js
        cookie_manager.js
        fontsize.js
    - javadoc
      - package-list
      - script.js
      - overview-summary.html
      - overview-frame.html
      - opennlp
        uima
        Person_Type.html
        package-frame.html
        Parse_Type.html
        Time_Type.html
        Location_Type.html
        class-use
        Person_Type.html
        Parse_Type.html
        Time_Type.html
        Location_Type.html
        Date.html
        Location.html
        Token_Type.html
        Sentence_Type.html
        Chunk.html
        Organization_Type.html
        Person.html
        Money.html
        Percentage.html
        Percentage_Type.html
        Parse.html
        Organization.html
        Date_Type.html
        Chunk_Type.html
        Time.html
        Token.html
        Sentence.html
        Money_Type.html
        package-tree.html
        Date.html
        Location.html
        Token_Type.html
        Sentence_Type.html
        Chunk.html
        Organization_Type.html
        Person.html
        Money.html
        Percentage.html
        Percentage_Type.html
        Parse.html
        Organization.html
        Date_Type.html
        Chunk_Type.html
        Time.html
        package-summary.html
        Token.html
        package-use.html
        Sentence.html
        Money_Type.html
      - overview-tree.html
      - serialized-form.html
      - help-doc.html
      - constant-values.html
      - deprecated-list.html
      - index-files
        index-14.html
        index-16.html
        index-7.html
        index-17.html
        index-10.html
        index-2.html
        index-3.html
        index-12.html
        index-9.html
        index-21.html
        index-18.html
        index-5.html
        index-11.html
        index-6.html
        index-13.html
        index-1.html
        index-8.html
        index-4.html
        index-20.html
        index-19.html
        index-15.html
      - allclasses-frame.html
      - de
        unihd
        dbs
        uima
        types
        heideltime
        package-frame.html
        GoldEvent_Type.html
        GoldEvent.html
        Timex3Interval_Type.html
        Event.html
        class-use
        GoldEvent_Type.html
        GoldEvent.html
        Timex3Interval_Type.html
        Event.html
        SourceDocInfo.html
        Event_Type.html
        Token_Type.html
        Sentence_Type.html
        Dct_Type.html
        Dct.html
        Timex3_Type.html
        IntervalCandidateSentence.html
        Timex3Interval.html
        Timex3.html
        SourceDocInfo_Type.html
        IntervalCandidateSentence_Type.html
        Token.html
        Sentence.html
        SourceDocInfo.html
        package-tree.html
        Event_Type.html
        Token_Type.html
        Sentence_Type.html
        Dct_Type.html
        Dct.html
        Timex3_Type.html
        IntervalCandidateSentence.html
        Timex3Interval.html
        Timex3.html
        SourceDocInfo_Type.html
        IntervalCandidateSentence_Type.html
        package-summary.html
        Token.html
        package-use.html
        Sentence.html
      - allclasses-noframe.html
      - index.html
      - stylesheet.css
      - uhh_lt
        newsleak
        resources
        package-frame.html
        class-use
        PostgresResource.html
        LanguageDetectorResource.html
        DictionaryResource.html
        DictionaryResource.Dictionary.html
        HooverResource.html
        DictionaryResource.noStemmer.html
        MetadataResource.html
        TextLineWriterResource.html
        ElasticsearchResource.html
        package-tree.html
        PostgresResource.html
        LanguageDetectorResource.html
        DictionaryResource.html
        DictionaryResource.Dictionary.html
        HooverResource.html
        DictionaryResource.noStemmer.html
        MetadataResource.html
        TextLineWriterResource.html
        package-summary.html
        package-use.html
        ElasticsearchResource.html
        annotator
        package-frame.html
        SegmenterICU.html
        NerMicroservice.html
        LanguageDetector.html
        DictionaryExtractor.html
        DictionaryExtractor.noStemmer.html
        class-use
        SegmenterICU.html
        NerMicroservice.html
        LanguageDetector.html
        DictionaryExtractor.html
        DictionaryExtractor.noStemmer.html
        KeytermExtractor.html
        HeidelTimeOpenNLP.html
        SentenceCleaner.html
        package-tree.html
        KeytermExtractor.html
        HeidelTimeOpenNLP.html
        SentenceCleaner.html
        package-summary.html
        package-use.html
        util
        package-frame.html
        class-use
        ResultSetIterable.html
        MapUtil.html
        AtomicCounter.html
        package-tree.html
        ResultSetIterable.html
        MapUtil.html
        AtomicCounter.html
        package-summary.html
        package-use.html
        types
        package-frame.html
        Metadata.html
        Paragraph_Type.html
        Paragraph.html
        class-use
        Metadata.html
        Paragraph_Type.html
        Paragraph.html
        TimeX.html
        Metadata_Type.html
        DictTerm.html
        DictTerm_Type.html
        package-tree.html
        TimeX.html
        Metadata_Type.html
        DictTerm.html
        package-summary.html
        package-use.html
        DictTerm_Type.html
        preprocessing
        package-frame.html
        NewsleakPreprocessor.html
        class-use
        NewsleakPreprocessor.html
        CreateCollection.html
        NewsleakStatusCallbackListener.html
        Postgres2ElasticsearchIndexer.NamedEntity.html
        InformationExtraction2Postgres.html
        Postgres2ElasticsearchIndexer.BulkRequestConcurrent.html
        Postgres2ElasticsearchIndexer.TimeX.html
        Postgres2ElasticsearchIndexer.html
        package-tree.html
        CreateCollection.html
        NewsleakStatusCallbackListener.html
        Postgres2ElasticsearchIndexer.NamedEntity.html
        InformationExtraction2Postgres.html
        Postgres2ElasticsearchIndexer.BulkRequestConcurrent.html
        package-summary.html
        package-use.html
        Postgres2ElasticsearchIndexer.TimeX.html
        Postgres2ElasticsearchIndexer.html
        reader
        package-frame.html
        class-use
        NewsleakCsvStreamReader.html
        NewsleakElasticsearchReader.html
        HooverElasticsearchReader.html
        NewsleakReader.html
        package-tree.html
        NewsleakCsvStreamReader.html
        NewsleakElasticsearchReader.html
        HooverElasticsearchReader.html
        package-summary.html
        package-use.html
        NewsleakReader.html
        writer
        package-frame.html
        NewsleakTimeFormatter.html
        class-use
        NewsleakTimeFormatter.html
        ElasticsearchDocumentWriter.html
        TextLineWriter.html
        PostgresDbWriter.html
        package-tree.html
        ElasticsearchDocumentWriter.html
        TextLineWriter.html
        package-summary.html
        PostgresDbWriter.html
        package-use.html
    - user-manual
      - document_tl
        index.en.htm
      - index.en.htm
      - images
        logo_der_spiegel.jpg
      - search
        index.en.htm
      - frequency
        index.en.htm
      - graphview
        index.en.htm
        display
        index.en.htm
        .DS_Store
        edit
        index.en.htm
        interaction
        index.en.htm
        settings
        index.en.htm
      - .DS_Store
      - document
        index.en.htm
        .DS_Store
        reading
        index.en.htm
        list
        index.en.htm
      - history
        index.en.htm
      - index.htm
      - settings
        index.en.htm
      - css
        styles.css
        styles_pc.css
        display.css
        styles_mac.css
        print.css
    - scaladoc
      - index
        index-p.html
        index-c.html
        index-r.html
        index-k.html
        index-i.html
        index-a.html
        index-h.html
        index-n.html
        index-w.html
        index-b.html
        index-d.html
        index-l.html
        index-u.html
        index-f.html
        index-v.html
        index-s.html
        index-o.html
        index-y.html
        index-e.html
        index-q.html
        index-g.html
        index-t.html
        index-m.html
        index-_.html
        index-j.html
      - views
        html
        index_Scope0$$index.html
        index_Scope0$.html
        index$.html
        package.html
        package.html
      - models
        Network.html
        Tag$.html
        services
        SearchClientService.html
        ESTransportClient.html
        EntityService.html
        NetworkService.html
        DBDocumentService.html
        AggregateService.html
        DBEntityService.html
        ESNetworkService.html
        ESDocumentService.html
        TimelineService.html
        DocumentService.html
        ESTimelineService.html
        ESAggregateService.html
        FinalDocumentService.html
        package.html
        IteratorSession.html
        Document$.html
        Relationship.html
        Relationship$.html
        Facets$.html
        Tag.html
        Entity$.html
        MetaDataBucket.html
        Bucket.html
        Aggregation.html
        Document.html
        NodeBucket.html
        KeyTerm$.html
        LoD$.html
        Fragment.html
        KeyTerm.html
        Facets.html
        Entity.html
        package.html
      - router
        Routes.html
        RoutesPrefix$.html
        package.html
      - util
        NewsleakConfigReader$.html
        RichString.html
        Binders$.html
        TupleWriters$.html
        SessionUtils$.html
        es
        ESRequestUtils.html
        SearchHitIterator.html
        package.html
        ESSettings.html
        package.html
        DateUtils.html
        RichString$.html
      - controllers
        routes.html
        ReverseApplication.html
        ReverseAssets.html
        Application.html
        javascript
        ReverseApplication.html
        ReverseAssets.html
        ReverseDocumentController.html
        ReverseEntityController.html
        ReverseMetadataController.html
        ReverseHistogramController.html
        package.html
        ReverseNetworkController.html
        ReverseDocumentController.html
        ReverseEntityController.html
        ReverseMetadataController.html
        ReverseHistogramController.html
        package.html
        ReverseNetworkController.html
      - scalikejdbc
        package.html
      - index.html
      - package.html
      - index.js
  - archetypes
    - default.md
- README.md
- package.json
- preprocessing
  - src
    - main
      - java
        opennlp
        uima
        Token_Type.java
        Money_Type.java
        Parse_Type.java
        Token.java
        Percentage.java
        Time_Type.java
        Person.java
        Person_Type.java
        Sentence_Type.java
        Time.java
        Parse.java
        Location.java
        Location_Type.java
        Date.java
        Money.java
        Organization_Type.java
        Chunk.java
        Sentence.java
        Date_Type.java
        Chunk_Type.java
        Organization.java
        Percentage_Type.java
        de
        unihd
        dbs
        uima
        types
        heideltime
        Token_Type.java
        Token.java
        Dct_Type.java
        SourceDocInfo.java
        Event.java
        Timex3Interval_Type.java
        GoldEvent_Type.java
        GoldEvent.java
        Sentence_Type.java
        Timex3Interval.java
        SourceDocInfo_Type.java
        Timex3_Type.java
        Sentence.java
        Dct.java
        IntervalCandidateSentence_Type.java
        Event_Type.java
        IntervalCandidateSentence.java
        Timex3.java
        uhh_lt
        newsleak
        resources
        DictionaryResource.java
        TextLineWriterResource.java
        LanguageDetectorResource.java
        PostgresResource.java
        MetadataResource.java
        HooverResource.java
        ElasticsearchResource.java
        annotator
        SegmenterICU.java
        LanguageDetector.java
        DictionaryExtractor.java
        KeytermExtractor.java
        HeidelTimeOpenNLP.java
        NerMicroservice.java
        SentenceCleaner.java
        util
        AtomicCounter.java
        ResultSetIterable.java
        MapUtil.java
        types
        DictTerm.java
        DictTerm_Type.java
        Metadata.java
        Paragraph_Type.java
        TimeX.java
        Paragraph.java
        Metadata_Type.java
        preprocessing
        InformationExtraction2Postgres.java
        CreateCollection.java
        Postgres2ElasticsearchIndexer.java
        NewsleakStatusCallbackListener.java
        NewsleakPreprocessor.java
        reader
        HooverElasticsearchReader.java
        NewsleakElasticsearchReader.java
        NewsleakReader.java
        NewsleakCsvStreamReader.java
        writer
        TextLineWriter.java
        ElasticsearchDocumentWriter.java
        NewsleakTimeFormatter.java
        PostgresDbWriter.java
  - resources
    - supportedLanguages.txt
    - .DS_Store
  - pom.xml
  - metadata
    - install.xml
  - .settings
    - org.eclipse.m2e.core.prefs
    - org.eclipse.jdt.core.prefs
    - org.eclipse.core.resources.prefs
  - data
    - document_example.csv
    - metadata.csv
    - xmi
      - 4.xmi
      - 2.xmi
      - 6.xmi
      - 5.xmi
      - 1.xmi
      - 3.xmi
    - hoover_metadata.csv.id-map
    - metadata_example.csv
    - documentLanguages.ser
    - hoover_metadata.csv.mapped
    - hoover_metadata.csv
    - document copy.csv
    - 9301
  - desc
    - postgresIndices.sql
    - HeidelTime_TypeSystem.xml
    - elasticsearch_mapping_document_2.4.json
    - HeidelTime_annotator.xml
    - postgresSchema.sql
    - NewsleakDocument.xml
    - openNLP.xml
    - elasticsearch_mapping_document_6.1.json
    - NewsleakDocumentStyleMap.xml
  - preprocessing.iml
  - conf
    - dictionaries
      - fck.ita
      - fck.all
      - spam.all
      - fck.deu
      - fck.eng
      - nsdap.all
    - newsleak.properties
    - newsleak_dev.properties
  - .project
  - .classpath
- newsleak-start.sh
- Dockerfile
- app
  - views
    - package.scala
    - index.scala.html
  - models
    - Network.scala
    - services
      - AggregateService.scala
      - NetworkService.scala
      - package.scala
      - DocumentService.scala
      - TimelineService.scala
      - KeywordNetworkService.scala
      - EntityService.scala
      - SearchClientService.scala
    - Aggregation.scala
    - package.scala
    - Document.scala
    - Entity.scala
    - KeywordRelationship.scala
    - KeyTerm.scala
    - LoD.scala
    - Tag.scala
    - Relationship.scala
    - IteratorSession.scala
    - Fragment.scala
    - KeywordNetwork.scala
    - Facets.scala
  - util
    - RichString.scala
    - package.scala
    - TupleWriters.scala
    - DateUtils.scala
    - es
      - package.scala
      - ESRequestUtils.scala
      - SearchHitIterator.scala
    - SessionUtils.scala
    - Binders.scala
    - NewsleakConfigReader.scala
  - controllers
    - KeywordNetworkController.scala
    - HistogramController.scala
    - Application.scala
    - package.scala
    - MetadataController.scala
    - DocumentController.scala
    - NetworkController.scala
    - EntityController.scala
  - assets
    - javascripts
      - services
        playRoutes.js
        underscore-module.js
        EntityService.js
        ObserverService.js
      - main.js
      - components
        network
        KeywordNetworkController.js
        GraphConfig.js
        NetworkController.js
        metadata
        MetadataController.js
        sources
        DocumentController.js
        SourceController.js
        SearchController.js
        histogram
        HistogramController.js
        HistogramXController.js
        history
        HistoryController.js
      - app.js
      - directives
        angular-vis.js
      - factory
        source
        SourceFactory.js
        metadata
        MetaFactory.js
    - stylesheets
      - style.css
- build.sbt
- .gitignore
- conf
  - application.conf
  - logback.xml
  - application.production.conf
  - routes

package uhh_lt.newsleak.writer;

import java.util.Arrays;
import java.util.Collection;
import java.util.HashMap;
import java.util.HashSet;
import org.apache.uima.UimaContext;
import org.apache.uima.analysis_engine.AnalysisEngineProcessException;
import org.apache.uima.fit.component.JCasAnnotator_ImplBase;
import org.apache.uima.fit.descriptor.ExternalResource;
import org.apache.uima.fit.descriptor.OperationalProperties;
import org.apache.uima.fit.util.JCasUtil;
import org.apache.uima.jcas.JCas;
import org.apache.uima.resource.ResourceInitializationException;
import org.apache.uima.util.Level;
import org.apache.uima.util.Logger;

import opennlp.uima.Sentence;
import opennlp.uima.Token;
import uhh_lt.newsleak.resources.TextLineWriterResource;
import uhh_lt.newsleak.types.Metadata;

/**
 * A simple writer for debug and development purposes only. It write fulltexts
 * and/or extracted entities to disk.
 * 
 * This writer is not used in any production setting.
 */
@OperationalProperties(multipleDeploymentAllowed = true, modifiesCas = false)
public class TextLineWriter extends JCasAnnotator_ImplBase {

	/** The sample id hash. */
	private HashSet<String> sampleIdHash = new HashSet<String>();

	/** The logger. */
	Logger logger;

	/** The lang stats. */
	public HashMap<String, String> langStats;

	/** The Constant RESOURCE_LINEWRITER. */
	public static final String RESOURCE_LINEWRITER = "linewriter";

	/** The linewriter. */
	@ExternalResource(key = RESOURCE_LINEWRITER)
	private TextLineWriterResource linewriter;

	/*
	 * (non-Javadoc)
	 * 
	 * @see
	 * org.apache.uima.fit.component.JCasAnnotator_ImplBase#initialize(org.apache.
	 * uima.UimaContext)
	 */
	@Override
	public void initialize(UimaContext context) throws ResourceInitializationException {
		super.initialize(context);
		langStats = new HashMap<String, String>();
		logger = context.getLogger();
		// restrict to samples
		String[] sampleIds = { "9141", "9099", "10779", "6823", "7455", "8078", "9538", "10051", "9660", "10521" };
		sampleIdHash.addAll(Arrays.asList(sampleIds));
	}

	/*
	 * (non-Javadoc)
	 * 
	 * @see
	 * org.apache.uima.analysis_component.JCasAnnotator_ImplBase#process(org.apache.
	 * uima.jcas.JCas)
	 */
	@Override
	public void process(JCas jcas) throws AnalysisEngineProcessException {

		String docText = jcas.getDocumentText();
		// Language
		String outputText = jcas.getDocumentLanguage() + "\t";

		// n sentencs
		Collection<Sentence> sentences = JCasUtil.selectCovered(jcas, Sentence.class, 0,
				jcas.getDocumentText().length());
		outputText += sentences.size() + "\t";

		// n tokens
		Collection<Token> tokens = JCasUtil.selectCovered(jcas, Token.class, 0, jcas.getDocumentText().length());
		outputText += tokens.size() + "\t";

		// pos
		String firstPOS = tokens.iterator().next().getPos();
		outputText += firstPOS + "\t";

		// text
		outputText += docText.replaceAll("\n", " ");

		// linewriter.append(outputText);

		Metadata metadata = (Metadata) jcas.getAnnotationIndex(Metadata.type).iterator().next();
		langStats.put(metadata.getDocId(), jcas.getDocumentLanguage());

		if (sampleIdHash.contains(metadata.getDocId())) {
			int i = 0;
			for (Sentence s : sentences) {
				i++;
				String sOut = metadata.getDocId() + "\t" + i + "\t";
				String tOut = "";
				for (Token t : JCasUtil.selectCovered(jcas, Token.class, s.getBegin(), s.getEnd())) {
					tOut += t.getCoveredText() + " ";
				}
				sOut += tOut.trim();
				linewriter.append(sOut);
			}
		}

	}

	/*
	 * (non-Javadoc)
	 * 
	 * @see org.apache.uima.analysis_component.AnalysisComponent_ImplBase#
	 * collectionProcessComplete()
	 */
	@Override
	public void collectionProcessComplete() throws AnalysisEngineProcessException {
		logger.log(Level.INFO, langStats.toString());
	}

}