blip-master
- compile-blip.sh
- LICENSE
- api
  - src
    - main
      - resources
        clazzes
      - java
        ch
        idsia
        blip
        api
        exp
        ExpColin.java
        ExpSemClassification.java
        ExpBounds.java
        ExpK2.java
        ExpHiddenSEM.java
        ExpEntr.java
        IndependenceNewScorer.java
        ExpUKang.java
        ExpSemSimple.java
        ExpWinMine.java
        ExpBounds2.java
        ExpBDeuAlpha.java
        ExpNewWinasobs.java
        ExpSemImputationJoint2.java
        ExpSemImputation.java
        ExpTreewidth.java
        Random.java
        ExpSemImputationJoint.java
        common
        SamGeApi.java
        NetToGraphApi.java
        MarginalsApi.java
        LLEvalApi.java
        HammingDist.java
        Analyze.java
        Evaluate.java
        QueryApi.java
        old
        DivConqApi.java
        KTreeScoreApi.java
        Bda.java
        BetterNetsApi.java
        MatrixArcVisualizerApi.java
        KlDivApi.java
        learn
        solver
        AsobsSolverApi.java
        tw
        BrutalGreedySolverApi.java
        BrutalMaxSolverApi.java
        BrutalAstarSolverApi.java
        QuietMcSolverApi.java
        BrutalGreedyAdvSolverApi.java
        TwSolverApi.java
        ObsAdvSolverApi.java
        AsobsAvgSolverApi.java
        AsobsAdvSolverApi.java
        win
        WinAsobsPertSolverApi.java
        WinObsSolverApi.java
        WinObsAdvSolverApi.java
        WinAsobsImprSolverApi.java
        WinAsobsSolverApi.java
        WinAsobsAdvSolverApi.java
        WinAsobsLearningSolverApi.java
        ScoreSolverApi.java
        ObsSolverApi.java
        constraints
        PcAlgoApi.java
        missing
        SemImputationApi.java
        param
        ParLeApi.java
        ParLeSmoothApi.java
        scorer
        IndependenceScorerApi.java
        AdvK2ScorerApi.java
        ScorerApi.java
        RankScores.java
        GreedyScorerApi.java
        SeqScorerApi.java
        SeqAdvScorerApi.java
        Api.java
        Blip.java
    - test
      - java
        ExpSPN.java
        ch
        idsia
        blip
        api
        ParLeTest.java
        measure
        HammingDistTest.java
        utils
        KTreeScoreTest.java
        RankScoreTest.java
        SamGeTest.java
        NetToGraphTest.java
        TheTest.java
        common
        SamGeApiTest.java
        LLEvalTest.java
        old
        KLDivTest.java
        DivConqTest.java
        experiments
        FailComplete.java
        Normalize.java
        ExpImageRecon.java
        ExpVarsGreedy.java
        ExpUai06Big.java
        FeatureSelectionTest.java
        ExpChordalysis.java
        ExpMaj.java
        MissingFillTest.java
        ExpMax.java
        NewBrutalTest.java
        FailPowah.java
        ExpS2.java
        NetFix.java
        ExpUai06Final.java
        ExpAsobs.java
        ColinTest.java
        ExpUstat.java
        ExpNewGreedy.java
        ExpSearcherAsobs.java
        ExpUai06Small.java
        ExpBrutal.java
        ExpTreewidth.java
        InobsTest.java
        ExpParle.java
        Random.java
        ExpSampler.java
        ExpSamplerAsobs.java
        learn
        solver
        BrutalApiTest.java
        WinAsobsChecker.java
        SolverTest.java
        constraints
        PcAlgoTest.java
        missing
        SemImputationApiTest.java
        scorer
        SeqAdvScorerTest.java
        AdvK2Test.java
        IndependenceScorerTest.java
        GreedyScorerTest.java
        SeqScorerTest.java
        HammingDistanceTest.java
        VEgaTest.java
        ExpUstat.java
        RandomTestN.java
        RandomTestNewNew.java
  - pom.xml
- data
  - tmpfinal.uai
  - tmp
    - em-2.uai
    - em-1.res
    - em-1.uai
    - base.jkl
    - base.res
    - em-3.uai
    - em-2.jkl
    - em-3.jkl
    - em-2.res
    - em-1.jkl
    - em-3.res
  - child-5000.kgent.res
  - child-5000-imputed.dat
  - child-5000-missing.dat
  - child.res
  - child-5000.kmax.res
  - child-5000.jkl
  - child.kg.res
  - child-5000.dat
  - child-5000.kg.res
- README.md
- core
  - src
    - main
      - resources
        astar
        f_score.m
        buildgraph.m
        find_cliques.m
        test.m
        AstarKtree.m
      - java
        ch
        idsia
        blip
        core
        utils
        arcs
        NamedDirected.java
        Directed.java
        Arcs.java
        WeightUndirected.java
        Undirected.java
        Und.java
        graph
        UndToGraph.java
        BnSeparator.java
        UndSeparator.java
        UndirectedSeparator.java
        tw
        Dandelion.java
        KTree.java
        KTreeSampler.java
        AstarKtree.java
        TreeWidth.java
        BayesianNetwork.java
        MarkovNetwork.java
        DataSet.java
        exp
        TreeWidthExceededException.java
        CyclicGraphException.java
        ParentSet.java
        RandomStuff.java
        score
        SoftMissingBDeu.java
        BDeuWeight.java
        K2.java
        MissingBIC.java
        MIT.java
        BDeu.java
        Score.java
        BIC.java
        BDeu2.java
        DyBIC.java
        data
        PrimeFinder.java
        FastList.java
        common
        TIntCollection.java
        TDoubleCollection.java
        TPrimitiveIterator.java
        TDoubleIterator.java
        TIntIterator.java
        TIterator.java
        Constants.java
        array
        TIntList.java
        TDoubleList.java
        TDoubleArrayList.java
        TIntArrayList.java
        SIntSet.java
        HashFunctions.java
        map
        TObjectHash.java
        TCustomHashMap.java
        ArrayHashingStrategy.java
        ToObjectArrayProceedure.java
        TObjectFunction.java
        TCustomHashSet.java
        TCustomObjectHash.java
        THashIterator.java
        TObjectObjectProcedure.java
        HashingStrategy.java
        THash.java
        TObjectHashIterator.java
        TObjectProcedure.java
        THashMap.java
        TMap.java
        SShortSet.java
        hash
        TAdvancingIterator.java
        TIntIntHashMap.java
        TIntIntHash.java
        TIntIntMap.java
        TIntIntIterator.java
        TIntDoubleHash.java
        TIntDoubleMap.java
        TIntDoubleIterator.java
        TIntDoubleHashMap.java
        WIntSet.java
        set
        THashPrimitiveIterator.java
        TIntSet.java
        TIntHash.java
        THash.java
        TIntHashSet.java
        TPrimitiveHash.java
        ArrayUtils.java
        analyze
        BayesMutualInformationMatlab.java
        BayesMutualInformation.java
        Analyzer.java
        MutualInformation.java
        Entropy.java
        LogLikelihood.java
        math
        NumericalConstants.java
        FastMath.java
        FastMathCalc.java
        ChiSquare.java
        cache
        LRUCache.java
        Node.java
        matrix
        UpperMatrix.java
        cmd
        RunTimeout.java
        other
        ValueIndex.java
        DivConq.java
        SubsetIterator.java
        KLDiv.java
        StreamGobbler.java
        MersenneTwister.java
        Tuple.java
        ExpectationMaximization.java
        IncorrectCallException.java
        ParentSetQueue2.java
        BnBuilder.java
        BnGenerator.java
        ParentSetCache.java
        Gamma.java
        Worker.java
        Pair.java
        DFGenerator.java
        KTreeScore.java
        StringUtils.java
        Clique.java
        TopologicalOrder.java
        BetterNets.java
        Base.java
        common
        SamGe.java
        Query.java
        MatrixArcVisualizer.java
        NetToGraph.java
        Marginals.java
        LLEval.java
        learn
        solver
        src
        WinObsSearcher.java
        Searcher.java
        ScoreSearcher.java
        brutal
        BrutalMaxUndirectedSearcherOld.java
        BrutalOldSearcher.java
        BrutalGreedySearcher.java
        AuxSearcher.java
        BrutalUndirectedSearcher.java
        BrutalAstarSearcher.java
        BrutalMaxDirectedSearcher.java
        BrutalMaxDirectedSearcherWeight.java
        BtsSearcher.java
        BrutalMaxUndirectedSearcher.java
        BrutalNewGreedySearcher.java
        AuxObsSearcher.java
        obs
        InobsSearcher4.java
        InobsSearcher.java
        ObsSearcher.java
        ObsGreedySearcher.java
        ObsOptSearcher.java
        winasobs
        WinAsobsSearcherImprove2.java
        WinAsobsSearcherImprove.java
        WinAsobsSearcherPerturbation.java
        WinAsobsSearcherOld.java
        WinAsobsLearningSearcher.java
        WinAsobsSearcher.java
        ClOptSearcher.java
        asobs
        InAsobsSearcherOld.java
        AsobsSearcher.java
        InAsobsSearcher.java
        ObsSolver.java
        FakeSolver.java
        WinAsobsSolver.java
        samp
        SamplerUtils.java
        MISampler.java
        Sampler.java
        EntropyRSampler.java
        MIBSampler.java
        SkelSampler.java
        SimpleSampler.java
        EntropySampler.java
        MIRSampler.java
        NullSampler.java
        EntropyBSampler.java
        AsobsSolver.java
        ktree
        S2PlusSolver.java
        BaseS2Solver.java
        S2Solver.java
        AsobsAvgSolver.java
        brtl
        QuietGreedySolver.java
        BrutalSolver.java
        BrutalPcAstarSolver.java
        BrutalUndirectedSolver.java
        BrutalMaxSolver.java
        BrutalPcGreedySolver.java
        BrutalAstarSolver.java
        WinObsSolver.java
        BaseSolver.java
        WinAsobsLearningSolver.java
        ClOptSolver.java
        WinAsobsPertSolver.java
        ps
        SkelProvider.java
        Provider.java
        SimpleProvider.java
        MaxScoreProvider.java
        NullProvider.java
        SkelSolver.java
        AsobsNiceSolver.java
        ScoreSolver.java
        WinAsobsImprSolver.java
        constraints
        PcAlgo.java
        oracle
        MiOracle.java
        Oracle.java
        missing
        SemIndependenceScorer.java
        SoftMissingSEM.java
        HardMissingSEM.java
        HiddenSEM.java
        LLEvalHidden.java
        SEM.java
        HardJointMissingSEM.java
        HardSimpleMissingSEM.java
        HardMPEMissingSEM.java
        SEM2.java
        HiddenSEM2.java
        MissingIndependenceScorer.java
        feature
        IambMi.java
        IambBMi1.java
        IambBMi.java
        Iamb.java
        IambBMi3.java
        IambBMi2.java
        param
        ParLe.java
        ParLeSmooth.java
        ParLeWeight.java
        ParLeBayes.java
        ParLeOpt.java
        ParLeMissing.java
        scorer
        SeqNewScorer.java
        BaseScorer.java
        utils
        DoneParentSet.java
        OpenParentSet.java
        GreedyScorer.java
        AdvK2.java
        RankerScores.java
        concurrency
        ThreadCompleteListener.java
        NotifyingThread.java
        Executor.java
        SeqUltScorer.java
        MultiLabelScorer.java
        SeqScorer.java
        SeqAdvScorer.java
        IndependenceScorer.java
        io
        ScoreReader.java
        dat
        ArffFileLineReader.java
        DatFileLineWriter.java
        AnyFileReader.java
        ArffFileWriter.java
        DatFileReader.java
        DatFileWriter.java
        DatFileLineReader.java
        AnyFileLineReader.java
        BaseFileLineReader.java
        DataFileReader.java
        ArffFileLineWriter.java
        ArffFileReader.java
        CsvToDat.java
        DataFileLineReader.java
        DataFileWriter.java
        BaseFileLineWriter.java
        MarkovUaiReader.java
        GraphWriter.java
        bn
        BnUaiWriter.java
        BnWriter.java
        BnUaiReader.java
        BnNetWriter.java
        BnNetUtils.java
        BnErgWriter.java
        BnResReader.java
        BnErgReader.java
        BnNetReader.java
        BnMdlReader.java
        ScoreWriter.java
        GobnilpReader.java
        inference
        sample
        MarkovSampler.java
        MpeSol.java
        BayesianSampler.java
        BaseSampler.java
        BaseInference.java
        bp
        VarNode.java
        BeliefPropagation.java
        Node.java
        FactNode.java
        ve
        Simulation.java
        BayesianFactor.java
        VariableElimination.java
        samiam
        Samiam.java
        App.java
    - test
      - resources
        exp
        failcase-10000.dat
        failcase-10000.tab
        complete
        failcase-10000.dat
        failcase-10000.tab
        failcase-100000.tab
        failcase-2-ko.res
        failcase-1-ko.res
        failcase.plt
        failcase-1-ok.res
        failcase-100000.dat
        failcase-bn.net
        failcase-2-ok.res
        powah
        failcase-sc-0.99.res
        failcase-sc-0.51.res
        failcase-sc-0.60.res
        failcase-sc-0.70.res
        failcase-sc-0.80.res
        failcase-sc.plt
        failcase-sc.res
        failcase-sc-0.90.res
        failcase-bn.net
        norm
        nets
        pigs.net
        water.net
        insurance.net
        link.net
        andes.net
        random30.net
        random10.net
        alarm.net
        win95pts.net
        hepar2.net
        child.net
        random10-1.net
        random5-1.net
        hailfinder.net
        new
        random600-1.net
        pigs.net
        water.net
        insurance.net
        andes.net
        random2000-1.net
        random30.net
        random10.net
        alarm.net
        win95pts.net
        hepar2.net
        child.net
        random10-1.net
        random5-1.net
        hailfinder.net
        missing-orig-50.dat
      - java
        ch
        idsia
        blip
        core
        BayesMutualInformationTest.java
        utils
        arcs
        ArcsTest.java
        RandomStuffTest.java
        OpenParentSetQueueTest.java
        score
        MITTest.java
        BICTest.java
        BDeuTest.java
        GammaTest.java
        TreeWidthTest.java
        What.java
        learn
        solver
        ObsOptTest.java
        BrutalGreedyNewTest.java
        BrutalAstarTest.java
        BrutalGreedyTest.java
        MajRuleSearcherTest.java
        constraint
        ConstraintOrderSamplerTest.java
        PcAlgoTest.java
        scorer
        RankerScoresTest.java
        Hashtest.java
        MutualInformationTest.java
        RandomTest.java
        io
        BnNetReaderTest.java
        MarkovUaiReaderTest.java
        BnMdlReaderTest.java
        BnNetWriterTest.java
        DataFileReaderTest.java
        ScoreReaderTest.java
        BnNetTest.java
        BnErg.java
        InferenceTest.java
        sampler
        MarkovSamplerTest.java
        BayesianSamplerTest.java
        TheTest.java
  - pom.xml
- .gitignore

blip

This is the "Bayesian network Learning Improved Project" (blip), an open-source Java package that offers a wide range of structure learning algorithms. It is developed my Mauro Scanagatta and it is distributed under the LGPL-3 by IDSIA.

It focuses on score-based learning, mainly the BIC and the BDeu score functions, and allows the user to learn BNs from datasets containing thousands of variables. It provides state-of-the-art algortihms for the following tasks: parent set identification ( BIC ), general structure optimization (WINASOBS-ENT), bounded treewidth structure optimization (KMAX) and structure learning on incomplete data sets (SEM-KMAX).

An R binding is also available: (https://github.com/mauro-idsia/r.blip).

References

This package implements the algorithms detailed in the following papers:

Learning Bayesian Networks with Thousands of Variables (NIPS 2015) Mauro Scanagatta, Giorgio Corani, Cassio P. de Campos, Marco Zaffalon
Learning Treewidth-Bounded Bayesian Networks with Thousands of Variables (NIPS 2016) Mauro Scanagatta, Giorgio Corani, Cassio P. de Campos, Marco Zaffalon
Efficient learning of bounded-treewidth Bayesian networks from complete and incomplete data sets (IJAR 2018) - supplementary material
Improved Local Search in Bayesian Networks Structure Learning (AMBN 2017)
Approximated Structural Learning for Large Bayesian Networks (ECML PKDD 2018) supplementary material

Usage

The process of learning a bounded-treewidth BN is explained by using the "child" network as example.

Dataset format

The format for the initial dataset has to be the same as the file "child-5000.dat", namely a space-separated file containing:

* First line: list of variables names, separated by space;
* Second line: list of variables cardinalities, separated by space;
* Following lines: list of values taken by the variables in each datapoint, separated by space.

Parent set identification

The first step is build the parent sets score cache. The state-of-the-art approach is to use BIC* (for the BIC score):

java -jar blip.jar scorer.is -d data/child-5000.dat -j data/child-5000.jkl -t 10 -b 0

Main options:

-d VAL : Datafile input path (.dat format)
-j VAL : Parent set scores output file (.jkl format)
-t N : Maximum time limit, in seconds (default: 10)
-b N : Number of machine cores to use - if 0, all are used (default: 1)

General structure optimization

Given the parent sets score cache, now it is time to learn the structure. The state-of-the-art approach is to use WINASOBS (Windows operator applied to ASOBS) with ENT (entropy-based) ordering:

java -jar blip.jar solver.winasobs.adv -smp ent -d data/child-5000.dat -j data/child-5000.jkl -r data/child.wa.res -t 10 -b 0

Main options:

-smp VAL : Advanced sampler (possible values: std, mi, ent, r_mi, r_ent)
-d VAL : Datafile input path (.dat format)
-j N : Parent set scores input file (.jkl format)
-r VAL : Structure output file (.res format)
-t N : Maximum time limit, in seconds (default: 10)
-b N : Number of machine cores to use - if 0, all are used (default: 1)

Bounded-treewidth structure optimization

Given the parent sets score cache, it is possible to learn a structure under a bounded treewidth constraints. The state-of-the-art approach is to use k-max:

For perfoming with k-max:

java -jar blip.jar solver.kmax -w 4 -j data/child-5000.jkl -r data/child-5000.kmax.res -t 10 -b 0

Main options:

-w N : Maximum treewidth allowed
-j N : Parent set scores input file (.jkl format)
-r VAL : Structure output file (.res format)
-t N : Maximum time limit, in seconds (default: 10)
-b N : Number of machine cores to use - if 0, all are used (default: 1)

Structure learning from incomplete data sets

To learn a structure from data containing missing values the state-of-the-art approach is to use SEM-kMAX:

java -jar blip.jar imputation.sem  -d data/child-5000-missing.dat -o data/child-5000-imputed.dat -r data/child.res -t 1 -tmp data/tmp -w 6 -b 0

Main options:

-d VAL : Datafile (with missing valus) input path (.dat format)
-o VAL : Datafile (with imputed values) output path (.dat format)
-r VAL : Structure output file (.res format)
-t N : Time regulation parameter (default: 1)
-tmp VAL : Temporary directory
-w N : Learning treewidth (default: 6)
-b N : Number of machine cores to use - if 0, all are used (default: 1)

Interpreting the result

The format of the ".res" file is as follows: each line indicates the parent set assigned to each variable and its score.

For example the line "4: -2797.39 (10,17,18)" indicates that to the variable with index 4 in the dataset are assgined as parents the variables with index (10,17,18). This parent set has score -2797.39 (by default the score function is the BIC).

Learn the parameters

Using the structure found it is possible to learn the parameters with:

java -jar blip.jar parle -d data/child-5000.dat -r data/child-5000.kmax.res -n data/child-5000.kmax.uai

Main options:

-d VAL : Datafile input path (.dat format)
-r VAL : Structure input file (.res format)
-n VAL : BN output file (.uai format)

The final output will be a full Bayesian network in UAI format.