java source code of SBPRModel

jstarcraft-rns-master
- src
  - main
    - java
      - com
        jstarcraft
        rns
        utility
        LogisticUtility.java
        Trigamma.java
        GaussianUtility.java
        SearchUtility.java
        SampleUtility.java
        GammaUtility.java
        Digamma.java
        data
        processor
        AllFeatureDataSorter.java
        QuantityFeatureDataSorter.java
        QualityFeatureDataSplitter.java
        QualityFeatureDataSorter.java
        RandomDataSorter.java
        model
        ensemble
        ensemble.txt
        bandit
        bandit.txt
        Model.java
        content
        content.txt
        rating
        TopicMFATModel.java
        EFMRatingModel.java
        TopicMFMTModel.java
        HFTModel.java
        EFMModel.java
        ranking
        TFIDFModel.java
        EFMRankingModel.java
        ProbabilisticGraphicalModel.java
        collaborative
        collaborative.txt
        ItemKNNModel.java
        rating
        BUCMRatingModel.java
        CCDModel.java
        AspectModelRatingModel.java
        BHFreeRatingModel.java
        UserKNNRatingModel.java
        PMFModel.java
        RBMModel.java
        ASVDPlusPlusModel.java
        FMSGDModel.java
        MFALSModel.java
        NMFModel.java
        AutoRecModel.java
        RFRecModel.java
        AutoRecLearner.java
        BPMFModel.java
        FMALSModel.java
        ItemKNNRatingModel.java
        LDCCModel.java
        URPModel.java
        KernelSmoother.java
        GPLSAModel.java
        SVDPlusPlusModel.java
        LLORMAModel.java
        FFMModel.java
        IRRGModel.java
        LLORMALearner.java
        BiasedMFModel.java
        UserKNNModel.java
        ranking
        EALSModel.java
        BPRModel.java
        VBPRModel.java
        WBPRModel.java
        SLIMModel.java
        AoBPRModel.java
        AspectModelRankingModel.java
        LambdaFMWeightModel.java
        ItemKNNRankingModel.java
        ItemBigramModel.java
        FISMAUCModel.java
        CLiMFModel.java
        BHFreeRankingModel.java
        UserKNNRankingModel.java
        RankSGDModel.java
        HMMModel.java
        RankCDModel.java
        BUCMRankingModel.java
        RankVFCDModel.java
        GBPRModel.java
        FISMRMSEModel.java
        RankALSModel.java
        LambdaFMDynamicModel.java
        LambdaFMModel.java
        WRMFModel.java
        PLSAModel.java
        LambdaFMStaticModel.java
        ListwiseMFModel.java
        LDAModel.java
        WARPMFModel.java
        BHFreeModel.java
        BUCMModel.java
        extend
        rating
        SlopeOneModel.java
        PersonalityDiagnosisModel.java
        ranking
        PRankDModel.java
        AssociationRuleModel.java
        model.txt
        updateable.txt
        SocialModel.java
        AbstractModel.java
        context
        social.txt
        rating
        SoRegModel.java
        SoRecModel.java
        TrustMFModel.java
        TrustSVDModel.java
        SocialMFModel.java
        TimeSVDModel.java
        RSTEModel.java
        context.txt
        ranking
        SBPRModel.java
        RankGeoFMModel.java
        neuralnetwork
        AutoRecLossFunction.java
        CDAELayer.java
        AutoRecModel.java
        DeepCrossModel.java
        CDAEModel.java
        DeepFMModel.java
        neural.txt
        FMLayer.java
        exception
        ModelException.java
        FactorizationMachineModel.java
        neural network.txt
        EpocheModel.java
        MatrixFactorizationModel.java
        dl4j
        ngcf.txt
        dl4j.txt
        rating
        AutoRecModel.java
        AutoRecLearner.java
        ncf.txt
        ranking
        CDAEConfiguration.java
        CDAEParameter.java
        DeepFMProductVertex.java
        DeepFMInputConfiguration.java
        DeepFMProductConfiguration.java
        CDAELayer.java
        DeepFMSumConfiguration.java
        DeepFMSumVertex.java
        DeepFMParameter.java
        DeepFMOutputConfiguration.java
        DeepFMOutputLayer.java
        CDAEModel.java
        DeepFMModel.java
        DeepFMInputLayer.java
        NeuralNetworkModel.java
        benchmark
        rating
        GlobalAverageModel.java
        ItemClusterModel.java
        ItemAverageModel.java
        UserAverageModel.java
        ConstantGuessModel.java
        UserClusterModel.java
        RandomGuessModel.java
        ranking
        MostPopularModel.java
        svd.txt
  - test
    - resources
      - log4j2.xml
      - data
        game.properties
        ml100k.properties
        musical_instruments.properties
        dc_dense.properties
        Foursquare.properties
        filmtrust.properties
        product.properties
      - com
        jstarcraft
        rns
        script
        Model.rb
        Model.groovy
        Model.js
        Model.lua
        Model.py
      - model
        content
        tfidf-test.properties
        hft-test.properties
        efmranking-test.properties
        efmrating-test.properties
        topicmfat-test.properties
        topicmfmt-test.properties
        collaborative
        itemknnrating-test.properties
        bhfreerating-test.properties
        bucmrating-test.properties
        userknnrating-test.properties
        rating
        ffm-test.properties
        irrg-test.properties
        urp-test.properties
        rbm-test.properties
        gplsa-test.properties
        mfals-test.properties
        ldcc-test.properties
        pmf-test.properties
        rfrec-test.properties
        fmsgd-test.properties
        llorma-test.properties
        fmals-test.properties
        asvdpp-test.properties
        svdpp-test.properties
        ccd-test.properties
        nmf-test.properties
        aspectmodelrating-test.properties
        autorec-test.properties
        bpoissmf-test.properties
        bpmf-test.properties
        biasedmf-test.properties
        bucmranking-test.properties
        userknnranking-test.properties
        itemknnranking-test.properties
        bhfreeranking-test.properties
        ranking
        fismrmse-test.properties
        cdae-test.properties
        hmm-test.properties
        eals-test.properties
        bpr-test.properties
        deepfm-test.properties
        gbpr-test.properties
        listwisemf-test.properties
        slim-test.properties
        lambdafmw-test.properties
        aobpr-test.properties
        aspectmodelranking-test.properties
        wrmf-test.properties
        ranksgd-test.properties
        deepcross-test.properties
        lambdafms-test.properties
        lambdafmd-test.properties
        warpmf-test.properties
        rankcd-test.properties
        rankvfcd-test.properties
        listrankmf-test.properties
        itembigram-test.properties
        fismauc-test.properties
        wbpr-test.properties
        plsa-test.properties
        rankals-test.properties
        vbpr-test.properties
        climf-test.properties
        lda-test.properties
        extend
        slopeone-test.properties
        prankd-test.properties
        personalitydiagnosis-test.properties
        associationrule-test.properties
        external-test.properties
        context
        rating
        trustmf-test.properties
        socialmf-test.properties
        rste-test.properties
        trustsvd-test.properties
        timesvd-test.properties
        sorec-test.properties
        soreg-test.properties
        ranking
        rankgeofm-test.properties
        sbpr-test.properties
        benchmark
        constantguess-test.properties
        useraverage-test.properties
        globalaverage-test.properties
        usercluster-test.properties
        randomguess-test.properties
        mostpopular-test.properties
        itemcluster-test.properties
        itemaverage-test.properties
      - data.properties
    - java
      - com
        jstarcraft
        rns
        script
        ScriptTestCase.java
        MockDataFactory.java
        task
        AbstractTask.java
        RankingTask.java
        ConverterConfigurer.java
        SeparatorConfigurer.java
        ModuleConfigurer.java
        RatingTask.java
        utility
        SampleUtilityTestCase.java
        GammaUtilityTestCase.java
        SearchUtilityTestCase.java
        configure
        ConfigurationTestCase.java
        data
        converter
        YongfengZhangDatasetConverter.java
        YongfengZhangDatasetTestCase.java
        YongfengZhangAttributeHandler.java
        separator
        RatioSeparator.java
        GivenNumberSeparator.java
        GivenInstanceSeparator.java
        DataSeparator.java
        GivenDataSeparator.java
        LeaveOneCrossValidationSeparator.java
        RandomSeparator.java
        KFoldCrossValidationSeparator.java
        model
        content
        EFMModelTestCase.java
        ContentTestSuite.java
        rating
        TopicMFATModelTestCase.java
        TopicMFMTModelTestCase.java
        HFTModelTestCase.java
        ranking
        TFIDFModelTestCase.java
        collaborative
        rating
        FMALSModelTestCase.java
        LLORMAModelTestCase.java
        SVDPlusPlusModelTestCase.java
        ItemKNNRatingModelTestCase.java
        CCDModelTestCase.java
        FMSGDModelTestCase.java
        CollaborativeRatingTestSuite.java
        GPLSAModelTestCase.java
        NMFModelTestCase.java
        BHFreeRatingModelTestCase.java
        PMFModelTestCase.java
        URPModelTestCase.java
        AspectModelRatingModelTestCase.java
        RFRecModelTestCase.java
        LDCCModelTestCase.java
        BPMFModelTestCase.java
        BUCMRatingModelTestCase.java
        RBMModelTestCase.java
        ASVDPlusPlusModelTestCase.java
        IRRGModelTestCase.java
        BiasedMFModelTestCase.java
        MFALSModelTestCase.java
        AutoRecModelTestCase.java
        FFMModelTestCase.java
        UserKNNRatingModelTestCase.java
        CollaborativeTestSuite.java
        ranking
        DeepFMModelTestCase.java
        RankVFCDModelTestCase.java
        SLIMModelTestCase.java
        CollaborativeRankingTestSuite.java
        ItemBigramModelTestCase.java
        ItemKNNRankingModelTestCase.java
        HMMModelTestCase.java
        WARPMFModelTestCase.java
        UserKNNRankingModelTestCase.java
        CLiMFModelTestCase.java
        EALSModelTestCase.java
        ListwiseMFModelTestCase.java
        BUCMRankingModelTestCase.java
        AspectModelRankingModelTestCase.java
        CDAEModelTestCase.java
        FISMRMSEModelTestCase.java
        GBPRModelTestCase.java
        FISMAUCModelTestCase.java
        BHFreeRankingModelTestCase.java
        PLSAModelTestCase.java
        WBPRModelTestCase.java
        AoBPRModelTestCase.java
        RankSGDModelTestCase.java
        LambdaFMModelTestCase.java
        RankCDModelTestCase.java
        DeepCrossModelTestCase.java
        WRMFModelTestCase.java
        BPRModelTestCase.java
        RankALSModelTestCase.java
        LDAModelTestCase.java
        VBPRModelTestCase.java
        extend
        rating
        SlopeOneModelTestCase.java
        PersonalityDiagnosisModelTestCase.java
        ExtendTestSuite.java
        ranking
        PRankDModelTestCase.java
        AssociationRuleModelTestCase.java
        AutoRecLossFunctionTestCase.java
        context
        ContextTestSuite.java
        rating
        TrustSVDModelTestCase.java
        SocialMFModelTestCase.java
        RSTEModelTestCase.java
        TimeSVDModelTestCase.java
        SoRecModelTestCase.java
        SoRegModelTestCase.java
        TrustMFModelTestCase.java
        ranking
        SBPRModelTestCase.java
        RankGeoFMModelTestCase.java
        ModelTestCase.java
        ModelTestSuite.java
        LossFunctionTestCase.java
        dl4j
        rating
        AutoRecModelTestCase.java
        ranking
        DeepFMModelTestCase.java
        CDAEModelTestCase.java
        benchmark
        rating
        GlobalAverageModelTestCase.java
        ConstantGuessModelTestCase.java
        UserClusterModelTestCase.java
        UserAverageModelTestCase.java
        ItemClusterModelTestCase.java
        ItemAverageModelTestCase.java
        RandomGuessModelTestCase.java
        BenchmarkTestSuite.java
        ranking
        MostPopularModelTestCase.java
- pom.xml
- LICENSE
- README.md

package com.jstarcraft.rns.model.context.ranking;

import java.util.ArrayList;
import java.util.LinkedList;
import java.util.List;

import com.jstarcraft.ai.data.DataInstance;
import com.jstarcraft.ai.data.DataModule;
import com.jstarcraft.ai.data.DataSpace;
import com.jstarcraft.ai.math.structure.DefaultScalar;
import com.jstarcraft.ai.math.structure.MathCalculator;
import com.jstarcraft.ai.math.structure.vector.DenseVector;
import com.jstarcraft.ai.math.structure.vector.SparseVector;
import com.jstarcraft.ai.math.structure.vector.VectorScalar;
import com.jstarcraft.core.common.configuration.Configurator;
import com.jstarcraft.core.utility.RandomUtility;
import com.jstarcraft.rns.model.SocialModel;
import com.jstarcraft.rns.utility.LogisticUtility;

import it.unimi.dsi.fastutil.ints.IntSet;

/**
 * 
 * SBPR推荐器
 * 
 * <pre>
 * Social Bayesian Personalized Ranking (SBPR)
 * Leveraging Social Connections to Improve Personalized Ranking for Collaborative Filtering
 * 参考LibRec团队
 * </pre>
 * 
 * @author Birdy
 *
 */
// TODO 仍需重构
public class SBPRModel extends SocialModel {
    /**
     * items biases vector
     */
    private DenseVector itemBiases;

    /**
     * bias regularization
     */
    protected float regBias;

    /**
     * find items rated by trusted neighbors only
     */
    // TODO 考虑重构为List<IntSet>
    private List<List<Integer>> socialItemList;

    private List<IntSet> userItemSet;

    @Override
    public void prepare(Configurator configuration, DataModule model, DataSpace space) {
        super.prepare(configuration, model, space);
        regBias = configuration.getFloat("recommender.bias.regularization", 0.01F);
        // cacheSpec = conf.get("guava.cache.spec",
        // "maximumSize=5000,expireAfterAccess=50m");

        itemBiases = DenseVector.valueOf(itemSize);
        itemBiases.iterateElement(MathCalculator.SERIAL, (scalar) -> {
            scalar.setValue(RandomUtility.randomFloat(1F));
        });

        userItemSet = getUserItemSet(scoreMatrix);

        // TODO 考虑重构
        // find items rated by trusted neighbors only
        socialItemList = new ArrayList<>(userSize);

        for (int userIndex = 0; userIndex < userSize; userIndex++) {
            SparseVector userVector = scoreMatrix.getRowVector(userIndex);
            IntSet itemSet = userItemSet.get(userIndex);
            // find items rated by trusted neighbors only

            SparseVector socialVector = socialMatrix.getRowVector(userIndex);
            List<Integer> socialList = new LinkedList<>();
            for (VectorScalar term : socialVector) {
                int socialIndex = term.getIndex();
                userVector = scoreMatrix.getRowVector(socialIndex);
                for (VectorScalar enrty : userVector) {
                    int itemIndex = enrty.getIndex();
                    // v's rated items
                    if (!itemSet.contains(itemIndex) && !socialList.contains(itemIndex)) {
                        socialList.add(itemIndex);
                    }
                }
            }
            socialItemList.add(new ArrayList<>(socialList));
        }
    }

    @Override
    protected void doPractice() {
        for (int epocheIndex = 0; epocheIndex < epocheSize; epocheIndex++) {
            totalError = 0F;
            for (int sampleIndex = 0, sampleTimes = userSize * 100; sampleIndex < sampleTimes; sampleIndex++) {
                // uniformly draw (userIdx, posItemIdx, k, negItemIdx)
                int userIndex, positiveItemIndex, negativeItemIndex;
                // userIdx
                SparseVector userVector;
                do {
                    userIndex = RandomUtility.randomInteger(userSize);
                    userVector = scoreMatrix.getRowVector(userIndex);
                } while (userVector.getElementSize() == 0);

                // positive item index
                positiveItemIndex = userVector.getIndex(RandomUtility.randomInteger(userVector.getElementSize()));
                float positiveScore = predict(userIndex, positiveItemIndex);

                // social Items List
                // TODO 应该修改为IntSet合适点.
                List<Integer> socialList = socialItemList.get(userIndex);
                IntSet itemSet = userItemSet.get(userIndex);
                do {
                    negativeItemIndex = RandomUtility.randomInteger(itemSize);
                } while (itemSet.contains(negativeItemIndex) || socialList.contains(negativeItemIndex));
                float negativeScore = predict(userIndex, negativeItemIndex);

                if (socialList.size() > 0) {
                    // if having social neighbors
                    int itemIndex = socialList.get(RandomUtility.randomInteger(socialList.size()));
                    float socialScore = predict(userIndex, itemIndex);
                    SparseVector socialVector = socialMatrix.getRowVector(userIndex);
                    float socialWeight = 0F;
                    for (VectorScalar term : socialVector) {
                        int socialIndex = term.getIndex();
                        itemSet = userItemSet.get(socialIndex);
                        if (itemSet.contains(itemIndex)) {
                            socialWeight += 1;
                        }
                    }
                    float positiveError = (positiveScore - socialScore) / (1 + socialWeight);
                    float negativeError = socialScore - negativeScore;
                    float positiveGradient = LogisticUtility.getValue(-positiveError), negativeGradient = LogisticUtility.getValue(-negativeError);
                    float error = (float) (-Math.log(1 - positiveGradient) - Math.log(1 - negativeGradient));
                    totalError += error;

                    // update bi, bk, bj
                    float positiveBias = itemBiases.getValue(positiveItemIndex);
                    itemBiases.shiftValue(positiveItemIndex, learnRatio * (positiveGradient / (1F + socialWeight) - regBias * positiveBias));
                    totalError += regBias * positiveBias * positiveBias;
                    float socialBias = itemBiases.getValue(itemIndex);
                    itemBiases.shiftValue(itemIndex, learnRatio * (-positiveGradient / (1F + socialWeight) + negativeGradient - regBias * socialBias));
                    totalError += regBias * socialBias * socialBias;
                    float negativeBias = itemBiases.getValue(negativeItemIndex);
                    itemBiases.shiftValue(negativeItemIndex, learnRatio * (-negativeGradient - regBias * negativeBias));
                    totalError += regBias * negativeBias * negativeBias;

                    // update P, Q
                    for (int factorIndex = 0; factorIndex < factorSize; factorIndex++) {
                        float userFactor = userFactors.getValue(userIndex, factorIndex);
                        float positiveFactor = itemFactors.getValue(positiveItemIndex, factorIndex);
                        float itemFactor = itemFactors.getValue(itemIndex, factorIndex);
                        float negativeFactor = itemFactors.getValue(negativeItemIndex, factorIndex);
                        float delta = positiveGradient * (positiveFactor - itemFactor) / (1F + socialWeight) + negativeGradient * (itemFactor - negativeFactor);
                        userFactors.shiftValue(userIndex, factorIndex, learnRatio * (delta - userRegularization * userFactor));
                        itemFactors.shiftValue(positiveItemIndex, factorIndex, learnRatio * (positiveGradient * userFactor / (1F + socialWeight) - itemRegularization * positiveFactor));
                        itemFactors.shiftValue(negativeItemIndex, factorIndex, learnRatio * (negativeGradient * (-userFactor) - itemRegularization * negativeFactor));
                        delta = positiveGradient * (-userFactor / (1F + socialWeight)) + negativeGradient * userFactor;
                        itemFactors.shiftValue(itemIndex, factorIndex, learnRatio * (delta - itemRegularization * itemFactor));
                        totalError += userRegularization * userFactor * userFactor + itemRegularization * positiveFactor * positiveFactor + itemRegularization * negativeFactor * negativeFactor + itemRegularization * itemFactor * itemFactor;
                    }
                } else {
                    // if no social neighbors, the same as BPR
                    float error = positiveScore - negativeScore;
                    totalError += error;
                    float gradient = LogisticUtility.getValue(-error);

                    // update bi, bj
                    float positiveBias = itemBiases.getValue(positiveItemIndex);
                    itemBiases.shiftValue(positiveItemIndex, learnRatio * (gradient - regBias * positiveBias));
                    totalError += regBias * positiveBias * positiveBias;
                    float negativeBias = itemBiases.getValue(negativeItemIndex);
                    itemBiases.shiftValue(negativeItemIndex, learnRatio * (-gradient - regBias * negativeBias));
                    totalError += regBias * negativeBias * negativeBias;

                    // update user factors, item factors
                    for (int factorIndex = 0; factorIndex < factorSize; factorIndex++) {
                        float userFactor = userFactors.getValue(userIndex, factorIndex);
                        float positiveFactor = itemFactors.getValue(positiveItemIndex, factorIndex);
                        float negItemFactorValue = itemFactors.getValue(negativeItemIndex, factorIndex);
                        userFactors.shiftValue(userIndex, factorIndex, learnRatio * (gradient * (positiveFactor - negItemFactorValue) - userRegularization * userFactor));
                        itemFactors.shiftValue(positiveItemIndex, factorIndex, learnRatio * (gradient * userFactor - itemRegularization * positiveFactor));
                        itemFactors.shiftValue(negativeItemIndex, factorIndex, learnRatio * (gradient * (-userFactor) - itemRegularization * negItemFactorValue));
                        totalError += userRegularization * userFactor * userFactor + itemRegularization * positiveFactor * positiveFactor + itemRegularization * negItemFactorValue * negItemFactorValue;
                    }
                }
            }

            if (isConverged(epocheIndex) && isConverged) {
                break;
            }
            isLearned(epocheIndex);
            currentError = totalError;
        }
    }

    @Override
    protected float predict(int userIndex, int itemIndex) {
        DefaultScalar scalar = DefaultScalar.getInstance();
        DenseVector userVector = userFactors.getRowVector(userIndex);
        DenseVector itemVector = itemFactors.getRowVector(itemIndex);
        return itemBiases.getValue(itemIndex) + scalar.dotProduct(userVector, itemVector).getValue();
    }

    @Override
    public void predict(DataInstance instance) {
        int userIndex = instance.getQualityFeature(userDimension);
        int itemIndex = instance.getQualityFeature(itemDimension);
        instance.setQuantityMark(predict(userIndex, itemIndex));
    }

}