python source code of epmgp

emukit-master
- .github
  - PULL_REQUEST_TEMPLATE.md
- emukit
  - multi_fidelity
    - kernels
      - __init__.py
      - linear_multi_fidelity_kernel.py
    - convert_lists_to_array.py
    - models
      - non_linear_multi_fidelity_model.py
      - linear_model.py
      - __init__.py
    - __init__.py
  - __version__.py
  - examples
    - spread_of_disease-with_seir_model
      - Emukit_task_seir_model
        sir_gillespie.py
        gillespie_analysis.py
        gillespie_base.py
        seir_gillespie.py
        __init__.py
        base_models.py
    - vanilla_bayesian_quadrature_with_rbf
      - vanilla_bq_loop_with_rbf.py
      - __init__.py
    - models
      - bohamiann.py
      - __init__.py
      - random_forest.py
    - multi_fidelity_dgp
      - multi_fidelity_deep_gp.py
      - baseline_model_wrappers.py
      - benchmarking_examples.ipynb
      - __init__.py
      - README.md
    - __init__.py
    - gp_bayesian_optimization
      - optimization_loops.py
      - single_objective_bayesian_optimization.py
      - __init__.py
      - unknown_constraint_bayesian_optimization.py
      - enums.py
    - README.md
    - emulation_mountain_car_simulator
      - mountain_car.py
    - preferential_batch_bayesian_optimization
      - installation.txt
      - minimum_working_example.py
      - pbbo
        util.py
        gp_models.py
        inferences
        vi_batch_comparison.py
        sexpgp_comparison.stan
        mcmc_batch_comparison.py
        __init__.py
        ep_batch_comparison.py
        bayesian_optimization.py
        acquisitions
        thompson_sampling_acquisition.py
        expectation_acquisition.py
        __init__.py
        acquisition_function.py
        __init__.py
      - README.md
    - fabolas
      - fmin.py
      - fabolas_model.py
      - example.py
      - continuous_fidelity_entropy_search.py
      - __init__.py
      - fabolas_loop.py
    - profet
      - train_meta_model.py
      - performance_assessment.py
      - meta_benchmarks
        meta_svm.py
        meta_fcnet.py
        meta_xgboost.py
        meta_forrester.py
        architecture.py
        meta_surrogates.py
        __init__.py
      - __init__.py
  - experimental_design
    - experimental_design_loop.py
    - acquisitions
      - integrated_variance.py
      - model_variance.py
      - __init__.py
    - __init__.py
    - interfaces
      - models.py
      - __init__.py
  - benchmarking
    - loop_benchmarking
      - benchmark_plot.py
      - metrics.py
      - benchmarker.py
      - benchmark_result.py
      - random_search.py
      - __init__.py
    - __init__.py
  - model_wrappers
    - gpy_model_wrappers.py
    - gpy_quadrature_wrappers.py
    - __init__.py
    - simple_gp_model.py
  - __init__.py
  - bayesian_optimization
    - local_penalization_calculator.py
    - epmgp.py
    - loops
      - cost_sensitive_bayesian_optimization_loop.py
      - bayesian_optimization_loop.py
      - __init__.py
      - unknown_constraint_bayesian_optimization_loop.py
    - acquisitions
      - log_acquisition.py
      - max_value_entropy_search.py
      - probability_of_feasibility.py
      - entropy_search.py
      - expected_improvement.py
      - local_penalization.py
      - negative_lower_confidence_bound.py
      - __init__.py
      - probability_of_improvement.py
    - __init__.py
    - interfaces
      - models.py
      - __init__.py
  - quadrature
    - kernels
      - integration_measures.py
      - __init__.py
      - quadrature_rbf.py
      - bounds.py
      - quadrature_kernels.py
    - loop
      - quadrature_point_calculators.py
      - bayesian_monte_carlo_loop.py
      - vanilla_bq_loop.py
      - __init__.py
    - acquisitions
      - uncertainty_sampling.py
      - squared_correlation.py
      - __init__.py
      - mutual_information.py
    - __init__.py
    - methods
      - warped_bq_model.py
      - vanilla_bq.py
      - __init__.py
    - interfaces
      - base_gp.py
      - standard_kernels.py
      - __init__.py
  - core
    - constraints.py
    - bandit_parameter.py
    - optimization
      - optimizer.py
      - anchor_points_generator.py
      - multi_source_acquisition_optimizer.py
      - gradient_acquisition_optimizer.py
      - acquisition_optimizer.py
      - __init__.py
      - local_search_acquisition_optimizer.py
      - random_search_acquisition_optimizer.py
      - context_manager.py
    - categorical_parameter.py
    - parameter_space.py
    - loop
      - stopping_conditions.py
      - user_function_result.py
      - loop_state.py
      - __init__.py
      - outer_loop.py
      - user_function.py
      - candidate_point_calculators.py
      - model_updaters.py
    - encodings.py
    - event_handler.py
    - acquisition
      - acquisition.py
      - acquisition_per_cost.py
      - __init__.py
      - integrated_acquisition.py
    - initial_designs
      - random_design.py
      - sobol_design.py
      - __init__.py
      - latin_design.py
      - base.py
    - __init__.py
    - discrete_parameter.py
    - continuous_parameter.py
    - parameter.py
    - interfaces
      - models.py
      - __init__.py
  - samplers
    - mcmc_sampler.py
    - __init__.py
  - sensitivity
    - monte_carlo
      - monte_carlo_sensitivity.py
      - __init__.py
    - __init__.py
  - test_functions
    - sixhumpcamel.py
    - multi_fidelity
      - borehole.py
      - park.py
      - __init__.py
      - branin.py
      - hartmann.py
      - currin.py
    - __init__.py
    - branin.py
    - quadrature
      - hennig1D.py
      - circular_gaussian.py
      - __init__.py
      - baselines.py
      - hennig2D.py
      - sombrero2D.py
    - forrester.py
    - non_linear_sin.py
    - sensitivity
      - ishigami.py
      - __init__.py
- readthedocs.yml
- LICENSE
- CONTRIBUTING.md
- .gitattributes
- CHANGELOG.md
- notebooks
  - Emukit-tutorial-custom-model.ipynb
  - Emukit-tutorial-bayesian-optimization-external-objective-evaluation.ipynb
  - Emukit-tutorial-how-to-write-a-notebook.ipynb
  - Emukit-tutorial-Max-Value-Entropy-Search-Example.ipynb
  - Emukit-tutorial-bayesian-optimization-context-variables.ipynb
  - Emukit-tutorial-bayesian-optimization-integrating-model-hyperparameters.ipynb
  - Emukit-Categorical-with-Tensorflow.ipynb
  - Emukit-tutorial-bayesian-optimization-benchmark.ipynb
  - Emukit-tutorial-sensitivity-montecarlo.ipynb
  - Emukit-tutorial-basic-use-of-the-library.ipynb
  - Emukit-tutorial-intro.ipynb
  - index.ipynb
- setup.py
- setup.cfg
- .travis.yml
- README.md
- tests
  - emukit
    - multi_fidelity
      - test_models.py
      - test_convert_list_to_array.py
      - test_kernels.py
      - test_non_linear_models.py
    - examples
      - test_simple_gp_model.py
    - test_acquisitions.py
    - models
      - __init__.py
    - experimental_design
      - test_integrated_variance.py
      - test_batch_experimental_design.py
      - __init__.py
      - test_experimental_design_loop.py
    - benchmarking
      - test_benchmark_result.py
      - test_benchmark_plot.py
      - test_random_search.py
      - test_metrics.py
    - bayesian_optimization
      - test_entropy_search.py
      - test_cost_sensitive_bayesian_optimization.py
      - test_constrained_loop.py
      - test_epmgp.py
      - test_bayesian_optimization_loop.py
      - __init__.py
      - test_local_penalization_calculator.py
      - test_local_penalization.py
      - test_multipoint_expected_improvement.py
    - quadrature
      - test_rbf_quadrature_kernel.py
      - ground_truth_integrals_vanilla_bq.py
      - test_quadrature_acquisitions.py
      - test_vanilla_bq.py
      - test_measures.py
      - test_integral_bounds.py
      - ground_truth_integrals_qkernel.py
    - core
      - test_parameter_space.py
      - test_loop_steps.py
      - optimization
        test_random_search_acquisition_optimizer.py
        test_optimizer.py
        test_trust_region_constrained_optimizer.py
        test_local_search_acquisition_optimizer.py
        test_anchor_points_generator.py
        test_multi_source_acquisition_optimizer.py
        test_context_manager.py
        test_gradient_acquisition_optimizer.py
        conftest.py
      - test_categorical_parameter.py
      - test_stopping_conditions.py
      - test_encodings.py
      - test_loop_state.py
      - test_parameters.py
      - test_constraints.py
      - test_user_function.py
      - test_acquisition.py
      - test_outer_loop.py
      - test_multi_source_optimizer.py
      - test_model_free_designs.py
    - sensitivity
      - test_emukit_sensitivity.py
    - conftest.py
    - test_functions
      - test_sixhumpcamel.py
      - test_circular_gaussian.py
      - test_ishigami_function.py
      - test_forrester.py
      - test_multi_fidelity_functions.py
      - test_branin.py
      - test_hennig1d.py
      - test_sombrero2d.py
      - test_nonlinear_sin.py
      - test_baselines.py
      - test_hennig2d.py
  - README.md
- CODE_OF_CONDUCT.md
- NOTICE
- .gitignore
- requirements
  - integration_test_requirements.txt
  - test_requirements.txt
  - doc_requirements.txt
  - requirements.txt
- MANIFEST.in
- doc
  - Makefile
  - vision.rst
  - usage.rst
  - api
    - emukit.experimental_design.acquisitions.rst
    - emukit.quadrature.loop.rst
    - emukit.core.initial_designs.rst
    - emukit.core.acquisition.rst
    - emukit.quadrature.methods.rst
    - emukit.quadrature.acquisitions.rst
    - emukit.quadrature.rst
    - emukit.test_functions.sensitivity.rst
    - emukit.core.interfaces.rst
    - emukit.samplers.rst
    - emukit.bayesian_optimization.acquisitions.rst
    - emukit.rst
    - emukit.test_functions.rst
    - emukit.core.rst
    - emukit.benchmarking.loop_benchmarking.rst
    - emukit.test_functions.quadrature.rst
    - emukit.bayesian_optimization.rst
    - emukit.sensitivity.rst
    - emukit.multi_fidelity.rst
    - emukit.benchmarking.rst
    - emukit.model_wrappers.rst
    - emukit.quadrature.kernels.rst
    - emukit.core.optimization.rst
    - emukit.quadrature.interfaces.rst
    - emukit.multi_fidelity.models.rst
    - emukit.experimental_design.interfaces.rst
    - emukit.test_functions.multi_fidelity.rst
    - emukit.bayesian_optimization.loops.rst
    - modules.rst
    - emukit.experimental_design.rst
    - emukit.core.loop.rst
    - emukit.multi_fidelity.kernels.rst
    - emukit.bayesian_optimization.interfaces.rst
    - emukit.sensitivity.monte_carlo.rst
  - emukit_structure.rst
  - api.rst
  - README.md
  - tutorials.rst
  - index.rst
  - conf.py
  - _static
    - Emukit_vision.svg
  - installation.rst
- integration_tests
  - emukit
    - models
      - test_random_forest.py
      - test_bohamiann.py
    - experimental_design
      - test_multi_source_experimental_design.py
      - test_experimental_design_with_categorical.py
    - benchmarking
      - test_benchmarker.py
    - notebooks
      - test_notebooks.py
    - bayesian_optimization
      - test_create_bayesian_optimization_loop.py
      - test_single_objective_bayesian_optimization.py
      - test_unknown_constraints_bayesian_optimization.py
      - test_local_penalization_loop.py
      - test_constrained_loop.py
      - test_optimization_with_categorical_variables.py
    - quadrature
      - test_vanilla_bq_loop.py
      - test_bayesian_monte_carlo_loop.py
    - fabolas
      - __init__.py
      - test_continuous_entropy_search.py
      - test_fabolas_model.py
    - profet
      - test_performance_assessment.py
      - __init__.py
  - README.md

# Copyright 2018 Amazon.com, Inc. or its affiliates. All Rights Reserved.
# SPDX-License-Identifier: Apache-2.0


import numpy as np
from scipy import special


# some variables
sq2 = np.sqrt(2)
eps = np.finfo(np.float32).eps
l2p = np.log(2) + np.log(np.pi)


def joint_min(mu: np.ndarray, var: np.ndarray, with_derivatives: bool=False) -> np.ndarray:
    """
    Computes the probability of every given point to be the minimum
    based on the EPMGP[1] algorithm.
    [1] J. Cunningham, P. Hennig, and S. Lacoste-Julien.
    Gaussian probabilities and expectation propagation.
    under review. Preprint at arXiv, November 2011.

    :param mu: Mean value of each of the N points, dims (N,).
    :param var: Covariance matrix for all points, dims (N, N).
    :param with_derivatives: If True than also the gradients are computed.
    :returns: pmin distribution, dims (N,1).
    """

    logP = np.zeros(mu.shape)
    D = mu.shape[0]
    if with_derivatives:
        dlogPdMu = np.zeros((D, D))
        dlogPdSigma = np.zeros((D, int(0.5 * D * (D + 1))))
        dlogPdMudMu = np.zeros((D, D, D))
    for i in range(mu.shape[0]):

        # logP[k] ) self._min_factor(mu, var, 0)
        a = min_factor(mu, var, i)

        logP[i] = next(a)
        if with_derivatives:
            dlogPdMu[i, :] = next(a).T
            dlogPdMudMu[i, :, :] = next(a)
            dlogPdSigma[i, :] = next(a).T

    logP[np.isinf(logP)] = -500
    # re-normalize at the end, to smooth out numerical imbalances:
    logPold = logP
    Z = np.sum(np.exp(logPold))
    maxLogP = np.max(logP)
    s = maxLogP + np.log(np.sum(np.exp(logP - maxLogP)))
    s = maxLogP if np.isinf(s) else s

    logP = logP - s
    if not with_derivatives:
        return logP

    dlogPdMuold = dlogPdMu
    dlogPdSigmaold = dlogPdSigma
    dlogPdMudMuold = dlogPdMudMu
    # adjust derivatives, too. This is a bit tedious.
    Zm = sum(np.rot90((np.exp(logPold) * np.rot90(dlogPdMuold, 1)), 3)) / Z
    Zs = sum(np.rot90((np.exp(logPold) * np.rot90(dlogPdSigmaold, 1)), 3)) / Z

    dlogPdMu = dlogPdMuold - Zm
    dlogPdSigma = dlogPdSigmaold - Zs

    ff = np.einsum('ki,kj->kij', dlogPdMuold, dlogPdMuold)
    gg = np.einsum('kij,k->ij', dlogPdMudMuold + ff, np.exp(logPold)) / Z
    Zij = Zm.T * Zm
    adds = np.reshape(-gg + Zij, (1, D, D))
    dlogPdMudMu = dlogPdMudMuold + adds
    return logP, dlogPdMu, dlogPdSigma, dlogPdMudMu


def min_factor(Mu, Sigma, k, gamma=1):
    D = Mu.shape[0]
    logS = np.zeros((D - 1,))
    # mean time first moment
    MP = np.zeros((D - 1,))

    # precision, second moment
    P = np.zeros((D - 1,))

    M = np.copy(Mu)
    V = np.copy(Sigma)
    b = False
    d = np.NaN
    for count in range(50):
        diff = 0
        for i in range(D - 1):
            l = i if i < k else i + 1  # noqa: E741 to be consistent with paper notation
            try:
                M, V, P[i], MP[i], logS[i], d = lt_factor(k, l, M, V,
                                                          MP[i], P[i], gamma)
            except Exception as e:
                raise

            if np.isnan(d):
                break
            diff += np.abs(d)
        if np.isnan(d):
            break
        if np.abs(diff) < 0.001:
            b = True
            break
    if np.isnan(d):
        logZ = -np.Infinity
        yield logZ
        dlogZdMu = np.zeros((D, 1))
        yield dlogZdMu

        dlogZdMudMu = np.zeros((D, D))
        yield dlogZdMudMu
        dlogZdSigma = np.zeros((int(0.5 * (D * (D + 1))), 1))
        yield dlogZdSigma
        mvmin = [Mu[k], Sigma[k, k]]
        yield mvmin
    else:
        # evaluate log Z:
        C = np.eye(D) / sq2
        C[k, :] = -1 / sq2
        C = np.delete(C, k, 1)

        R = np.sqrt(P.T) * C
        r = np.sum(MP.T * C, 1)
        mp_not_zero = np.where(MP != 0)
        mpm = MP[mp_not_zero] * MP[mp_not_zero] / P[mp_not_zero]
        mpm = sum(mpm)

        s = sum(logS)
        IRSR = (np.eye(D - 1) + np.dot(np.dot(R.T, Sigma), R))
        rSr = np.dot(np.dot(r.T, Sigma), r)
        A = np.dot(R, np.linalg.solve(IRSR, R.T))

        A = 0.5 * (A.T + A)  # ensure symmetry.
        b = (Mu + np.dot(Sigma, r))
        Ab = np.dot(A, b)
        try:
            cIRSR = np.linalg.cholesky(IRSR)
        except np.linalg.LinAlgError:
            try:
                cIRSR = np.linalg.cholesky(IRSR + 1e-10 * np.eye(IRSR.shape[0]))
            except np.linalg.LinAlgError:
                cIRSR = np.linalg.cholesky(IRSR + 1e-6 * np.eye(IRSR.shape[0]))
        dts = 2 * np.sum(np.log(np.diagonal(cIRSR)))
        logZ = 0.5 * (rSr - np.dot(b.T, Ab) - dts) + np.dot(Mu.T, r) + s - 0.5 * mpm
        yield logZ
        btA = np.dot(b.T, A)

        dlogZdMu = r - Ab
        yield dlogZdMu
        dlogZdMudMu = -A
        yield dlogZdMudMu
        dlogZdSigma = -A - 2 * np.outer(r, Ab.T) + np.outer(r, r.T) \
                      + np.outer(btA.T, Ab.T)
        dlogZdSigma2 = np.zeros_like(dlogZdSigma)
        np.fill_diagonal(dlogZdSigma2, np.diagonal(dlogZdSigma))
        dlogZdSigma = 0.5 * (dlogZdSigma + dlogZdSigma.T - dlogZdSigma2)
        dlogZdSigma = np.rot90(dlogZdSigma, k=2)[np.triu_indices(D)][::-1]
        yield dlogZdSigma


def lt_factor(s, l, M, V, mp, p, gamma):
    cVc = (V[l, l] - 2 * V[s, l] + V[s, s]) / 2.0
    Vc = (V[:, l] - V[:, s]) / sq2
    cM = (M[l] - M[s]) / sq2
    cVnic = np.max([cVc / (1 - p * cVc), 0])
    cmni = cM + cVnic * (p * cM - mp)
    z = cmni / np.sqrt(cVnic + 1e-25)
    if np.isnan(z):
        z = -np.inf
    e, lP, exit_flag = log_relative_gauss(z)
    if exit_flag == 0:
        alpha = e / np.sqrt(cVnic)
        # beta  = alpha * (alpha + cmni / cVnic);
        # r     = beta * cVnic / (1 - cVnic * beta);
        beta = alpha * (alpha * cVnic + cmni)
        r = beta / (1 - beta)
        # new message
        pnew = r / cVnic
        mpnew = r * (alpha + cmni / cVnic) + alpha

        # update terms
        dp = np.max([-p + eps, gamma * (pnew - p)])  # at worst, remove message
        dmp = np.max([-mp + eps, gamma * (mpnew - mp)])
        d = np.max([dmp, dp])  # for convergence measures

        pnew = p + dp
        mpnew = mp + dmp
        # project out to marginal
        Vnew = V - dp / (1 + dp * cVc) * np.outer(Vc, Vc)

        Mnew = M + (dmp - cM * dp) / (1 + dp * cVc) * Vc
        if np.any(np.isnan(Vnew)):
            raise Exception("an error occurs while running expectation "
                            "propagation in entropy search. "
                            "Resulting variance contains NaN")
        # % there is a problem here, when z is very large
        logS = lP - 0.5 * (np.log(beta) - np.log(pnew) - np.log(cVnic)) \
               + (alpha * alpha) / (2 * beta) * cVnic

    elif exit_flag == -1:
        d = np.NAN
        Mnew = 0
        Vnew = 0
        pnew = 0
        mpnew = 0
        logS = -np.Infinity
    elif exit_flag == 1:
        d = 0
        # remove message from marginal:
        # new message
        pnew = 0
        mpnew = 0
        # update terms
        dp = -p  # at worst, remove message
        dmp = -mp
        d = max([dmp, dp])  # for convergence measures
        # project out to marginal
        Vnew = V - dp / (1 + dp * cVc) * (np.outer(Vc, Vc))
        Mnew = M + (dmp - cM * dp) / (1 + dp * cVc) * Vc
        logS = 0
    return Mnew, Vnew, pnew, mpnew, logS, d


def log_relative_gauss(z):
    """
    log_relative_gauss
    """
    if z < -6:
        return 1, -1.0e12, -1
    if z > 6:
        return 0, 0, 1
    else:
        logphi = -0.5 * (z * z + l2p)
        logPhi = np.log(.5 * special.erfc(-z / sq2))
        e = np.exp(logphi - logPhi)
    return e, logPhi, 0