python source code of test

nltools-master
- nltools
  - resources
    - MNI152_T1_2mm_brain_mask_no_ventricles.nii.gz
    - MNI152_T1_3mm_brain_mask_no_ventricles.nii.gz
    - covariates_example.csv
    - onsets_example_with_dur.txt
    - gm_mask_2mm.nii.gz
    - MNI152_T1_3mm_brain.nii.gz
    - MNI152_T1_3mm_brain_mask.nii.gz
    - onsets_example.txt
    - gm_mask_3mm.nii.gz
    - MNI152_T1_2mm_brain_mask.nii.gz
  - analysis.py
  - simulator.py
  - version.py
  - cross_validation.py
  - file_reader.py
  - external
    - hrf.py
    - __init__.py
    - srm.py
  - stats.py
  - mask.py
  - datasets.py
  - data
    - design_matrix.py
    - adjacency.py
    - brain_data.py
    - __init__.py
  - prefs.py
  - plotting.py
  - __init__.py
  - utils.py
  - tests
    - test_cross_validation.py
    - test_adjacency.py
    - test_utils.py
    - test_mask.py
    - test_file_reader.py
    - test_groupby.py
    - test_brain_data.py
    - matplotlibrc
    - test_analysis.py
    - test_simulator.py
    - test_stats.py
    - test_design_matrix.py
    - conftest.py
- examples
  - README.txt
  - 01_DataOperations
    - plot_mask.py
    - plot_design_matrix.py
    - README.txt
    - plot_download.py
    - plot_adjacency.py
    - plot_neurovault_io.py
  - 02_Analysis
    - plot_hyperalignment.py
    - plot_decomposition.py
    - README.txt
    - plot_univariate_regression.py
    - plot_multivariate_prediction.py
    - plot_multivariate_classification.py
    - plot_similarity_example.py
- optional-dependencies.txt
- LICENSE
- .readthedocs.yml
- setup.py
- setup.cfg
- .travis.yml
- README.md
- pytest.ini
- requirements.txt
- .gitignore
- docs
  - install.rst
  - environment.yml
  - Makefile
  - backreferences
    - nltools.data.Adjacency.mean.examples
    - nltools.data.Brain_Data.randomise.examples
    - nltools.data.Brain_Data.r_to_z.examples
    - nltools.plotting.plot_brain.examples
    - nltools.data.Brain_Data.multivariate_similarity.examples
    - nltools.stats.examples
    - nltools.mask.roi_to_brain.examples
    - nltools.data.Brain_Data.aggregate.examples
    - nltools.data.Brain_Data.bootstrap.examples
    - nltools.data.Design_Matrix.vif.examples
    - nltools.data.Brain_Data.regions.examples
    - nltools.stats.procrustes_distance.examples
    - nltools.mask.create_sphere.examples
    - nltools.analysis.Roc.plot.examples
    - nltools.data.Adjacency.plot_label_distance.examples
    - nltools.simulator.Simulator.create_cov_data.examples
    - nltools.stats.holm_bonf.examples
    - nltools.datasets.download_collection.examples
    - nltools.data.Adjacency.within_cluster_mean.examples
    - nltools.analysis.Roc.examples
    - nltools.data.Brain_Data.smooth.examples
    - nltools.data.Brain_Data.scale.examples
    - nltools.data.Brain_Data.distance.examples
    - nltools.data.Adjacency.ttest.examples
    - nltools.data.Brain_Data.similarity.examples
    - nltools.data.Groupby.split.examples
    - nltools.data.Adjacency.distance_to_similarity.examples
    - nltools.simulator.Simulator.examples
    - nltools.data.Brain_Data.upload_neurovault.examples
    - nltools.data.Design_Matrix.upsample.examples
    - nltools.simulator.Simulator.n_spheres.examples
    - nltools.data.Design_Matrix.downsample.examples
    - nltools.data.Brain_Data.find_spikes.examples
    - nltools.stats.transform_pairwise.examples
    - nltools.plotting.plot_t_brain.examples
    - nltools.plotting.dist_from_hyperplane_plot.examples
    - nltools.utils.get_resource_path.examples
    - nltools.data.Design_Matrix.convolve.examples
    - nltools.stats.upsample.examples
    - nltools.data.Brain_Data.astype.examples
    - nltools.simulator.Simulator.create_ncov_data.examples
    - nltools.data.Design_Matrix.clean.examples
    - nltools.stats.one_sample_permutation.examples
    - nltools.stats.distance_correlation.examples
    - nltools.stats.threshold.examples
    - nltools.data.Brain_Data.predict.examples
    - nltools.plotting.plot_silhouette.examples
    - nltools.data.Brain_Data.icc.examples
    - nltools.data.Adjacency.squareform.examples
    - nltools.data.Brain_Data.std.examples
    - nltools.data.Brain_Data.iplot.examples
    - nltools.data.Adjacency.bootstrap.examples
    - nltools.simulator.Simulator.to_nifti.examples
    - nltools.stats.trim.examples
    - nltools.data.Adjacency.append.examples
    - nltools.plotting.probability_plot.examples
    - nltools.utils.set_decomposition_algorithm.examples
    - nltools.stats.correlation_permutation.examples
    - nltools.datasets.examples
    - nltools.data.Design_Matrix.heatmap.examples
    - nltools.data.Adjacency.stats_label_distance.examples
    - nltools.data.Adjacency.examples
    - nltools.stats.correlation.examples
    - nltools.datasets.fetch_pain.examples
    - nltools.data.Brain_Data.write.examples
    - nltools.file_reader.examples
    - nltools.data.Groupby.examples
    - nltools.data.Brain_Data.decompose.examples
    - nltools.data.Adjacency.similarity.examples
    - nltools.plotting.plot_interactive_brain.examples
    - nltools.data.Design_Matrix.details.examples
    - nltools.stats.jackknife_permutation.examples
    - nltools.stats.fdr.examples
    - nltools.utils.examples
    - nltools.stats.regress.examples
    - nltools.plotting.scatterplot.examples
    - nltools.stats.align.examples
    - nltools.data.Brain_Data.examples
    - nltools.stats.matrix_permutation.examples
    - nltools.plotting.roc_plot.examples
    - nltools.analysis.Roc.calculate.examples
    - nltools.plotting.plot_stacked_adjacency.examples
    - nltools.data.Brain_Data.sum.examples
    - nltools.data.Groupby.combine.examples
    - nltools.data.Brain_Data.shape.examples
    - nltools.data.Brain_Data.median.examples
    - nltools.data.Brain_Data.empty.examples
    - nltools.data.Adjacency.threshold.examples
    - nltools.datasets.download_nifti.examples
    - nltools.analysis.Roc.summary.examples
    - nltools.data.Adjacency.to_graph.examples
    - nltools.data.Adjacency.similarity_to_distance.examples
    - nltools.data.Design_Matrix.add_dct_basis.examples
    - nltools.data.Brain_Data.transform_pairwise.examples
    - nltools.data.Groupby.apply.examples
    - nltools.data.Adjacency.copy.examples
    - nltools.stats.downsample.examples
    - nltools.simulator.Simulator.normal_noise.examples
    - nltools.cross_validation.set_cv.examples
    - nltools.data.Brain_Data.apply_mask.examples
    - nltools.utils.concatenate.examples
    - nltools.data.Design_Matrix.examples
    - nltools.stats.winsorize.examples
    - nltools.stats.double_center.examples
    - nltools.mask.expand_mask.examples
    - nltools.stats.two_sample_permutation.examples
    - nltools.stats.zscore.examples
    - nltools.data.Brain_Data.predict_multi.examples
    - nltools.mask.collapse_mask.examples
    - nltools.stats.procrustes.examples
    - nltools.data.Brain_Data.regress.examples
    - nltools.cross_validation.KFoldStratified.examples
    - nltools.stats.pearson.examples
    - nltools.stats.multi_threshold.examples
    - nltools.data.Adjacency.square_shape.examples
    - nltools.data.Design_Matrix.replace_data.examples
    - nltools.data.Brain_Data.align.examples
    - nltools.mask.examples
    - nltools.data.Design_Matrix.add_poly.examples
    - nltools.data.Adjacency.distance.examples
    - nltools.utils.get_anatomical.examples
    - nltools.stats.summarize_bootstrap.examples
    - nltools.data.Adjacency.plot_silhouette.examples
    - nltools.data.Adjacency.plot.examples
    - nltools.data.Adjacency.regress.examples
    - nltools.simulator.Simulator.gaussian.examples
    - nltools.stats.fisher_r_to_z.examples
    - nltools.data.Adjacency.plot_mds.examples
    - nltools.data.Adjacency.social_relations_model.examples
    - nltools.stats.calc_bpm.examples
    - nltools.simulator.Simulator.create_data.examples
    - nltools.file_reader.onsets_to_dm.examples
    - nltools.simulator.examples
    - nltools.stats.u_center.examples
    - nltools.data.Brain_Data.extract_roi.examples
    - nltools.data.Adjacency.shape.examples
    - nltools.simulator.Simulator.sphere.examples
    - nltools.data.Brain_Data.detrend.examples
    - nltools.data.Brain_Data.filter.examples
    - nltools.cross_validation.KFoldStratified.split.examples
    - nltools.data.Adjacency.std.examples
    - nltools.data.Brain_Data.plot.examples
    - nltools.stats.find_spikes.examples
    - nltools.data.Brain_Data.copy.examples
    - nltools.data.Adjacency.isempty.examples
    - nltools.datasets.fetch_localizer.examples
    - nltools.data.Brain_Data.dtype.examples
    - nltools.cross_validation.examples
    - nltools.data.Design_Matrix.zscore.examples
    - nltools.data.Brain_Data.append.examples
    - nltools.utils.set_algorithm.examples
    - nltools.data.Brain_Data.groupby.examples
    - nltools.data.Brain_Data.mean.examples
    - nltools.datasets.get_collection_image_metadata.examples
    - nltools.plotting.plot_between_label_distance.examples
    - nltools.plotting.examples
    - nltools.plotting.plot_mean_label_distance.examples
    - nltools.data.Brain_Data.to_nifti.examples
    - nltools.stats.make_cosine_basis.examples
    - nltools.data.Adjacency.write.examples
    - nltools.data.Brain_Data.isempty.examples
    - nltools.data.Brain_Data.threshold.examples
    - nltools.datasets.fetch_emotion_ratings.examples
    - nltools.data.Design_Matrix.append.examples
    - nltools.data.Brain_Data.ttest.examples
    - nltools.data.Brain_Data.standardize.examples
  - api.rst
  - index.rst
  - conf.py
  - sphinx_requirements.txt
- MANIFEST.in
- tox.ini

import os
import numpy as np
import pandas as pd
from nltools.data import Adjacency, Design_Matrix
import networkx as nx
from scipy.stats import pearsonr
from scipy.linalg import block_diag


def test_type_single(sim_adjacency_single):
    assert sim_adjacency_single.matrix_type == 'distance'
    dat_single2 = Adjacency(1-sim_adjacency_single.squareform())
    assert dat_single2.matrix_type == 'similarity'
    assert sim_adjacency_single.issymmetric

def test_type_directed(sim_adjacency_directed):
    assert not sim_adjacency_directed.issymmetric

def test_length(sim_adjacency_multiple):
    assert len(sim_adjacency_multiple) == sim_adjacency_multiple.data.shape[0]
    assert len(sim_adjacency_multiple[0]) == 1

def test_indexing(sim_adjacency_multiple):
    assert len(sim_adjacency_multiple[0]) == 1
    assert len(sim_adjacency_multiple[0:4]) == 4
    assert len(sim_adjacency_multiple[0, 2, 3]) == 3

def test_arithmetic(sim_adjacency_directed):
    assert(sim_adjacency_directed+5).data[0] == sim_adjacency_directed.data[0]+5
    assert(sim_adjacency_directed-.5).data[0] == sim_adjacency_directed.data[0]-.5
    assert(sim_adjacency_directed*5).data[0] == sim_adjacency_directed.data[0]*5
    assert np.all(np.isclose((sim_adjacency_directed + sim_adjacency_directed).data,
                             (sim_adjacency_directed*2).data))
    assert np.all(np.isclose((sim_adjacency_directed*2 - sim_adjacency_directed).data,
                             sim_adjacency_directed.data))
    np.testing.assert_almost_equal(((2*sim_adjacency_directed/2) / sim_adjacency_directed).mean(), 1, decimal=4)

def test_copy(sim_adjacency_multiple):
    assert np.all(sim_adjacency_multiple.data == sim_adjacency_multiple.copy().data)

def test_squareform(sim_adjacency_multiple):
    assert len(sim_adjacency_multiple.squareform()) == len(sim_adjacency_multiple)
    assert sim_adjacency_multiple[0].squareform().shape == sim_adjacency_multiple[0].square_shape()

def test_write_multiple(sim_adjacency_multiple, tmpdir):
    sim_adjacency_multiple.write(os.path.join(str(tmpdir.join('Test.csv'))),
                                 method='long')
    dat_multiple2 = Adjacency(os.path.join(str(tmpdir.join('Test.csv'))),
                              matrix_type='distance_flat')
    assert np.all(np.isclose(sim_adjacency_multiple.data, dat_multiple2.data))

    # Test i/o for hdf5
    sim_adjacency_multiple.write(os.path.join(str(tmpdir.join('test_write.h5'))))
    b = Adjacency(os.path.join(tmpdir.join('test_write.h5')))
    for k in ['Y', 'matrix_type', 'is_single_matrix', 'issymmetric', 'data']:
        if k == 'data':
            assert np.allclose(b.__dict__[k], sim_adjacency_multiple.__dict__[k])
        elif k == 'Y':
            assert all(b.__dict__[k].eq(sim_adjacency_multiple.__dict__[k]).values)
        else:
            assert b.__dict__[k] == sim_adjacency_multiple.__dict__[k]


def test_write_directed(sim_adjacency_directed, tmpdir):
    sim_adjacency_directed.write(os.path.join(str(tmpdir.join('Test.csv'))),
                                 method='long')
    dat_directed2 = Adjacency(os.path.join(str(tmpdir.join('Test.csv'))),
                              matrix_type='directed_flat')
    assert np.all(np.isclose(sim_adjacency_directed.data, dat_directed2.data))


def test_mean(sim_adjacency_multiple):
    assert isinstance(sim_adjacency_multiple.mean(axis=0), Adjacency)
    assert len(sim_adjacency_multiple.mean(axis=0)) == 1
    assert len(sim_adjacency_multiple.mean(axis=1)) == len(np.mean(sim_adjacency_multiple.data, axis=1))


def test_std(sim_adjacency_multiple):
    assert isinstance(sim_adjacency_multiple.std(axis=0), Adjacency)
    assert len(sim_adjacency_multiple.std(axis=0)) == 1
    assert len(sim_adjacency_multiple.std(axis=1)) == len(np.std(sim_adjacency_multiple.data, axis=1))


def test_similarity(sim_adjacency_multiple):
    n_permute = 1000
    assert len(sim_adjacency_multiple.similarity(
                sim_adjacency_multiple[0].squareform(), perm_type='1d',
                n_permute=n_permute)) == len(sim_adjacency_multiple)
    assert len(sim_adjacency_multiple.similarity(sim_adjacency_multiple[0].squareform(), perm_type='1d',
                                                 metric='pearson', n_permute=n_permute)) == len(sim_adjacency_multiple)
    assert len(sim_adjacency_multiple.similarity(sim_adjacency_multiple[0].squareform(), perm_type='1d',
                                                 metric='kendall', n_permute=n_permute)) == len(sim_adjacency_multiple)

    data2 = sim_adjacency_multiple[0].copy()
    data2.data = data2.data + np.random.randn(len(data2.data))*.1
    assert sim_adjacency_multiple[0].similarity(data2.squareform(), perm_type=None, n_permute=n_permute)['correlation'] > .5
    assert sim_adjacency_multiple[0].similarity(data2.squareform(), perm_type='1d', n_permute=n_permute)['correlation'] > .5
    assert sim_adjacency_multiple[0].similarity(data2.squareform(), perm_type='2d', n_permute=n_permute)['correlation'] > .5


def test_similarity_matrix_permutation():
    dat = np.random.multivariate_normal([2, 6], [[.5, 2], [.5, 3]], 190)
    x = Adjacency(dat[:, 0])
    y = Adjacency(dat[:, 1])
    stats = x.similarity(y, perm_type='2d', n_permute=1000)
    assert (stats['correlation'] > .4) & (stats['correlation'] < .85) & (stats['p'] < .001)
    stats = x.similarity(y, perm_type=None)
    assert (stats['correlation'] > .4) & (stats['correlation'] < .85)


def test_directed_similarity():
    dat = np.random.multivariate_normal([2, 6], [[.5, 2], [.5, 3]], 400)
    x = Adjacency(dat[:, 0].reshape(20, 20), matrix_type='directed')
    y = Adjacency(dat[:, 1].reshape(20, 20), matrix_type='directed')
    # Ignore diagonal
    stats = x.similarity(y, perm_type='1d', ignore_diagonal=True, n_permute=1000)
    assert (stats['correlation'] > .4) & (stats['correlation'] < .85) & (stats['p'] < .001)
    # Use diagonal
    stats = x.similarity(y, perm_type=None, ignore_diagonal=False)
    assert (stats['correlation'] > .4) & (stats['correlation'] < .85)
    # Error out but make usre TypeError is the reason why
    try:
        x.similarity(y, perm_type='2d')
    except TypeError as e:
        pass 


def test_distance(sim_adjacency_multiple):
    assert isinstance(sim_adjacency_multiple.distance(), Adjacency)
    assert sim_adjacency_multiple.distance().square_shape()[0] == len(sim_adjacency_multiple)


def test_ttest(sim_adjacency_multiple):
    out = sim_adjacency_multiple.ttest()
    assert len(out['t']) == 1
    assert len(out['p']) == 1
    assert out['t'].shape()[0] == sim_adjacency_multiple.shape()[1]
    assert out['p'].shape()[0] == sim_adjacency_multiple.shape()[1]
    out = sim_adjacency_multiple.ttest(permutation=True, n_permute=1000)
    assert len(out['t']) == 1
    assert len(out['p']) == 1
    assert out['t'].shape()[0] == sim_adjacency_multiple.shape()[1]
    assert out['p'].shape()[0] == sim_adjacency_multiple.shape()[1]


def test_threshold(sim_adjacency_directed):
    assert np.sum(sim_adjacency_directed.threshold(upper=.8).data == 0) == 10
    assert sim_adjacency_directed.threshold(upper=.8, binarize=True).data[0]
    assert np.sum(sim_adjacency_directed.threshold(upper='70%', binarize=True).data) == 5
    assert np.sum(sim_adjacency_directed.threshold(lower=.4, binarize=True).data) == 6


def test_graph_directed(sim_adjacency_directed):
    assert isinstance(sim_adjacency_directed.to_graph(), nx.DiGraph)


def test_graph_single(sim_adjacency_single):
    assert isinstance(sim_adjacency_single.to_graph(), nx.Graph)


def test_append(sim_adjacency_single):
    a = Adjacency()
    a = a.append(sim_adjacency_single)
    assert a.shape() == sim_adjacency_single.shape()
    a = a.append(a)
    assert a.shape() == (2, 6)


def test_bootstrap(sim_adjacency_multiple):
    n_samples = 3
    b = sim_adjacency_multiple.bootstrap('mean', n_samples=n_samples)
    assert isinstance(b['Z'], Adjacency)
    b = sim_adjacency_multiple.bootstrap('std', n_samples=n_samples)
    assert isinstance(b['Z'], Adjacency)


def test_plot(sim_adjacency_multiple):
    sim_adjacency_multiple[0].plot()
    sim_adjacency_multiple.plot()


def test_plot_mds(sim_adjacency_single):
    sim_adjacency_single.plot_mds()


def test_similarity_conversion(sim_adjacency_single):
    np.testing.assert_approx_equal(-1, pearsonr(sim_adjacency_single.data, sim_adjacency_single.distance_to_similarity().data)[0], significant=1)
    np.testing.assert_approx_equal(-1, pearsonr(sim_adjacency_single.distance_to_similarity().data, sim_adjacency_single.distance_to_similarity().similarity_to_distance().data)[0], significant=1)


def test_cluster_mean():
    test_dat = Adjacency(block_diag(np.ones((4, 4)), np.ones((4, 4))*2, np.ones((4, 4))*3), matrix_type='similarity')
    test_labels = np.concatenate([np.ones(4)*x for x in range(1, 4)])
    out = test_dat.within_cluster_mean(clusters=test_labels)
    assert np.sum(np.array([1, 2, 3])-np.array([out[x] for x in out])) == 0


def test_regression():
    # Test Adjacency Regression
    m1 = block_diag(np.ones((4, 4)), np.zeros((4, 4)), np.zeros((4, 4)))
    m2 = block_diag(np.zeros((4, 4)), np.ones((4, 4)), np.zeros((4, 4)))
    m3 = block_diag(np.zeros((4, 4)), np.zeros((4, 4)), np.ones((4, 4)))
    Y = Adjacency(m1*1+m2*2+m3*3, matrix_type='similarity')
    X = Adjacency([m1, m2, m3], matrix_type='similarity')

    stats = Y.regress(X)
    assert np.allclose(stats['beta'], np.array([1, 2, 3]))

    # Test Design_Matrix Regression
    n = 10
    d = Adjacency([block_diag(np.ones((4, 4))+np.random.randn(4, 4)*.1, np.zeros((8, 8))) for x in range(n)],
                  matrix_type='similarity')
    X = Design_Matrix(np.ones(n))
    stats = d.regress(X)
    out = stats['beta'].within_cluster_mean(clusters=['Group1']*4 + ['Group2']*8)
    assert np.allclose(np.array([out['Group1'], out['Group2']]), np.array([1, 0]), rtol=1e-01)  # np.allclose(np.sum(stats['beta']-np.array([1,2,3])),0)


def test_social_relations_model():
    data = Adjacency(np.array([[np.nan, 8, 5, 10],
                    [7, np.nan, 7, 6],
                    [8, 7, np.nan, 5],
                    [4, 5, 0, np.nan]]), matrix_type='directed')
    data2 = data.append(data)
    results1 = data.social_relations_model()
    assert isinstance(data.social_relations_model(), pd.Series)
    assert isinstance(data2.social_relations_model(), pd.DataFrame)
    assert len(results1['actor_effect']) == data.square_shape()[0]
    assert results1['relationship_effect'].shape == data.square_shape()
    np.testing.assert_approx_equal(results1['actor_variance'], 3.33, significant=2)
    np.testing.assert_approx_equal(results1['partner_variance'], 0.66, significant=2)
    np.testing.assert_approx_equal(results1['relationship_variance'], 3.33, significant=2)
    np.testing.assert_approx_equal(results1['actor_partner_correlation'], 0.22, significant=2)
    np.testing.assert_approx_equal(results1['dyadic_reciprocity_correlation'], 0.2, significant=2)

    # # Test stats_label_distance - FAILED - Need to sort this out
    # labels = np.array(['group1','group1','group2','group2'])
    # stats = dat_multiple[0].stats_label_distance(labels)
    # assert np.isclose(stats['group1']['mean'],-1*stats['group2']['mean'])

def test_isc(sim_adjacency_single):
    n_boot = 100
    for metric in ['median', 'mean']:
        stats = sim_adjacency_single.isc(metric=metric, n_bootstraps=n_boot, return_bootstraps=True)
        assert (stats['isc'] > -1) & (stats['isc'] < 1)
        assert (stats['p'] > 0) & (stats['p'] < 1)
        assert len(stats['null_distribution']) == n_boot