Speaker Recognition

avatar avatar avatar avatar

​ 使用数据集:AISHELL-ASR0009-OS1 下载

​ 模型结构参考论文 “DEEP NEURAL NETWORKS FOR SMALL FOOTPRINT TEXT-DEPENDENT“,在实现时将论文中所提出的4层DNN结构的前两层替换为两层一维卷积,训练时通过Softmax分类器进行训练,注册及验证时将Softmax层去掉,DNN的输出作为d-vector,通过计算 cosine-distance 来判别说话人是否在注册集内。