【B417】基于GMM模型进行说话人识别即声纹识别

2021-12-15 20:02:42      索炜达电子      905     

文件编号:B417

文件大小:4.5M

代码行数:26行(主程序)

开发环境:Python3.6

猿创承诺:该源码均通过亲自测试可正常运行

简要概述:语音识别实践课程项目—说话人识别 说话人识别是在通过说话人的语音进行说话人的识别,是将测试需要识别的语音与对应库中的说话人语音模型进行匹配的一个过程。此次设计基于GMM模型进行说话人识别即声纹识别

具体实现为首先对说话人的声音进行MFCC提取作为观察向量,利用GMM算法进行说话人的模型训练和测试识别。项目提供友好的人机交互GUI界面,更好的观测感受到识别的效率。经过测试该项目说话人识别准确率较高。

运行效果:

【B417】基于GMM模型进行说话人识别即声纹识别

目录│文件列表:

 ├ 演示视频

 │  └ 演示视频.mp4

 └ 项目源码

    ├ HHSTU_Voice

    │  ├ Code

    │  │  │ FeaturesExtractor.py

    │  │  │ GMM_EM.py

    │  │  │ GUI.py

    │  │  │ ModelsTrainer.py

    │  │  │ Modeltrain_Two.py

    │  │  │ output.wav

    │  │  │ pywav.py

    │  │  │ SpeakerIdentifier1.py

    │  │  ├ SpeakerModels

    │  │  │  │ 曲帅凱.gmm

    │  │  │  │ 李澳.gmm

    │  │  │  └ 石子怡.gmm

    │  │  └ __pycache__

    │  │     │ FeaturesExtractor.cpython-36.pyc

    │  │     │ pywav.cpython-36.pyc

    │  │     │ pywav.cpython-38.pyc

    │  │     └ SpeakerIdentifier1.cpython-36.pyc

    │  └ test

    │     │ 曲帅凱.wav

    │     │ 李澳.wav

    │     │ 李澳2.wav

    │     └ 石子怡.wav

    └ 流程图

       │ GMM模型训练.jpg

       │ GMM模型训练.vsdx

       │ MFCC提取.jpg

       │ MFCC提取.vsdx

       │ 说话测试流程.jpg

       │ 说话测试流程.vsdx

       │ 项目基本流程.jpg

       └ 项目基本流程.vsdx


TAG声纹识别
  • 9 次
  • 50 分