PocketSphinx语音识别系统的安装和使用

环境： Ubuntu 12.4

CMUSphinx语音识别工具包下载
Pocketsphinx —用C语言编写的轻量级识别库，主要是进行识别的。

Sphinxbase — Pocketsphinx所需要的支持库，主要完成的是语音信号的特征提取；

Sphinx3 —为语音识别研究用C语言编写的解码器

Sphinx4 —为语音识别研究用JAVA语言编写的解码器

CMUclmtk —语言模型训练工具

Sphinxtrain —声学模型训练工具

官方地址：http://cmusphinx.sourceforge.net/
下载地址如下：http://sourceforge.net/projects/cmusphinx/files/

由于只是测试使用，故只需要下载Pocketsphinx和Sphinxbase这两个包，下载文件如下： pocketsphinx-0.8.tar.gz sphinxbase-0.8.tar.gz

1. 安装Sphinxbase

tar xvf sphinxbase-0.8.tar.gz
cd sphinxbase-0.8
./configure
sudo make
sudo make install

2. 安装pocketsphinx

配置Sphinxbase的环境变量
vi ~/.bashrc
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig

(这个PKG_CONFIG_PATH主要指明Sphinxbase的.pc文件的所在路径，这样 pkg-config工具就可以根据.pc文件的内容动态生成编译和连接选项，比如 cflags（编译用的头文件）和 libs （连接用的库）)

这个设置只对当前系统生效，编辑系统的链接文件/etc/ld.so.conf去使其长期有效，如下：

sudo vi /etc/ld.so.conf

打开后，在新的一行添加（每一个路径一行）：

/usr/local/lib

/usr/local/lib/pkgconfig

然后，执行：

sudo ldconfig
编译安装pocketsphinx:
tar xvf pocketsphinx-0.8.tar.gz
cd pocketsphinx-0.8
./configure
sudo make
sudo make install

3. 测试安装效果
pocketsphinx_continuous -infile pocketsphinx-0.8/test/data/cards/005.wav > audio.result
查询识别结果
more audio.result
000000000: eight of states for a close seven of hearts

作者： hqiang1984

量化自我，极简主义查看hqiang1984的所有文章