PocketSphinx语音识别系统的安装和使用

环境: Ubuntu 12.4

CMUSphinx语音识别工具包下载
Pocketsphinx —用C语言编写的轻量级识别库,主要是进行识别的。

Sphinxbase — Pocketsphinx所需要的支持库,主要完成的是语音信号的特征提取;

Sphinx3 —为语音识别研究用C语言编写的解码器

Sphinx4 —为语音识别研究用JAVA语言编写的解码器

CMUclmtk —语言模型训练工具

Sphinxtrain —声学模型训练工具

官方地址:http://cmusphinx.sourceforge.net/
下载地址如下:http://sourceforge.net/projects/cmusphinx/files/

由于只是测试使用,故只需要下载Pocketsphinx和Sphinxbase这两个包,下载文件如下: pocketsphinx-0.8.tar.gz  sphinxbase-0.8.tar.gz

1.  安装Sphinxbase

tar xvf sphinxbase-0.8.tar.gz
cd sphinxbase-0.8
./configure
sudo make
sudo make install

2. 安装pocketsphinx

配置Sphinxbase的环境变量
vi ~/.bashrc
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig

(这个PKG_CONFIG_PATH主要指明Sphinxbase的.pc文件的所在路径,这样 pkg-config工具就可以根据.pc文件的内容动态生成编译和连接选项,比如 cflags(编译用的头文件)和 libs (连接用的库))

这个设置只对当前系统生效,编辑系统的链接文件/etc/ld.so.conf去使其长期有效,如下:

sudo vi /etc/ld.so.conf

打开后,在新的一行添加(每一个路径一行):

/usr/local/lib

/usr/local/lib/pkgconfig

然后,执行:

sudo ldconfig
编译安装pocketsphinx:
tar xvf pocketsphinx-0.8.tar.gz
cd pocketsphinx-0.8
./configure
sudo make
sudo make install

3. 测试安装效果
pocketsphinx_continuous -infile pocketsphinx-0.8/test/data/cards/005.wav > audio.result
查询识别结果
more audio.result
000000000: eight of states for a close seven of hearts

作者: hqiang1984

量化自我,极简主义