语音识别为嵌入式设备提供了自然的人机交互方式。本文将详细介绍如何使用意法半导体的STM32微控制器驱动ICRoute公司的LD3320语音识别芯片,涵盖硬件连接、寄存器操作以及完整的软件实现流程,帮助开发者快速构建离线语音指令识别功能。
硬件连接原理
STM32与LD3320通过并行总线连接,这是实现高速数据通信的基础。从原理图分析,关键的连接信号包括:
- 数据总线(D0-D7):使用STM32的PB5、PB4、PB3、PA15、PB9、PB8、PB7、PB6引脚,分别对应LD3320的8位并行数据线,用于读写芯片寄存器。
- 控制信号:
A0(地址/数据选择):连接至PB15,用于指示当前操作的是地址还是数据。
CS(片选):连接至PA11。
WR(写使能):连接至PA12。
RD(读使能):连接至PB14。
RST(复位):连接至PB10。
MD(模式选择):连接至PB13,配置为并行模式。
- 中断信号:
INTB连接至PB11,配置为下降沿触发的外部中断,用于通知STM32识别完成或MP3播放需要新数据。
此外,STM32的PA8引脚被配置为时钟输出(MCO),为LD3320提供外部时钟源。电源(VCC)和地(GND)需按要求连接,并建议在数字电源引脚附近添加去耦电容以保证芯片稳定工作。
核心驱动代码解析
驱动代码主要包括寄存器读写、芯片初始化、语音识别流程控制等部分。
1. 引脚与宏定义
在头文件 LD3320.h 中,首先定义了所有控制引脚和数据引脚的宏,方便操作。同时定义了一个位域结构体,用于便捷地访问一个字节数据的各个位。
#define LD3320_A0 PBout(15)
#define LD3320_RD PBout(14)
#define LD3320_WR PAout(12)
...
#define LD3320_D0 PBout(5)
#define LD3320_D1 PBout(4)
...
#define LD3320_D0_R PBin(5)
#define LD3320_D1_R PBin(4)
...
// 数据方向切换宏
#define LD3320_DATA_IN() {GPIOA->CRH&=0X0FFFFFFF;GPIOA->CRH|=(u32)8<<28;...}
#define LD3320_DATA_OUT() {GPIOA->CRH&=0X0FFFFFFF;GPIOA->CRH|=(u32)3<<28;...}
2. 寄存器读写函数
驱动的基础是正确读写LD3320的内部寄存器。写寄存器时,先写入地址,再写入数据;读寄存器时,则需先写入地址,然后读取数据,并注意数据引脚方向的切换。
void ld3320_write_reg( unsigned char address, unsigned char dataout )
{
ld3320Data=address;
LD3320_D0=bita0;LD3320_D1=bita1;... // 设置地址位
delay_us(1);
LD3320_A0 =1; // 表示当前输出的是地址
LD3320_CS = 0;
LD3320_WR = 0;
LD3320_WR = 1;
LD3320_CS = 1;
// 接着写入数据部分,将A0置0
...
}
unsigned char ld3320_read_reg( unsigned char address )
{
unsigned char datain;
// 先写入地址
...
LD3320_A0 = 0; // 准备读数据
delay_us(1);
LD3320_CS = 0;
delay_us(1);
LD3320_RD = 0;
LD3320_DATA_IN(); // 切换引脚为输入模式
delay_us(1);
// 读取数据
bita0=LD3320_D0_R;bita1=LD3320_D1_R;...
datain= ld3320Data;
LD3320_DATA_OUT(); // 恢复为输出模式
LD3320_RD = 1;
...
return datain;
}
3. 初始化与语音识别流程
完整的语音识别(ASR)流程由几个关键函数串联而成。
LD_AsrStart(): 初始化芯片进入ASR模式,配置相关寄存器。
ld3320_asr_addFixed(): 添加关键词列表。开发者需要将希望识别的短语拼音字符串和对应的结果代码写入此函数。例如,识别“打开继电器一”并返回结果代码 openRelayOne (10)。
const char sRecog[24][30] = {"xiao hui hui",
"da kai ji dian qi yi", // 对应“打开继电器一”
...};
const Order pCode[24] = {name,
openRelayOne, // 对应结果代码10
...};
// 在循环中将每个词条写入芯片
for (k=0; k<24; k++) {
ld3320_write_reg(0xc1, pCode[k] ); // 写入结果代码
ld3320_write_reg(0xc3, 0 );
ld3320_write_reg(0x08, 0x04); // 触发写入
delay_ms(1);
...
for (nAsrAddLength=0; nAsrAddLength<30; nAsrAddLength++) {
if (sRecog[k][nAsrAddLength] == 0) break;
ld3320_write_reg(0x5, sRecog[k][nAsrAddLength]); // 逐个写入拼音字符
}
ld3320_write_reg(0xb9, nAsrAddLength); // 写入词条长度
...
}
ld3320_asrun(): 启动一次识别过程。芯片开始监听麦克风输入。
- 中断处理: 当LD3320完成识别(无论成功与否),会通过INTB引脚触发STM32的外部中断。在中断服务函数
EXTI15_10_IRQHandler 中调用 ld3320_process_init() 处理结果。
- 获取结果: 处理函数会检查状态寄存器,若识别成功(
nAsrStatus=LD_ASR_FOUNDOK),则可以通过 ld3320_get_result() 读取寄存器 0xc5 获得对应的结果代码(即之前添加的 pCode[k])。
4. 主程序逻辑
主程序 main.c 中的逻辑是一个状态机,负责协调整个识别流程。
- 硬件与驱动初始化:初始化系统时钟、串口、LED、LD3320引脚,并复位和检测芯片。
- 启动识别流程:在
nAsrStatus 为 LD_ASR_NONE 时,调用 ld3320_run_asr()。该函数内部依次执行 LD_AsrStart(), ld3320_asr_addFixed(), ld3320_asrun(),并将状态置为 LD_ASR_RUNING。
- 等待与处理结果:程序主循环不断检查
nAsrStatus。当芯片中断触发并处理完毕后,此状态会被更新。
- 若变为
LD_ASR_FOUNDOK,则调用 ld3320_get_result() 获取识别出的结果代码,并通过 switch-case 分支执行相应操作(如打印指令、控制继电器等)。
- 若变为
LD_ASR_FOUNDZERO,表示未识别到有效指令,则重置状态,准备下一次识别。
- 循环监听:处理完一次识别结果后,状态重置为
LD_ASR_NONE,主循环将自动启动下一次识别流程,从而实现连续监听。
while(1)
{
if (bMp3Play!=0) // 如果正在播放MP3,则等待(本例程主要展示ASR)
continue;
switch(nAsrStatus)
{
case LD_ASR_NONE:
{
nAsrStatus=LD_ASR_RUNING;
if (ld3320_run_asr()==0) // 启动识别
{
nAsrStatus = LD_ASR_ERROR;
}
}break;
case LD_ASR_FOUNDOK:
{
nAsrRes = ld3320_get_result(); // 获取结果代码
printf("nAsrRes=%d\r\n",nAsrRes);
switch(nAsrRes) // 根据结果代码执行对应操作
{
case openRelayOne:
printf("打开继电器一\r\n");
// 这里可以添加实际控制GPIO输出高低的代码
break;
case closeRelayOne:
printf("关闭继电器一\r\n");
// 控制代码
break;
... // 其他指令
}
nAsrStatus = LD_ASR_NONE; // 重置状态,准备下次识别
}break;
case LD_ASR_FOUNDZERO:
default:
{
nAsrStatus = LD_ASR_NONE;
}break;
}
// 其他任务(如LED闪烁)
}
开发注意事项
- 时钟配置:LD3320需要外部时钟,文中使用STM32的MCO功能输出HSE时钟。需根据实际输入时钟频率,在
LD3320.h 中修改 CLK_IN 宏定义,并重新计算 LD_PLL_xx 系列PLL参数。
- 关键词设计:添加的关键词应为全拼音小写,字母间用空格分隔。识别成功率受环境噪音、发音标准度、关键词数量和复杂度影响。可参考芯片高阶手册优化词条。
- 中断处理:中断服务函数中应尽快读取状态、清除标志,避免丢失后续中断。复杂的处理可置标志位,在主循环中完成。
- 电源与PCB:模拟部分(麦克风)与数字部分电源建议隔离,并做好退耦,这对识别稳定性至关重要。
- 调试:通过串口打印关键状态(如识别结果、寄存器值)是有效的调试手段。
通过上述硬件连接和软件驱动分析,开发者可以掌握STM32与LD3320协同工作的核心机制。实际项目中,可根据需求扩展指令集,并将识别结果与具体的设备控制逻辑相结合,构建出功能丰富的离线语音交互产品。对于更复杂的系统设计和并发处理,需要深入规划任务架构。
参考资料
[1] STM32驱动LD3320进行语音识别程序及原理图, 微信公众号:mp.weixin.qq.com/s/c_5U1MsXIvUx7o5Pazweyg
版权声明:本文由 云栈社区 整理发布,版权归原作者所有。