找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1482

积分

0

好友

194

主题
发表于 前天 03:41 | 查看: 15| 回复: 0

在嵌入式开发中,输出日志(Log)是定位问题、理解程序运行状态的核心手段。串口(UART)输出是最常见的方法,因其实现简单且多数芯片都支持。然而,在某些特定场景下,依赖串口输出Log会遇到瓶颈:

  • 拿到一款新芯片,其串口驱动尚未调通时,如何查看Log?
  • 一些对时序极其敏感的操作(如USB枚举过程),串口输出占用时间过长怎么办?
  • 某些Bug仅在特定条件下复现,一旦连接串口输出Log就“消失”了,如何捕捉?
  • 在引脚受限的封装中,串口已被复用为其他功能,或无串口外设时,如何输出Log?

针对这些实际开发中的痛点,本文将基于STM32F407平台,详细介绍四种不依赖(或部分阶段不依赖)串口的Log输出方案,并附上代码实现。

1. 输出Log信息到SRAM(内存调试法)

严格来说,这种方法并非“输出”,而是将Log暂存于芯片的SRAM中,待操作结束后通过仿真器(如J-Link、ST-LINK)直接查看内存区域。这尤其适用于无法打断点或断点会影响关键流程的调试场景。

首先,我们定义一个管理Log缓冲区的结构体:

STM32 Log设备结构体定义代码

接着,在SRAM中开辟一块区域作为环形缓冲区(Ring Buffer):

static u8 log_buffer[LOG_MAX_LEN];

环形缓冲区的优势在于,用较小的空间即可实现“无限”打印,但其缺点也显而易见:如果Log未被及时提取,就会被后续的Log覆盖。缓冲区大小可根据芯片SRAM容量灵活设置,此处示例为1KB。

为了能方便地使用printf进行格式化输出,需要在开发环境(以Keil为例)中进行如下配置,并勾选“Use MicroLIB”:

Keil环境配置MicroLIB与优化选项

同时,在代码中包含#include <stdio.h>,并重定向fputc函数,使其指向我们自定义的写入函数:

重定向fputc函数到自定义打印函数

print_ch函数负责将字符写入SRAM缓冲区:

print_ch函数:将字符写入Log缓冲区

为了更灵活地控制Log的打印(例如方便地全局关闭调试信息),可以封装一个自定义的宏:

自定义DEBUG_LOG宏,便于控制调试输出

在需要打印Log的地方调用DEBUG()宏即可。程序运行后,便可在IDE的Memory窗口中看到存储在指定地址的Log信息:

Memory窗口查看SRAM中的Log信息

这种方法简单有效,但缺点是在调试量较大时,可能来不及查看,Log就被覆盖了。为此,我们可以引入更实时的方法。

2. 通过SWO(Serial Wire Output)输出Log

SWO是ARM Cortex-M内核芯片自带的一种调试组件,它通过SWD接口的另一条线(SWO)输出数据,完全不占用CPU时间,也无需担心缓冲区被覆盖。

首先需确认硬件连接,在STM32F407 Discovery板上,SWO引脚已连接至ST-LINK,原理图如下:

STM32F407 Discovery板SWO引脚连接原理图

我们在Log设备结构体中扩展一个函数指针集,用于支持多种输出方式(如SWO、UART):

typedef struct {
    u8 (*init)(void* arg);
    u8 (*print)(u8 ch);
    u8 (*print_dma)(u8* buffer, u32 len);
} log_func;

typedef struct {
    volatile u8     type;
    u8*             buffer;
    volatile u32    write_idx;
    volatile u32    read_idx;
    //SWO
    log_func*       swo_log_func;
} log_dev;

SWO的输出函数实现非常简单,直接调用Coretex-M的ITM接口函数:

u8 swo_print_ch(u8 ch)
{
    ITM_SendChar(ch);
    return 0;
}

我们可以选择将Log先存入缓冲区,然后在系统空闲时(如在主循环中)调用输出函数输出,以平衡实时性与对代码执行时间的影响。

/*output log buffer to I/O*/
void output_ch(void) {
    u8 ch;
    volatile u32 tmp_write,tmp_read;
    tmp_write = log_dev_ptr->write_idx;
    tmp_read = log_dev_ptr->read_idx;

    if(tmp_write != tmp_read) {
        ch = log_dev_ptr->buffer[tmp_read++];
        //swo
        if(log_dev_ptr->swo_log_func)
            log_dev_ptr->swo_log_func->print(ch);
        if(tmp_read >= LOG_MAX_LEN) {
            log_dev_ptr->read_idx = 0;
        } else {
            log_dev_ptr->read_idx = tmp_read;
        }
    }
}

2.1 通过IDE(Keil/IAR)查看SWO Log

在Keil中需要配置调试器,启用Trace并设置正确的SWO时钟:

Keil调试器设置启用SWO Trace

配置完成后,运行程序即可在Debug (printf) Viewer窗口中看到实时输出的Log:

Keil Debug Viewer中显示的SWO Log

使用ST官方工具STM32 ST-LINK Utility则更为直接,打开“Printf via SWO viewer”窗口并启动即可:

ST-LINK Utility的SWO Viewer显示Log

SWO输出非常高效,但它依赖于调试器连接。对于需要长期运行或在现场进行调试的场景,我们仍需要串口方案。

3. 通过串口输出Log(含DMA优化)

前两种方法更多用于开发调试阶段,产品长期运行或现场调试,串口仍是可靠的选择。我们只需在设备结构体中增加串口的函数集:

typedef struct {
    volatile u8     type;
    u8*             buffer;
    volatile u32    write_idx;
    volatile u32    read_idx;
    volatile u32    dma_read_idx;
    //uart
    log_func*       uart_log_func;
    //SWO
    log_func*       swo_log_func;
} log_dev;

实现串口初始化及打印函数:

UART Log函数集初始化结构体

但串口输出速度慢(尤其在高波特率下仍可能成为瓶颈),长时间输出会严重阻塞CPU。为解决此问题,我们可以利用DMA(直接内存访问)技术。让DMA自动将内存中的Log数据搬运到串口发送寄存器,而CPU在此期间可以处理其他任务。

串口及DMA的初始化配置如下(以USART2, DMA1 Stream6 Channel4为例):

u8 uart_log_init(void* arg) {
    DMA_InitTypeDef DMA_InitStructure;
    u32* bound = (u32*)arg;
    //GPIO端口设置
    GPIO_InitTypeDef GPIO_InitStructure;
    USART_InitTypeDef USART_InitStructure;

    RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_GPIOA,ENABLE); //使能GPIOA时钟
    RCC_APB1PeriphClockCmd(RCC_APB1Periph_USART2,ENABLE);//使能USART2时钟
    //串口2对应引脚复用映射
    GPIO_PinAFConfig(GPIOA,GPIO_PinSource2,GPIO_AF_USART2);
    //USART2端口配置
    GPIO_InitStructure.GPIO_Pin = GPIO_Pin_2;
    GPIO_InitStructure.GPIO_Mode = GPIO_Mode_AF;//复用功能
    GPIO_InitStructure.GPIO_Speed = GPIO_Speed_50MHz;   //速度50MHz
    GPIO_InitStructure.GPIO_OType = GPIO_OType_PP; //推挽复用输出
    GPIO_InitStructure.GPIO_PuPd = GPIO_PuPd_UP; //上拉
    GPIO_Init(GPIOA,&GPIO_InitStructure);
    //USART2初始化设置
    USART_InitStructure.USART_BaudRate = *bound;//波特率设置
    USART_InitStructure.USART_WordLength = USART_WordLength_8b;//字长为8位数据格式
    USART_InitStructure.USART_StopBits = USART_StopBits_1;//一个停止位
    USART_InitStructure.USART_Parity = USART_Parity_No;//无奇偶校验位
    USART_InitStructure.USART_HardwareFlowControl = USART_HardwareFlowControl_None;//无硬件数据流控制
    USART_InitStructure.USART_Mode = USART_Mode_Tx; //收发模式
    USART_Init(USART2, &USART_InitStructure); //初始化串口1
#ifdef LOG_UART_DMA_EN
    USART_DMACmd(USART2,USART_DMAReq_Tx,ENABLE);
#endif
    USART_Cmd(USART2, ENABLE);  //使能串口1
    USART_ClearFlag(USART2, USART_FLAG_TC);
    while (USART_GetFlagStatus(USART2, USART_FLAG_TC) == RESET);
#ifdef LOG_UART_DMA_EN
    RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA1, ENABLE);
    //Config DMA channel, uart2 TX usb DMA1 Stream6 Channel
    DMA_DeInit(DMA1_Stream6);
    DMA_InitStructure.DMA_Channel = DMA_Channel_4;
    DMA_InitStructure.DMA_PeripheralBaseAddr = (uint32_t)(&USART2->DR);
    DMA_InitStructure.DMA_DIR = DMA_DIR_MemoryToPeripheral;
    DMA_InitStructure.DMA_PeripheralInc = DMA_PeripheralInc_Disable;
    DMA_InitStructure.DMA_MemoryInc = DMA_MemoryInc_Enable;
    DMA_InitStructure.DMA_PeripheralDataSize = DMA_PeripheralDataSize_Byte;
    DMA_InitStructure.DMA_MemoryDataSize = DMA_PeripheralDataSize_Byte;
    DMA_InitStructure.DMA_Mode = DMA_Mode_Normal;
    DMA_InitStructure.DMA_Priority = DMA_Priority_High;
    DMA_InitStructure.DMA_FIFOMode = DMA_FIFOMode_Disable;
    DMA_InitStructure.DMA_MemoryBurst = DMA_MemoryBurst_Single;
    DMA_InitStructure.DMA_PeripheralBurst = DMA_PeripheralBurst_Single;
    DMA_Init(DMA1_Stream6, &DMA_InitStructure);
    RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_DMA1, ENABLE);
#endif
    return 0;
}

DMA发送函数负责启动传输,示例中为查询方式,实际可改为中断方式以提高效率:

UART DMA发送函数代码

根据STM32F4的Datasheet,可以查到USART2_TX对应DMA1 Stream6 Channel4:

STM32 DMA请求映射表,标注USART2_TX通道

最终,在PC端的串口助手可以接收到清晰的Log输出:

串口助手接收到的Log信息

使用DMA输出串口Log对系统性能影响最小,且能保证及时性,是实际项目中最推荐的方式。此思路也可扩展至SPI、USB等其他支持DMA的外设。

4. 使用普通IO口模拟串口输出Log

最后一种方法适用于没有空闲串口或芯片封装无串口外设的极端情况。其原理是利用一个普通GPIO,通过精准的时序模拟UART协议波形。标准UART帧格式如下:

UART通信协议帧格式时序图

模拟的关键在于精确的比特延时,这需要借助定时器。以下代码使用TIM4产生1us基准延时(注意避免定时器冲突):

u8 simu_log_init(void* arg) {
    TIM_TimeBaseInitTypeDef TIM_InitStructure;
    u32* bound = (u32*)arg;
    //GPIO端口设置
    GPIO_InitTypeDef GPIO_InitStructure;
    RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_GPIOA,ENABLE); //使能GPIOA时钟
    GPIO_InitStructure.GPIO_Pin = GPIO_Pin_2;
    GPIO_InitStructure.GPIO_Mode = GPIO_Mode_OUT;
    GPIO_InitStructure.GPIO_Speed = GPIO_Speed_50MHz;   //速度50MHz
    GPIO_InitStructure.GPIO_OType = GPIO_OType_PP; //推挽复用输出
    GPIO_InitStructure.GPIO_PuPd = GPIO_PuPd_UP; //上拉
    GPIO_Init(GPIOA,&GPIO_InitStructure);
    GPIO_SetBits(GPIOA, GPIO_Pin_2);
    //Config TIM
    RCC_APB1PeriphClockCmd(RCC_APB1Periph_TIM4,ENABLE); //使能TIM4时钟
    TIM_DeInit(TIM4);
    TIM_InitStructure.TIM_Prescaler = 1;        //2分频
    TIM_InitStructure.TIM_CounterMode = TIM_CounterMode_Up;
    TIM_InitStructure.TIM_Period = 41;          //1us timer
    TIM_InitStructure.TIM_ClockDivision = TIM_CKD_DIV1;
    TIM_TimeBaseInit(TIM4, &TIM_InitStructure);
    TIM_ClearFlag(TIM4, TIM_FLAG_Update);
    baud_delay = 1000000/(*bound);          //根据波特率计算每个bit延时
    return 0;
}

精准延时函数:

基于定时器的微秒级延时函数

模拟发送函数。特别注意:在波形生成期间必须关闭中断,发送完毕后再打开,否则时序会被打断导致乱码。

u8 simu_print_ch(u8 ch) {
    volatile u8 i=8;
    __asm("cpsid i");
    //start bit
    GPIO_ResetBits(GPIOA, GPIO_Pin_2);
    simu_delay(baud_delay);
    while(i--) {
        if(ch & 0x01)
            GPIO_SetBits(GPIOA, GPIO_Pin_2);
        else
            GPIO_ResetBits(GPIOA, GPIO_Pin_2);
            ch >>= 1;
            simu_delay(baud_delay);
    }
    //stop bit
    GPIO_SetBits(GPIOA, GPIO_Pin_2);
    simu_delay(baud_delay);
    simu_delay(baud_delay);
    __asm("cpsie i");
    return 0;
}

这种方法仅需一个IO口,在小封装或资源极度受限的场合非常实用,是实现“无串口”打印Log的终极软件方案。

总结

本文探讨了在STM32嵌入式开发中,应对不同场景的四种Log输出方案:

  1. SRAM暂存法:适用于驱动未就绪或严禁打断的初调阶段。
  2. SWO输出法:利用内核调试组件,无损耗、实时性高,依赖调试器。
  3. 串口DMA输出法:平衡性能与便利性的最佳长期方案,对系统影响小。
  4. IO模拟串口法:在无硬件串口情况下的应急解决方案,仅需一个GPIO。

掌握这四种方法,能够让你在各种复杂的嵌入式调试环境中游刃有余。希望这些实践性的C语言代码和思路能对你的项目有所帮助。如果你有更多嵌入式调试的技巧或想法,欢迎在云栈社区与其他开发者交流探讨。




上一篇:Claude Sonnet 4.6 深度解析:200K上下文加持,AI代理与计算机操作能力再进化
下一篇:自研推理引擎两年实战:从ResNet到DeepSeek-V3,一个芯片工程师的心路历程
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-23 10:25 , Processed in 0.698986 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表