云栈社区»论坛 › 技术文档「 Note & Doc 」 › FreeRTOS五种内存管理方案深度解析：从heap_1到heap_5的选型指南 ...

发回帖发新帖

4546 积分	0 好友	593 主题

发消息

FreeRTOS五种内存管理方案深度解析：从heap_1到heap_5的选型指南

发表于 2026-3-11 01:16:52 | 查看: 202| 回复: 0

在资源受限的嵌入式系统中，如何高效、安全地管理内存？FreeRTOS 为我们提供了五种不同的内存管理方案（heap_1 到 heap_5），它们各有其独特的设计理念、优缺点和适用场景。理解它们的内部机制，对于构建稳定高效的嵌入式应用至关重要。

FreeRTOS 内存管理

FreeRTOS 内存管理的核心是 pvPortMalloc() 和 vPortFree() 函数，所有动态内存操作都经由这两个入口。不同的方案通过实现这两个函数，提供了截然不同的内存分配策略。

内存管理的关键考量

在评估这些方案时，我们主要关注以下几个核心指标：

碎片化：内存块被频繁分配和释放后，可用内存被分割成多个不连续的小块，导致无法分配大块连续内存。
线程安全性：在多任务环境下，内存分配操作是否受到保护，避免数据竞争。
性能开销：执行内存分配和释放操作所需的时间。
内存利用率：实际可用内存占总内存的比例。
实现复杂度：代码本身的复杂度和维护难度。

深入理解内存管理的基本原理，有助于我们更好地分析这些策略。

heap_1 分析

设计理念

heap_1 是最简单的内存管理方案，其核心思想是“只分配，不释放”。它适用于那些在系统初始化阶段分配好所有内存，之后便不再进行动态内存释放的场景。

源码实现

/* 定义堆的初始大小 */
#define configTOTAL_HEAP_SIZE        ( ( size_t ) ( 17 * 1024 ) )
static uint8_t ucHeap[ configTOTAL_HEAP_SIZE ];
static size_t xNextFreeByte = ( size_t ) 0;

void *pvPortMalloc( size_t xWantedSize )
{
void *pvReturn = NULL;
static volatile uint32_t ulCriticalNesting;

    /* 确保请求大小有效 */
    if( xWantedSize > 0 )
    {
        /* 内存对齐处理 */
        xWantedSize = ( ( xWantedSize + ( portBYTE_ALIGNMENT - 1 ) ) & ~( portBYTE_ALIGNMENT - 1 ) );

        /* 进入临界区以保证线程安全 */
        ulCriticalNesting = portSET_INTERRUPT_MASK_FROM_ISR();
        {
            /* 检查是否有足够的内存且无溢出 */
            if( ( ( xNextFreeByte + xWantedSize ) < configTOTAL_HEAP_SIZE ) &&
                ( ( xNextFreeByte + xWantedSize ) > xNextFreeByte ) )
            {
                /* 返回当前空闲内存地址 */
                pvReturn = &( ucHeap[ xNextFreeByte ] );
                /* 更新下一个空闲内存位置 */
                xNextFreeByte += xWantedSize;
            }
        }
        portCLEAR_INTERRUPT_MASK_FROM_ISR( ulCriticalNesting );
    }

    return pvReturn;
}

void vPortFree( void *pv )
{
    /* heap_1 不支持释放，此函数为空实现 */
    ( void ) pv;
    /* 断言，防止错误使用 */
    configASSERT( pv == NULL );
}

特点

指标	评价	说明
碎片化	无	只分配不释放，从根本上避免了碎片产生。
线程安全性	高	分配操作使用临界区保护，是线程安全的。
性能开销	极低	仅需移动指针和做边界检查，速度非常快。
内存利用率	中	由于不释放，已分配内存无法被重用。
实现复杂度	极低	代码非常简单，易于理解和维护。

适用场景

只有内存分配，没有内存释放需求的简单应用。
对实时性要求极高，不能容忍动态释放延迟的系统。
资源极其受限的微控制器。

heap_2 分析

设计理念

heap_2 采用了最佳适配算法，维护一个按大小排序的空闲内存块链表。它支持内存的释放，但有一个关键的局限性：不合并相邻的空闲块。

源码实现（核心部分）

/* 空闲块链表结构 */
typedef struct A_BLOCK_LINK
{
    struct A_BLOCK_LINK *pxNextFreeBlock; /* 指向下一个空闲块 */
    size_t xBlockSize;                    /* 块大小，包括块头 */
} BlockLink_t;

static uint8_t ucHeap[ configTOTAL_HEAP_SIZE ];
static BlockLink_t xStart, *pxEnd = NULL;

void *pvPortMalloc( size_t xWantedSize )
{
    BlockLink_t *pxBlock, *pxPreviousBlock, *pxNewBlockLink;
    void *pvReturn = NULL;

    if( xWantedSize > 0 )
    {
        /* 内存对齐并加上块头大小 */
        xWantedSize += heapSTRUCT_SIZE;
        xWantedSize &= ~portBYTE_ALIGNMENT_MASK;

        vTaskSuspendAll(); /* 挂起所有任务以实现临界区 */
        {
            /* 遍历链表，找到第一个足够大的空闲块（最佳适配） */
            pxPreviousBlock = &xStart;
            pxBlock = xStart.pxNextFreeBlock;
            while( ( pxBlock->xBlockSize < xWantedSize ) && ( pxBlock->pxNextFreeBlock != NULL ) )
            {
                pxPreviousBlock = pxBlock;
                pxBlock = pxBlock->pxNextFreeBlock;
            }

            /* 如果找到合适的块，且剩余空间足够大，则分割块 */
            if( ( pxBlock->xBlockSize - xWantedSize ) > ( heapMINIMUM_BLOCK_SIZE + heapSTRUCT_SIZE ) )
            {
                pxNewBlockLink = ( BlockLink_t * )( ( ( uint8_t * ) pxBlock ) + xWantedSize );
                pxNewBlockLink->xBlockSize = pxBlock->xBlockSize - xWantedSize;
                pxNewBlockLink->pxNextFreeBlock = pxBlock->pxNextFreeBlock;

                pxBlock->xBlockSize = xWantedSize;
                pxBlock->pxNextFreeBlock = pxNewBlockLink;
            }

            /* 从空闲链表中移除该块 */
            pxPreviousBlock->pxNextFreeBlock = pxBlock->pxNextFreeBlock;
        }
        xTaskResumeAll();

        /* 返回给用户的是有效数据区地址（跳过块头） */
        pvReturn = ( void * )( ( ( uint8_t * ) pxBlock ) + heapSTRUCT_SIZE );
    }
    return pvReturn;
}

void vPortFree( void *pv )
{
    if( pv != NULL )
    {
        uint8_t *puc = ( uint8_t * ) pv;
        BlockLink_t *pxLink;

        puc -= heapSTRUCT_SIZE; /* 定位到块头 */
        pxLink = ( BlockLink_t * ) puc;

        vTaskSuspendAll();
        {
            /* 将释放的块按大小顺序插回空闲链表 */
            prvInsertBlockIntoFreeList( pxLink );
        }
        xTaskResumeAll();
    }
}

特点

指标	评价	说明
碎片化	高	由于不合并相邻空闲块，随着不同大小内存块的频繁分配释放，极易产生外部碎片。
线程安全性	高	使用临界区保护。
性能开销	中	分配需要遍历链表查找最佳块，释放需要排序插入，有一定开销。
内存利用率	中	支持释放和重用，但高碎片化会降低长期利用率。
实现复杂度	中	需要维护有序链表，比 heap_1 复杂。

适用场景

有内存分配和释放需求，但内存块大小相对固定的应用。
系统运行时间不长，或者分配释放模式不会导致严重碎片的场景。
注意：由于碎片问题严重，heap_2 现在已不推荐使用，通常被 heap_4 替代。

heap_3 分析

设计理念

heap_3 的设计非常直接：它仅仅是对标准 C 库 malloc() 和 free() 函数的一层简单包装，并利用 FreeRTOS 的临界区机制确保了这些动态内存操作的线程安全性。

源码实现

void *pvPortMalloc( size_t xWantedSize )
{
    void *pvReturn;

    vTaskSuspendAll(); /* 进入临界区 */
    {
        pvReturn = malloc( xWantedSize ); /* 直接调用标准库 */
        traceMALLOC( pvReturn, xWantedSize );
    }
    ( void ) xTaskResumeAll();

    #if ( configUSE_MALLOC_FAILED_HOOK == 1 )
    {
        if( pvReturn == NULL )
        {
            extern void vApplicationMallocFailedHook( void );
            vApplicationMallocFailedHook();
        }
    }
    #endif

    return pvReturn;
}

void vPortFree( void *pv )
{
    if( pv )
    {
        vTaskSuspendAll();
        {
            free( pv ); /* 直接调用标准库 */
            traceFREE( pv, 0 );
        }
        ( void ) xTaskResumeAll();
    }
}

特点

指标	评价	说明
碎片化	取决于标准库	完全依赖底层编译器提供的 C 库实现，其算法决定了碎片化程度。
线程安全性	高	通过挂起任务实现临界区，保证了线程安全。
性能开销	取决于标准库	通常比 FreeRTOS 自带的方案更慢，且不确定性更高。
内存利用率	取决于标准库	由 C 库的内存管理算法决定。
实现复杂度	极低	几乎没有自己的实现，只是简单的封装。

适用场景

对内存管理没有特殊要求，且开发平台提供了可靠 C 库的场合。
快速原型开发阶段，用于验证逻辑。
需要与大量使用标准库 malloc/free 的第三方代码集成的项目。

heap_4 分析

设计理念

heap_4 在 heap_2 的基础上做出了关键改进：支持相邻空闲块的合并。它同样使用最佳适配算法和有序链表，但在释放内存时，会检查并合并物理地址相邻的空闲块，从而有效对抗内存碎片化。

源码实现（关键改进：块合并）

static void prvInsertBlockIntoFreeList( BlockLink_t *pxBlockToInsert )
{
    BlockLink_t *pxIterator;
    uint8_t *puc;

    /* 查找插入位置（按大小排序） */
    for( pxIterator = &xStart; pxIterator->pxNextFreeBlock != NULL; pxIterator = pxIterator->pxNextFreeBlock )
    {
        if( pxIterator->pxNextFreeBlock->xBlockSize > pxBlockToInsert->xBlockSize )
        {
            break;
        }
    }

    /* **关键：检查是否能与后面的块合并** */
    puc = ( uint8_t * ) pxIterator->pxNextFreeBlock;
    if( ( puc + pxIterator->pxNextFreeBlock->xBlockSize ) == ( uint8_t * ) pxBlockToInsert )
    {
        pxBlockToInsert->xBlockSize += pxIterator->pxNextFreeBlock->xBlockSize;
        pxBlockToInsert->pxNextFreeBlock = pxIterator->pxNextFreeBlock->pxNextFreeBlock;
    }
    else
    {
        pxBlockToInsert->pxNextFreeBlock = pxIterator->pxNextFreeBlock;
    }

    /* **关键：检查是否能与前一个块合并** */
    puc = ( uint8_t * ) pxIterator;
    if( ( puc + pxIterator->xBlockSize ) == ( uint8_t * ) pxBlockToInsert )
    {
        pxIterator->xBlockSize += pxBlockToInsert->xBlockSize;
        pxIterator->pxNextFreeBlock = pxBlockToInsert->pxNextFreeBlock;
    }
    else
    {
        pxIterator->pxNextFreeBlock = pxBlockToInsert;
    }
}

特点

指标	评价	说明
碎片化	低	合并机制能有效减少外部碎片，是长期运行系统的首选。
线程安全性	高	使用临界区保护。
性能开销	中	比 heap_2 略高，因为释放时需要检查并执行合并操作。
内存利用率	高	支持释放、合并与重用，内存利用率很高。
实现复杂度	中	需要处理块合并的逻辑，比 heap_2 稍复杂。

适用场景

绝大多数需要动态内存管理的 FreeRTOS 项目，尤其是需要长期稳定运行的系统。
内存分配和释放模式不可预测，容易产生碎片的场景。
对内存利用率和系统长期稳定性有较高要求的应用。

heap_5 分析

设计理念

heap_5 继承了 heap_4 的所有优点（如最佳适配、块合并），并增加了一个强大功能：可以管理多个非连续的内存区域。这意味着堆内存可以来源于芯片内部的 SRAM、外部的 SDRAM 等多个物理上不连续的空间。

源码实现（核心：多区域初始化）

/* 内存区域描述结构体 */
typedef struct HeapRegion
{
    uint8_t *pucStartAddress; /* 内存区域起始地址 */
    size_t xSizeInBytes;      /* 内存区域大小 */
} HeapRegion_t;

/* 必须在使用前调用此初始化函数 */
void vPortDefineHeapRegions( const HeapRegion_t * const pxRegions )
{
    size_t xTotalRegionSize = 0;
    const HeapRegion_t *pxRegion = pxRegions;
    uint8_t *pucAlignedHeap;

    configASSERT( pxRegions != NULL );

    vTaskSuspendAll();
    {
        while( pxRegion->xSizeInBytes > 0 )
        {
            /* 对齐内存区域起始地址 */
            pucAlignedHeap = ( uint8_t * )( ( ( portPOINTER_SIZE_TYPE ) pxRegion->pucStartAddress + ( portBYTE_ALIGNMENT - 1 ) ) & ~( portBYTE_ALIGNMENT_MASK ) );

            /* 将该区域初始化为一个大空闲块，并链接到全局空闲链表 */
            prvInitFreeBlockHeap( pucAlignedHeap, pxRegion->xSizeInBytes - ( pucAlignedHeap - pxRegion->pucStartAddress ) );

            xTotalRegionSize += pxRegion->xSizeInBytes;
            pxRegion++;
        }
    }
    xTaskResumeAll();
}

分配 (pvPortMalloc) 和释放 (vPortFree) 函数与 heap_4 逻辑类似，但需要在多个内存区域构成的“大堆”中操作。

特点

指标	评价	说明
碎片化	低	具备 `heap_4` 的块合并能力，能有效管理各区域内的碎片。
线程安全性	高	使用临界区保护。
性能开销	中	与 `heap_4` 相当，管理多个区域带来的额外开销很小。
内存利用率	高	能够利用系统中所有可用的、可能不连续的内存，利用率最高。
实现复杂度	高	初始化配置稍复杂，需要定义内存区域数组。

适用场景

内存资源分布在内部 RAM 和外部 RAM 的复杂芯片。
系统中存在多个物理上隔离的内存块需要统一管理。
需要灵活扩展堆内存大小的应用。

针对特定场景的优化方案

除了标准方案，在面对极端场景时，我们还可以基于现有方案进行深度优化。

场景一：长期运行的多任务系统

挑战：长期运行导致内存碎片化积累；频繁且不可预测的内存分配/释放；对系统数月甚至数年的稳定性要求极高。

优化思路：在 heap_4 的基础上，增加主动碎片整理和增强监控。

/* 扩展块头，增加状态标记和统计 */
typedef struct A_BLOCK_LINK_ENHANCED
{
    struct A_BLOCK_LINK_ENHANCED *pxNextFreeBlock;
    size_t xBlockSize;
    uint8_t ucBlockState; /* 块状态标记 */
    uint32_t ulAllocCount; /* 分配次数统计 */
} BlockLinkEnhanced_t;

/* 周期性内存碎片整理函数 */
static void prvDefragmentHeap( void )
{
    BlockLinkEnhanced_t *pxIterator;
    uint8_t *pucCurrent, *pucNext;

    for( pxIterator = &xStart; pxIterator->pxNextFreeBlock != NULL; )
    {
        pucCurrent = ( uint8_t * ) pxIterator;
        pucNext = ( uint8_t * ) pxIterator->pxNextFreeBlock;
        /* 检查物理相邻并合并 */
        if( ( pucCurrent + pxIterator->xBlockSize ) == pucNext )
        {
            pxIterator->xBlockSize += pxIterator->pxNextFreeBlock->xBlockSize;
            pxIterator->pxNextFreeBlock = pxIterator->pxNextFreeBlock->pxNextFreeBlock;
            // 合并后继续检查，可能与再下一块也相邻
        }
        else
        {
            pxIterator = pxIterator->pxNextFreeBlock;
        }
    }
}

/* 增强版分配函数，可周期性触发整理 */
void *pvPortMallocEnhanced( size_t xWantedSize )
{
    void *pvReturn = NULL;
    static uint32_t ulAllocCounter = 0;

    /* 例如：每1000次分配后尝试整理一次 */
    if( ( ulAllocCounter++ % 1000 ) == 0 )
    {
        prvDefragmentHeap();
    }
    pvReturn = pvPortMalloc( xWantedSize );
    return pvReturn;
}

场景二：多小内存频繁申请的系统

挑战：大量固定小对象（如任务通知、小消息体）的频繁创建销毁；标准动态分配方案开销大、易碎片。

优化思路：采用“内存池 + 动态堆”的混合管理方案。

#define NUM_POOL_SIZES 5
static const size_t xPoolSizes[NUM_POOL_SIZES] = { 16, 32, 64, 128, 256 };
static void *pxPools[NUM_POOL_SIZES][100]; /* 每个大小预分配100个块 */
static uint8_t ucPoolFreeCounts[NUM_POOL_SIZES] = { 100, 100, 100, 100, 100 };

void *pvPortMallocMixed( size_t xWantedSize )
{
    void *pvReturn = NULL;
    size_t xPoolIdx;

    /* 1. 先尝试从合适大小的内存池中获取 */
    for( xPoolIdx = 0; xPoolIdx < NUM_POOL_SIZES; xPoolIdx++ )
    {
        if( xWantedSize <= xPoolSizes[xPoolIdx] )
        {
            vTaskSuspendAll();
            {
                if( ucPoolFreeCounts[xPoolIdx] > 0 )
                {
                    /* 从池中取出一个预分配块 */
                    pvReturn = pxPools[xPoolIdx][ --ucPoolFreeCounts[xPoolIdx] ];
                }
            }
            xTaskResumeAll();
            if( pvReturn != NULL ) return pvReturn;
            break; /* 池为空，尝试动态分配 */
        }
    }
    /* 2. 内存池无法满足，回退到标准的动态分配（如heap_4） */
    pvReturn = pvPortMalloc( xWantedSize );
    return pvReturn;
}

/* 释放时需要知道块的大小，以决定归还到池还是动态堆 */
void vPortFreeMixed( void *pv, size_t xSize )
{
    if( pv != NULL )
    {
        size_t xPoolIdx;
        for( xPoolIdx = 0; xPoolIdx < NUM_POOL_SIZES; xPoolIdx++ )
        {
            if( xSize <= xPoolSizes[xPoolIdx] )
            {
                vTaskSuspendAll();
                {
                    if( ucPoolFreeCounts[xPoolIdx] < 100 )
                    {
                        /* 归还到内存池 */
                        pxPools[xPoolIdx][ ucPoolFreeCounts[xPoolIdx]++ ] = pv;
                        xTaskResumeAll();
                        return; /* 归还到池，无需调用vPortFree */
                    }
                }
                xTaskResumeAll();
                break; /* 池已满，释放到动态堆 */
            }
        }
        /* 不属于池或池已满，释放到动态堆 */
        vPortFree( pv );
    }
}

方案选择快速参考

系统类型/需求	推荐方案	核心理由
简单嵌入式系统，无释放需求	heap_1	实现最简单，性能最高，确定性好。
快速原型验证，兼容现有C库代码	heap_3	无需额外移植，利用编译器自带库。
通用场景，需动态内存管理	heap_4	在碎片、性能、复杂度上取得最佳平衡，是默认推荐。
内存资源分布在多个不连续区域	heap_5	唯一支持管理非连续内存区的方案，灵活性最高。
对实时性要求极端，分配需恒定时间	自定义静态内存池	完全消除动态分配的不确定性，性能最高。
大量固定小对象的频繁分配	混合方案（内存池+heap_4）	针对小对象优化，兼具高性能和低碎片。

总结

FreeRTOS 提供的五种内存管理方案，从极简的 heap_1 到功能强大的 heap_5，覆盖了从资源极度受限到系统高度复杂的各种嵌入式场景。对于开发者而言，没有“最好”的方案，只有“最合适”的方案。选择的关键在于深入理解应用本身的内存使用模式（分配/释放频率、对象大小、生命周期）和系统资源约束，从而做出明智的权衡。

在实际项目中，heap_4 因其出色的综合表现成为大多数应用的首选，而 heap_5 则为拥有复杂内存架构的硬件平台提供了强大的支持。对于性能瓶颈明确的场景，则可以考虑在标准方案之上，进行类似内存池、碎片整理等定制化优化。希望本文的分析能帮助你在下一个 FreeRTOS 项目中，做出更优的内存管理决策。更多嵌入式开发实战经验和深度讨论，欢迎访问云栈社区与广大开发者共同交流。

上一篇：从零移植到高效开发：手把手解析MicroPython在STM32/ESP32上的应用与优化
下一篇：基于正激励噪声的静态场景神经视频压缩：中国电信TeleAI实现73%码率节省

FreeRTOS, 嵌入式系统, 实时操作系统, 内存管理, C语言

FreeRTOS五种内存管理方案深度解析：从heap_1到heap_5的选型指南

FreeRTOS 内存管理

内存管理的关键考量

heap_1 分析

设计理念

源码实现

特点

适用场景

heap_2 分析

设计理念

源码实现（核心部分）

特点

适用场景

heap_3 分析

设计理念

源码实现

特点

适用场景

heap_4 分析

设计理念

源码实现（关键改进：块合并）

特点

适用场景

heap_5 分析

设计理念

源码实现（核心：多区域初始化）

特点

适用场景

针对特定场景的优化方案

场景一：长期运行的多任务系统

场景二：多小内存频繁申请的系统

方案选择快速参考

总结

相关帖子