Malloc内存调配器是怎样成功的

2024-11-15

大家好，我是岛主小风哥，当天聊聊malloc内存调配器是怎样成功的。

在此之前咱们要求回答一个基本疑问，那就是咱们为什么要发明内存调配器这种物品。

程序员经常经常使用的内存放开形式被称为灵活内存调配，Dynamic Memory Allocation。咱们为什么要求灵活的去启动内存调配与监禁呢？

答案很繁难，由于咱们不能提早知道程序究竟要求经常使用多少内存。那咱们什么时刻能力知道呢？答案是只要当程序真的运转起来后咱们才知道。

这就是为什么程序员要求灵活的去放开内存的要素，假设能提早知道咱们的程序究竟要求多少内存，那么间接知道通知编译器就好了，这样也不用发明malloc等外存调配器了。

知道了为什么要发明内存调配器的要素后，接上去咱们着手成功一个。

程序员应如何看待内存

实践上，现代程序员是很幸福的，程序员很少去关心内存调配的疑问。作为程序员，可以繁难的以为咱们的程序独占内存，留意，是独占哦。

写程序时你素来没有关心过假设咱们的程序占用过多内存会不会影响到其它程序，咱们可以繁难的以为每个程序(进程)独占4G内存(32位操作系统)，即使咱们的物理内存512M。不信你可以去试试，在即使只要512M大小的内存上你依然可以放开到2G内存来经常使用，可这是为什么呢？关于这个疑问咱们会在《深化了解操作系统》系列中具体论述。

总之，程序员可以安心的以为咱们的程序运转起来后在内存中是这样的：

作为程序员咱们应该知道，内存灵活放开和监禁都出当初堆区，heap。

咱们经常使用的malloc或许C++中的new放开内存时，就是从堆区这个区域中放开的。

接上去咱们就要自己治理堆区这个内存区域。

堆区这个区域实践上十分繁难，真的是十分繁难，你可以将其看做一大数组，就像这样：

从内存调配器的角度看，内存调配器基本不关心你是整数、浮点数、链表、二叉树等数据结构、还是对象、结构体等这些花哨的概念，在内存调配器眼里不过就是一个内存块，这些内存块中可以装入原生的字节序列，放开者拿到该内存块后可以塑形成整数、浮点数、链表、二叉树等数据结构以及对象、结构体等，这是经常使用者的事件，和内存调配器有关。

咱们要在这片内存上处置两个疑问：

这是内存调配器要处置的两个最外围的疑问，接上去咱们先去停车场看看能找到什么启发。

从停车场到内存治理

实践上你可以把内存看做一条长长的停车场，咱们放开内存就是要找到一块停车位，监禁内存就是把车开走让出停车位。

只不过这个停车场比拟不凡，咱们不止可以停小汽车、也可以停占低空积很小的自行车以及占低空积很大的卡车，重点就是放开的内存是大小不一的，在这样的条件下你该怎样成功以下两个指标呢？

如今，咱们曾经清楚的了解义务了，那么该怎样成功呢？

义务拆分

如今咱们曾经明白要成功什么以及权衡其好坏的规范，接上去咱们就要去设计成功细节了，让咱们把义务拆分一下，怎样拆分呢？

咱们可以自己想一下从内存的放开到监禁要求哪些细节。

放开内存时，咱们要求在内存中找到一块大小适合的闲暇内存调配进来，那么咱们怎样知道有哪些内存块是闲暇的呢？

因此，第一个成功细节出现了，咱们要求把内存块用某种形式组织起来，这样咱们能力追踪到每一块内存的调配形态。

如今闲暇内存块组织好了，那么一次性内存放开或许有很多闲暇内存块满足要求，那么咱们该选用哪一个闲暇内存块调配给用户呢？

因此，第二个成功细节出现了，咱们该选用什么样的闲暇内存块给到用户。

接上去咱们找到了一块大小适合的内存块，假定用户要求16个字节，而咱们找到的这块闲暇内存块大小为32字节，那么将16字节调配给用户后还剩下16字节，这剩下的内存该怎样处置呢？

因此，第三个成功细节出现了，调配进来内存后，闲暇内存块残余的空间该怎样处置？

最后，调配给用户的内存经常使用终了，这是第四个细节出现了，咱们该怎样处置用户还给咱们的内存呢？

以上四个疑问是任何一个内存调配器肯定要回答的，接上去咱们就逐一处置这些疑问，处置完这些疑问后一个崭新的内存调配器就降生啦。

治理闲暇内存块

闲暇内存块的实质是要求某种方法来来辨别哪些是闲暇内存哪些是曾经调配进来的内存。

有的同窗或许会说，这还不繁难吗，用一个链表之类的结构记载下每个闲暇内存块的开局和开头不就可以了，这句话也对也不对。

说不对，是由于假设要放开内存来创立这个链表那么这就是不对的，要素很繁难，由于创立链表无法防止的要放开内存，放开内存就要求经过内存调配器，可是你要成功的就是一个内存调配器，你没有方法向一个还没有成功的内存调配器放开内存。

说对也对，咱们确实要求一个相似链表这样的结构来保养闲暇内存块，但这个链表并不是咱们经常出现的那种。

由于咱们无法将闲暇内存块的信息保留在其它中央，那么没有方法，咱们只能将保养内存块的调配信息保留在内存块自身中，这也是大少数内存调配器的成功方法。

那么，为了保养内存块调配形态，咱们要求知道哪些信息呢？很繁难：

为了繁难起见，咱们的内存调配器不对内存对齐有要求，同时一次性内存放开准许的最大内存块为2G，留意，这些假定是为了繁难解说内存调配器的成功而屏蔽一些细节，咱们罕用的malloc等不会有这样的限度。

由于咱们的内存块大小下限为2G，因此咱们可以经常使用31个比特位来记载块大小，剩下的一个比特位用来标识该内存块是闲暇的还是曾经被调配进来了，下图中的f/a是free/allocate，也就是标志是曾经调配进来还是闲暇的。这32个比特位就是header，用来存储块信息。

剩下的灰色局部才是真正可以调配给用户的内存，这一局部也被称为负载，payload，咱们调用malloc前往的内存起始地址正是这块内存的起始地址。

如今你应该知道了吧，不是说堆上有10G内存，这外面就可以所有用来存储数据的，这外面肯定有一局部要拿进去保养内存块的一些信息，就像这里的header一样。

跟踪内存调配形态

有了上图，咱们就可以将堆这块内存区域组织起来并启动内存调配与监禁了，如图所示：

在这里咱们的堆区还很小，每一方框代表4字节，其中白色区域示意曾经调配进来的，灰色区域示意闲暇内存，每一块内存都有一个header，用带斜线的方框示意，比如16/1，就示意该内存块大小是16字节，1示意曾经调配进来了；而32/0示意该内存块大小是32字节，0示意该内存块闲暇。

细心的同窗或许会问，那最后一个方框0/1示意什么呢？原来，咱们要求某种不凡标志来通知咱们的内存调配器是不是曾经到末尾了，这就是最后4字节的作用。

经过引入header咱们就能知道每一个内存块的大小，从而可以很繁难的遍历整个堆区。遍历方法很繁难，由于咱们知道每一块的大小，那么从的位置加上块的大小就是下一个内存块的起始位置，如图所示：

经过每一个header的最后一个bit位就能知道每一块内存是闲暇的还是曾经调配进来了，这样咱们就能追踪到每一个内存块的调配信息，因此上文提到的第一个疑问处置了。

接上去咱们看第二个疑问。

怎样选用闲暇内存块

当运行程序调用咱们成功的malloc时，内存调配器要求遍历整个闲暇内存块找到一块能满足运行程序要求的内存块前往，就像下图这样：

假定运行程序要求放开4字节内存，从图中咱们可以看到有两个闲暇内存块满足要求，第一个大小为8字节的内存块和第三个大小为32字节的内存块，那么咱们究竟该选用哪一个前往呢？这就触及到了调配战略的疑问，实践上这里有很多的战略可供选用。

最繁难的就是每次从头开局找起，找到第一个满足要求的就前往，这就是所谓的First fit方法，教科书中普通称为初次顺应方法，当然咱们不要求记住这样拗口的名字，只要要记住这是什么意思就可以了。

这种方法的好处在于繁难，但该战略总是从前面的闲暇块找起，因此很容易在堆区前半局部因调配出内存留下很多小的内存块，因此下一次性内存放开搜查的闲暇块数量将会越来越多。

该方法是小名鼎鼎的Donald Knuth初次提进去的，假设你不知道谁是Donald Knuth，那么数据结构课上折磨的你痛不欲生的字符串婚配KMP算法你肯定不会错过，KMP其中的K就是指Donald Knuth，该算法全称Knuth–Morris–Pratt string-searching algorithm，假设你也没听过KMP算法那么你肯定听过上方这本书：

这就是愈加小名鼎鼎的《计算机程序设计艺术》，这本书就是Donald Knuth写的，假设你没有听过这本书请面壁思过一分钟，比尔盖茨曾经说过，假设你看懂了这本书就去给微软投简历吧，这本书也是很多程序员买回来后素来不会翻一眼只是拿来当做镇宅之宝用的。

不止比尔盖茨，有一次性乔布斯见到Knuth老爷子后。。算了，扯远了，无时机再和大家讲这个故事，拉回来。

Next Fit说的是什么呢？这个战略和First Fit很相似，是说咱们别总是从头开局找了，而是从上一次性找到适合的闲暇内存块的位置找起，老爷子观察到上一次性找到某个适合的内存块的中央很有或许剩下的内存块能满足接上去的内存调配恳求，由于不要求从头开局搜查，因此Next Fit将远快于First Fit。

但是也有钻研标明Next Fit方法内存经常使用率不迭First Fit，也就是雷同的停车局面积，First Fit方法能停更多的车。

First Fit和Next Fit都是找到第一个满足要求的内存块就前往，但Best Fit不是这样。

Best Fit算法会找到一切的闲暇内存块，而后将一切满足要求的并且大小为最小的那个闲暇内存块前往，这样的闲暇内存块才是最Best的，因此被称为Best Fit。就像下图虽然有三个闲暇内存块满足要求，但是Best Fit会选用大小为8字节的闲暇内存块。

显然，从直觉上咱们就能得出Best Fit会比前两种方法能更正当应用内存的论断，各项钻研也证明了这一点。

但是Best Fit最大的缺陷就是调配内存时要求遍历堆上一切的闲暇内存块，在速度上显然不迭前面两种方法。

以上引见的这三种战略在各种内存调配器中十分经常出现，当然调配战略远不止这几种，但这些算法不是该主题下关注的重点，因此就不在这里具体论述了，假定在这里咱们选用First Fit算法。

没有银弹

关键的是，从上方的引见中咱们能够看到，没有一种完美的战略，每一种战略都有其好处和缺陷，咱们能做到的只要取舍和权衡。因此，要成功一个内存调配器，设计空间其实是十分大的，要想设计出一个通用的内存调配器，就像咱们罕用的malloc是很不容易的。

其实不止内存调配器，在设计其它软件系统时咱们也没有银弹。

调配内存

如今咱们找到适合的闲暇内存块了，接上去咱们又将面临一个新的疑问。

假设用户要求12字节，而咱们的闲暇内存块也恰恰是12字节，那么很好，间接前往就可以了。

但是，假设用户放开12字节内存，而咱们找到的闲暇内存块大小为32字节，那么咱们是要将这32字节的整个闲暇内存块标志为已调配吗？就像这样：

这样虽然速度最快，但显然会糜费内存，构成外部碎片，也就是说该内存块剩下的空间将无法被应用到。

一种显而易见的方法就是将闲暇内存块启动划分，前一局部设置为已调配，前往给内存放开者经常使用，后一局部变为一个新的闲暇内存块，只不过大小会更小而已，就像这样：

咱们要求将闲暇内存块大小从32修正为16，其中信息头header占据4字节，剩下的12字节调配进来，并将标志为置为1，示意该内存块已调配。

调配出16字节后，还剩下16字节，咱们要求拿出4字节作为新的header并将其标志为闲暇内存块。

监禁内存

到目前为止，咱们的malloc曾经能够处置内存调配恳求了，还差最后的内存监禁。

内存监禁和咱们构想的不太一样，该环节并不比前几个环节繁难。咱们要思考到的关键一点就在于，与被监禁的内存块相邻的内存块或许也是闲暇的。假设监禁一块内存后咱们仅仅繁难的将其标志位置为闲暇，那么或许会出现上方的场景：

从图中咱们可以看到，被监禁内存的下一个内存块也是闲暇的，假设咱们仅仅将这16个字节的内存块标志为闲暇的话，那么当下一次性放开20字节时图中的这两个内存块都不能满足要求，虽然这两个闲暇内存块的总数要超越20字节。

因此一种更好的方法是当运行程序向咱们的malloc监禁内存时，咱们检查一下相邻的内存块能否是闲暇的，假设是闲暇的话咱们要求兼并闲暇内存块，就像这样：

在这里咱们又面临一个新的决策，那就是监禁内存时咱们要立刻去审核能否够兼并相邻闲暇内存块吗？还是说咱们可以推延一段期间，推早退下一次性调配内存找不到满足要的闲暇内存块时再兼并相邻闲暇内存块。

监禁内存时立刻兼并闲暇内存块相对繁难，但每次监禁内存时将引入兼并内存块的开支，假设运行程序总是监禁12字节而后放开12字节，而后在监禁12字节等等这样重复的形式：

freeptrobj ptr  mallocfreeptrobj ptr  malloc

那么这种内存经常使用形式统一刻兼并闲暇内存块这种战略十分不友好，咱们的内存调配器会有很多的无用功。但这种战略最为繁难，在这里咱们依然选用经常使用这种繁难的战略。

实践上咱们要求看法到，实践经常使用的内存调配器都会有某种推延兼并闲暇内存块的战略。

高效兼并闲暇内存块

兼并闲暇内存块的故事到这里就完了吗？疑问没有那么繁难。

让咱们来看这样一个场景：

咱们之所以能向后跳是由于内存块的大小是知道的，那么咱们该怎样向前跳找到上一个内存块呢？

还是咱们上文提到的Donald Knuth，老爷子提出了一个很痴呆的设计，咱们之所以不能往前跳是由于不知道前一个内存块的信息，那么咱们该怎样极速知道前一个内存块的信息呢？

Knuth老爷子的设计是这样的，咱们不是有一个信息头header吗，那么咱们就在该内存块的末尾再加一个信息尾，footer，footer一词用的很笼统，header和footer的内容是一样的。

由于上一内存块的footer和下一个内存块的header是相邻的，因此咱们只要要在内存块的位置向上移动4间接就可以等到上一个内存块的信息，这样当咱们监禁内存时就可以极速的启动相邻闲暇内存块的兼并了。

至此，咱们的内存调配器就曾经设计终了了。

咱们的繁难内存调配器驳回了First Fit调配算法；找到一个满足要求的内存块后会启动切分，剩下的作为新的内存块；同时当监禁内存时会立刻兼并相邻的闲暇内存块，同时为放慢兼并速度，咱们引入了Donald Knuth的设计方法，为每个内存块参与footer信息。

调配器内存 malloc

<<以技术与专长赋能开发者独特推进开源技术的蓬勃开展英特尔李映

亚太地域数据仓库即服务及其对电信的影响技术的未来>>