运维开发网
广告位招商联系QQ:123077622
 
广告位招商联系QQ:123077622

堆栈分配给线程

运维开发网 https://www.qedev.com 2020-07-05 12:40 出处:网络
我一直试图将堆栈内存分配给线程.我无法把整个事情拼凑起来.我试着去看代码,但我更困惑,所以我要求你的帮助.
我一直试图将堆栈内存分配给线程.我无法把整个事情拼凑起来.我试着去看代码,但我更困惑,所以我要求你的帮助.

我asked this question不久前.因此假设特定程序(因此,所有线程都在同一个进程中).如果我为堆栈指针的每个开头写printfs,然后为它们分配了多少,那么我得到的东西就像这个消息末尾的表,其中第一列是time_t usec,第二列无所谓,第三个是线程的tid,第四个是保护大小,然后是堆栈的开始,堆栈的结尾(按堆栈的开头排序),最后一个是分配的堆栈(默认为8 Megs),最后一列是第一个分配的堆栈的结束与下一个堆栈的开始之间的差异.

这意味着(我认为),如果为0,那么堆栈是连续的,如果是正的,因为堆栈在内存中增长,那么这意味着在tid和下一个之间存在多个Mbs的“自由空间”(在记忆).如果是否定的,这意味着内存正在被重用.所以这可能意味着在创建此线程之前已释放该堆栈空间.

我的问题是:为线程分配堆栈空间的算法到底是什么(比代码更高的层次),为什么我有时会得到连续的堆栈,有时候没有,有时在最后一列得到像7.94140625和0.0625这样的值?

这是所有Linux 2.6,C和pthreads.

这可能是我们必须重复以使其正确的问题,为此我道歉,但我告诉你我现在所知道的.随意要求澄清.

谢谢你.表格如下.

52815   14  14786   4096    92549120    100941824   8392704 0
52481   14  14784   4096    100941824   109334528   8392704 0
51700   14  14777   4096    109334528   117727232   8392704 0
70747   14  14806   4096    117727232   126119936   8392704 8.00390625
75813   14  14824   4096    117727232   126119936   8392704 0
51464   14  14776   4096    126119936   134512640   8392704 8.00390625
76679   14  14833   4096    126119936   134512640   8392704 -4.51953125
53799   14  14791   4096    139251712   147644416   8392704 -4.90234375
52708   14  14785   4096    152784896   161177600   8392704 0
50912   14  14773   4096    161177600   169570304   8392704 0
51617   14  14775   4096    169570304   177963008   8392704 0
70028   14  14793   4096    177963008   186355712   8392704 0
51048   14  14774   4096    186355712   194748416   8392704 0
50596   14  14771   4096    194748416   203141120   8392704 8.00390625
首先,通过提供一个启动单个线程的简单测试程序,我们可以看到它用于创建新线程的系统调用.这是一个简单的测试程序:

#include <pthread.h>
#include <stdio.h>

void *test(void *x) { }

int main() {
        pthread_t thr;
        printf("start\n");
        pthread_create(&thr, NULL, test, NULL);
        pthread_join(thr, NULL);
        printf("end\n");
        return 0;
}

并且其strace输出的相关部分:

write(1, "start\n", 6start
)                  = 6
mmap2(NULL, 8392704, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS|MAP_STACK, -1, 0) = 0xf6e32000
brk(0)                                  = 0x8915000
brk(0x8936000)                          = 0x8936000
mprotect(0xf6e32000, 4096, PROT_NONE)   = 0
clone(child_stack=0xf7632494, flags=CLONE_VM|CLONE_FS|CLONE_FILES|CLONE_SIGHAND|CLONE_THREAD|CLONE_SYSVSEM|CLONE_SETTLS|CLONE_PARENT_SETTID|CLONE_CHILD_CLEARTID, parent_tidptr=0xf7632bd8, {entry_number:12, base_addr:0xf7632b70, limit:1048575, seg_32bit:1, contents:0, read_exec_only:0, limit_in_pages:1, seg_not_present:0, useable:1}, child_tidptr=0xf7632bd8) = 9181
futex(0xf7632bd8, FUTEX_WAIT, 9181, NULL) = -1 EAGAIN (Resource temporarily unavailable)
write(1, "end\n", 4end
)                    = 4
exit_group(0)                           = ?

我们可以看到它使用PROT_READ | PROT_WRITE保护和MAP_PRIVATE | MAP_ANONYMOUS | MAP_STACK标志从mmap获取堆栈.然后它保护堆栈的第一个(即最低)页面,以检测堆栈溢出.其余的电话与手头的讨论并不相关.

那么,mmap如何分配堆栈呢?好吧,让我们从Linux内核的mmap_pgoff开始;现代mmap2系统调用的入口点.它在锁定后委托给do_mmap_pgoff.然后调用get_unmapped_area以找到适当范围的未映射页面.

不幸的是,这会调用vma中定义的函数指针 – 这可能使得32位和64位进程可以对不同的地址进行映射.在x86的情况下,这是在arch_pick_mmap_layout中定义的,它根据是否使用32位或64位架构进行切换.

那么让我们来看看arch_get_unmapped_area的实现.它首先从find_start_end获取其搜索的一些合理默认值,然后测试以查看传入的地址提示是否有效(对于线程堆栈,没有传递提示).然后它开始扫描虚拟内存映射,从缓存的地址开始,直到找到一个洞.它保存了孔的末端以供下次搜索使用,然后返回该孔的位置.如果它到达地址空间的末尾,它将从头开始再次启动,再给它一次机会找到一个开放区域.

正如您所看到的,通常情况下,它将以递增的方式分配堆栈(对于x86; x86-64使用arch_get_unmapped_area_topdown并且可能会将它们分配为递减).但是,它还会保留从何处开始搜索的缓存,因此可能会留下空白,具体取决于区域的释放时间.特别是,当一个mmaped区域被释放时,它可能会更新free-address-search-cache,因此你可能会看到那里的乱序分配.

也就是说,这都是一个实现细节.不要在你的程序中依赖任何这些.只需拿出mmap手中的地址并快乐:)

扫码领视频副本.gif

0

精彩评论

暂无评论...
验证码 换一张
取 消

关注公众号