您的当前位置:首页正文

efl格式分析

2024-11-27 来源:个人技术集锦

最近研究了一下elf文件格式,发现好多资料写的都比较繁琐,可能会严重打击学习者的热情,我把自己研究的结果和大家分享,希望我的描述能够简洁一些。

一、基础知识

       elf是一种文件格式,用于存储Linux程序.它内部都有一些什么信息呢?大概包括编制好的计算机指令,数据,计算机在需要的时候把这个文件读取到内存中,cpu就可以从内存中一条一条的读取指令来执行了。所以说想明白elf格式,我们应该了解一下计算机执行程序需要那些信息。所以这一节,我们补充一些计算机系统的基础知识。

进程和虚拟内存:

其实计算机的内存是没有那么大的,比如我们实际使用的计算机只有2G,以前更小,只有几百M,而且一台计算机上不只运行一个进程,一个占用4G,如果有10个进程,那就得着用40G了,哪有那么打的内存呢?其实这个不要紧,因为操作系统分配给用户的是虚拟内存,程序要可以使用3G的内存。至于操作系统怎样把虚拟内存转化成物理内存,对于开发应用程序的工程师来说,是不需要了解的。我们直接使用虚拟内存就可以了,而不用担心其它进程会侵犯到你的内存空间。

进程的创建和运行进程的创建和运行大致经历了以下步骤:

1.用户请求运行程序时,操作系统会读取存储在磁盘上的可执行文件,在linux系统上这个文件就是我们的elf格式文件,为用户分配4G的虚拟内存空间,

2.根据文件的信息指示,把不同的文件内容放到为你分配的这3G虚拟内存

3.然后根据文件的指示,系统设置设置代码段和数据段寄存器

5.main开始,计算机就一条一条的执行我们给的指令,处理我们的数据了,直到我们程序结束。虽然在这个过程中,系统会多次切换到其他进程,但对用户程序来说没有影响,我们可以认为计算机只为我们服务。

通过以上我们多次看到计算机是根据文件指示这样的语言,所以学习elf首先要理解elf指示了那些信息。

二、可执行的elf文件。

elf文件分三种类型:1、目标文件(通常是.o);2、可执行文件(我们的运行文件)  3、动态库(.so)

我们先讲一下可执行文件。

可执行文件一般分成4个部分,能扩展,我们理解这4部分就够了。

1elf文件头,这个文件是对elf文件整体信息的描述,在32位系统下是56的字节,在64位系统下是64个字节。对于可执行文件来说,文件头包含的一下信息与进程启动相关

         e_phoff        segment偏移

         e_phnum     segment数量

2.segment表,这个表是加载指示器,操作系统(确切的说是加载器,有些elf文件,比如操作系统内核,是由其他程序加载的),该表的结构非常重要。

typedef struct
{
Elf64_Word  p_type; /* Segment type */
 Elf64_Word  p_flags; /* Segment flags segment权限,6表示可读写,5表示可读可执行*/
 Elf64_Off      p_offset;/* Segment file offset 段在文件中的偏移*/
 Elf64_Addr   p_vaddr;/* Segment virtual address 虚拟内存地址,这个表示内存中的*/
Elf64_Addr      p_paddr; /* Segment physical address 物理内存地址,对应用程序来说,这个字段无用*/
Elf64_Xword    p_filesz; /* Segment size in file 段在文件中的长度*/
Elf64_Xword     p_memsz;  /* Segment size in memory 在内存中的长度,一般和p_filesz的值一样*/
Elf64_Xwordp_align;/* Segment alignment  段对齐*/
} Elf64_Phdr;

3.elf的主题,对于可执行文件来说,最主要的就是数据段和代码段

4.section表,对可执行文件来说,没有用,在链接的时候用,是对代码段数据段在链接是的一种描述。

整个elf文件的组成可以使用下图来描述 

显示全文