TA的每日心情 | 郁闷 2021-10-6 14:33 |
---|
签到天数: 1 天 连续签到: 1 天 [LV.1]初来乍到
|
本帖最后由 乔二 于 2021-10-6 10:02 编辑
在Linux操作系统中,普遍使用ELF格式作为可执行程序或者程序生成过程中的中间格式。ELF(Executable and Linking Format,可执行连接格式)是UNIX系统实验室(USL)作为应用程序二进制接口(Application BinaryInterface,ABI)而开发和发布的。工具接口标准委员会(TIS)选择了正在发展中的ELF标准作为工作在32位Intel体系上不同操作系统之间可移植的二进制文件格式。源代码到可执行程序的转换时需要经历以下过程:
1 预处理
2 编译
3 汇编
4 链接
预处理阶段:读取c源程序,对其中的伪指令(以#开头的指令)和特殊符号进行处理
伪指令主要包括以下四个方面:
(1)宏定义指令(2)条件编译指令(3)头文件包含指令(4)特殊符号 预编译程序所完成的基本上是对源程序的“替代”工作。经过此种替代,生成一个没有宏定义、没有条件编译指令、没有特殊符号的输出文件。这个文件的含义同没有经过预处理的源文件是相同的,但内容有所不同。
编译是指把用高级语言编写的程序转换成相应处理器的汇编语言程序的过程。从本质上讲,编译是一个文本转换的过程。对嵌入式系统而言,一般要把用C语言编写的程序转换成处理器的汇编代码。编译过程包含了C语言的语法解析和汇编码的生成两个步骤。
l 汇编是从汇编语言程序生成目标系统的二进制代码(机器代码)的过程。机器代码的生成和处理器有密切的联系。对于一款特定的处理器,其汇编语言和二进制的机器代码是一一对应的。汇编过程的输入是汇编代码,这个汇编代码可能来源于编译过程的输出,也可以是直接用汇编语言书写的程序。
l 连接是指将汇编生成的多段机器代码组合成一个可执行程序。一般来说,通过编译和汇编过程,每一个源文件将生成一个目标文件。连接器的作用就是将这些目标文件组合起来,组合的过程包括了代码段、数据段等部分的合并,以及添加相应的文件头。
GCC是Linux下主要的程序生成工具,它除了编译器、汇编器、连接器外,还包括一些辅助工具。对于最后编译出来的可执行程序,当我们执行它的时候,操作系统又是如何反应的呢?如图2所示:
Linux的操作系统提供了一系列的接口,这些接口被称为系统调用(System Call)。系统调用"提供的是机制,而不是策略"。C语言的库函数通过调用系统调用来实现,库函数对上层提供了C语言库文件的接口。在应用程序层,通过调用C语言库函数和系统调用来实现功能。一般来说,应用程序大多使用C语言库函数实现其功能,较少使用系统调用。
ELF文件格式包括三种主要的类型:可执行文件、可重定向文件、共享库。
1.可执行文件(应用程序)
可执行文件包含了代码和数据,是可以直接运行的程序。
2.可重定向文件(*.o)
可重定向文件又称为目标文件,它包含了代码和数据(这些数据是和其他重定位文件和共享的object文件一起连接时使用的)。
*.o文件参与程序的连接(创建一个程序)和程序的执行(运行一个程序),它提供了一个方便有效的方法来用并行的视角看待文件的内容,这些*.o文件的活动可以反映出不同的需要。
Linux下,我们可以用gcc -c编译源文件时可将其编译成*.o格式。
3.共享文件(*.so)
也称为动态库文件,它包含了代码和数据(这些数据是在连接时候被连接器ld和运行时动态连接器使用的)。
那么到底什么是库呢?
库从本质上来说是一种可执行代码的二进制格式,可以被载入内存中执行。库分静态库和动态库两种。
静态库:这类库的名字一般是libxxx.a,xxx为库的名字。利用静态函数库编译成的文件比较大,因为整个函数库的所有数据都会被整合进目标代码中,他的优点就显而易见了,即编译后的执行程序不需要外部的函数库支持,因为所有使用的函数都已经被编译进去了。当然这也会成为他的缺点,因为如果静态函数库改变了,那么你的程序必须重新编译。
动态库:这类库的名字一般是libxxx.M.N.so,同样的xxx为库的名字,M是库的主版本号,N是库的副版本号。当然也可以不要版本号,但名字必须有。相对于静态函数库,动态函数库在编译的时候并没有被编译进目标代码中,你的程序执行到相关函数时才调用该函数库里的相应函数,因此动态函数库所产生的可执行文件比较小。由于函数库没有被整合进你的程序,而是程序运行时动态的申请并调用,所以程序的运行环境中必须提供相应的库。动态函数库的改变并不影响你的程序,所以动态函数库的升级比较方便。linux系统有几个重要的目录存放相应的函数库,如/lib /usr/lib。
当要使用静态的程序库时,连接器会找出程序所需的函数,然后将它们拷贝到执行文件,由于这种拷贝是完整的,所以一旦连接成功,静态程序库也就不再需要了。然而,对动态库而言,就不是这样。动态库会在执行程序内留下一个标记指明当程序执行时,首先必须载入这个库。由于动态库节省空间,linux下进行连接的缺省操作是首先连接动态库,也就是说,如果同时存在静态和动态库,不特别指定的话,将与动态库相连接。
1、静态链接库
我们先制作自己的静态链接库,然后再使用它。制作静态链接库的过程中要用到gcc和ar命令。
准备两个源码文件main.c和hello.c, 内容如下图示:
接下来使用命令把hello.c 制作成静态库文件libhello.a:
由上面知道静态库文件libmytest.a已经生成,用file命令查看其属性,发现它确实是归档压缩文件。
在main.c中调用了hello.c实现的函数,使用静态库的方式编译得到一个可执行文件main_a
2、动态库
动态库的后缀为*.so。在Linux发行版中大多数的动态库基本都位于/usr/lib和/lib目录下。
有时候当我们的应用程序无法运行时,它会提示我们说它找不到什么样的库,或者哪个库的版本又不合它胃口了等等之类的话。那么应用程序它是怎么知道需要哪些库的呢?我们前面已几个学了个很棒的命令ldd,用就是用来查看一个文件到底依赖了那些so库文件。
依旧使用刚才的源码文件
将其中的hello.c制作成一个名为libhello.so的动态链接库文件:
1、先生成目标.o文件:
[root@localhost make_so_a]# gcc -c hello.c -o hello.o
2、再生成so文件:
[root@localhost make_so_a]# gcc -fpic -shared hello.o -o libhello.so
-shared该选项指定生成动态连接库(让连接器生成T类型的导出符号表),不用该标志外部程序无法连接。相当于一个可执行文件。
-fpic:表示编译为位置独立的代码,不用此选项的话编译后的代码是位置相关的所以动态载入时是通过代码拷贝的方式来满足不同进程的需要,而不能达到真正代码段共享的目的。
接下来,就是如何使用这个动态库了。使用动态链接的方式生成最终的可执行文件
使用“-lhello”标记来告诉GCC驱动程序在连接阶段引用共享函数库libhello.so。“-L./”标记告诉GCC函数库位于当前目录。否则GNU连接器会查找标准系统函数目录。
这里我们注意,ldd的输出它说我们的libtest.so它没找到。
这是因为生成的可执行文件执行时搜索路径的顺序是:
1. 环境变量LD_LIBRARY_PATH指定的动态库搜索路径
2. 配置文件/etc/ld.so.conf中指定的动态库搜索路径
3. 默认的动态库搜索路径/lib
4. 默认的动态库搜索路径/usr/lib
我们可以使用以下几种方法
方法一:
使用ldconfig命令,它是一个动态链接库管理命令
ldconfig 命令的用途,主要是在默认搜寻目录(/lib和/usr/lib)以及动态库配置文件/etc/ld.so.conf内所列的目录下,搜索出可共享的动态 链接库(格式如前介绍,lib*.so*),进而创建出动态装入程序(ld.so)所需的连接和缓存文件.缓存文件默认为 /etc/ld.so.cache,此文件保存已排好序的动态链接库名字列表. ldconfig通常在系统启动时运行,而当用户安装了一个新的动态链接库时,就需要手工运行这个命令.
执行如下:
方法二:
将生成的动态库文件拷贝到linux系统默认搜索的动态库文件的目录中,如/lib /usr/lib目录下,然后生成可执行文件并执行,如图示:
方法三:
添加系统的环境变量LD_LIBRARY_PATH指定动态库的目录
执行可以看到,使用当前目录下的动态库文件链接生成可执行文件main_so,但是在执行时提示找不到相应的动态库,这时我们通过向系统添加环境变量LD_LIBRARY_PATH告诉动态链接库的地址,如图所示
通过本文的叙述和练习相信大家应该对Linux的库函数机制有了些许了解,最主要的是学会怎么去开发使用库文件。
|
|