GCC编译过程和动态静态库

GCC编译过程和动态静态库

outline

[TOC]

本质上来说库是一种可执行代码的二进制形式,可以被操作系统载入内存执行。库有两种:静态库(.a、.lib)和动态库(.so、.dll)。 windows上对应的是.lib .dll linux上对应的是.a .so

编译过程:

img

静态库

之所以成为【静态库】,是因为在链接阶段,会将汇编生成的目标文件.o与引用到的库一起链接打包到可执行文件中。因此对应的链接方式称为静态链接。

试想一下,静态库与汇编生成的目标文件一起链接为可执行文件,那么静态库必定跟.o文件格式相似其实一个静态库可以简单看成是一组目标文件(.o/.obj文件)的集合,即很多目标文件经过压缩打包后形成的一个文件。静态库特点总结:

  • 静态库对函数库的链接是放在编译时期完成的
  • 程序在运行时与函数库再无瓜葛,移植方便。
  • 浪费空间和资源,因为所有相关的目标文件与牵涉到的函数库被链接合成一个可执行文件。

Linux静态库命名规范,必须是”lib[your_library_name].a”:lib为前缀,中间是静态库名,扩展名为==.a==

通过上面的流程可以知道,Linux创建静态库过程如下:

首先,将代码文件编译成目标文件.o(StaticMath.o)

1
gcc -c StaticMath.c -o StaticMath.o

注意带参数-c,否则直接编译为可执行文件

然后,通过ar工具将目标文件打包成.a静态库文件

1
ar -crv libstaticmath.a StaticMath.o

生成静态库libstaticmath.a

使用

Linux下使用静态库,只需要在编译的时候,指定静态库的搜索路径(-L选项)、指定静态库名(不需要lib前缀和.a后缀,-l选项)

1
gcc test.c -L ./ -lstaticmath
  • -L:表示要连接的库所在目录

  • -I:指定链接时需要的动态库,编译器查找动态连接库时有隐含的命名规则,即在给出的名字前面加上lib,后面加上.a或.so来确定库的名称。

动态库

为什么需要动态库,其实也是静态库的特点导致。

空间浪费是静态库的一个问题。

clip_image021[4]

另一个问题是静态库对程序的更新、部署和发布页会带来麻烦。如果静态库liba.lib更新了,所以使用它的应用程序都需要重新编译、发布给用户(对于玩家来说,可能是一个很小的改动,却导致整个程序重新下载,全量更新

动态库在程序编译时并不会被连接到目标代码中,而是在程序运行是才被载入。不同的应用程序如果调用相同的库,那么在内存里只需要有一份该共享库的实例,规避了空间浪费问题。动态库在程序运行是才被载入,也解决了静态库对程序的更新、部署和发布页会带来麻烦。用户只需要更新动态库即可,增量更新

img

创建动态库

动态链接库的名字形式为 libxxx.so,前缀是lib,后缀名为“.so”。

  • 针对于实际库文件,每个共享库都有个特殊的名字“soname”。在程序启动后,程序通过这个名字来告诉动态加载器该载入哪个共享库。

  • 在文件系统中,soname仅是一个链接到实际动态库的链接。对于动态库而言,每个库实际上都有另一个名字给编译器来用。它是一个指向实际库镜像文件的链接文件(lib+soname+.so)

  • 首先,生成目标文件,此时要加编译器选项-fpic

    1
    gcc -fPIC -c DynamicMath.cpp

    -fPIC创建与地址无关的编译程序(pic,position independent code),是为了能够在多个应用程序间共享。

  • 然后,生成动态库,此时要加链接器选项-shared

    1
    g++ -shared -o libdynmath.so DynamicMath.o

    -shared指定生成动态链接库。
    其实上面两个步骤可以合并为一个命令:

    1
    g++ -fPIC -shared -o libdynmath.so DynamicMath.cpp

    使用动态库

引用动态库编译成可执行文件(跟静态库方式一样):

1
g++ TestDynamicLibrary.cpp -L../DynamicLibrary -ldynmath

然后运行:./a.out,发现竟然报错了!!!

解决方法:首先使用export LD_LIBRARY_PATH=.:$LD_LIBRARY_PATH将当前目录加入LD_LIBRARY_PATH变量中。再次运行

1) 当系统加载可执行代码时候,能够知道其所依赖的库的名字,但是还需要知道绝对路径。此时就需要系统动态载入器(dynamic linker/loader)。
2) 对于elf格式的可执行程序,是由ld-linux.so*来完成的,它先后搜索elf文件的DT_RPATH段—环境变量LD_LIBRARY_PATH—/etc/ld.so.cache文件列表—/lib/,/usr/lib 目录找到库文件后将其载入内存。
如何让系统能够找到它:
如果安装在/lib或者/usr/lib下,那么ld默认能够找到,无需其他操作。
如果安装在其他目录,需要将其添加到/etc/ld.so.cache文件中,步骤如下:
编辑/etc/ld.so.conf文件,加入库文件所在目录的路径
运行ldconfig ,该命令会重建/etc/ld.so.cache文件
我们将创建的动态库复制到/usr/lib下面,然后运行测试程序。

GCC编译过程

编译过程可以被细分为四个阶段:

预处理( Pre-Processing )
编译( Compiling )
汇编( Asse mbling )
链接( Linking )

img

img

GCC编译过程

1)gcc 预处理阶段:主要对包含的头文件(#include )和宏定义(#define,#ifdef … )进行处理。可以使用“gcc -E” 让gcc 在预处理之后停止编译过程,生成 *.i 文件。

1
gcc -E hello.c -o hello.i

2)gcc 编译阶段:gcc 首先要检查代码的规范性,是否有语法错误等。以确定代码实际要做的工作,在检查无误后,gcc 把代码翻译成汇编语言。用户可以使用-S 选项进行查看,该选项只进
行编译而不进行汇编,生成汇编代码。

1
gcc -S hello.i -o hello.s

3)gcc 汇编阶段:生成目标代码 .o ;有两种方式:使用 gcc 直接从源代码生成目标代码 gcc -c .s -o .o 以及使用汇编器从汇编代码生成目标代码 as .s -o *.o

1
2
gcc -c hello.s -o hello.o
as hello.s -o hello.o

也可以直接使用as .s, 将执行汇编、链接过程生成可执行文件a.out, 可以像上面使用-o 选项指定输出文件的格式。
4)gcc 链接阶段:生成可执行文件;可以生成的可执行文件格式有: a.out/
/,当然可能还有其它格式。

1
2
gcc hello.o     生成可执行文件 a.out
gcc hello.o -o hello 生成可执行文件 hello