👹
Carlos's Tech Blog
  • 🧔ECUs
    • ZYNQ_Documents
      • [ZYNQ] 构建ZYNQ的BSP工程
      • [ZYNQ] 启动流程
      • [ZYNQ] Secure Boot Flow
      • [ZYNQ] Provisioning Guideline
      • [ZYNQ] Decrypting Partition by the Decrypt Agent Using PUF key
      • [ZYNQ] enabling the cryptsetup on ramdisk
      • [ZYNQ] Encrypt external files based on file system using PUF key
      • [ZYNQ] Loading an Encrypted Linux kernel at U-Boot with a KUP Key
      • [ZYNQ] cross-compile the cryptsetup on Xilinx ZYNQ aarch64 platform
      • [ZYNQ] Linux Linaro系统镜像制作SD卡启动
    • S32G_Documents
      • [S32G] Going through the s32g hard/soft platform
      • [S32G] S32g247's Secure Boot using HSE firmware
        • S32g2 HSE key config
        • How S32g verify secure boot image
        • S32g secure boot signature generation
        • How to download and build S32g Secure boot image
        • [S32G] OTA with Secure Boot
    • RT117x_Documents
      • [RT-117x]IMX RT1170 Provisioning Guideline
      • [RT-117x] Going through the MX-RT1170 hard/soft platform
      • [RT-117x] i.MX-RT1170's Secure Boot
        • [RT-117x]Signing image with the HSM (SignServer)
    • LS104x_Documents
      • [LS104x] bsp project
      • [LS104x] boot flow
      • [LS104x] secure boot
      • [LS104x] Application Note, Using the PKCS#11 in TCU platform
      • [LS104x] 使用ostree更新rootfs
      • [LS104x] ostree的移植
      • [LS104x] Starting with Yocto
      • [LS104x] 使用FIT的kernel格式和initramfs
    • IMX6/8_Documents
      • [IMX6] Defining A U-Boot Command
      • NXP IMX6 嵌入式板子一些笔记
      • NXP-imx6 initialization
    • Vehicle_Apps
      • [SecOC] Tree
        • [SecOC] SecOC Freshness and MAC Truncation
  • 😾TECH
    • Rust Arm OS
      • ARMv7m_Using_The_RUST_Cross_Compiler
    • ARM
      • ARM-v7-M
        • 01_ARMv7-M_处理器架构技术综述
        • 02_ARMv7-M_编程模型与模式
        • 03_ARMv7-M_存储系统结构
        • 04_ARMv7-M_异常处理及中断处理
      • ARM-v8-A
        • 02_ARMv8_基本概念
        • 03_ARMv8_指令集介绍_加载指令集和存储指令集
        • 04_ARMv8_指令集_运算指令集
        • 05_ARMv8_指令集_跳转_比较与返回指令
        • 06_ARMv8_指令集_一些重要的指令
        • 0X_ARMv8_指令集_基于汇编的UART驱动
        • 07_ARMv8_汇编器Using as
        • 08_ARMv8_链接器和链接脚本
        • 09_ARMv8_内嵌汇编(内联汇编)Inline assembly
        • 10_ARMv8_异常处理(一) - 入口与返回、栈选择、异常向量表
        • 11_ARMv8_异常处理(二)- Legacy 中断处理
        • 12_ARMv8_异常处理(三)- GICv1/v2中断处理
        • 13_ARMv8_内存管理(一)-内存管理要素
        • 14_ARMv8_内存管理(二)-ARM的MMU设计
        • 15_ARMv8_内存管理(三)-MMU恒等映射及Linux实现
        • 16_ARMv8_高速缓存(一)cache要素
        • 17_ARMv8_高速缓存(二)ARM cache设计
        • 18_ARMv8_高速缓存(三)多核与一致性要素
        • 19_ARMv8_TLB管理(Translation Lookaside buffer)
        • 20_ARMv8_barrier(一)流水线和一致性模型
        • 21_ARMv8_barrier(二)内存屏障案例
      • ARM Boot Flow
        • 01_Embedded_ARMv7/v8 non-secure Boot Flow
        • 02_Embedded_ARMv8 ATF Secure Boot Flow (BL1/BL2/BL31)
        • 03_Embedded_ARMv8 BL33 Uboot Booting Flow
      • ARM Compiler
        • Compiler optimization and the volatile keyword
      • ARM Development
        • 在MACBOOK上搭建ARMv8架构的ARM开发环境
        • Starting with JLink debugger or QEMU
    • Linux
      • Kernel
        • 0x01_LinuxKernel_内核的启动(一)之启动前准备
        • 0x02_LinuxKernel_内核的启动(二)SMP多核处理器启动过程分析
        • 0x21_LinuxKernel_内核活动(一)之系统调用
        • 0x22_LinuxKernel_内核活动(二)中断体系结构(中断上文)
        • 0x23_LinuxKernel_内核活动(三)中断体系结构(中断下文)
        • 0x24_LinuxKernel_进程(一)进程的管理(生命周期、进程表示)
        • 0x25_LinuxKernel_进程(二)进程的调度器的实现
        • 0x26_LinuxKernel_设备驱动(一)综述与文件系统关联
        • 0x27_LinuxKernel_设备驱动(二)字符设备操作
        • 0x28_LinuxKernel_设备驱动(三)块设备操作
        • 0x29_LinuxKernel_设备驱动(四)资源与总线系统
        • 0x30_LinuxKernel_设备驱动(五)模块
        • 0x31_LinuxKernel_内存管理(一)物理页面、伙伴系统和slab分配器
        • 0x32_LinuxKernel_内存管理(二)虚拟内存管理、缺页与调试工具
        • 0x33_LinuxKernel_同步管理_原子操作_内存屏障_锁机制等
        • 01_LinuxDebug_调试理论和基础综述
      • Userspace
        • Linux-用户空间-多线程与同步
        • Linux进程之间的通信-管道(上)
        • Linux进程之间的通信-管道(下)
        • Linux进程之间的通信-信号量(System V)
        • Linux进程之间的通信-内存共享(System V)
        • Linux进程之间的通信-消息队列(System V)
        • Linux应用调试(一)方法、技巧和工具 - 综述
        • Linux应用调试(二)工具之coredump
        • Linux应用调试(三)工具之Valgrind
        • Linux机制之内存池
        • Linux机制之对象管理和引用计数(kobject/ktype/kset)
        • Linux机制copy_{to, from}_user
        • Linux设备树 - DTS语法、节点、设备树解析等
        • Linux System : Managing Linux Services - inittab & init.d
        • Linux System : Managing Linux Services - initramfs
      • Kernel Examples
        • Linux Driver - GPIO键盘驱动开发记录_OMAPL138
        • 基于OMAPL138的Linux字符驱动_GPIO驱动AD9833(一)之miscdevice和ioctl
        • 基于OMAPL138的Linux字符驱动_GPIO驱动AD9833(二)之cdev与read、write
        • 基于OMAPL138的字符驱动_GPIO驱动AD9833(三)之中断申请IRQ
        • Linux内核调用SPI驱动_实现OLED显示功能
        • Linux内核调用I2C驱动_驱动嵌套驱动方法MPU6050
    • OPTEE
      • 01_OPTEE-OS_基础之(一)功能综述、简要介绍
      • 02_OPTEE-OS_基础之(二)TrustZone和ATF功能综述、简要介绍
      • 03_OPTEE-OS_系统集成之(一)编译、实例、在QEMU上执行
      • 05_OPTEE-OS_系统集成之(三)ATF启动过程
      • 06_OPTEE-OS_系统集成之(四)OPTEE镜像启动过程
      • 07_OPTEE-OS_系统集成之(五)REE侧上层软件
      • 08_OPTEE-OS_系统集成之(六)TEE的驱动
      • 09_OPTEE-OS_内核之(一)ARM核安全态和非安全态的切换
      • 10_OPTEE-OS_内核之(二)对安全监控模式的调用的处理
      • 11_OPTEE-OS_内核之(三)中断与异常的处理
      • 12_OPTEE-OS_内核之(四)对TA请求的处理
      • 13_OPTEE-OS_内核之(五)内存和cache管理
      • 14_OPTEE-OS_内核之(六)线程管理与并发
      • 15_OPTEE-OS_内核之(七)系统调用及IPC机制
      • 16_OPTEE-OS_应用之(一)TA镜像的签名和加载
      • 17_OPTEE-OS_应用之(二)密码学算法和安全存储
      • 18_OPTEE-OS_应用之(三)可信应用的开发
      • 19_OPTEE-OS_应用之(四)安全驱动开发
      • 20_OPTEE-OS_应用之(五)终端密钥在线下发系统
    • Binary
      • 01_ELF文件_目标文件格式
      • 02_ELF文件结构_浅析内部文件结构
      • 03_ELF文件_静态链接
      • 04_ELF文件_加载进程虚拟地址空间
      • 05_ELF文件_动态链接
      • 06_Linux的动态共享库
      • 07_ELF文件_堆和栈调用惯例以ARMv8为例
      • 08_ELF文件_运行库(入口、库、多线程)
      • 09_ELF文件_基于ARMv7的Linux系统调用原理
      • 10_ELF文件_ARM的镜像文件(.bin/.hex/.s19)
    • Build
      • 01_Script_makefile_summary
    • Rust
      • 02_SYS_RUST_文件IO
    • Security
      • Crypto
        • 1.0_Security_计算机安全概述及安全需求
        • 2.0_Security_随机数(伪随机数)
        • 3.0_Security_对称密钥算法加解密
        • 3.1_Security_对称密钥算法之AES
        • 3.2_Security_对称密钥算法之MAC(CMAC/HMAC)
        • 3.3_Security_对称密钥算法之AEAD
        • 8.0_Security_pkcs7(CMS)_embedded
        • 9.0_Security_pkcs11(HSM)_embedded
      • Tools
        • Openssl EVP to implement RSA and SM2 en/dec sign/verify
        • 基于Mac Silicon M1 的OpenSSL 编译
        • How to compile mbedtls library on Linux/Mac/Windows
    • Embedded
      • eMMC启动介质
  • 😃Design
    • Secure Boot
      • JY Secure Boot Desgin
    • FOTA
      • [FOTA] Module of ECUs' FOTA unit design
        • [FOTA] Tech key point: OSTree Deployment
        • [FOTA] Tech key point: repositories role for onboard
        • [FOTA] Tech key point: metadata management
        • [FOTA] Tech key point: ECU verifying and Decrpting
        • [FOTA] Tech key point: time server
      • [FOTA] Local-OTA for Embedded Linux System
    • Provisioning
      • [X-Shield] Module of the Embedded Boards initialization
    • Report
由 GitBook 提供支持
在本页
  • 08_ELF文件_运行库(入口、库、多线程)
  • 1 函数入口
  • 2 运行库
  • Ref
  1. TECH
  2. Binary

08_ELF文件_运行库(入口、库、多线程)

https://github.com/carloscn/blog/issues/52

上一页07_ELF文件_堆和栈调用惯例以ARMv8为例下一页09_ELF文件_基于ARMv7的Linux系统调用原理

最后更新于1年前

08_ELF文件_运行库(入口、库、多线程)

1 函数入口

如果现阶段我们还认为函数入口是从main开始的,只能说,我们的在学习高中物理而并非大学物理。虽然没有绝对的否定,但是可以用不准确来形容。对于一个SoC的programmer来说,程序从main开始我觉得这是不允许的。我们必须知道程序真正的入口在哪里。这个函数,如果是我们按照正常的理解,那么后输出的是main will return,先输出的my exit!,但是事实并非如此。

#include <stdio.h>
#include <stdlib.h>
void my_exit(void) {
    printf("my exit!\n");
}
int main(void) {
    atexit(&my_exit);
    printf("main will return\n");
    return 0;
}

程序在main返回之后,会记录main函数的返回值,调用atexit注册的函数,然后结束进程。可以看到,c语言并非简单的由main函数进行控制,在此之前肯定做了不少的工作。

那么程序在main之前做了什么?我们要知道,每个平台都不一样,x86和ARM的肯定是不一样的,但肯定有一些是共性的,对于ARM平台:bare-mental和有操作系统的也肯定是不一样。他们需要在这个阶段完成的使命是:

  • S1:操作系统(或baremental)创建进程之后,把控制权交到程序的入口,这个入口往往是运行库中的某个程序入口。(注意入口不是main,是Entry Point)

  • S2:运行库的Entry Point势必要对程序的环境进行初始化,包括stack、heap、I/O、线程、全局变量。

  • S3:call 我们程序中的main函数。

  • S4:main函数结束完毕之后,还会调到运行库的入口函数,入口函数做一些清理工作,包括全局变量的销毁、stack释放、heap释放、关闭IO、最后结束进程。

1.1 glibc入口函数

glibc的entry point是_start(这个入口是由ld链接器默认的链接脚本所指定的,我们也可以通过相关参数设定自己的入口 ld -e),我们看下libc里面怎么实现的:

armv7平台的:glibc-2.35/sysdeps/arm/start.S

armv8平台的:glibc-2.35/sysdeps/aarch64/start.S

我们先研究一下armv8平台的,armv7的可以参考

/* This is the canonical entry point, usually the first thing in the text
   segment.

   Note that the code in the .init section has already been run.
   This includes _init and _libc_init


   At this entry point, most registers' values are unspecified, except:

   x0/w0	Contains a function pointer to be registered with `atexit'.
		This is how the dynamic linker arranges to have DT_FINI
		functions called for shared libraries that have been loaded
		before this code runs.

   sp		The stack contains the arguments and environment:
		0(sp)			argc
		8(sp)			argv[0]
		...
		(8*argc)(sp)		NULL
		(8*(argc+1))(sp)	envp[0]
		...
					NULL
 */

	.text
ENTRY(_start)
	/* Create an initial frame with 0 LR and FP */
	cfi_undefined (x30)
	mov	x29, #0
	mov	x30, #0

	/* Setup rtld_fini in argument register */
	mov	x5, x0

	/* Load argc and a pointer to argv */
	ldr	PTR_REG (1), [sp, #0]
	add	x2, sp, #PTR_SIZE

	/* Setup stack limit in argument register */
	mov	x6, sp

#ifdef PIC
# ifdef SHARED
        adrp    x0, :got:main
	ldr     PTR_REG (0), [x0, #:got_lo12:main]
# else
	adrp	x0, __wrap_main
	add	x0, x0, :lo12:__wrap_main
# endif
#else
	/* Set up the other arguments in registers */
	MOVL (0, main)
#endif
	mov	x3, #0		/* Used to be init.  */
	mov	x4, #0		/* Used to be fini.  */

	/* __libc_start_main (main, argc, argv, init, fini, rtld_fini,
			      stack_end) */

	/* Let the libc call main and exit with its return code.  */
	bl	__libc_start_main

	/* should never get here....*/
	bl	abort

#if defined PIC && !defined SHARED
	/* When main is not defined in the executable but in a shared library
	   then a wrapper is needed in crt1.o of the static-pie enabled libc,
	   because crt1.o and rcrt1.o share code and the later must avoid the
	   use of GOT relocations before __libc_start_main is called.  */
__wrap_main:
	BTI_C
	b	main
#endif
END(_start)

	/* Define a symbol for the first piece of initialized data.  */
	.data
	.globl __data_start
__data_start:
	.long 0
	.weak data_start
	data_start = __data_start

我们先看一下glibc入口的栈使用情况,我给画出来了,栈底有NULL,栈顶是argc,最先吐出来的也是argc,接着就是argv的参数了,最后还有envp环境变量的参数。还要注意的是,寄存器x0被占用,存放我们atexit(func_addr)里面func_addr的值。

void _start()
{
    int x0 = atexit_func_address;
    /* Create an initial frame with 0 LR and FP */
    int x29 = 0;   // lR
    int x30 = 0;   // fp
    /* Setup rtld_fini in argument register */
    int x5 = x0;   // rtld_fini

    /* Load argc and a pointer to argv */
    int argc = /* pop from stack */ sp[0];
    char ** argv = /* pop from stack*/ sp[1];

    __libc_start_main (main, argc, argv, init, fini, rtld_fini, stack_end)
}

这个_start函数提供了一些参数初始化,然后会调用运行库里面__libc_start_main函数:

  • performing any necessary security checks if the effective user ID is not the same as the real user ID.

  • initialize the threading subsystem.

  • registering the *rtld_fini* to release resources when this dynamic shared object exits (or is unloaded).

  • registering the *fini* handler to run at program exit.

  • calling the initializer function (**init*)().

  • calling main() with appropriate arguments.

  • calling exit() with the return value from main().

__libc_start_main函数从此和平台没有任何关系了, 仅仅是调用的逻辑不同。__libc_start_main函数在,被定义成LIBC_START_MAIN在glibc-2.35/csu路径。

这里面有很多宏定义隔开的在不同场景下的,我们先看最基本的:

__pthread_initialize_minimal()
__cxa_atexit(rtld_fini, NULL, NULL)
__libc_init_first(argc, argv, __environ)
__cxa_atexit(fini, NULL, NULL)
(*init)(argc, argv, __environ)

传入的参数fini和rtld_fini用于main结束之后调用。还有个要注意的,atexit是一个链表结构,在exit时候会遍历每个链表:

void exit(int status)
{
	while(__exit_funcs != NULL) {
		__exit_funcs = __exit_funcs->next;
	}
	__exit(status);
}

1.2 I/O初始化

这部分简单的来说,进程需要在用户空间建立stdin,stdout,stderr对应的FILE FD,让程序可以直接使用printf,scanf等。

2 运行库

glibc发布版本主要有三部分组成:

  • 头文件:/usr/include

  • 二进制文件部分

    • 动态部分:/lib/libc.so.6

    • 静态部分:/usr/lib/libc.a

  • 辅助运行库

    • /usr/lib/crt1.o

    • /usr/lib/crti.o

    • /usr/lib/ctrn.o

2.1 glibc启动文件

这个文件包含程序的入口函数_start,所以由它负责调用我们1节说的_libc_start_main,包含了基本的启动、退出代码,ctr1.o必须是链接器第一个输入的位置。elf文件这块对于ctr1.o也有要求,目标文件中引入了.init和.finit,运行库会保证所有位于这两个段中的代码会先于/后于main函数执行,所以他们用来实现全局构构造和全局析构。在ctr1.o中包含了一些辅助代码,(比如计算GOT之类的),因此引入了crti.o和ctrn.o两个文件。ctri.o和ctrn.o这两个目标文件中包含的代码实际上是_init()函数和_finit()函数开始和结尾的部分。链接器输入文件顺序是:

ld crt1.o crti.o [user_objects] [system_libraries] crtn.o

2.2 全局构造和解析

在main前调用函数,glibc的全局构造函数放置在.ctors段内部,因此如果我们手动在.ctors段里面加一些函数指针,就可以让这些函数在全局狗在函数时候(main)前调用:

#include <stdio.h>
#include <stdlib.h>
typedef void (*ctor_t)(void);
void __attribute__((constructor)) my_init(void)
{
    printf("my init!\n");
}
void __attribute__((destructor)) my_exit(void) {
    printf("my exit!\n");
}
void atexit_func(void) {
    printf("atexit !\n");
}
int main(void) {
    atexit(&atexit_func);
    printf("main will return\n");
    return 0;
}

注意,由于全局对象的构建和析构都是由运行库来完成的,于是在程序或共享库中有全局对象的时候,不能使用-nonstartfiles和-nostdlib选项否则,编译不通过。

Ref

image-20220424154657535

😾
Linux中誰來呼叫C語言中的main? (armv7)