当前位置：网站首页>【精通高并发】深入理解C语言基础与汇编下的C语言

【精通高并发】深入理解C语言基础与汇编下的C语言

2022-06-25 15:57:00 【华为云】

作者简介：小明的Java问道之路，某大型金融互联网公司后端研发高级工程师，擅长订单/交易领域的高安全/可用/并发/性能的架构设计与落地，专注于研究计算机底层与金融科技领域技术
如果此文还不错的话，还请关注、点赞、收藏三连支持一下博主

本文导读：C语言基础部分不过多赘述，主要讲解结构体、指针和数组原理，并分析汇编下的C语言。Liunx内核和JNI都是通过C编写，这部分主要讲解通过操作指针和内存执行程序的思想，对后续Hotspot和java的api的理解有很重要的作用。

二、C语言基础

1.结构体应用

必须使用struct语句，struct语句定义了一个包含多个成员的数据类型

 struct tag {   // tag是结构体标签  	member-list // member-list 是标准的变量定义  	member-list  	...  } variable-list; // variable-list是结构变量，定义在结构体末尾，最后一个分号前，可以指定一个或多个结构体变量

结构体应用：介绍了如何声明（定义）结构体，初始化结构体变量（相当于new或者set对象），如何访问结构体成员（相当于访问对象属性），结构体作为函数参数和指向结构体的指针应用。

2.从汇编的角度看结构体

从此段简单的代码分析，name和age地址相差8个字节，整好是一个整形4个字节+4个字节填充，我们将其反汇编，看下汇编代码的实现。

#include<stdio.h>struct User { // 声明结构体 	int age;	char *name;	long money;};int main() {	struct User user = {18,"XiaoMing",10000};	struct User *p = &user; 		printf("user变量地址 : %p",&user); 	printf("p指针访问值: %d",p->age); 	printf("age的地址 : %p",&(p->age)); 	printf("p指针访问值name: %s",p->name); 	printf("name的地址: %p",&(p->name)); }// user变量地址 : 000000000062FE30// p指针访问值: 18// age的地址 : 000000000062FE30// p指针访问值name: XiaoMing// name的地址: 000000000062FE38

// main方法汇编代码 main: push   %rbp        // 开辟新的栈帧 mov    %rsp,%rbpsub    $0x40,%rsp  // 创造64byte的空间，需要注意下面存储的数据和内存对齐机制  callq  0x4023b0 <__main>  movl   $0x11,-0x20(%rbp)  // mov指令，将整型17（0x11，4个字节），字符串，长整型放到栈对应的地址中，相当于执行 struct User user = {17,"lisa",10000};movl   $0x2710,-0x10(%rbp)lea    0x28b5(%rip),%rax        # 0x404050 // 取17的地址放到rax寄存器中，然后保存在栈中，相当于执行 struct User *p = &user; mov    %rax,-0x18(%rbp)  // lea:取有效地址，mov:传送指令 lea    -0x20(%rbp),%rax   mov    %rax,-0x8(%rbp)lea    -0x20(%rbp),%rax  //  取17的地址放到rax寄存器中，然后调用printf，相当于执行 printf("user变量地址 : %p",&user); mov    %rax,%rdxlea    0x2899(%rip),%rcx        # 0x404055callq  0x402dd0 <printf>mov    -0x8(%rbp),%rax   //  取17的地址放到rax寄存器中，然后作为地址，将寻址的地址单元中的值放入eax寄存器 mov    (%rax),%eax       //  (%rax)表示将rax寄存器中的值作为地址寻址放入eax寄存器中 mov    %eax,%edxlea    0x2897(%rip),%rcx        # 0x404067callq  0x402dd0 <printf>mov    -0x8(%rbp),%rax   // 将地址往前偏移8个字节单元地址的内容，放入rax寄存器，这个内容就是指向***的指针，由于64位机，此时整好是8个字节 mov    %rax,%rdxlea    0x2894(%rip),%rcx        # 0x404077callq  0x402dd0 <printf>mov    -0x8(%rbp),%raxmov    0x8(%rax),%raxmov    %rax,%rdxlea    0x288c(%rip),%rcx        # 0x404086callq  0x402dd0 <printf>mov    -0x8(%rbp),%raxadd    $0x8,%raxmov    %rax,%rdxlea    0x2889(%rip),%rcx        # 0x40409acallq  0x402dd0 <printf>mov    $0x0,%eaxadd    $0x40,%rsp  // 将地址值直接加8，相当于地址加8个字节 pop    %rbplesve  // 清除栈帧并设置地址返回retq         // ret:返回指令

3.指针原理

每个变量都会有一个内存地址，每个内存地址都可以使用&访问，他表示在内存中的地址。首先明确一个概念，指针就是一个变量，其值就是另一个变量的地址（内存位置的直接地址），所有使用的时候必须先声明。

	// type *varName; type是指针的基类型，必须是有效的数据类型 	int *ip;    // 整形指针 	double *dp; // 所有实际数据类型，都是内存地址16进制数 	float *fp;	char *cp;

指针的应用：这里面p就是一个指针，与变量var的类型相同

#include<stdio.h>int main() {	int var = 20;	int *p; 	p = &var;	printf("var变量的地址 : %p",&var); 	printf("p指针的存储地址: %p",p); 	printf("p指针访问的值: %d",*p); } // var变量的地址 : 000000000062FE44// p指针的存储地址: 000000000062FE44// p指针访问的值: 20

4.从汇编的角度看指针

将上述代码反汇编之后的代码，作者为64位系统

main:push   %rbp           // 开辟新的栈帧 mov    %rsp,%rbp          sub    $0x30,%rsp     // 在栈上开辟48（0x30）byte大小的空间 callq  0x402120 <__main>movl   $0x14,-0xc(%rbp) // 将4byte大小的20（0x14）放入栈中（rbp） lea    -0xc(%rbp),%rax  // 将20在栈中的地址取出，放入rax寄存器 mov    %rax,-0x8(%rbp)  // 将rax寄存器，20的地址放入栈中，在64位系统中，地址大小是8byte  以上两行代码相当于 int *p; p=&var; lea    -0xc(%rbp),%rax  // 再次获取20的地址 mov    %rax,%rdx     // 将20的地址从rax寄存器放入rdx寄存器中 lea    0x2aa6(%rip),%rcx        # 0x404000callq  0x402b38 <printf>    // 相当于printf("var变量的地址 : %p",&var); mov    -0x8(%rbp),%rax   // 将之前保存20的地址放入rax中 mov    %rax,%rdxlea    0x2aa6(%rip),%rcx        # 0x404013callq  0x402b38 <printf>    // 相当于printf("p指针的存储地址: %p",p); mov    -0x8(%rbp),%rax   // 将之前保存20的地址放入rax中 mov    (%rax),%eax       // 注意这里 (%rax)，相当于将rax寄存器中的表露当做地址，去内存中获取对应地址的值，放入eax寄存器						 // 20只有4byte（32位），所以不需要rax寄存器（64位） mov    %eax,%edxlea    0x2aa6(%rip),%rcx        # 0x404027callq  0x402b38 <printf>    // 相当于printf("p指针访问的值: %d",*p); mov    $0x0,%eaxadd    $0x30,%rsppop    %rbpretq

这里我们总结，指针就是一个内存单元保存了一个地址，一般用&地址符，相当于 lea 指令，使用指针用 * 解地址符，相当于汇编代码中的 () 例如 mov (%rax),%eax，将之前的 lea 指令获取的地址信息作为访问，以获取地址响应的变量信息。

5.一些指针的基础应用

通过指针访问数组，数组是连续的空间，指针中保存的是对应数据的地址，声明数组的时候就是默认新开辟连续的地址空间的第一个元素的地址，使用var[index] 等价于我们直接操作指针 * 引用获取元素；
指针数组就是保存元素地址（指针）的数组

#include<stdio.h>int main() {	/**	 * 通过指针访问数组 	 */	int var[] = {1,2,3};	printf("地址: %p",var); 	printf("地址: %p",var+1); 	printf("值: %d",*var); 	printf("值: %d",*(var+1)); 		/**	 * 指针数组 	 */ 	int i, *arr[3];	for (i=0;i<3;i++) {		arr[i] = &var[i];	}	for(i=0;i<3;i++){		printf("var[%d] = %d ",i , *arr[i]); 		} } // 地址: 000000000062FE40// 地址: 000000000062FE44// 值: 1// 值: 2// var[0] = 1 var[1] = 2 var[2] = 3

原网站

版权声明
本文为[华为云]所创，转载请带上原文链接，感谢
https://bbs.huaweicloud.com/blogs/361592