这个『整型提升』隐藏的太深了...
Integer Promotions in C 简介
整型提升是C程序设计语言中的一项规定:在表达式计算时,各种整形首先要提升为int类型,如果int类型不足以表示的话,就需要提升为unsigned int类型,然后再执行表达式的运算
。
这一规则是由C语言的发明人丹尼斯·里奇与肯·汤普逊
创设的:
'A character, a short integer, or an integer bit-field, all either signed or not, or an object of enumeration type, may be used in an expression wherever an integer maybe used. If an int can represent all the values of the original type, then the value is converted to int; otherwise the value is converted to unsigned int. This process is called integral promotion.'
这段话的大意是:无论使用什么整数,都可以在表达式中使用char,short int或 int字段(全部带符号或没有符号)或枚举类型的对象。如果一个int可以代表原始类型的所有值,则该值将转换为int;否则,该值将转换为unsigned int,这个过程称为整体提升。
举例子来了解一下整形提升
一些数据类型(比如char,short int)比int占用更少的字节数,对它们执行操作时,这些数据类型会自动提升为int或unsigned int,例如,在较小的类型(如char,short和enum)上不会进行算术计算,代码如下:
1//在win10_64位+vs2017
2#include <stdio.h>
3int main()
4{
5 char a = 30, b = 40, c = 10;
6 char d = (a * b) / c;
7 printf ('%d ', d);
8 system('pause');
9 return 0;
10}
输出结果:120
直接看代码,表达式(a * b)/ c
似乎引起算术溢出,因为带符号的字符只能具有-128至127的值(在大多数C编译器中),而子表达式的值(a * b)=1200
,大于128。
但是整数提升是在char类型进行算术运算时发生的,我们得到了适当的结果而没有任何溢出。
整型提升的意义
虽然机器指令中可能有现两个8比特字节这种字节相加指令,但是一般用途的CPU是难以直接实现这样的字节相加运算的。
所以,表达式中各种长度可能小于int长度的整型值,都必须先转换为int或unsigned int,然后才能送入CPU去执行运算。
CPU内整型运算器(ALU)的操作数的字节长度一般就是int的字节长度,同时也是CPU的通用寄存器的长度。而表达式的整型运算要在CPU的相应运算器件内执行。
因此,两个char类型的树进行相加运算时,是在CPU中执行,自然而然的需要先转换为CPU内整型操作数的标准长度。
应用举例
short int的长度 = int的长度的情况
C语言标准中仅规定了:
char的长度 ≤ short int的长度 ≤ int的长度
这意味着short int与int的长度相等的可能,这种情形下,unsigned short就无法提升为int表示,只能提升为unsigned int,代码如下:
1//在win10_64位+vs2017 2#include <stdio.h> 3int main(){ 4 char a = 0xb6; 5 short b = 0xb600; 6 int c = 0xb6000000; 7 if ( a == 0xb6) printf('a'); 8 if ( b == 0xb600) printf('b'); 9 if ( c == 0xb6000000) printf('c'); 10 system('pause');11}
输出结果:c
C语言标准没有规定char类型是有符号还是无符号,在这些环境下,编译器把char定义为signed char
。
表达式a==0xb6
被整型提升,其中char类型的a
提升为int类型并表示为一个负值,因此这个表达式的结果为false;
表达式b==0xb600
被整型提升,其中short类型的b
提升为int类型并为一个负值,因此这个表达式的结果为false;
表达式c == 0xb6000000
没有做整型提升,==运算符的两段都是int类型的负值,其结果为true。
我们再考虑以下程序作为另一个示例。
1//在win10_64位+vs2017
2#include <stdio.h>
3
4int main()
5{
6 char a = 0xfb;
7 unsigned char b = 0xfb;
8
9 printf('a = %c', a);
10 printf('\nb = %c', b);
11
12 if (a == b)
13 printf('\nSame');
14 else
15 printf('\nNot Same');
16
17 system('pause');
18 return 0;
19}
输出结果:
a=
b=
Not Same
当我们打印“a”和“b”时,将打印相同的字符,但是当我们比较它们时,输出的结果却不相同。
“a”和“b”与char具有相同的二进制表示形式,但是,当对“a”和 ”b”执行比较操作时,它们首先会转换为int。
“a”是一个有符号的字符,当转换为int时,其值变为-5(有符号的值0xfb)。
“b”是无符号字符,当将其转换为int时,其值变为251。
值-5和251具有不同的int表示形式,因此我们得到的输出为“Not Same”。
前缀+的情况
C语言的单操作数的+运算符(即“前缀+”),一个主要作用就是实现对操作数的整型提升。例如:
1//在win10_64位+vs2017 2#include <stdio.h> 3int main() 4{ 5 char a = 1; 6 printf('%u', sizeof(a) ); 7 printf('\n'); 8 printf('%u', sizeof( +a ) ); 9 system('pause');10 return 0;11}
输出结果:
1
4
从结果中我们可以看到,前缀+把大小给提升了。
话说C语言的特点
这里不得不提一下C语言的特点,C语言高效、灵活、功能丰富、表达力强,在诞生起初,为了避免各开发厂商用的C语言语法产生差异,C语言订定了一套语法ANSI C,作为C语言的标准。
以上所有的程序以及结论都是在win10_64位+vs2017完成的,不同平台和不同编译器之间可能的实验结果都不一样,但这并不影响我们深入理解C语言的特性,讲原理,抠细节,究根源,乐趣在此。