C语言笔记

变量相关：

C99以前的C要求在一个代码块的开始处声明变量。
声明语句为变量创建，标定存储空间并为其制定初始值。
C99引入_Bool类型表示布尔值。它还提供stdbool.h头文件，包含这个头文件可以使用bool来代替_Bool，并把true和false定义为1和0的符号常量。
C99提供一个可选的名字集合，用来描述确定的位数。如int16_t表示一个16位有符号整数类型，uint32_t表示一个32位无符号整数类型。使用这些名字，需要包含头文件inttypes.h。另外，这种确切的长度类型在某些系统上可能不支持。不如，不能保证某些系统上存在一种int8_t类型（8位有符号整数）。为了解决这个问题，C99标准定义了第二组名字集合。这些名字保证所表示的类型至少大于指定长度的最小类型，被称为“最小长度类型”。例如，int_least8_t是可以容纳8位有符号数的那些类型中长度最小的一个别名。因为一些程序员更关心速度而非空间。C99为他们定义了一组可使计算达到最快的类型集合。这组集合被称为“最快最小长度类型”。如，int_fast8_t定义为系统中对8位有符号数而言计算最快的整数类型的别名。为了使用printf输出这些类型，C99还提供了一些串宏来帮助打印这些类型。（注：可能一些编译器并不支持这一特性）
浮点数的上溢和下溢。当一个计算结果是一个大的不能表达的数时，会发生上溢，现在C语言用一个特殊值表示这个太大的数，printf函数显示此值为inf或infinity。如果将浮点数能表示的最小的数除以2，将会得到一个低于正常的值，如果除以一个足够大的数，将使所有位都为0。现在C库提供了用于检查计算是否会产生低于正常的值的函数。有一个特殊的浮点值NaN（Not-a-Number）。例如asin函数返回反正弦值，但是正弦值不能大于1，所以它的输入参数不能大于1，否则函数返回NaN值，printf函数显示此值为nan，NaN或类似形式。
C99还支持复数和虚数类型。
在将浮点数转换为整数时，C简单的丢弃小数部分（截尾），而不进行四舍五入。
sizeof运算符返回一个size_t类型的数，这个类型通常是unsigned或unsigned long。对于某个具体量的大小sizeof的括号是可选的，但对于类型来说，括号是必需的。如sizeof(int)，sizeof(2.0)<=>sizeof 2.0。
C99标准要求编译器识别局部标识符的前63个字符和外部标识符的前31个字符。在这之前分别为31个和6个字符。

参数传递机制

对于下面的代码段：

float n1 = 3.0;
double n2 = 3.0;
long n3 = 300000;
long n4 = 123456790;
printf("%ld %ld %ld %ld\n", n1, n2, n3, n4);

该调用告诉计算机把变量n1,n2,n3,n4的值传递给计算机，计算机把他们放置到被称为堆栈（stack）的一块内存区域中来实现。计算机根据变量的类型而非转换说明符把这些值放到堆栈中。所以，n1,n2,n3,n4四个变量在堆栈中分别占8,8,4,4个字节，其中n1的float被转换成了double。然后，控制交给了printf函数。该函数中堆栈中把值读出来，但是在读取时，它根据转换说明符去读取。%ld说明符指出，printf应该读取4个字节，所以printf在堆栈中读取前4个字节作为它的一个值。这就是n1的前半部分，它被解释成一个long类型。写一个%ld说明符再读取4个字节；这就是n1的后半部分，它也被解释成一个long类型。同样，第三个和第四个%ld说明符分别读取n2的前半部分和后半部分，并解释成一个long类型。所以虽然n3和n4的说明符都正确，但是printf仍然读取了错误的字节。
一般来说，栈从高地址向低地址生长，即高地址是栈的底部。而函数的入栈顺序是从右向左。从右向左入栈的原因是，这样可以使得编译器可以支持可变参数，通过第一个参数可以获得参数的个数和每个参数的大小，这样就能取得每个参数。
在C中，会发生许多自动类型转换。当char和short类型出现在表达式里或者作为函数的参数时，它们都被提升为int类型。当float类型作为一个函数参数时被提升为double。
在包含两种数据类型的任何运算里，两个值都被转换成两种类型里较高的级别。

优先级和求值顺序

运算符的优先级为决定表达式里求值的顺序提供了重要的规则，但是它并不决定所有的规则。如：
1
y = 6 * 12 + 5 * 20;

当两个运算符共享一个操作数的时候，优先级规定了求值顺序。例如，12既是运算符的操作数，又是+运算符的操作数，根据优先级的规定乘法运算先进行。与之类似，优先级规定了对5进行乘法操作而不是加法操作。总之，两个乘法操作在加法操作之前进行。但是优先级并没有确定的是这两个乘法运算中到底那个先进行。C将这个选择权留给实现者，这是因为可能一种选择在一种硬件上效率更高，而另一种选择在另一种硬件上效率更高。但是不管先执行那个乘法运算，表达式都会简化成72+100。虽然乘法运算符的结合性是从左到右，但因为两个\运算符不共享一个操作数，所以从左到右的规则对它并不适用。也就是说结合规则适用于共享同一操作数的运算符。

对于参数传递，参数的求值顺序也是不确定的。所以，下边的语句的结果在不同的系统上可能会产生不同的结果。
1
2
3
4
int num = 1;
printf("%d %d\n", num, num * num++);
int n = 2;
printf("%d\n", n++ + n++);

但是我们可以通过一下原则来避免这些问题。

如果一个变量出现在同一个函数的多个参数中，不要将增量或减量运算符用于它上边。
当一个变量多次出现在一个表达式里时，不要将增量或减量运算符用于它上边。

顺序点是程序执行中的一点，在该点处，所有的副作用都在进入下一步之前被计算。在C中语句里的分号标志了一个顺序点。任何一个完整的表达式结束也是一个顺序点。一个完整的表达式是这样一个表达式——它不是一个更大的表达式的子表达式。逗号运算符是一个顺序点。

分支和跳转

C99标准要求编译器最少支持127层else-if嵌套。
C99标准为逻辑运算符增加了可供选择的拼写方法。它们在iso646.h头文件中定义，包含这个头文件可以使用and，or，not来代替相应的逻辑运算符。同时，C还提供了3元字符扩展。
switch语句里的case必须是整型（包括char）常量或者整型常量表达式（仅包含整数常量的表达式）。

函数

C99标准不再支持函数的int类型的默认设置。类型声明是函数定义的一部分。
一般来讲，尾递归的空间复杂度是常量。
所有的C函数地位同等，也就是说，main函数也可以被其本身或者被其他函数递归掉调用——尽管很少这么做。

数组

数组制定初始化项目，对数组中指定的项目初始化。如多次对一个元素初始化，则最后一次有效。

// 传统语法
int arr1[6] = {0, 0, 0, 0, 0, 123};
// C99语法
int arr2[6] = {[5] = 123};
int arr3[3] = {[2] = 3, 4}; // 数组内容为0， 3， 4

C99之前声明数组的方括号内只能使用整数常量表达式（表达式的值必须大于0）。注意，与C++不同，const值不是一个整数常量。

C99引入了变长数组，即声明数组的方括号内可以使用变量。变长数组必须是自动存储类型的，这意味着他们必须在函数内部或者作为函数形式参数声明，而且声明时不可以进行初始化。

1
2
3

int sum2d(int, int, int ar[*][*]);		// ar是一个边长数组，必须使用*号代替省略的维数
int sum2d(int a, int b, int ar[a][b]);	// a和b的声明一定要在ar的前边
int sum2d(int ar[a][b], int a, int b);	// 错误

C99复合文字。可以使用复合文字创建一个无名数组。

// 一个包含两个int值的数组
(int [2]){10, 20}
// 可以通过指针来使用他们，也可以将他们用做函数参数
int *p = (int [3]){1, 2, 3};

指针

可以使用const来创建指向常量的指针或指针常量，当然也可以创建指向常量的指针常量。如下：

1 2	const int pi1; // 指向常量的指针，指针指向的值不能改变 int const pi2; // 指针常量，指针指向的地址不能改变，但是指针指向地址的值可以改变

指向多为数组的指针。

1 2	int (pz)[2]; // pz指向一个包含两个int值的数组 int p[2]; // p是一个数组，这个数组的每一个元素是一个指向一个int值的指针

指针兼容性。多维数组指针要求指针的维数是一致的。

int *pt;
int (*pa)[3];
int ar1[2][3];
int ar2[3][2];
int **p2;		// 指向指针的指针
pt = &ar1[0][0];
pt = ar1[0];
pt = ar1;		// 非法
pa = ar1;
pa = ar2;		// 非法
p2 = &pt;
*p2 = ar2[0];
p2 = ar2;		// 非法

const指针与非const指针。可以把一个非const指针赋值给一个const指针，但是不能把一个const指针赋值给一个非const指针。这个结论有一个前提，值进行一层间接运算。在两层间接运算时，这样的赋值就不再安全。

const int **pp2;
int *p1;
const int n = 13;
pp2 = &p1;		// 不允许，但我们假设允许
*pp2 = &n;		// 合法，二者都是const，这同时会使p1指向n
*p1 = 10;		// 合法，但这会改变const n的值

void指针。在C中void指针可以赋给其他类型的指针而不需要强制转换。但在C++中需要。
在C99中同样可以声明一个变长数组指针。

字符串

字符串属于静态存储类。
ANSI C提供了函数：atoi, atof, atol, strtol, strtoul, strtod来将字符串转换成数值。
可以使用sprintf来将数值转换成字符串。

作用域

一个C变量的作用域可以是代码块作用域，函数原型作用域或者文件作用域。
一个C变量有静态存储时期和自动存储时期。除非你显示的初始化自动变量，否则他们不会被自动初始化。
如果一个变量被声明为寄存器变量，你无法获得它的地址。
一个外部变量只能进行一次初始化，而且一定是在变量被定义时进行。

类型限定符

限定词volatile告诉编译器该变量除了可被程序修改外还可以被其他代理改变。因此，这告诉编译器要小心的优化这个变量。
限定词restrict只可以用于指针，表明该指针是访问一个数据对象的唯一且初始的方式。这样编译器就可以进行合适的优化。一个例子是memcpy的参数使用了restrict，要求两个内存区域不能有重叠，而memmove则不做这个假定。

文件I/O

stdout和stderr的一个区别是，当出现输出重定向的时候，stderr仍然将输出打印到屏幕上。即stderr不受重定向的影响。
在Unix和Linux这样只有一种文件类型的系统，打开文件时使用带b字母的模式和不带b字母的模式是相同的。
程序中可以同时打开的文件数目是有限制的，这取决于系统和实现，通常为10到20之间。

结构，联合和枚举

指定项目初始化。与数组的类似。

1	struct person p = {.name = "gwq"}; // 仅仅指定名字

在一些系统上，结构的占用空间大小可能会大于他内部各个成员大小之和，这是因为系统对数据的对齐存储要求所致。
和数组名不同，单独的结构名不是该结构地址的同义词。
可以允许一个结构赋值给另一个结构，但是对数组不能这么做。

C99复合文字和结构。

// 无名结构对结构赋值
struct person p = （struct person){"gwq", 21};
// 如果需要一个结构的地址，可以使用&获得一个复合结构的地址。
struct person *pp = &（struct person){"gwq", 21};

C99的伸缩型数组成员。声明一个伸缩型数组成员的规则是：1）伸缩性数组成员必须是最后一个数组成员。2）结构中必须至少有一个其他成员。3）伸缩型数组就像普通数组一样被声明，除了它的方括号内是空的。该数组成员的特殊属性之一是它不存在，至少不立即存在。C99的意图是使用malloc来分配足够的空间来使用这个数组成员。如：

struct flex {
	int count;
	double average;
	double scores[];   // 伸缩型数组成员
};
// 现在这个pf指向的结构，拥有了5个元素的double类型数组。
struct flex *pf = malloc(sizeof(struct flex) + 5 * sizeof(double));

联合是一个能在同一个存储空间里（但不同时）存储不同类型数据的数据类型。
枚举可以声明代表整数常量的符号名称。实际上，枚举常量是int类型的。虽然枚举常量是int类型的，但是枚举变量较为宽松的限定为任一种整数类型，只要该整数类型能保存这些枚举常量。
C的某些枚举属性不能延伸到C++中，如C允许对枚举变量使用++，但C++不允许。

枚举的默认值是从零开始递增。但可以制定特定的值。

1 2	enum color {red, green, blue};// 分别为0， 1， 2 enum levels { low, medium = 500; high}; 分别为0， 500， 501

C使用术语名字空间（namespace）来表示识别一个名字的程序的部分。作用域是这个概念的一部分：名字相同但具有不同作用域的两个变量不会冲突；而名字相同并在相同作用域中的两个变量就会冲突。名字空间是分类别的。在一个特定作用域内的结构标记，联合标记以及枚举标记都共享一个名字空间，并且这个名字空间与普通变量使用的名字空间是不同的。如：
1
2
struct rect {double x; double y};
int rect; // 在C中不会引起冲突

但是这种方式会引起混乱；而且，C++不允许在同一个作用域内对一个变量和一个标记使用同一个名字，因为它把标记和变量名放在同一个名字空间中。

奇特的声明

如下：

int board[8][8];		// int数组的数组
int **ptr;				// 指向int指针的指针
int *risks[10];			// 具有10个元素的数组，每个元素是一个指向int的指针
int (*rusks)[10];		// 一个指针，指向具有10个元素的int数组
int *oof[3][4];			// 一个3*4的数组，每个元素是一个指向int的指针
int (*uuf)[3][4];		// 一个指针，指向3*4的int数组
int (*uof[3])[4];		// 一个具有3个元素的数组，每一个元素是指向具
						// 有四个元素的int数组的指针

弄清楚这些声明的诀窍便是理解使用修饰符的顺序。

表示一个数组的[]和表示一个函数的()具有相同的优先级，这个优先级高于间接运算符的优先级。如：int arr[10]声明一个指针数组，而不是一个指向数组的指针。
[]和()都是从左到右结合的。声明int goods[10][50]使得goods是一个由12个具有50个int值的数组构成的数组，而不是一个由50个具有12个int值的数组构成的数组。
[]和()具有相同的优先级，但是由于他们是从左到右结合的，所以声明int (*rusks)[10]在应用方括号之前先将*和rusks组合在一起。这意味着rusks是一个指向具有10个int值的数组的指针。

函数和指针

声明一个指向特定函数类型的指针，首先声明一个该类型的函数，然后用(*pf)形式的表达式代替函数名称；pf就成为了指向那种类型函数的指针了。

使用指针调用函数有两种看起来都合理的方式。如：

void ToUpper(char *);
void ToLower(char *);
void (*pf)(char *);
char mis[] = "Nina Metier";
pf = ToUpper;
(*pf)(mis);		// 把ToUpper作用于mis
pf = ToLower;
pf(mis);		// 把ToLower作用于mis

K&R C不允许第二种形式，但是有的实现却采用第二种形式，为了保持与现有代码的兼容性，ANSI C把这二者作用等价形式全部接受。

不能拥有一个函数的数组，但是可以拥有一个函数指针的数组。如char (*pf[3])(void);

位操作

掩码。使用位与（&）可以获得特定某个位或某些位的值。
打开位。使用位或（|）可以将某一位置为1而不管这个位原来是多少。
关闭位。使用位与（&）与求反（～）可以将某个位置为0，不管这个位原来是多少。如：
1
2
3
int mask = 1;
int n = 3;
int m = n & ~mask; // 将最低位关闭
转置位，因为1与0异或为1，1与1异或为0。而0与0异或为0,0与1异或为1。所以可以使用异或操作（^）来转置某些位。只需要将需要转置的位的掩码置为1，其余置为0就行了。
左移位运算符（<<）将其左侧操作数的值的每位向左移动，移动的位数由其右侧操作数指定。空出的位用0填充，并且丢弃移出左侧操作数末端的位。
右移位运算符（>>）将其左侧操作数的值的每位向右移动，移动的位数由其右侧操作数指定。丢弃移出左侧操作数右端的位。对于unsigned类型，使用0填充左端空出的位。对于有符号数，结果依赖机器。空出的位可能用0填充，或者使用符号（最左端的）位的副本填充。
移位运算符能够提供快捷，高效的（依赖于硬件）的对2的幂的乘法和除法。
可以在结构中使用位字段，即对其的操作仅仅是对这个或这几个位的操作。使用一个宽度为0的未命名字段迫使下一个字段与下一个整数对齐。不允许一个字段跨越两个unsigned int之间的边界，编译器自动的移位这样一个字段定义，使得字段按unsigned int边界对齐。发生这种情况时，会在第一个unsigned int中留下一个未命名的洞。如：
1
2
3
4
5
6
7
struct {
unsigned int field1: 1;
unsigned int : 2;
unsigned int field2: 1;
unsigned int : 0;
unsigned int field3: 1;
}stuff;

以上例子中，stuff.field1与stuff.field2之间有一个2位的间隙，stuff.field3存储在下一个int中。

一个重要的机器依赖性是将字段放置到一个int中的顺序。在有些机器上，这个顺序是从左向右；在另一些机器上顺序是从右向左。另外，不同机器在两个字段间边界的位置上也有区别。由于这些原因，位字段往往难以移植。
同样也可使用位运算来模仿位字段的功能，但这要稍微复杂一些。

C预处理器和库

C的预处理只进行字符替换，不会进行算数运算。如：

1 2	#define TWO 2 int x = TWO * TWO; // 进过预处理后是2 * 2，实际想乘发生在编译阶段

预处理器不会替换在字符串中的宏。如：

1
2
3

#define TWO 2
#define OW "nihao"
printf("TWO:OW");// 打印出来TWO:OW而不是2:nihao

对于重定义宏，ANSI C只允许新定义与旧定义完全相同。相同定义意味着主体具有相同顺序的语言符号。
在宏定义中可以使用参数。但这使用不当可能会带来难以理解的结果。因为宏只进行简单的文本替换，可能一个参数在宏中会出现好多次，这对有副作用的表达式，会产生多次副作用，典型的就是自增和自减运算符。

可以使用#号将一个宏的参数字符串化。如：

1
2
3

#define PR(x) printf(#x " = %d.\n", x);
int x = 56;
PR(x);        // 替换为:printf("x" " = %d.\n", x);

可以使用##符号来将一个语言符号组合成一个语言符号，可以理解为生成一个变量的名称。如：
1
2
XNAME(n) x ## n
int XNAME(1) = 4; // 替换为int x1 = 4;
可以使用…和__VA_ARGS__来定义一个可变参数的宏。方法是将宏定义中参数列表的最后一个参数写为省略号，然后在被替换部分就可以使用__VA_ARGS__来代替省略的部分。如：
1
2
3
#define PR(...) printf(__VA_ARGS__)
PR("nihao"); // printf("nihao");
PR("%d", x); // printf("%d", x);
函数调用需要一定的开销，这意味着执行调用时花费了时间用于建立调用，传递参数，跳转到函数代码段并返回。使用类函数宏的一个原因就是可以减少执行时间。此外C99还提供了另外一种方法：内敛函数。C99标准这样叙述：“把函数变为内联函数将建议编译器尽可能快速地调用该函数。上述建议的效果由实现来定义”。因此，使函数变为内联函数可能会简化函数的调用机制，但也可能不起作用。
因为内联函数没有预留给它单独代码块，所以无法获得内敛函数的地址（实际上，可以获得地址，但这样会使编译器产生非内联代码）。另外，内联函数不会在调试器中显示。
内联函数应该比较短小。对于很长的函数，调用函数的时间少于执行函数主体的时间；此时，使用内敛函数不会节省很多时间。
编译器在优化内联函数时，必须知道函数定义的内容，这意味着内联函数的定义和对该函数的调用必须在同一文件中，正因为这样，内联函数通常具有内部连接。在多文件的程序中，每个调用内联函数的文件，都要对该函数进行定义。
main函数在结束时会隐式的调用exit()；可以使用atexit函数注册在程序（隐式或显示）调用exit函数前，调用的函数。可以注册多个函数，最后注册的函数最先被调用。ANSI保证这个列表中至少可以放置32个函数。

注：以上这些文字，大部分抄录自C Primer Plus（第五版）中文版。

C语言笔记

C语言笔记

参数传递机制

优先级和求值顺序

分支和跳转

函数

数组

指针

字符串

作用域

类型限定符

文件I/O

结构，联合和枚举

奇特的声明

函数和指针

位操作

C预处理器和库

谢谢大爷~