- Real C - UDN开源文档

0x05-C语言变量

C语言在明面上将数的变量分为两类，整型变量以及浮点数，对应着现实世界的整数和小数。

首先是整数，使用了这么多的C语言之后，每当在使用整数之时都会将其想象成二进制的存在，而不是十进制。原因在于，这是程序的本质所在，稍有研究编译器工作原理的都会发现，在编译器处理乘法乃至除法的时候，优秀的编译器总会想方设法的加快程序的速度，毫无疑问在所有运算中移位运算是最快速的"乘法"以及"除法":
1<<2 == 4 ,8>>2 == 2

而正常一个乘法相当于十数次的加法运算的时间消耗，移位则不用(除法的消耗更大，但是随着CPU的进步，这些差距正在逐渐缩小，就目前来看依旧是有着不小的差距但无论如何优化，乘法时间都会大于加法)。正如前面所说，C语言设计之初便是给了程序员所有的权利，而程序员要做的就是掌控所有能掌控的，即便是数的计算亦是如此，比如在优秀的编译器看来:
2*7 ====> (2<<3) - 2
5*31 ====> (5<<5) - 5
毫无疑问经过编译器优化后的代码此前者要快许多。这就是为什么我们要将一个数看作二进制，这不仅仅是表面，而是要在深层次的认为它是二进制，总体来说C语言的整型是非常简洁明了的总体分为 有符号 和 无符号，很好理解只需要注意不要让无符号数进行负数的运算，这里有一个原则，可以很好的规避这种无意之过，不把无符号类型变量和有符号类型变量放于同一运算中，时刻记得保持式子的类型一致是设计时的保障。
浮点数，由于实数域可以看作稠密的，故除了整数以外，还有无数的小数，而小数在计算机中如何表示？一种无限的状态是无法在计算机中被精确表示，所以有了浮点法，关于浮点法可以参考书籍《深入理解计算机系统》。
这里介绍的是在C语言中我们应该如何正确使用浮点数？很多人(包括我)在初作之时总是想当然的以为计算机是无所不能的，连人类都无法完全表达出来的小数计算机一定可以，实际上并非如此，在这里我可以说，计算机只是近似表达，而最大的忌讳的便是将两个浮点数进行比较，此处介绍一种浮点数常用的比较方法，精确度法:
```
  #define DISTANCE 0.00000001
  ...
  float f_x_1 = 20.5;
  float f_x_2 = 19.5;
  if(f_x_1 - f_x_2 < DISTANCE)
      printf("They are Equal\n");
  else
      printf("Different\n");
```
所以说，在很大程度上，当你在程序中使用了浮点数，又直接使用浮点数进行比较，却发现始终无法达到预期效果，那么你可以检查一下，是否是这个原因，在这一点上，不得不说是C语言的一个缺憾。
指针变量，是一种比较特别的变量，以至于总是对它进行特别对待。这里有几个原则:
- 两个不相关的指针进行加减操作是无意义的
- 始终确保自己能够找到分配的内存
- 无论何时何地何种情况，都要记住，不使用未初始化的指针，不让未使用的内存持续存在。
指针在不同位的操作系统上的大小是不一样的，但是在同一个操作系统下，无论什么类型的指针都是相同大小，这涉及到指针的寻址问题，(题外话:C语言的寻址实际上使用了汇编语言的间接寻址，有兴趣的可以自行尝试，方法之一，使用gcc编译器的汇编选项，产生汇编代码，进行一一比对)，对于寻址一个笼统一些的说法便是
4Byte = 32bit
2^32 = 4G
所以32位的操作系统下C语言指针:
```
  ...
  size_t what = sizeof(void*);
  printf("%d", what);
  ...
```
输出:$root@mine: 4
对于大部分使用者来说，指针主要用来降低内存消耗以及提高运算效率的，这里设计许多学问，我也无法一一展示，比较有意思也常用的两个东西便是递增以及语法糖:++, ->
```
  ...
  int dupli_of_me[10] = {0};//也可以使用库函数memset()进行置0
  int *point_to_me = dupli_of_me;
  int me = 100;
  while(point_to_me < (dupli_of_me + 10))
      *point_to_me++ = me;
```
其中*point_to_me++ = me;在C语言应用广泛它相当于是:
```
  *point_to_me = me;
  point_to_me++;
```
的语法糖，对于++，在非必要的情况下，请使用前缀递增，而非后缀递增，原因是消耗问题，仔细想想这两种递增的区别在何处？
前缀递增总是在原数上进行递增操作，然而后缀递增呢？它首先拷贝一份原数放于别处，并且递增这份拷贝，在原数进行的操作完毕后，将这份拷贝再拷贝进原数取代它，此中的操作涉及的更多，所以在非必要的情况下，请使用前缀递增而不是后缀递增(递减也是同样的道理)
->则是在结构体上使用的非常广泛:
```
  typedef struct data{
      int test;
      struct data* next;
  }my_struct;
  ...
  my_struct temp;
  my_struct *ptemp = &temp;
  ptemp->test = 100;
  ptemp->next = NULL;
  if(temp.test == 100)
      printf("Correctly!\n");
  else
      printf("That is impossible!\n");
  ...
```
可以很清楚的看出其实ptemp->test便是(*ptemp).test的语法糖
变量限定

const 是最常用的变量限定符，它的意思是告诉编译器，这个变量或者对象在初始化以后不能被改变，常用它来保护一些必要的返回值，参数以及常量的定义。

volatile 这个关键字常常被C语言教材所忽略，它很神秘。实际上确实如此，他的作用的确很神秘：一旦使用了，就是告诉编译器，即使这个变量没有被使用或修改其他内存单元，它的值也可能发生变化。通俗的说就是，告诉编译器，不要把你的那一套优化策略用在我身上。
```
      /* 此时我们将编译器优化等级提高到 -O2 */
      int          test_num   = 100; //测试一个迭代加法
      int          nor_result = 0;
      volatile int vol_result = 0;
      /* 测试无volatile限定下，该程序的耗时 */         
      for(int i = 0;i < 10000;++i)
          for(int j = 0;j < 10000;++j)
                  nor_result += test_num;
```
接下来就是测试volatile限定下的代码
```
      for(int i = 0;i < 10000;++i)
          for(int j = 0;j < 10000;++j)
                  vol_result += test_num;
```
在使用一些手段后，得到运行时间，可以很清晰的看出差别，在我的机器上，i5-4CPU，得到的结果是后者比前者慢大概十五倍。从某一些方向上证明了，volatile的一些作用，比如调试的时候，或者一些特殊用途。涉足不多，故不记录。

变量说明

extern 用于将不同文件的，带有外部链接性的变量引用到本文件中。所谓外部链接性就是可以被除本文件外的其他文件"看见"的变量，如全局变量，使用方法：

  /* 以下为一个工程内可见 */
  /*file1.c*/
  int glo_show;//对于该全局变量来说，它们在声明时无初始化，则默认初始为0
  int glo_print = 10;//声明定义完成后，自动分配内存以存储信息    
  ...

  /* file2.c */
  extern glo_print; //仅仅是引用名字，并不会额外分配空间
                    //所以，只需要写正确变量名字即可，后方的初始化无须完全
                    //因为变量的初始化定义只能有一次。

  void print()
  {
      printf("The Globle Value is %d \n", glo_print);
  }

auto 可以姑且忽略，因为没有什么实际意义。

变量获取

格式化输入输出在C语言的初学中使用的比较频繁，但是到后期会发现，由于I/O操作过于消耗资源，换句话来说就是会极大影响程序的执行效率，会渐渐的在发行版程序中消除。
- 常见格式化输入标准函数： sacnf, fscanf, sscanf
```
对于常见的使用不赘述，有两种比较不常见的格式：`%[]` 和 `%*`，
前者是用于限制读取类型，常见于字符串的过滤(不是真正的过滤)

        scanf("%d %[a-z]", &tmp, str);
        scanf("%d %[^i]", &tmp, str);
        scanf("%d %[^,]", &tmp, str);
```
  假设输入的是：22 hello,string to me!
  读取到的分别为:22 hello 和 22 hello,str 和 22 hello
  后者则是忽略第一个输入：
```
        scanf("%*d %d", &tmp);
```
  假设输入的是：22 33
  读取到的则是：33
  其中开头的%*d忽略的输入，必须和其类型匹配，例如输入：string 33则会读取失败。
  也可以将其解读为文件宽度，例如在使用printf格式化输出的时候:
```
    char str[10] = "dir";
    printf("%*s%s",4 ,"" , str);
    /* 输出:    dir */ 四个空白占位   
```
  但是实际上scanf并不太好用，所谓的好用指的是功能上以及设计上的缺陷，总是让很多人摸不着头脑的出了错，往往很难调试。例如它会将每一行输入的\n保留在输入流里面，这个缺陷导致如果不明所以得人将其与其他的输入函数，例如fgets或者gets配合会出现差错。