返回首页 Real C

0x05-C语言变量

C语言在明面上将数的变量分为两类,整型变量以及浮点数,对应着现实世界的整数和小数。

  • 首先是整数,使用了这么多的C语言之后,每当在使用整数之时都会将其想象成二进制的存在,而不是十进制。原因在于,这是程序的本质所在,稍有研究编译器工作原理的都会发现,在编译器处理乘法乃至除法的时候,优秀的编译器总会想方设法的加快程序的速度,毫无疑问在所有运算中移位运算是最快速的"乘法"以及"除法":
    1<<2 == 4 ,8>>2 == 2

    而正常一个乘法相当于十数次的加法运算的时间消耗,移位则不用(除法的消耗更大,但是随着CPU的进步,这些差距正在逐渐缩小,就目前来看依旧是有着不小的差距但无论如何优化,乘法时间都会大于加法)。正如前面所说,C语言设计之初便是给了程序员所有的权利,而程序员要做的就是掌控所有能掌控的,即便是数的计算亦是如此,比如在优秀的编译器看来:
    2*7 ====> (2<<3) - 2
    5*31 ====> (5<<5) - 5
    毫无疑问经过编译器优化后的代码此前者要快许多。这就是为什么我们要将一个数看作二进制,这不仅仅是表面,而是要在深层次的认为它是二进制,总体来说C语言的整型是非常简洁明了的总体分为 有符号无符号,很好理解只需要注意不要让无符号数进行负数的运算,这里有一个原则,可以很好的规避这种无意之过,不把无符号类型变量和有符号类型变量放于同一运算中,时刻记得保持式子的类型一致是设计时的保障。

  • 浮点数,由于实数域可以看作稠密的,故除了整数以外,还有无数的小数,而小数在计算机中如何表示?一种无限的状态是无法在计算机中被精确表示,所以有了浮点法,关于浮点法可以参考书籍《深入理解计算机系统》
    这里介绍的是在C语言中我们应该如何正确使用浮点数?很多人(包括我)在初作之时总是想当然的以为计算机是无所不能的,连人类都无法完全表达出来的小数计算机一定可以,实际上并非如此,在这里我可以说,计算机只是近似表达,而最大的忌讳的便是将两个浮点数进行比较,此处介绍一种浮点数常用的比较方法,精确度法:

      #define DISTANCE 0.00000001
      ...
      float f_x_1 = 20.5;
      float f_x_2 = 19.5;
      if(f_x_1 - f_x_2 < DISTANCE)
          printf("They are Equal\n");
      else
          printf("Different\n");

    所以说,在很大程度上,当你在程序中使用了浮点数,又直接使用浮点数进行比较,却发现始终无法达到预期效果,那么你可以检查一下,是否是这个原因,在这一点上,不得不说是C语言的一个缺憾。

  • 指针变量,是一种比较特别的变量,以至于总是对它进行特别对待。这里有几个原则:

    • 两个不相关的指针进行加减操作是无意义的
    • 始终确保自己能够找到分配的内存
    • 无论何时何地何种情况,都要记住,不使用未初始化的指针,不让未使用的内存持续存在。

    指针在不同位的操作系统上的大小是不一样的,但是在同一个操作系统下,无论什么类型的指针都是相同大小,这涉及到指针的寻址问题,(题外话:C语言的寻址实际上使用了汇编语言的间接寻址,有兴趣的可以自行尝试,方法之一,使用gcc编译器的汇编选项,产生汇编代码,进行一一比对),对于寻址一个笼统一些的说法便是
    4Byte = 32bit
    2^32 = 4G
    所以32位的操作系统下C语言指针:

      ...
      size_t what = sizeof(void*);
      printf("%d", what);
      ...

    输出:$root@mine: 4
    对于大部分使用者来说,指针主要用来降低内存消耗以及提高运算效率的,这里设计许多学问,我也无法一一展示,比较有意思也常用的两个东西便是递增以及语法糖:++, ->

      ...
      int dupli_of_me[10] = {0};//也可以使用库函数memset()进行置0
      int *point_to_me = dupli_of_me;
      int me = 100;
      while(point_to_me < (dupli_of_me + 10))
          *point_to_me++ = me;

    其中*point_to_me++ = me;在C语言应用广泛它相当于是:

      *point_to_me = me;
      point_to_me++;

    的语法糖,对于++,在非必要的情况下,请使用前缀递增,而非后缀递增,原因是消耗问题,仔细想想这两种递增的区别在何处?
    前缀递增总是在原数上进行递增操作,然而后缀递增呢?它首先拷贝一份原数放于别处,并且递增这份拷贝,在原数进行的操作完毕后,将这份拷贝再拷贝进原数取代它,此中的操作涉及的更多,所以在非必要的情况下,请使用前缀递增而不是后缀递增(递减也是同样的道理)
    ->则是在结构体上使用的非常广泛:

      typedef struct data{
          int test;
          struct data* next;
      }my_struct;
      ...
      my_struct temp;
      my_struct *ptemp = &temp;
      ptemp->test = 100;
      ptemp->next = NULL;
      if(temp.test == 100)
          printf("Correctly!\n");
      else
          printf("That is impossible!\n");
      ...

    可以很清楚的看出其实ptemp->test便是(*ptemp).test的语法糖

  • 变量限定

    const 是最常用的变量限定符,它的意思是告诉编译器,这个变量或者对象在初始化以后不能被改变,常用它来保护一些必要的返回值,参数以及常量的定义。

    volatile 这个关键字常常被C语言教材所忽略,它很神秘。实际上确实如此,他的作用的确很神秘:一旦使用了,就是告诉编译器,即使这个变量没有被使用或修改其他内存单元,它的值也可能发生变化。通俗的说就是,告诉编译器,不要把你的那一套优化策略用在我身上

          /* 此时我们将编译器优化等级提高到 -O2 */
          int          test_num   = 100; //测试一个迭代加法
          int          nor_result = 0;
          volatile int vol_result = 0;
          /* 测试无volatile限定下,该程序的耗时 */         
          for(int i = 0;i < 10000;++i)
              for(int j = 0;j < 10000;++j)
                      nor_result += test_num;

    接下来就是测试volatile限定下的代码

          for(int i = 0;i < 10000;++i)
              for(int j = 0;j < 10000;++j)
                      vol_result += test_num;

    在使用一些手段后,得到运行时间,可以很清晰的看出差别,在我的机器上,i5-4CPU,得到的结果是后者比前者慢大概十五倍。 从某一些方向上证明了,volatile的一些作用,比如调试的时候,或者一些特殊用途。涉足不多,故不记录。

  • 变量说明

    extern 用于将不同文件的,带有外部链接性的变量引用到本文件中。所谓外部链接性就是可以被除本文件外的其他文件"看见"的变量,如全局变量,使用方法:

      /* 以下为一个工程内可见 */
      /*file1.c*/
      int glo_show;//对于该全局变量来说,它们在声明时无初始化,则默认初始为0
      int glo_print = 10;//声明定义完成后,自动分配内存以存储信息    
      ...
    
      /* file2.c */
      extern glo_print; //仅仅是引用名字,并不会额外分配空间
                        //所以,只需要写正确变量名字即可,后方的初始化无须完全
                        //因为变量的初始化定义只能有一次。
    
      void print()
      {
          printf("The Globle Value is %d \n", glo_print);
      }

    auto 可以姑且忽略,因为没有什么实际意义。

  • 变量获取

    格式化输入输出在C语言的初学中使用的比较频繁,但是到后期会发现,由于I/O操作过于消耗资源,换句话来说就是会极大影响程序的执行效率,会渐渐的在发行版程序中消除。

    • 常见格式化输入标准函数: sacnf, fscanf, sscanf

      对于常见的使用不赘述,有两种比较不常见的格式:`%[]` 和 `%*`,
      前者是用于限制读取类型,常见于字符串的过滤(不是真正的过滤)
      
              scanf("%d %[a-z]", &tmp, str);
              scanf("%d %[^i]", &tmp, str);
              scanf("%d %[^,]", &tmp, str);

      假设输入的是:22 hello,string to me!
      读取到的分别为:22 hello22 hello,str22 hello
      后者则是忽略第一个输入:

              scanf("%*d %d", &tmp);

      假设输入的是:22 33
      读取到的则是:33
      其中开头的%*d忽略的输入,必须和其类型匹配,例如输入:string 33则会读取失败。
      也可以将其解读为文件宽度,例如在使用printf格式化输出的时候:

          char str[10] = "dir";
          printf("%*s%s",4 ,"" , str);
          /* 输出:    dir */ 四个空白占位   

      但是实际上scanf并不太好用,所谓的好用指的是功能上以及设计上的缺陷,总是让很多人摸不着头脑的出了错,往往很难调试。例如它会将每一行输入的\n保留在输入流里面,这个缺陷导致如果不明所以得人将其与其他的输入函数,例如fgets或者gets配合会出现差错。

上一篇: C代码规范 下一篇: 第二部分