C语言打印数据的二进制格式-原理解析与编程实现

中国计量大学控制理论与控制工程硕士

问题引出

C语言中，在需要用到16进制数据的时候，可以通过printf函数的%x格式打印数据的16进制形式。在某些位标记、位操作的场合，需要用到2进制格式的数据，但printf函数不能输出2进制格式，虽然可以通过使用itoa或_itoa的方法转为2进制的字符串打印，但显示的长度是不固定的，无法显示有效数位前面的0。

例如：现在需要打印数字258的2进制格式，且需要将32位全部显示出来，即想要得到结果00000000 00000000 00000001 00000010，而使用_itoa的方法和打印结果为：

int a = 258;    
char s[32];
_itoa(a, s, 2);
printf("a --> %s\n", s);
a --> 100000010

不是我们想要的格式！

数据存储原理探析

那要怎么办呢？自己写个小程序吧，思路如下：

首先弄清楚数据在计算机中是如何存储的，对应int型数字，在32或64位计算机中都占4个字节，而计算机中的数据存储是以字节(Byte)为单位，1个字节包含8个位(bit)，例如，数字258的16进制形式为0x00000102，2进制形式为：00000000 00000000 00000001 00000010，其在计算机内存中的存储方式如图所示：

右侧的16进制数是内存的地址，向上递增，方框里的二进制数是内存单元实际存储的字节内存，我们可以通过程序测试验证一下，因为unsigned char或char类型在系统是占用一个字节，因此可以定义该变量的指针，分别指向int的4个字节，打印其内存地址和实际存储的内存进行验证，代码如下：

int a = 258;
//使用unsigned char来验证int的每一个字节
unsigned char *p1 = (unsigned char*)&a;   //获取a的首地址
unsigned char *p2 = (unsigned char*)&a+1; //获取a的首地址的后一个字节地址
unsigned char *p3 = (unsigned char*)&a+2; //获取a的首地址的后两个字节地址
unsigned char *p4 = (unsigned char*)&a+3; //获取a的首地址的后三个字节地址
printf("[a] p1:%x, %d\r\n", p1, *p1); //打印p1的地址与存储的字节内容
printf("[a] p2:%x, %d\r\n", p2, *p2); //打印p2的地址与存储的字节内容
printf("[a] p3:%x, %d\r\n", p3, *p3); //打印p3的地址与存储的字节内容
printf("[a] p4:%x, %d\r\n", p4, *p4); //打印p4的地址与存储的字节内容

运行结果：

[a] p1:5216f804, 2
[a] p2:5216f805, 1
[a] p3:5216f806, 0
[a] p4:5216f807, 0

可以看出，随着地址的增加，存储的内存依次是2、1、0、0，对应数字258的从底到高的4个字节的值，另外每次运行程序，变量a的地址是自动分配的，所以每次的输出与上面示意图的地址是不同的，但都是4个连续增加的地址值。

另外补充一下，这是一种小端字节序的存储方法，即将一个数据的低字节存储在内存的低地址，或理解为先存储数据的低字节。与之对应的是大端字节序存储方式，即先存储数据的高位字节，类似与我们书写数字时从左到右先写高位数字一样。由于计算机先处理地位字节的效率比较高，因此计算机内部的数据处理均采用小端字节序，而为了方便人的阅读，除了计算机内部处理，其它场合是采用大端字节序的。可通过下面的示意图助记：

另外，需要区分一点，无论大端还小端字节序，在一个字节的内部的8位2进制数，都是按照人类的习惯从左到右存放，如00000010

在字节中也是按照这样存储的，不需要反过来。

C代码实现

分析了这么多，可以编写代码来输出一个数字的2进制格式形式了。具体的代码实现：

void printf_bin(int num)
{
    int i, j, k;
    unsigned char *p = (unsigned char*)&num + 3;//p先指向num后面第3个字节的地址，即num的最高位字节地址

    for (i = 0; i < 4; i++) //依次处理4个字节(32位）
    {
        j = *(p - i); //取每个字节的首地址，从高位字节到低位字节，即p p-1 p-2 p-3地址处
        for (int k = 7; k >= 0; k--) //处理每个字节的8个位，注意字节内部的二进制数是按照人的习惯存储！
        {
            if (j & (1 << k))//1左移k位，与单前的字节内容j进行或运算，如k=7时，00000000&10000000=0 ->该字节的最高位为0
                printf("1");
            else
                printf("0");
        }
        printf(" ");//每8位加个空格，方便查看
    }
    printf("\r\n");
}

数字258的实际运行效果：

00000000 00000000 00000001 00000010

对应unsigned char型的数字，如果只需要显示8位2进制数，可以对上述小程序简化：

void printf_bin_8(unsigned char num)
{
    int k;
    unsigned char *p = (unsigned char*)&num;

    for (int k = 7; k >= 0; k--) //处理8个位
    {
        if (*p & (1 << k))
            printf("1");
        else
            printf("0");
    }
    printf("\r\n");
}

数字12的运行效果

00001100

关于负数

上面测试的都是正数，当然，对于负数，也是可以显示的，因为负数在计算机中是以对应正数的补码来存储的，因而显示的2进制数也是补码形式，这里顺便再复习一下补码：

对于负数-9，对应的正数位9，9的原码，反码，补码如下：

这里只画出8位示意，int型数字实际是占32位，对应的高位全是0或1。

使用程序测试一下-9的2进制格式输出：

11111111 11111111 11111111 11110111

可以正确显示。

完整测试代码

下面是整个本文的整个测试程序：

#include <stdio.h>
#include <stdlib.h>

void printf_bin(int num)
{
    int i, j, k;
    unsigned char *p = (unsigned char*)&num + 3;

    for (i = 0; i < 4; i++) //处理4个字节(32位）
    {
        j = *(p - i); //取每个字节的首地址
        for (int k = 7; k >= 0; k--) //处理每个字节的8个位
        {
            if (j & (1 << k))
                printf("1");
            else
                printf("0");
        }
        printf(" ");
    }
    printf("\r\n");
}

void printf_bin_8(unsigned char num)
{
    int k;
    unsigned char *p = (unsigned char*)&num;

    for (int k = 7; k >= 0; k--) //处理8个位
    {
        if (*p & (1 << k))
            printf("1");
        else
            printf("0");
    }
    printf("\r\n");
}

int main()
{
    int a = 258;
    int b = -9;
    printf("定义int a=%d, int b=%d\r\n", a, b);

    //使用unsigned char来验证int的每一个字节
    unsigned char *p1 = (unsigned char*)&a;  //获取a的首地址
    unsigned char *p2 = (unsigned char*)&a+1;//获取a的首地址的后一个字节地址
    unsigned char *p3 = (unsigned char*)&a+2;//获取a的首地址的后两个字节地址
    unsigned char *p4 = (unsigned char*)&a+3;//获取a的首地址的后三个字节地址
    printf("\r\n查看a的每个字节的地址与内容：\r\n");
    printf("[a] p1:%x, %d\r\n", p1, *p1);//打印p1的地址与存储的字节内容
    printf("[a] p2:%x, %d\r\n", p2, *p2);//打印p2的地址与存储的字节内容
    printf("[a] p3:%x, %d\r\n", p3, *p3);//打印p3的地址与存储的字节内容
    printf("[a] p4:%x, %d\r\n", p4, *p4);//打印p4的地址与存储的字节内容

    p1 = (unsigned char*)&b;
    p2 = (unsigned char*)&b + 1;
    p3 = (unsigned char*)&b + 2;
    p4 = (unsigned char*)&b + 3;
    printf("\r\n查看b的每个字节的地址与内容：\r\n");
    printf("[b] p1:%x, %d\r\n", p1, *p1);
    printf("[b] p2:%x, %d\r\n", p2, *p2);
    printf("[b] p3:%x, %d\r\n", p3, *p3);
    printf("[b] p4:%x, %d\r\n", p4, *p4);

    //自己的方法1
    printf("\r\na的2进制格式(显示32位)：\r\n");
    printf_bin(a);
    printf("\r\nb的2进制格式(显示32位)：\r\n");
    printf_bin(b);

    //自己的方法2
    unsigned char c = 12;
    printf("\r\n定义unsigned char c=%d\r\n", c);
    printf("c的2进制格式(显示8位)：\r\n");
    printf_bin_8(c);


    //调用函数的方法
    printf("\r\n使用_itoa函数显示2进制格式\r\n");
    char s[32];
    _itoa(a, s, 2);
    printf("a --> %s\n", s);
    _itoa(b, s, 2);
    printf("b --> %s\n", s);   
    _itoa(c, s, 2);
    printf("c --> %s\n", s);

    getchar();

    return 0;
}

运行结果：

定义int a=258, int b=-9

查看a的每个字节的地址与内容：
[a] p1:a739f4d4, 2
[a] p2:a739f4d5, 1
[a] p3:a739f4d6, 0
[a] p4:a739f4d7, 0

查看b的每个字节的地址与内容：
[b] p1:a739f4f4, 247
[b] p2:a739f4f5, 255
[b] p3:a739f4f6, 255
[b] p4:a739f4f7, 255

a的2进制格式(显示32位)：
00000000 00000000 00000001 00000010

b的2进制格式(显示32位)：
11111111 11111111 11111111 11110111

定义unsigned char c=12
c的2进制格式(显示8位)：
00001100

使用_itoa函数显示2进制格式
a --> 100000010
b --> 11111111111111111111111111110111
c --> 1100

发布于 2020-06-26 15:43

C / C++

二进制数

数据存储（广义）