C语言打印数据的二进制格式-原理解析与编程实现

C语言打印数据的二进制格式-原理解析与编程实现

问题引出

C语言中,在需要用到16进制数据的时候,可以通过printf函数的%x格式打印数据的16进制形式。在某些位标记、位操作的场合,需要用到2进制格式的数据,但printf函数不能输出2进制格式,虽然可以通过使用itoa_itoa的方法转为2进制的字符串打印,但显示的长度是不固定的,无法显示有效数位前面的0。

例如:现在需要打印数字258的2进制格式,且需要将32位全部显示出来,即想要得到结果00000000 00000000 00000001 00000010,而使用_itoa的方法和打印结果为:

int a = 258;    
char s[32];
_itoa(a, s, 2);
printf("a --> %s\n", s);
a --> 100000010

不是我们想要的格式!

数据存储原理探析

那要怎么办呢?自己写个小程序吧,思路如下:

首先弄清楚数据在计算机中是如何存储的,对应int型数字,在32或64位计算机中都占4个字节,而计算机中的数据存储是以字节(Byte)为单位,1个字节包含8个位(bit),例如,数字258的16进制形式为0x00000102,2进制形式为:00000000 00000000 00000001 00000010,其在计算机内存中的存储方式如图所示:

右侧的16进制数是内存的地址,向上递增,方框里的二进制数是内存单元实际存储的字节内存,我们可以通过程序测试验证一下,因为unsigned char或char类型在系统是占用一个字节,因此可以定义该变量的指针,分别指向int的4个字节,打印其内存地址和实际存储的内存进行验证,代码如下:

int a = 258;
//使用unsigned char来验证int的每一个字节
unsigned char *p1 = (unsigned char*)&a;   //获取a的首地址
unsigned char *p2 = (unsigned char*)&a+1; //获取a的首地址的后一个字节地址
unsigned char *p3 = (unsigned char*)&a+2; //获取a的首地址的后两个字节地址
unsigned char *p4 = (unsigned char*)&a+3; //获取a的首地址的后三个字节地址
printf("[a] p1:%x, %d\r\n", p1, *p1); //打印p1的地址与存储的字节内容
printf("[a] p2:%x, %d\r\n", p2, *p2); //打印p2的地址与存储的字节内容
printf("[a] p3:%x, %d\r\n", p3, *p3); //打印p3的地址与存储的字节内容
printf("[a] p4:%x, %d\r\n", p4, *p4); //打印p4的地址与存储的字节内容

运行结果:

[a] p1:5216f804, 2
[a] p2:5216f805, 1
[a] p3:5216f806, 0
[a] p4:5216f807, 0

可以看出,随着地址的增加,存储的内存依次是2、1、0、0,对应数字258的从底到高的4个字节的值,另外每次运行程序,变量a的地址是自动分配的,所以每次的输出与上面示意图的地址是不同的,但都是4个连续增加的地址值。

另外补充一下,这是一种小端字节序的存储方法,即将一个数据的低字节存储在内存的低地址,或理解为先存储数据的低字节。与之对应的是大端字节序存储方式,即先存储数据的高位字节,类似与我们书写数字时从左到右先写高位数字一样。由于计算机先处理地位字节的效率比较高,因此计算机内部的数据处理均采用小端字节序,而为了方便人的阅读,除了计算机内部处理,其它场合是采用大端字节序的。可通过下面的示意图助记:

另外,需要区分一点,无论大端还小端字节序,在一个字节的内部的8位2进制数,都是按照人类的习惯从左到右存放,如00000010

在字节中也是按照这样存储的,不需要反过来。

C代码实现

分析了这么多,可以编写代码来输出一个数字的2进制格式形式了。具体的代码实现:

void printf_bin(int num)
{
    int i, j, k;
    unsigned char *p = (unsigned char*)&num + 3;//p先指向num后面第3个字节的地址,即num的最高位字节地址

    for (i = 0; i < 4; i++) //依次处理4个字节(32位)
    {
        j = *(p - i); //取每个字节的首地址,从高位字节到低位字节,即p p-1 p-2 p-3地址处
        for (int k = 7; k >= 0; k--) //处理每个字节的8个位,注意字节内部的二进制数是按照人的习惯存储!
        {
            if (j & (1 << k))//1左移k位,与单前的字节内容j进行或运算,如k=7时,00000000&10000000=0 ->该字节的最高位为0
                printf("1");
            else
                printf("0");
        }
        printf(" ");//每8位加个空格,方便查看
    }
    printf("\r\n");
}

数字258的实际运行效果:

00000000 00000000 00000001 00000010

对应unsigned char型的数字,如果只需要显示8位2进制数,可以对上述小程序简化:

void printf_bin_8(unsigned char num)
{
    int k;
    unsigned char *p = (unsigned char*)&num;

    for (int k = 7; k >= 0; k--) //处理8个位
    {
        if (*p & (1 << k))
            printf("1");
        else
            printf("0");
    }
    printf("\r\n");
}

数字12的运行效果

00001100

关于负数

上面测试的都是正数,当然,对于负数,也是可以显示的,因为负数在计算机中是以对应正数的补码来存储的,因而显示的2进制数也是补码形式,这里顺便再复习一下补码:

对于负数-9,对应的正数位9,9的原码,反码,补码如下:

这里只画出8位示意,int型数字实际是占32位,对应的高位全是0或1。

使用程序测试一下-9的2进制格式输出:

11111111 11111111 11111111 11110111

可以正确显示。

完整测试代码

下面是整个本文的整个测试程序:

#include <stdio.h>
#include <stdlib.h>

void printf_bin(int num)
{
    int i, j, k;
    unsigned char *p = (unsigned char*)&num + 3;

    for (i = 0; i < 4; i++) //处理4个字节(32位)
    {
        j = *(p - i); //取每个字节的首地址
        for (int k = 7; k >= 0; k--) //处理每个字节的8个位
        {
            if (j & (1 << k))
                printf("1");
            else
                printf("0");
        }
        printf(" ");
    }
    printf("\r\n");
}

void printf_bin_8(unsigned char num)
{
    int k;
    unsigned char *p = (unsigned char*)&num;

    for (int k = 7; k >= 0; k--) //处理8个位
    {
        if (*p & (1 << k))
            printf("1");
        else
            printf("0");
    }
    printf("\r\n");
}

int main()
{
    int a = 258;
    int b = -9;
    printf("定义int a=%d, int b=%d\r\n", a, b);

    //使用unsigned char来验证int的每一个字节
    unsigned char *p1 = (unsigned char*)&a;  //获取a的首地址
    unsigned char *p2 = (unsigned char*)&a+1;//获取a的首地址的后一个字节地址
    unsigned char *p3 = (unsigned char*)&a+2;//获取a的首地址的后两个字节地址
    unsigned char *p4 = (unsigned char*)&a+3;//获取a的首地址的后三个字节地址
    printf("\r\n查看a的每个字节的地址与内容:\r\n");
    printf("[a] p1:%x, %d\r\n", p1, *p1);//打印p1的地址与存储的字节内容
    printf("[a] p2:%x, %d\r\n", p2, *p2);//打印p2的地址与存储的字节内容
    printf("[a] p3:%x, %d\r\n", p3, *p3);//打印p3的地址与存储的字节内容
    printf("[a] p4:%x, %d\r\n", p4, *p4);//打印p4的地址与存储的字节内容

    p1 = (unsigned char*)&b;
    p2 = (unsigned char*)&b + 1;
    p3 = (unsigned char*)&b + 2;
    p4 = (unsigned char*)&b + 3;
    printf("\r\n查看b的每个字节的地址与内容:\r\n");
    printf("[b] p1:%x, %d\r\n", p1, *p1);
    printf("[b] p2:%x, %d\r\n", p2, *p2);
    printf("[b] p3:%x, %d\r\n", p3, *p3);
    printf("[b] p4:%x, %d\r\n", p4, *p4);

    //自己的方法1
    printf("\r\na的2进制格式(显示32位):\r\n");
    printf_bin(a);
    printf("\r\nb的2进制格式(显示32位):\r\n");
    printf_bin(b);

    //自己的方法2
    unsigned char c = 12;
    printf("\r\n定义unsigned char c=%d\r\n", c);
    printf("c的2进制格式(显示8位):\r\n");
    printf_bin_8(c);


    //调用函数的方法
    printf("\r\n使用_itoa函数显示2进制格式\r\n");
    char s[32];
    _itoa(a, s, 2);
    printf("a --> %s\n", s);
    _itoa(b, s, 2);
    printf("b --> %s\n", s);   
    _itoa(c, s, 2);
    printf("c --> %s\n", s);

    getchar();

    return 0;
}

运行结果:

定义int a=258, int b=-9

查看a的每个字节的地址与内容:
[a] p1:a739f4d4, 2
[a] p2:a739f4d5, 1
[a] p3:a739f4d6, 0
[a] p4:a739f4d7, 0

查看b的每个字节的地址与内容:
[b] p1:a739f4f4, 247
[b] p2:a739f4f5, 255
[b] p3:a739f4f6, 255
[b] p4:a739f4f7, 255

a的2进制格式(显示32位):
00000000 00000000 00000001 00000010

b的2进制格式(显示32位):
11111111 11111111 11111111 11110111

定义unsigned char c=12
c的2进制格式(显示8位):
00001100

使用_itoa函数显示2进制格式
a --> 100000010
b --> 11111111111111111111111111110111
c --> 1100

发布于 2020-06-26 15:43