从两道经典试题谈C/C++中联合体(union)的使用

简介:
从两道经典试题谈 C/C++ 中联合体( union )的使用
宋宝华  21cnbao sweek@21cn.com
试题一:编写一段程序判断系统中的CPU是Little endian还是Big endian模式?
分析:
作为一个计算机相关专业的人,我们应该在计算机组成中都学习过什么叫Little endian和Big endian。Little endian和Big endian是CPU存放数据的两种不同顺序。对于整型、长整型等数据类型,Big endian认为第一个字节是最高位字节(按照从低地址到高地址的顺序存放数据的高位字节到低位字节);而Little endian则相反,它认为第一个字节是最低位字节(按照从低地址到高地址的顺序存放数据的低位字节到高位字节)。
例如,假设从内存地址0x0000开始有以下数据:
0x0000
0x0001
0x0002
0x0003
0x12
0x34
0xab
0xcd
如果我们去读取一个地址为0x0000的四个字节变量,若字节序为big-endian,则读出结果为0x1234abcd;若字节序位little-endian,则读出结果为0xcdab3412。如果我们将0x1234abcd写入到以0x0000开始的内存中,则Little endian和Big endian模式的存放结果如下:
地址
0x0000
0x0001
0x0002
0x0003
big-endian
0x12
0x34
0xab
0xcd
little-endian
0xcd
0xab
0x34
0x12
一般来说,x86系列CPU都是little-endian的字节序,PowerPC通常是Big endian,还有的CPU能通过跳线来设置CPU工作于Little endian还是Big endian模式。
解答:
显然,解答这个问题的方法只能是将一个字节(CHAR/BYTE类型)的数据和一个整型数据存放于同样的内存开始地址,通过读取整型数据,分析CHAR/BYTE数据在整型数据的高位还是低位来判断CPU工作于Little endian还是Big endian模式。得出如下的答案:
typedef unsigned char BYTE;
int main(int argc, char* argv[])
{
       unsigned int num,*p;
    p = #
       num = 0;
 
    *(BYTE *)p = 0xff;
      
       if(num == 0xff)
       {
              printf("The endian of cpu is little\n");
       }
       else    //num == 0xff000000
       {
              printf("The endian of cpu is big\n");
       }
       return 0;
}
除了上述方法(通过指针类型强制转换并对整型数据首字节赋值,判断该赋值赋给了高位还是低位)外,还有没有更好的办法呢?我们知道,union的成员本身就被存放在相同的内存空间(共享内存,正是union发挥作用、做贡献的去处),因此,我们可以将一个CHAR/BYTE数据和一个整型数据同时作为一个union的成员,得出如下答案:
int checkCPU()
{
  {
   union w
   {
    int a;
    char b;
   } c;
   c.a = 1;
   return (c.b == 1);
  }
}
实现同样的功能,我们来看看Linux操作系统中相关的源代码是怎么做的:
static union { char c[4]; unsigned long l; } endian_test = { { 'l', '?', '?', 'b' } };
#define ENDIANNESS ((char)endian_test.l)
Linux的内核作者们仅仅用一个union变量和一个简单的宏定义就实现了一大段代码同样的功能!由以上一段代码我们可以深刻领会到Linux源代码的精妙之处!
试题二:假设网络节点A和网络节点B中的通信协议涉及四类报文,报文格式为“报文类型字段+报文内容的结构体”,四个报文内容的结构体类型分别为STRUCTTYPE1~ STRUCTTYPE4,请编写程序以最简单的方式组织一个统一的报文数据结构。
分析:
报文的格式为“报文类型+报文内容的结构体”,在真实的通信中,每次只能发四类报文中的一种,我们可以将四类报文的结构体组织为一个union(共享一段内存,但每次有效的只是一种),然后和报文类型字段统一组织成一个报文数据结构。
解答:
根据上述分析,我们很自然地得出如下答案:
typedef unsigned char BYTE;
 
// 报文内容联合体
typedef union tagPacketContent
{
       STRUCTTYPE1 pkt1;
       STRUCTTYPE2 pkt2;
       STRUCTTYPE3 pkt1;
       STRUCTTYPE4 pkt2;
}PacketContent;
 
// 统一的报文数据结构
typedef struct tagPacket
{
       BYTE pktType;
    PacketContent pktContent;
}Packet;
总结
在C/C++程序的编写中,当多个基本数据类型或复合数据结构要占用同一片内存时,我们要使用联合体(试题一是这样的例证);当多种类型,多个对象,多个事物只取其一时(我们姑且通俗地称其为“n选1”),我们也可以使用联合体来发挥其长处(试题二是这样的例证)。


 本文转自 21cnbao 51CTO博客,原文链接:http://blog.51cto.com/21cnbao/120108,如需转载请自行联系原作者


目录
打赏
0
0
0
0
347
分享
相关文章
C++一分钟之-结构体与联合体(Union)
【6月更文挑战第20天】在C++中,结构体(struct)用于组合多种数据类型形成复合类型,成员变量占用独立内存,适合存储不同类型且同时有效的数据。联合体(union)则让所有成员共享同一内存,适合节省空间和进行低级别类型转换,但需小心数据覆盖。通过`struct`和`union`,程序员能构建更灵活的代码,但也需留意内存对齐和数据管理等问题。
99 2
C/C++自定义类型(详解struct,enum,union)
C/C++自定义类型(详解struct,enum,union)
|
8月前
|
C++
第十三届蓝桥杯B组C++(试题C:刷题统计)
第十三届蓝桥杯B组C++(试题C:刷题统计)
56 0
|
8月前
|
C++
第十三届蓝桥杯B组C++(试题B:顺子日期)
第十三届蓝桥杯B组C++(试题B:顺子日期)
96 0
|
8月前
|
C++
C++【二叉树进阶试题】
C++【二叉树进阶试题】
59 0
C/C++之自定义类型(结构体,位段,联合体,枚举)详解
C/C++之自定义类型(结构体,位段,联合体,枚举)详解
84 0
第十三届蓝桥杯B组C++(试题A:九进制转十进制)
本题考点为进制转换,较为简单,参考二进制转换为十进制的方法。
160 0
第十三届蓝桥杯B组C++(试题A:九进制转十进制)
C++语言中类与引用感悟之经典
C++语言中类与引用感悟之经典
97 0
C++语言中类与引用感悟之经典
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等