大小端详解
作者:何小成
端模式(Endian)一词源自Jonathan Swift所著的《格列佛游记》。在这本书里,根据敲开鸡蛋的方式不同,人们被分为两类:从圆头开始敲开鸡蛋的人属于Big Endian,从尖头开始敲开鸡蛋的人属于Little Endian(这种表述十分形象)。小人国的内战就源于吃鸡蛋时究竟该从大头(Big-Endian)还是小头(Little-Endian)敲开。在计算机领域,Big Endian和Little Endian也几乎引发了一场“战争”。在计算机业界,Endian表示数据在存储器中的存放顺序。下面将举例说明计算机中大小端模式的区别。
32位整数在不同端模式下的存储
如果将一个32位的整数 0x12345678 存放到一个整型变量(int)中,这个整型变量采用大端或者小端模式在内存中的存储情况如下表所示。为方便表述,本文使用 OP0 表示一个32位数据的最高字节MSB(Most Significant Byte),使用 OP3 表示一个32位数据的最低字节LSB(Least Significant Byte)。
| 地址偏移 | 大端模式 | 小端模式 |
|---|---|---|
| 0x00 | 12(OP0) | 78(OP3) |
| 0x01 | 34(OP1) | 56(OP2) |
| 0x02 | 56(OP2) | 34(OP1) |
| 0x03 | 78(OP3) | 12(OP0) |
小端模式
小端模式下,较高的有效字节存放在较高的存储器地址,较低的有效字节存放在较低的存储器地址。
大端模式
大端模式下,较高的有效字节存放在较低的存储器地址,较低的有效字节存放在较高的存储器地址。
16位整数在不同端模式下的存储
如果将一个16位的整数 0x1234 存放到一个短整型变量(short)中,这个短整型变量在内存中的存储在大小端模式下的情况如下表所示。
| 地址偏移 | 大端模式 | 小端模式 |
|---|---|---|
| 0x00 | 12(OP0) | 34(OP1) |
| 0x01 | 34(OP1) | 12(OP0) |
由上述表格可知,采用大小端模式对数据进行存放的主要区别在于字节的存放顺序。大端方式将高位存放在低地址,小端方式将高位存放在高地址。采用大端方式进行数据存放符合人类的正常思维,而采用小端方式进行数据存放利于计算机处理。到目前为止,采用大端或者小端进行数据存放,其优劣尚无定论。
不同处理器的端模式选择
有的处理器系统采用了小端方式进行数据存放,例如Intel的奔腾处理器;有的处理器系统采用了大端方式进行数据存放,例如IBM半导体和Freescale的PowerPC处理器。不仅处理器存在端模式的选择,一些外设的设计中也会面临使用大端或者小端进行数据存放的抉择。
因此,在一个处理器系统中,有可能存在大端和小端模式同时存在的现象。这一现象给系统的软硬件设计带来了不小的麻烦,要求系统设计工程师必须深入理解大端和小端模式的差别。大端与小端模式的差别体现在一个处理器的寄存器、指令集、系统总线等各个层次中。
用函数判断系统是Big Endian还是Little Endian
// 如果字节序为big-endian,返回true;
// 反之为 little-endian,返回false
bool IsBig_Endian()
{
unsigned short test = 0x1234;
if (*((unsigned char*) &test) == 0x12)
return true;
else
return false;
} // IsBig_Endian()
大小端的分度说明
大小端的分度值是字节(byte),即每一个字节都是按照正常顺序,但是当字节组装成一个 int 或者 long 等类型时,每个字节的摆放位置不同。