在编译时确定字节序

Question

17 浏览2023年1月26日

匿名的 2023年1月26日

0 Comments

在编译时，有没有一种安全且可移植的方式来确定我的程序所编译的平台的字节顺序？我正在使用C语言编写。

[编辑]

感谢回答，我决定继续使用运行时解决方案！

0

3 答案

匿名的 · Answer 1 · 2023-09-01T09:38:43+00:00

确定编译时的字节序（Determining endianness at compile time）是一个常见的问题，特别是在需要处理不同字节序的系统上。字节序指的是在内存中以多字节形式存储数据时，字节的排列顺序。大端字节序（big-endian）是将高位字节存储在低地址，而小端字节序（little-endian）是将低位字节存储在低地址。

为了解决这个问题，有几种方法可以在编译时确定字节序。一种常见的方法是使用C语言的联合（union）和位域（bit-field）来创建一个可以访问字节的结构。下面是一个使用C99的宏定义来判断字节序的示例：

#define I_AM_LITTLE (((union { unsigned x; unsigned char c; }){1}).c)

上述代码创建了一个联合，其中包含一个无符号整数x和一个无符号字符数组c。通过将值为1的整数赋给x，我们可以通过访问c字段来判断字节序。如果是小端字节序，c字段的值将为1；如果是大端字节序，c字段的值将为0。

使用这个宏定义，我们可以在编译时进行条件判断，从而优化掉一些代码块。例如，可以使用以下条件语句来执行特定的代码块：

if (I_AM_LITTLE) {
    // 代码块1
} else {
    // 代码块2
}

这样，编译器就可以根据字节序的不同，优化掉不需要执行的代码块。

另外，如果使用C++并且可以使用boost库，我们可以使用boost/endian/conversion.hpp头文件中的函数来确定字节序。以下是一个使用boost库的示例代码：

#include 
static_assert(boost::endian::order::native == boost::endian::order::little, "you got some computer there!");

这段代码使用了boost库中的函数来判断本地字节序是否为小端字节序。如果不是小端字节序，编译器将会报错。

需要注意的是，上述的C99宏定义方法在某些编译器中可能无法被视为常量表达式。这意味着它不能用于静态存储持续时间的数据的初始化。然而，它仍然是一种有效的方法来在编译时确定字节序。

总之，确定编译时的字节序是一个重要的问题，可以通过使用C语言的联合和位域，或者使用boost库中的函数来解决。这些方法可以让我们在编译时根据字节序的不同进行条件判断，从而优化代码的执行。

匿名的 · Answer 2 · 2023-06-23T21:03:25+00:00

确定编译时字节顺序的原因是为了在编译时检查系统的字节顺序，以便在后续的代码中正确处理字节顺序的相关操作。为了解决这个问题，可以使用以下方法：

1. 使用Boost库中的endian.hpp头文件来获取系统的字节顺序信息。

2. 使用运行时检查的方法来确定系统的字节顺序。可以创建一个整数，然后读取它的第一个字节（最低有效字节）。如果这个字节的值为1，则系统是小端序；否则为大端序。可以使用以下代码来实现：

bool isLittleEndian()
{
    short int number = 0x1;
    char *numPtr = (char*)&number;
    return (numPtr[0] == 1);
}

3. 考虑到一些特殊平台上的潜在问题，可以使用<stdint.h>中提供的固定宽度的多字节整型，或者适配Boost库中的stdint.hpp头文件。

需要注意的是，这些方法中只有第一种方法是在编译时进行检查的，其他方法都是在运行时进行检查的。同时，使用特定库的头文件可能会导致代码的可移植性降低，尤其是在使用C语言而不是C++语言的情况下。因此，正确的答案应该是在下方，只有一到两个赞或者更少的答案。

匿名的 · Answer 3 · 2023-08-25T15:34:34+00:00

确定编译时的字节序的问题是因为没有标准化的方法可以在所有现有和将来的编译器上工作，因为现有的C、C++和POSIX标准都没有定义用于检测字节序的宏。但是，如果你愿意限制自己使用某个已知的编译器集合，你可以查找每个编译器的文档，了解它们使用的预定义宏（如果有的话）来定义字节序。这个页面列出了几个可以查找的宏，所以下面的代码可以用于这些宏：

#if defined(__BYTE_ORDER) && __BYTE_ORDER == __BIG_ENDIAN || \
    defined(__BIG_ENDIAN__) || \
    defined(__ARMEB__) || \
    defined(__THUMBEB__) || \
    defined(__AARCH64EB__) || \
    defined(_MIBSEB) || defined(__MIBSEB) || defined(__MIBSEB__)
// It's a big-endian target architecture
#elif defined(__BYTE_ORDER) && __BYTE_ORDER == __LITTLE_ENDIAN || \
    defined(__LITTLE_ENDIAN__) || \
    defined(__ARMEL__) || \
    defined(__THUMBEL__) || \
    defined(__AARCH64EL__) || \
    defined(_MIPSEL) || defined(__MIPSEL) || defined(__MIPSEL__)
// It's a little-endian target architecture
#else
#error "I don't know what architecture this is!"
#endif

如果你在编译器的文档中找不到预定义宏的信息，你还可以尝试让编译器输出其完整的预定义宏列表，并从中猜测哪个会起作用（查找任何带有ENDIAN、ORDER或处理器体系结构名称的内容）。这个页面列出了在不同编译器中执行此操作的一些方法：

Compiler                   C macros                         C++ macros
Clang/LLVM                 clang -dM -E -x c /dev/null      clang++ -dM -E -x c++ /dev/null
GNU GCC/G++                gcc   -dM -E -x c /dev/null      g++     -dM -E -x c++ /dev/null
Hewlett-Packard C/aC++     cc    -dM -E -x c /dev/null      aCC     -dM -E -x c++ /dev/null
IBM XL C/C++               xlc   -qshowmacros -E /dev/null  xlc++   -qshowmacros -E /dev/null
Intel ICC/ICPC             icc   -dM -E -x c /dev/null      icpc    -dM -E -x c++ /dev/null
Microsoft Visual Studio (none)                              (none)
Oracle Solaris Studio      cc    -xdumpmacros -E /dev/null  CC      -xdumpmacros -E /dev/null
Portland Group PGCC/PGCPP  pgcc  -dM -E                     (none)

最后，微软的Visual C/C++编译器是与众不同的，它们没有上述任何预定义宏。幸运的是，它们在这里记录了它们的预定义宏，你可以使用目标处理器架构来推断字节序。虽然Windows中所有当前支持的处理器都是小端字节序（_M_IX86，_M_X64，_M_IA64和_M_ARM都是小端字节序），但一些历史上支持的处理器如PowerPC（_M_PPC）是大端字节序。更重要的是，Xbox 360是一个大端字节序的PowerPC机器，所以如果你编写一个跨平台的库头文件，检查_M_PPC可能是一个好主意。

对于ARM，我不太了解微软的编译器，但是ARM可能在两种字节序模式下运行。我不确定是否有可能在编译时进行检查。

所以，你觉得你提供的代码片段是否足够通用？至少对于你列出的所有编译器来说，应该是通用的。

这是一个"混乱"的解决方案，但它在常见的平台上工作，并且至少在其他地方可以编译。而且，与其提出一行解决方案，不如列出那些可能随时过时的现有预定义宏。在arm-none-eabi和x86_64-w64-mingw32中，字节序宏被定义为：

#define __BYTE_ORDER__ __ORDER_LITTLE_ENDIAN__