编译器有什么有趣的地方?

发布时间:
2024-09-04 03:18
阅读量:
16

当编译器优化遇上 UB(未定义行为),就会很有意思。我这里分享某论坛上一个有名的例子——“C++编译器证伪费马大定理”,侵删。

考虑以下程序

图1

如果 13 行的方程在 1e9 内有解,函数就会返回,否则陷入死循环。而根据费马大定理,该方程无解。

在无优化下,程序如预期陷入死循环;而在 O2 优化下,程序却正常退出了

图2

这是因为,编译器认为函数一定会返回,而 31 行的 return 因为前面的死循环必然执行不到,所以编译器认定程序一定会从 14 行处返回,再加上该函数没有任何副作用

于是这个函数就被优化成了这个逼样(bool 变成 int64 大概是因为返回值寄存器是 64bit)

图3

因为 UB 的存在,编译器可能会对代码进行很多过激的优化,从而带来难以预料的错误。类似的例子网上能找到很多


update: 2024/08/27

读了一些评论,

表述欠妥。应该是,无副作用的死循环是 UB,所以编译器认定循环一定会退出,所以认为 14 行一定会执行;如此,该函数唯一的作用就成了 return false,因为其它语句没有副作用。

通过某种手段使得该循环具有副作用,比如输出、使用全局变量等,可以避免过度优化,但这是个坏主意。真正要做的应该是避免这种死循环,比如当 a b c 均达到 MAXN 就退出循环。

关于编译器“乱优化”,其实我觉得这是一把极锋利的刀,用好了很利,用不好就容易折。我记得最早 C 的委员会有一个毁誉参半的原则,大概是“信任程序员”;不清楚现在委员会是否还持有这个原则,但 g++ 似乎就非常信任我不会写出 UB,然而我本人一点信心都没有~

上面的函数没有内联。如果内联了,在 O2 下,整个程序会被直接优化成这样:

int main() { cout << "Fermat's theorem is wrong!" << endl; return 0; }

END