SIGFPE (8) 浮点异常详解：C++ 开发者的崩溃调试指南

一、信号基础认知（开篇 5 分钟入门）

信号核心信息

信号编号：8
信号名称：SIGFPE (Floating Point Exception)
POSIX 标准：是（POSIX.1-2001 定义）
可捕获：是
默认行为：终止进程并生成 coredump

核心定位

SIGFPE 的本质作用是算术运算异常告警。虽然名称是”浮点异常”，但实际上 SIGFPE 可以表示多种算术错误，包括整数除以零、浮点运算异常、整数溢出等。

默认行为

Linux 内核的默认处理逻辑：

终止进程：立即终止当前进程
生成 coredump：如果系统配置允许，会生成 core 文件
可捕获：可以捕获并处理，但通常应该让程序终止

与 C++ 的关联性

SIGFPE 在 C++ 开发中的高发场景：

除零错误：整数或浮点数除以零
整数溢出：有符号整数溢出（在某些架构上）
浮点运算异常：浮点数溢出、下溢、无效操作
数学库函数：某些数学函数在特定输入下可能触发
数值计算：科学计算、金融计算中的边界情况

二、信号触发场景（结合 C++ 代码实例）

核心触发原因

1. 编程失误类

场景 1.1：整数除以零

// 错误代码
#include <iostream>

int divide(int a, int b) {
    return a / b;  // 如果 b 为 0，触发 SIGFPE
}

int main() {
    int result = divide(10, 0);  // 崩溃点
    std::cout << "Result: " << result << std::endl;
    return 0;
}

Coredump 信息示例：

Program received signal SIGFPE, Arithmetic exception.
0x0000000000401123 in divide(int, int) (a=10, b=0) at main.cpp:4
4       return a / b;
(gdb) bt
#0  0x0000000000401123 in divide(int, int) (a=10, b=0) at main.cpp:4
#1  0x0000000000401145 in main () at main.cpp:8
(gdb) print b
$1 = 0

场景 1.2：浮点数除以零

// 错误代码
#include <iostream>
#include <cmath>

double divideDouble(double a, double b) {
    return a / b;  // 浮点数除以零可能触发 SIGFPE（取决于系统配置）
}

int main() {
    double result = divideDouble(10.0, 0.0);
    std::cout << "Result: " << result << std::endl;  // 可能输出 inf 或触发 SIGFPE
    return 0;
}

场景 1.3：整数溢出（有符号整数）

// 错误代码：在某些架构和编译器设置下
#include <iostream>
#include <climits>

int main() {
    int max_int = INT_MAX;
    int result = max_int + 1;  // 有符号整数溢出，可能触发 SIGFPE
    std::cout << "Result: " << result << std::endl;
    return 0;
}

注意：在大多数现代系统上，有符号整数溢出是未定义行为，可能不会触发 SIGFPE，而是产生错误的结果。

场景 1.4：模运算除以零

// 错误代码
#include <iostream>

int modulo(int a, int b) {
    return a % b;  // 如果 b 为 0，触发 SIGFPE
}

int main() {
    int result = modulo(10, 0);  // 崩溃点
    std::cout << "Result: " << result << std::endl;
    return 0;
}

2. 系统限制类

场景 2.1：浮点运算异常（启用浮点异常）

// 需要启用浮点异常
#include <iostream>
#include <cfenv>
#include <cmath>

int main() {
    // 启用浮点异常（需要系统支持）
    feenableexcept(FE_DIVBYZERO | FE_INVALID | FE_OVERFLOW);
    
    double result = 1.0 / 0.0;  // 可能触发 SIGFPE
    std::cout << "Result: " << result << std::endl;
    return 0;
}

3. 运行时异常类

场景 3.1：数学库函数异常

// 错误代码：某些数学函数在特定输入下可能触发异常
#include <iostream>
#include <cmath>

int main() {
    // sqrt(-1) 可能触发浮点异常（取决于系统配置）
    double result = sqrt(-1.0);  // NaN，但可能触发 SIGFPE
    std::cout << "Result: " << result << std::endl;
    return 0;
}

场景 3.2：数组索引计算错误

// 错误代码：索引计算导致除零
#include <iostream>
#include <vector>

int main() {
    std::vector<int> vec = {1, 2, 3, 4, 5};
    int divisor = 0;
    int index = 10 / divisor;  // 触发 SIGFPE
    int value = vec[index];
    return 0;
}

易混淆场景辨析

SIGFPE vs SIGSEGV

SIGFPE：算术运算异常（除以零、溢出等）

int result = 10 / 0;  // SIGFPE：算术异常

SIGSEGV：内存访问违规

int* ptr = nullptr;
*ptr = 42;  // SIGSEGV：内存访问违规

整数除零 vs 浮点除零

整数除零：总是触发 SIGFPE（在大多数系统上）
浮点除零：通常产生 inf 或 -inf，但在启用浮点异常时可能触发 SIGFPE

三、崩溃调试与定位（实操步骤）

基础定位：core 文件 + gdb 调试

步骤 1：开启 core 文件

ulimit -c unlimited

步骤 2：gdb 加载 core 文件

g++ -g -O0 -o program main.cpp
./program  # 会崩溃并生成 core
gdb ./program core

步骤 3：关键调试命令

(gdb) bt                    # 查看调用栈
(gdb) info registers        # 查看寄存器（包括浮点寄存器）
(gdb) print variable        # 打印变量值
(gdb) print/x $rax          # 查看寄存器值（16进制）
(gdb) info float            # 查看浮点寄存器状态

实际调试示例：

$ gdb ./sigfpe_example core
GNU gdb (Ubuntu 9.2-0ubuntu1~20.04) 9.2
...
Core was generated by `./sigfpe_example'.
Program terminated with signal SIGFPE, Arithmetic exception.
#0  0x0000000000401123 in divide(int, int) (a=10, b=0) at main.cpp:4
4       return a / b;

(gdb) bt
#0  0x0000000000401123 in divide(int, int) (a=10, b=0) at main.cpp:4
#1  0x0000000000401145 in main () at main.cpp:8

(gdb) print a
$1 = 10
(gdb) print b
$2 = 0

(gdb) info registers
rax            0xa                 10
rbx            0x0                 0
rcx            0x0                 0
rdx            0x0                 0    # rdx 是除法的余数寄存器
rsi            0x0                 0    # rsi 是第二个参数（b=0）
rdi            0xa                 10   # rdi 是第一个参数（a=10）

进阶工具

工具 1：使用 Undefined Behavior Sanitizer

# 编译时启用 UBSan
g++ -g -fsanitize=undefined -fno-omit-frame-pointer -o program main.cpp
./program

UBSan 输出示例：

main.cpp:4:10: runtime error: division by zero
SUMMARY: UndefinedBehaviorSanitizer: undefined-behavior main.cpp:4:10

工具 2：启用浮点异常

# 在代码中启用浮点异常检测
#include <cfenv>
feenableexcept(FE_DIVBYZERO | FE_INVALID | FE_OVERFLOW);

定位关键点

SIGFPE 崩溃的核心排查方向：

检查除零操作：查看变量值，确认除数是否为 0
检查整数溢出：确认计算结果是否超出类型范围
检查浮点运算：确认浮点运算是否产生异常值
检查数学函数：确认数学函数的输入是否有效
检查数组索引计算：确认索引计算是否正确

四、崩溃修复方案（针对性解决）

分场景修复代码

场景 1：整数除以零

快速修复：加除零检查

// 修复前
int divide(int a, int b) {
    return a / b;  // 崩溃点
}

// 快速修复
int divide(int a, int b) {
    if (b == 0) {
        std::cerr << "Error: division by zero" << std::endl;
        return 0;  // 或返回错误码
    }
    return a / b;
}

优雅修复：使用异常或 std::optional

// 优雅修复方案 1：使用异常
#include <stdexcept>

int divide(int a, int b) {
    if (b == 0) {
        throw std::domain_error("Division by zero");
    }
    return a / b;
}

// 优雅修复方案 2：使用 std::optional (C++17)
#include <optional>

std::optional<int> divide(int a, int b) {
    if (b == 0) {
        return std::nullopt;
    }
    return a / b;
}

// 使用
auto result = divide(10, 0);
if (result.has_value()) {
    std::cout << *result << std::endl;
} else {
    std::cerr << "Division by zero" << std::endl;
}

场景 2：浮点数除以零

快速修复：检查并处理

// 修复前
double divideDouble(double a, double b) {
    return a / b;
}

// 快速修复
double divideDouble(double a, double b) {
    if (b == 0.0) {
        if (a > 0) return std::numeric_limits<double>::infinity();
        if (a < 0) return -std::numeric_limits<double>::infinity();
        return std::numeric_limits<double>::quiet_NaN();
    }
    return a / b;
}

优雅修复：使用数学库函数

// 优雅修复：使用标准库处理特殊情况
#include <cmath>
#include <limits>

double safeDivide(double a, double b) {
    if (std::abs(b) < std::numeric_limits<double>::epsilon()) {
        // 处理除零情况
        if (std::abs(a) < std::numeric_limits<double>::epsilon()) {
            return std::numeric_limits<double>::quiet_NaN();
        }
        return (a > 0) ? std::numeric_limits<double>::infinity() 
                        : -std::numeric_limits<double>::infinity();
    }
    return a / b;
}

场景 3：整数溢出

快速修复：检查溢出

// 修复前
int add(int a, int b) {
    return a + b;  // 可能溢出
}

// 快速修复
#include <climits>

int safeAdd(int a, int b) {
    if (a > INT_MAX - b) {
        throw std::overflow_error("Integer overflow");
    }
    return a + b;
}

优雅修复：使用更大的类型或检查库

// 优雅修复方案 1：使用更大的类型
long long safeAdd(int a, int b) {
    return static_cast<long long>(a) + b;
}

// 优雅修复方案 2：使用 C++20 的 std::checked_add（如果可用）
// 或使用第三方库如 boost::safe_numerics

场景 4：模运算除以零

快速修复：加检查

// 修复前
int modulo(int a, int b) {
    return a % b;  // 如果 b 为 0，触发 SIGFPE
}

// 快速修复
int modulo(int a, int b) {
    if (b == 0) {
        throw std::domain_error("Modulo by zero");
    }
    return a % b;
}

修复验证

单元测试覆盖异常场景

#include <gtest/gtest.h>

TEST(DivisionTest, DivideByZero) {
    EXPECT_THROW(divide(10, 0), std::domain_error);
}

TEST(DivisionTest, NormalDivision) {
    EXPECT_EQ(divide(10, 2), 5);
}

TEST(OverflowTest, IntegerOverflow) {
    EXPECT_THROW(safeAdd(INT_MAX, 1), std::overflow_error);
}

避坑提醒

浮点除零通常不触发 SIGFPE：大多数系统上，浮点数除以零产生 inf 或 NaN，不会崩溃
整数溢出是未定义行为：在大多数系统上，有符号整数溢出不会触发 SIGFPE，而是产生错误结果
使用 UBSan 检测溢出：编译时使用 -fsanitize=undefined 可以检测整数溢出

五、长期预防策略（从编码到部署全链路）

编码规范

C++ 开发中规避 SIGFPE 的编码习惯：

除零检查：所有除法操作前检查除数

if (divisor != 0) {
    result = dividend / divisor;
}

浮点运算前校验分母

if (std::abs(divisor) > std::numeric_limits<double>::epsilon()) {
    result = dividend / divisor;
}

使用安全的数学函数

// 使用标准库函数处理边界情况
double result = std::sqrt(std::max(0.0, value));

检查数组索引计算

int index = (size > 0) ? value / size : 0;

编译阶段

开启防御性编译选项：

# 启用未定义行为检测
g++ -g -O0 -Wall -Wextra \
    -fsanitize=undefined \
    -fno-omit-frame-pointer \
    -o program main.cpp

测试策略

// 边界值测试
TEST(BoundaryTest, DivideByZero) {
    EXPECT_THROW(divide(10, 0), std::domain_error);
}

TEST(BoundaryTest, Overflow) {
    EXPECT_THROW(safeAdd(INT_MAX, 1), std::overflow_error);
}

// 浮点运算测试
TEST(FloatTest, InfinityHandling) {
    double result = divideDouble(1.0, 0.0);
    EXPECT_TRUE(std::isinf(result));
}

线上监控

#include <signal.h>
#include <cfenv>
#include <iostream>

void fpeHandler(int sig) {
    std::cerr << "SIGFPE caught!" << std::endl;
    
    // 检查浮点异常状态
    if (std::fetestexcept(FE_DIVBYZERO)) {
        std::cerr << "Division by zero detected" << std::endl;
    }
    if (std::fetestexcept(FE_INVALID)) {
        std::cerr << "Invalid floating point operation" << std::endl;
    }
    if (std::fetestexcept(FE_OVERFLOW)) {
        std::cerr << "Floating point overflow" << std::endl;
    }
    
    exit(1);
}

int main() {
    signal(SIGFPE, fpeHandler);
    // 程序代码
    return 0;
}

六、拓展延伸（加深理解）

进阶技巧：浮点异常控制

#include <cfenv>
#include <iostream>
#include <cmath>

int main() {
    // 启用浮点异常（需要系统支持）
    feenableexcept(FE_DIVBYZERO | FE_INVALID | FE_OVERFLOW);
    
    try {
        double result = 1.0 / 0.0;  // 会触发 SIGFPE
    } catch (...) {
        std::cerr << "Floating point exception caught" << std::endl;
    }
    
    return 0;
}

实际案例分享

案例：数组索引计算导致除零

问题描述：程序在处理空数组时崩溃，coredump 显示 SIGFPE。

排查过程：

GDB 分析显示崩溃在数组访问
检查变量值，发现除数为 0
追踪到数组大小计算

根本原因：

// 问题代码
int calculateIndex(int value, int size) {
    return value / size;  // size 可能为 0
}

int main() {
    std::vector<int> vec;  // 空向量
    int index = calculateIndex(10, vec.size());  // vec.size() = 0
    int value = vec[index];  // 触发 SIGFPE（在索引计算时）
}

解决方案：

// 修复代码
int calculateIndex(int value, int size) {
    if (size == 0) {
        throw std::invalid_argument("Size cannot be zero");
    }
    return value / size;
}

总结

SIGFPE 是算术运算异常信号，主要原因是除以零和整数溢出。通过：

除零检查：所有除法操作前检查除数
溢出检测：使用 UBSan 或手动检查溢出
浮点异常处理：正确处理浮点运算的特殊值
调试技巧：掌握 GDB 调试，分析寄存器值
预防策略：编码规范、测试覆盖、边界检查

可以有效减少 SIGFPE 崩溃，提高程序稳定性。