一次 GitHub Actions 翻车实录:E2E 测试把我的后端项目按在地上做体检

最近我给 FlashRisk 项目加了一个看起来很高级的东西:Testcontainers 端到端测试

理想很丰满:

一条命令启动 MySQL、Redis、Kafka,再拉起所有微服务,最后模拟注册、登录、库存预热、下单、风控、结算。

现实很直接:

GitHub Actions:你先别急着高级,我先让你看看什么叫红色感叹号。


一、事故现场

GitHub 上 CI 挂了:

FlashRisk CI / Maven Verify (push) Failing

失败点在:

Run unit and integration tests
mvn -B verify -DskipITs=false

本地看起来没啥问题,但 GitHub Actions 一跑完整 E2E,直接翻车。

这就是 E2E 测试的魅力:
单元测试像体检抽血,E2E 测试像让你跑 1000 米。问题藏不住。


二、第一个错误:MySQL 初始化权限不够

日志核心报错:

Access denied for user 'flashrisk'@'%' to database 'campaign_db'

当时的 E2E MySQL 配置大概是这样:

private static final MySQLContainer<?> MYSQL =
        new MySQLContainer<>(DockerImageName.parse("mysql:8.0"))
                .withDatabaseName("user_db")
                .withUsername("flashrisk")
                .withPassword("flashrisk_dev_password")
                .withInitScript("e2e/mysql-init.sql");

问题就在 withInitScript()

它会通过 JDBC 执行初始化 SQL,而这个 JDBC 连接使用的是我们配置的业务用户:

flashrisk

但初始化 SQL 里要做这些事情:

CREATE DATABASE IF NOT EXISTS campaign_db;
CREATE DATABASE IF NOT EXISTS order_db;
CREATE DATABASE IF NOT EXISTS risk_db;
GRANT ALL PRIVILEGES ...

这就很尴尬了。

业务用户 flashrisk 的权限定位是:

好好读写业务库,别想着当 DBA。

结果我们让它去创建数据库、授权用户。
这就像让实习生第一天上班就去改公司组织架构,系统当然说:你不配。


三、第一个修复:让 MySQL root 初始化脚本

正确做法是:
不要用 withInitScript() 执行多库初始化脚本,而是把 SQL 文件挂到 MySQL 官方镜像的初始化目录:

/docker-entrypoint-initdb.d/

修复后代码:

private static final MySQLContainer<?> MYSQL =
        new MySQLContainer<>(DockerImageName.parse("mysql:8.0"))
                .withDatabaseName("user_db")
                .withUsername(DB_USER)
                .withPassword(DB_PASSWORD)
                .withCopyFileToContainer(
                        MountableFile.forClasspathResource("e2e/mysql-init.sql"),
                        "/docker-entrypoint-initdb.d/001-init-flashrisk.sql"
                );

这样 SQL 会在 MySQL 容器初始化阶段执行,由镜像内部用 root 权限处理。

一句话总结:

withInitScript() 适合普通建表;
/docker-entrypoint-initdb.d/ 更适合创建数据库、创建用户、授权这种“管理员活儿”。


四、第二个错误:Gateway JWT issuer 翻车

第一个问题修完后,CI 往下跑,终于进入业务链路。

然后又挂了。

请求:

POST /api/campaigns/1/inventory/preheat

返回:

500 Internal Server Error

注意:注册、登录都成功了。
说明 JWT 生成没问题,问题出在带 Token 访问受保护接口时。

Gateway 里原来的代码是:

headers.set(AUTH_ISSUER_HEADER, jwt.getIssuer().toString());

看起来优雅,实际上暗藏小坑。

我们的 issuer 是:

flashrisk-user-service

它是一个普通字符串,不是 URL。

而 Spring Security 的 jwt.getIssuer() 更偏向把 iss 当成 URL/URI 语义处理。
普通字符串可能拿不到有效 issuer,结果这里一 .toString(),直接空指针。

这个错误很有节目效果:

JWT 明明带了 iss,但是你非要它长得像 URL。
它只是个服务名,不是网址。你不能要求每个人上班都穿西装。


五、第二个修复:直接读取原始 iss claim

修复前:

headers.set(AUTH_ISSUER_HEADER, jwt.getIssuer().toString());

修复后:

String issuer = jwt.getClaimAsString("iss");
if (issuer != null && !issuer.isBlank()) {
    headers.set(AUTH_ISSUER_HEADER, issuer);
}

这样就不会强行把 issuer 当 URL 解析了。

同时补了一个单元测试,专门验证这种普通字符串 issuer:

Map.of(
    "iss", "flashrisk-user-service",
    "sub", "1001",
    "username", "alice"
)

测试目标很明确:

issuer 不像 URL,也不准 Gateway 原地爆炸。


六、最终结果

修复后重新推送:

fix: initialize e2e mysql schemas as root
fix: relay jwt issuer claim safely

本地验证:

mvn -q -pl gateway-service -am test
mvn -q test

GitHub Actions 最新结果:

FlashRisk CI / Maven Verify passed

这次 CI 从红变绿,说明完整链路已经能在 GitHub runner 上跑通。


七、这次事故的经验

第一,Testcontainers 的 withInitScript() 不一定适合做数据库级初始化。
如果涉及 CREATE DATABASECREATE USERGRANT,优先考虑 MySQL 官方初始化目录。

第二,JWT 的 iss 不一定非得是 URL。
如果业务里 issuer 是服务名,例如:

flashrisk-user-service

那就直接用:

jwt.getClaimAsString("iss")

别强行用 getIssuer()

第三,E2E 测试很烦,但很有用。
它不会夸你架构优雅,它只会问:

你这一整套东西,真能跑起来吗?

这次它问了。
然后我们修了。
最后 CI 绿了。
技术人的快乐,有时候就是这么朴素。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值