1. 项目概述与背景
最近在巡检几台老旧的CentOS 7.6服务器时,安全扫描报告里那个关于OpenSSH的“高危”漏洞提示,像根刺一样扎眼。这几乎是所有Linux运维工程师的日常:面对一个稳定运行了多年的生产环境,突然被告知其核心的远程访问组件存在安全风险,必须升级。我手头的这几台服务器,OpenSSH版本还停留在7.4p1,而最新的稳定版已经到了10.0p2,中间跨越了多个主要版本,修复了包括认证绕过、信息泄露在内的数十个CVE漏洞。对于任何暴露在公网或处于敏感内网的服务器来说,不及时处理OpenSSH漏洞,无异于在机房大门上挂了一把生锈的锁。
这次升级,远不是一句简单的
yum update openssh
就能解决的。在CentOS 7的官方仓库里,你能找到的最新openssh-server包版本通常只到7.4p1或稍高一点,直接通过yum无法升级到8.x甚至10.x。这意味着我们必须走源码编译或寻找第三方高质量RPM包的道路。更关键的是,OpenSSH是系统的“命脉”——sshd服务一旦升级失败或配置出错,很可能导致我们无法再通过SSH连接服务器,也就是所谓的“自己把自己锁在门外”。因此,整个升级过程必须像外科手术一样精准,需要详尽的预案、清晰的回滚步骤和大量的前置检查。这篇文章,我就来详细拆解在CentOS 7.6环境下,将OpenSSH从老旧版本安全、稳妥地升级到10.0p2的全过程,以及我趟过的那些坑。
2. 升级前的核心评估与准备工作
在动手敲下任何命令之前,充分的评估和准备是避免灾难性后果的唯一途径。盲目升级OpenSSH是运维工作的大忌。
2.1 环境与依赖检查
首先,我们需要对当前服务器有一个全面的了解。登录服务器后,第一件事是确认基础环境。
# 1. 确认系统版本和架构
cat /etc/redhat-release
uname -m
# 2. 确认当前OpenSSH版本及安装方式
ssh -V
rpm -qa | grep -E “openssh|openldap|zlib|openssl”
我的服务器输出是“CentOS Linux release 7.6.1810 (Core)”和“x86_64”,当前OpenSSH版本是“OpenSSH_7.4p1, OpenSSL 1.0.2k-fips”。同时,通过rpm查询,我发现openssh-server、openssh-clients等包都是通过yum安装的。这很重要,它决定了我们后续的升级路径——我们需要编译或安装与现有RPM包管理体系兼容的软件包,以便于管理。
接下来是 依赖检查 。编译OpenSSH 10.0p2,主要依赖以下软件的新版本:
- OpenSSL :提供加密库。10.0p2推荐使用OpenSSL 1.1.x或3.x。而CentOS 7默认的1.0.2k版本太老,可能缺少某些特性或存在兼容性问题, 强烈建议同步升级 。
- Zlib :用于压缩。通常CentOS 7自带的版本(1.2.7)可以满足要求,但检查一下没坏处。
- PAM :可插拔认证模块。CentOS 7默认已安装并启用,编译时需要确认。
- GCC等开发工具 :编译源码必备。
注意 :在生产环境,我强烈反对直接覆盖升级系统自带的OpenSSL。一个更安全、对系统影响更小的方案是,为OpenSSH编译一个 私有版本 的OpenSSL,将其安装到独立目录(如
/opt/openssl_new),然后在编译OpenSSH时指向这个私有路径。这样,系统其他服务(如Apache, Postfix)仍然使用原有的OpenSSL库,互不干扰。这是本次升级的第一个关键决策点。
2.2 制定详尽的备份与回滚方案
这是整个升级过程中最不能省略的步骤。我们的目标是:无论升级过程中发生任何意外,都能在5分钟内恢复服务器的SSH可访问性。
备份清单:
-
现有SSH配置
:
cp -a /etc/ssh /etc/ssh_backup_before_upgrade -
现有SSH服务单元文件
(如果是systemd):
cp -a /usr/lib/systemd/system/sshd.service /usr/lib/systemd/system/sshd.service.backup -
现有RPM包
:
rpm -qa | grep openssh > ~/openssh_installed_packages.list。并考虑将现有rpm包本身下载备份:yumdownloader openssh-server openssh-clients(需要安装yum-utils)。 - 重要数据 :确保你有服务器控制台(如KVM、iDRAC、IPMI)的访问权限。这是最后的救命稻草。如果云服务器,确保有VNC或救援模式入口。
回滚方案:
- 快速回滚 :如果新sshd启动失败,但旧SSH连接未断开,立即通过现有连接恢复旧配置和服务。
- 控制台回滚 :如果SSH完全断开,通过服务器控制台登录,将备份文件还原,并强制安装旧版本的RPM包。
-
预案
:准备一个简单的回滚脚本放在
/tmp目录,内容就是还原备份和重启旧服务的命令,万一需要,可以在控制台快速执行。
2.3 获取并验证软件源码
从官方或可信镜像站下载源码包,并务必验证其完整性。
# 创建工作目录并进入
mkdir -p /usr/local/src/openssh_upgrade
cd /usr/local/src/openssh_upgrade
# 下载 OpenSSL 和 OpenSSH 源码包 (请替换为当时最新稳定版的直链)
# 以 OpenSSL 1.1.1w 和 OpenSSH 10.0p2 为例
wget https://www.openssl.org/source/openssl-1.1.1w.tar.gz
wget https://cdn.openbsd.org/pub/OpenBSD/OpenSSH/portable/openssh-10.0p2.tar.gz
# 下载对应的签名文件
wget https://www.openssl.org/source/openssl-1.1.1w.tar.gz.sha256
wget https://cdn.openbsd.org/pub/OpenBSD/OpenSSH/portable/openssh-10.0p2.tar.gz.sig
# 验证 OpenSSL (使用 sha256sum)
sha256sum openssl-1.1.1w.tar.gz
cat openssl-1.1.1w.tar.gz.sha256
# 对比两个输出的哈希值是否完全一致
# 验证 OpenSSH (需要导入开发者的GPG密钥,过程略复杂,至少进行哈希校验)
wget https://cdn.openbsd.org/pub/OpenBSD/OpenSSH/portable/openssh-10.0p2.tar.gz.sha256
sha256sum openssh-10.0p2.tar.gz
cat openssh-10.0p2.tar.gz.sha256
验证通过后,解压源码包:
tar zxvf openssl-1.1.1w.tar.gz
tar zxvf openssh-10.0p2.tar.gz
3. 分步编译与安装核心组件
采取先编译安装私有OpenSSL,再编译安装OpenSSH的策略。所有自定义安装的软件都放到
/opt
目录下,与系统文件隔离。
3.1 编译安装私有版本OpenSSL
进入OpenSSL源码目录,进行编译配置。关键是要指定安装前缀(
--prefix
),并禁用共享库(
no-shared
),这样编译出来的是静态库,被OpenSSH链接后可以独立运行,不依赖系统的
ld.so.conf
。
cd openssl-1.1.1w
# 安装编译依赖
yum install -y gcc make perl-core zlib-devel
# 配置编译参数
./config --prefix=/opt/openssl-1.1.1w no-shared
# `--prefix` 指定安装目录
# `no-shared` 只生成静态库,避免与系统库冲突
# 编译并安装
make -j$(nproc) # 使用所有CPU核心加速编译
make install
编译安装完成后,
/opt/openssl-1.1.1w
目录下会有
bin
,
include
,
lib
等子目录。我们需要将这个新OpenSSL的
lib
目录添加到动态链接器的缓存中,以便后续编译OpenSSH时能够找到它。
echo “/opt/openssl-1.1.1w/lib64” > /etc/ld.so.conf.d/openssl-1.1.1w.conf
ldconfig
实操心得 :使用
no-shared选项生成静态库,是生产环境升级此类底层库的“黄金法则”。它牺牲了一点磁盘空间,但换来了绝对的隔离性和可移植性。新编译的OpenSSH将静态链接这个OpenSSL,以后即使系统OpenSSL升级或降级,都不会影响我们这个SSH服务。
3.2 编译安装OpenSSH 10.0p2
现在进入重头戏。编译OpenSSH时,需要通过
--with-ssl-dir
参数明确指出我们刚才安装的私有OpenSSL路径。
cd ../openssh-10.0p2
# 安装OpenSSH编译依赖
yum install -y pam-devel zlib-devel
# 配置编译参数,这是最关键的一步
./configure --prefix=/usr \
--sysconfdir=/etc/ssh \
--with-ssl-dir=/opt/openssl-1.1.1w \
--with-pam \
--with-zlib \
--with-md5-passwords \
--with-privsep-path=/var/empty/sshd
# `--prefix=/usr` 是为了替换系统原有文件,保持路径一致
# `--sysconfdir=/etc/ssh` 保持配置文件路径不变
# `--with-ssl-dir` 指向我们自定义的OpenSSL
# `--with-pam` 启用PAM认证支持(非常重要!否则可能导致root无法登录)
# `--with-privsep-path` 指定特权分离目录
# 编译
make -j$(nproc)
在运行
make install
之前,
务必先停止当前的sshd服务
。但这里有一个至关重要的技巧:
不要直接关闭当前的SSH连接会话
。我们开启一个新的终端,通过
第二个SSH连接
来执行停止服务和安装的操作。万一安装失败,第一个连接还能作为“生命线”用于回滚。
在 第二个SSH终端 中执行:
# 停止sshd服务
systemctl stop sshd
# 回到第一个终端的编译目录,执行安装(这里假设第一个终端在/usr/local/src/openssh_upgrade/openssh-10.0p2)
# 在第一个终端执行:
make install
make install
会覆盖
/usr/bin/ssh
,
/usr/sbin/sshd
,
/etc/ssh/
下的模版文件等。它默认会备份旧的配置文件(如
sshd_config
会备份为
sshd_config.bak
),但我们的
/etc/ssh/ssh_config
和
/etc/ssh/sshd_config
因为之前做过手动备份,所以不用担心。
安装完成后,需要更新systemd的单元文件,并重新加载配置:
# 复制新的sshd.service文件(源码包中提供)到系统目录
cp contrib/redhat/sshd.init /usr/lib/systemd/system/sshd.service
# 或者,更稳妥的方法是:在原有service文件基础上修改,确保ExecStart指向新的sshd二进制文件。
# 查看新的sshd路径: which sshd 或 ls -lh /usr/sbin/sshd
# 重新加载systemd配置
systemctl daemon-reload
3.3 关键配置迁移与调整
直接启动新版本sshd大概率会失败,因为新旧版本的配置文件可能存在语法差异。我们采用“旧配置为主,手动合并新特性”的策略。
# 1. 首先,用新安装的sshd生成一份默认的新配置
/usr/sbin/sshd -t 2>&1 | head -20 # 先测试一下新sshd能否解析旧配置,通常会报一些警告
# 如果报错严重,我们需要合并配置。
# 2. 安全起见,将现有的sshd_config备份为sshd_config.old,然后将源码包中的默认配置复制过来作为基础
cp /etc/ssh/sshd_config /etc/ssh/sshd_config.old
cp sshd_config /etc/ssh/sshd_config.new
# 3. 手动将旧配置中的重要自定义项(如Port, PermitRootLogin, PasswordAuthentication, AllowUsers等)合并到新的配置文件中。
# 可以使用diff工具辅助:
diff -u /etc/ssh/sshd_config.new /etc/ssh/sshd_config.old | less
# 4. 一个更高效的方法是:直接用旧配置覆盖新配置,然后让新sshd检查并提示不支持的选项。
cp /etc/ssh/sshd_config.old /etc/ssh/sshd_config
/usr/sbin/sshd -t # 测试配置语法
运行
sshd -t
后,它会输出所有不推荐或已废弃的配置项警告。你需要根据这些警告,查阅OpenSSH 10.0p2的发布说明(
openssh-10.0p2/RELEASE_NOTES
),逐一修改或删除无效的配置行。这是一个需要耐心仔细的过程。
4. 服务重启、验证与深度测试
配置调整完毕后,就可以尝试启动新服务了。但请保持第一个SSH连接始终在线。
4.1 安全启动与初步验证
在第二个终端中启动服务:
systemctl start sshd
systemctl status sshd
如果状态显示为
active (running)
,恭喜你,成功了一大半。但先别急着断开第一个“生命线”连接。
打开 第三个终端 ,尝试用新连接登录服务器:
ssh -V # 确认客户端版本是否也更新了(通常`make install`会一起更新)
ssh username@your_server_ip
如果能成功登录,并且
ssh -V
显示为
OpenSSH_10.0p2
,说明升级基本成功。在第三个终端里执行一些命令,确保会话完全正常。
4.2 功能与兼容性深度测试
初步登录成功只是第一步,还需要进行一系列深度测试,确保所有关键功能正常。
-
密钥对认证测试 :这是最易出问题的环节。使用现有的私钥(如
id_rsa)和新生成的密钥(如ed25519)分别进行登录测试,确保各种密钥类型兼容。ssh -i ~/.ssh/id_rsa username@server ssh -i ~/.ssh/id_ed25519 username@server -
SFTP/SCP功能测试 :测试文件传输是否正常。
scp /etc/hostname username@server:/tmp/test_scp sftp username@server # 在sftp>提示符下执行 ls, put, get等命令 -
端口转发测试 :如果业务用到SSH隧道或端口转发,必须测试。
# 本地端口转发测试 ssh -L 8080:localhost:80 username@server -Nf curl http://localhost:8080 # 然后kill掉这个ssh进程 -
审计与日志检查 :查看新的sshd是否正常记录日志。
tail -f /var/log/secure # 在新的终端尝试成功/失败的登录,观察日志输出格式和内容是否正常。 -
防火墙与SELinux :如果服务器启用了SELinux,需要确保新的sshd二进制文件上下文正确,或者将SELinux设置为宽容模式进行测试。
ls -Z /usr/sbin/sshd # 如果上下文不对,可能需要执行:restorecon -v /usr/sbin/sshd
4.3 设置服务自启动并清理
所有测试通过后,就可以放心地设置新sshd开机自启,并清理编译环境了。
systemctl enable sshd
现在,你可以 逐渐关闭 之前保留的多个SSH连接,最终只保留一个使用新版本OpenSSH的会话。观察一段时间(建议24小时),确认服务稳定无误后,再进行清理。
# 删除编译目录和源码包
cd /usr/local/src
rm -rf openssh_upgrade/
# (可选)卸载旧版本的openssh RPM包,避免yum update时被意外降级。
# 但务必谨慎,先确认新版本的所有功能完全正常!
# rpm -e --nodeps openssh-server openssh-clients ...
5. 常见故障排查与经验实录
即使步骤再详细,在实际操作中还是会遇到各种“坑”。下面是我在多次升级中总结的典型问题及解决方法。
5.1 连接超时或直接拒绝连接
现象
:
systemctl start sshd
成功,但
ssh
连接时超时或显示
Connection refused
。
排查思路 :
-
检查服务是否真正监听端口
:
netstat -tlnp | grep :22或ss -tlnp | grep sshd。如果没有输出,说明sshd没有绑定到端口。 -
检查配置文件
:确认
/etc/ssh/sshd_config中Port设置正确,且没有被注释。同时检查ListenAddress是否绑定到了特定IP(如0.0.0.0)。 -
检查防火墙
:
firewall-cmd --list-all查看是否放行了SSH端口(默认22)。CentOS 7的firewalld可能阻止了连接。 -
查看sshd详细日志
:
journalctl -u sshd -f或tail -f /var/log/secure,在尝试连接时观察是否有错误日志。一个常见错误是Privilege separation user sshd does not exist,这是因为--with-privsep-path指定的目录或用户有问题。需要确保/var/empty/sshd目录存在且权限为711,用户sshd存在。
5.2 启动失败:
sshd: error while loading shared libraries
现象
:执行
systemctl status sshd
显示失败,运行
/usr/sbin/sshd
直接报错,提示找不到某个共享库(如
libssl.so.1.1
)。
原因与解决
:这通常是因为编译时没有使用
no-shared
的OpenSSL,或者动态链接路径未正确设置。
-
方案一(根治)
:按照本文所述,重新编译一个
no-shared的OpenSSL,并重新编译OpenSSH。 -
方案二(临时)
:如果已经编译了共享库版本的OpenSSL,确保
/etc/ld.so.conf.d/下的配置文件包含其lib路径,并执行ldconfig。但此方案有潜在风险。
5.3 登录失败:
Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password)
现象 :可以连接到服务器,但在输入密码或使用密钥后,提示权限被拒绝。
排查思路 :
-
检查PAM
:这是最常见的原因。编译时如果漏了
--with-pam选项,sshd将无法使用PAM进行密码认证。 解决方案只能是重新编译并加上--with-pam。 -
检查
sshd_config:-
PasswordAuthentication yes是否被启用? -
PermitRootLogin是否允许root登录(根据安全策略设置)? -
AllowUsers或DenyUsers是否限制了当前用户?
-
-
检查SELinux
:在SELinux enforcing模式下,异常的上下文可能导致认证失败。可以临时设置为permissive模式测试:
setenforce 0。如果问题解决,则需要审计并修复SELinux策略:ausearch -m avc -ts recent和restorecon -R -v /etc/ssh /usr/sbin/sshd。
5.4 升级后现有连接会话异常中断或卡顿
现象 :升级过程中,保持登录的第一个SSH会话(“生命线”)在重启sshd后变得响应缓慢或直接断开。
原因与解决 :这是因为新旧sshd实例在某些底层会话处理上可能存在不兼容。虽然TCP连接还在,但会话状态可能混乱。
-
最佳实践
:在重启sshd服务前,在“生命线”会话中,使用
screen或tmux开启一个持久化的终端会话。这样即使外层SSH连接断开,里面的工作也不会丢失。重启服务后,重新SSH登录,再接入screen或tmux会话即可。 - 补救措施 :如果已经断开,立即通过服务器控制台(KVM/iDRAC)登录,检查服务状态和日志,进行回滚。
5.5 回滚操作实录
当升级失败且无法通过现有SSH修复时,控制台是唯一出路。通过控制台登录后:
# 1. 停止有问题的sshd
systemctl stop sshd
# 2. 还原备份的配置文件
cp -a /etc/ssh_backup_before_upgrade/* /etc/ssh/
# 3. 强制重新安装旧版RPM包(如果你提前下载了)
rpm -Uvh --force ~/openssh-*.rpm
# 4. 恢复旧的systemd单元文件
cp /usr/lib/systemd/system/sshd.service.backup /usr/lib/systemd/system/sshd.service
systemctl daemon-reload
# 5. 启动旧服务
systemctl start sshd
整个过程的核心是 冷静 和 有备份 。只要备份齐全,回滚可以在几分钟内完成。
6. 升级后的安全加固建议
成功升级到OpenSSH 10.0p2后,不仅仅是解决了已知漏洞,我们还应该借此机会,根据新版本支持的特性,进一步加固SSH服务的安全配置。
6.1 利用新版本特性增强安全
编辑
/etc/ssh/sshd_config
,考虑启用以下配置(请根据实际需求调整):
# 1. 禁用不安全的密钥交换、加密和MAC算法
KexAlgorithms curve25519-sha256,curve25519-sha256@libssh.org,diffie-hellman-group-exchange-sha256
Ciphers chacha20-poly1305@openssh.com,aes256-gcm@openssh.com,aes128-gcm@openssh.com,aes256-ctr,aes192-ctr,aes128-ctr
MACs hmac-sha2-512-etm@openssh.com,hmac-sha2-256-etm@openssh.com,umac-128-etm@openssh.com
# 2. 限制用户登录尝试次数,防御暴力破解
MaxAuthTries 3
MaxSessions 10
# 3. 使用更严格的权限模型
AllowAgentForwarding no
AllowTcpForwarding no # 如非必要,建议关闭
X11Forwarding no
PermitRootLogin prohibit-password # 或直接设为 ‘no‘
PasswordAuthentication no # 强烈建议禁用密码登录,仅使用密钥
修改后,务必运行
sshd -t
测试配置,然后
systemctl reload sshd
重载服务。
6.2 建立长效监控与更新机制
一次升级不是终点。建议建立监控机制:
-
版本监控
:使用监控系统(如Zabbix, Prometheus)监控
sshd进程的版本信息,或定期通过脚本检查。 -
日志审计
:集中收集和分析
/var/log/secure日志,使用Fail2ban等工具自动封禁恶意IP。 - 漏洞跟踪 :订阅CVE安全公告,或关注OpenSSH官方网站的发布页面,及时了解新版本和安全通告。
最后,我个人最深刻的一个体会是:对于像OpenSSH这样的核心服务, “可回滚性”的优先级永远高于“新特性” 。每一次生产环境的变更,都必须有清晰、测试过的回滚路径。这次从7.4p1到10.0p2的跨越式升级,看似复杂,但只要拆解成“准备-编译-安装-测试-回滚预案”这几个标准化步骤,并严格在测试环境先行验证,就能将风险控制在极低的范围内。整个过程中,保持至少一个不受新sshd影响的稳定连接(或控制台访问),是你操作自信心的最大来源。
7427

被折叠的 条评论
为什么被折叠?



