如何在 CentOS 救援模式下使用 YUM 管理软件包？-HCRM博客

当CentOS系统遭遇意外崩溃、启动失败或关键文件损坏时，Rescue模式（救援模式）是管理员恢复系统的重要工具，而YUM作为CentOS的包管理工具，在救援过程中扮演着修复依赖、重建环境的关键角色，本文将从实际运维角度解析两者的协同使用方法，并提供可操作的解决方案。

CentOS Rescue模式的核心作用

Rescue模式并非简单的“系统恢复模式”，它本质上是通过最小化环境挂载原始系统根目录，为管理员提供完整的底层操作权限，这意味着：

1、当系统因内核升级失败、GRUB损坏或/etc/fstab配置错误无法启动时，可直接通过Rescue环境修复

2、关键系统文件被误删（如/bin/bash或/lib库文件）时，无需重装系统即可恢复

3、支持对LVM、RAID等复杂存储方案的诊断与修复

进入Rescue模式的标准流程：

1、从安装介质启动，在启动菜单选择"Troubleshooting"

2、选择"Rescue a CentOS system"

3、根据提示按"1"进入交互式Shell

4、执行chroot /mnt/sysimage挂载原始系统环境

YUM在救援环境中的特殊用法

常规情况下，YUM依赖完整的系统环境运行，但在Rescue模式中，需特别注意以下差异：

1. 网络连接的建立

部分救援环境默认不启用网络，需手动配置：

ip addr show  
nmcli dev connect eth0  
ping www.centos.org




若遇到DNS解析问题，可临时修改/etc/resolv.conf：

echo "nameserver 8.8.8.8" > /etc/resolv.conf




2. 修复损坏的RPM数据库

当出现"rpmdb: unable to join the environment"错误时，执行：

rm -f /var/lib/rpm/__db*  
rpm --rebuilddb  
yum clean all




3. 针对性软件包修复

案例：修复被破坏的glibc组件

yum reinstall glibc\* --disablerepo=* --enablerepo=base




使用--disablerepo参数避免元数据损坏导致安装失败

4. 内核版本冲突处理

当系统因多内核版本冲突无法启动时，在Rescue模式下：

rpm -qa | grep ^kernel  
yum remove kernel-3.10.0-1160.105.1.el7




典型故障处理方案

场景1：/boot分区误清理导致系统无法启动

处理步骤：

1、进入Rescue模式并挂载系统

2、挂载正确的分区到/boot：

mount /dev/sda1 /mnt/sysimage/boot




3、重新安装内核：

yum reinstall kernel




4、重建initramfs：

dracut -f /boot/initramfs-$(uname -r).img $(uname -r)




场景2：误删python导致YUM不可用

解决方案：

1、从其他正常主机复制对应版本的rpm包

2、在Rescue模式下强制安装：

rpm -ivh --force python-2.7.5-89.el7.x86_64.rpm




3、验证YUM功能：

yum check-update




深度优化建议

1、创建应急恢复包集合

yum install yum-utils  
repoquery --requires --resolve bash glibc coreutils > emergency_pkg.list




2、定期验证系统完整性：

rpm -Va | grep '^..5'




3、配置离线YUM源：在正常系统中执行

createrepo /data/local_repo/




在长期的系统运维实践中发现，90%以上的启动故障可通过Rescue模式配合YUM修复，但必须注意：操作前应对关键数据进行完整备份，避免在修复过程中产生二次损坏，对于物理服务器，建议配置iLO/iDRAC等带外管理接口；对于云服务器，应提前创建自定义系统镜像，系统稳定性建设本质上是一场与熵增的持续对抗，只有建立完善的监控预警机制，才能最大限度减少进入Rescue模式的概率。