CentOS 几件事:运维老手的实用笔记
在服务器领域摸爬滚打多年,CentOS 始终是绕不开的坚实伙伴,它那份源自红帽企业级血脉的稳定与可靠,让无数运维工程师在深夜也能安心入眠,围绕这个经典系统,有几件关键事项值得每位使用者深入理解。

版本选择:并非越新越好 CentOS Stream 的出现曾引发广泛讨论,它与传统 CentOS Linux 的定位差异显著,Stream 作为 RHEL 的上游,更新更快但稳定性需要更严谨的评估,对于核心生产环境,尤其是金融、医疗等对稳定性要求极高的场景,经过长期验证的 CentOS 7 或已过渡到的 Rocky Linux/AlmaLinux 等替代发行版,通常是更稳妥的选择,关键决策点在于:你的业务能否承受潜在的前沿更新带来的兼容性风险?将稳定性置于绝对优先级,往往是明智的起点。

安全加固:基础不容忽视 面对层出不穷的网络威胁,默认安装的 CentOS 只是起点。立即实施基础安全加固是强制要求:
- 最小化安装原则: 仅安装绝对必需的软件包 (
@minimal install),从根本上减少攻击面。 - 防火墙即生命线: 熟练掌握
firewalld(systemctl start firewalld,firewall-cmd --permanent --add-service=http) 或经典的iptables,严格限制入站流量,仅开放必要的端口与服务。 - SSH 安全至关重要: 禁用 root 直接登录 (
PermitRootLogin no),强制使用密钥认证 (PasswordAuthentication no),修改默认 22 端口,并利用fail2ban自动封锁暴力破解尝试。 - 及时更新是铁律: 建立严格的更新机制,定期执行
yum update --security或dnf update --security,第一时间修补已知漏洞,自动化工具如yum-cron或dnf-automatic不可或缺。 - SELinux 不是摆设: 理解其强制访问控制模型,配置为
Enforcing模式 (getenforce/setenforce),它是抵御零日漏洞的最后一道有力屏障,学习使用audit2allow合理处理合规告警而非简单禁用。
日常维护:稳定运行的基石
- 磁盘空间管理: 使用
df -Th监控分区,du -sh *定位大文件,重点关注/var(日志)、/home等增长区域,配置logrotate有效管理日志膨胀,防止单一日志文件拖垮整个系统。 - 性能监控与优化: 熟悉
top/htop、vmstat、iostat、netstat/ss等核心工具,关注 CPU 负载 (load average)、内存使用 (尤其是free -m中的available)、磁盘 I/O 等待 (wa)、网络流量,对异常进程保持高度敏感。 - 服务管理标准化: 统一使用
systemctl管理服务 (systemctl status/start/stop/restart/enable servicename),清晰的服务启动、停止、状态检查流程是运维规范化的体现。 - 备份重于一切: 制定并严格执行备份策略,系统配置 (
/etc, 用户信息)、关键应用数据、数据库必须定期备份,验证备份的可恢复性与演练恢复流程,其重要性怎么强调都不为过,工具如rsync,tar, 乃至BorgBackup都是可靠伙伴。
故障排查:冷静与逻辑至上 服务器故障如同深夜急诊,保持冷静和清晰的逻辑链至关重要:
- 精准定位现象: 服务不可用?性能骤降?错误日志报什么?精确描述问题是成功的一半。
- 日志是黄金线索: 熟练查阅
/var/log/messages,/var/log/secure,以及相关应用日志 (journalctl -u servicename)。grep,tail -f,less是必备的日志分析利器。 - 资源瓶颈分析: 迅速使用监控工具 (
top,free,iostat) 检查 CPU、内存、磁盘 I/O、网络是否出现瓶颈。dmesg能提供内核级别的宝贵信息。 - 网络连通性验证:
ping,traceroute/tracepath,telnet/nc(测试端口),ss/netstat(查看连接和监听) 是诊断网络问题的基本工具链。 - 服务状态与依赖检查:
systemctl status查看服务是否运行、有无错误;确认其依赖的服务(如数据库)是否正常。 - 尝试隔离与复现: 在安全前提下,尝试重启服务、在测试环境复现问题,缩小故障范围,版本回退有时是快速恢复的有效手段。
个人观点 CentOS 像一位沉默可靠的老伙计,它不会给你最炫目的新功能,却能在最需要的时候稳稳托住一切,它的价值不在于追赶潮流,而在于那份经过千锤百炼的稳定基石,在云原生和容器化席卷一切的今天,理解像 CentOS 这样的传统系统的精髓——安全、稳定、可预测、可深度掌控——这种能力不仅没有过时,反而在构建底层基础设施时显得更为珍贵,真正的运维功力,往往体现在对这些“老伙计”的驾驭和对基础原则的坚守上,选择 CentOS 或其精神继承者,本质上是对“稳定压倒一切”这一服务器领域核心信条的认同。

