服务器通过网络发送和收集数据。它是一种 24/7 全天候运行以管理网络资源的设备。像所有机器一样,它需要定期维护以防止服务器故障。服务器维护可确保您的网络高效运行。服务器故障可能导致代价高昂的停机时间。我们的服务器维护清单旨在确保您的服务器始终顺畅运行。
1.验证备份
在对服务器进行任何更改之前,请验证备份的完整性。
- 经常并定期进行备份
- 手动检查备份计划、位置和恢复时间
- 测试备份文件
- 检查服务器文件是否复制到正确的备份位置
- 执行“测试还原”
2.维护灾难恢复计划
灾难恢复计划( DRP) 概述了在服务器发生故障时如何响应。
(1).仔细考虑您的应用程序要求以概述主要目标。
(2).包括备份审核,例如:
- 状态检查
- 数据完整性检查
- 磁盘空间检查
- 恢复过程检查
(3).进行风险分析。服务器维护计划如何避免潜在风险,例如:
- 意外丢失应用程序和数据
- 系统错误
- 停电
- DDoS 攻击
- 天气灾害
(4).建立恢复团队。
(5).建立灾难恢复预算。
(6).定期测试和更新灾难恢复计划。
3.检查磁盘使用情况
保持您的服务器存储免费,以降低服务器崩溃的风险。通过删除旧日志或未使用的软件来减少存储。开始添加更多存储容量以避免数据丢失和服务器冻结的风险。建议有20-30% 的可用磁盘存储空间。
4.查看服务器资源使用情况
在预防性维护中,磁盘空间并不是您需要监控的唯一资源。处理器可以显示服务器使用情况。您需要查看CPU、RAM 和网络使用情况。如果其中任何一个接近完全使用,计划增加资源容量。如果它们接近极限,请积极主动。在使用量达到一定限度之前,迁移服务器或添加资源。您可以安装带有通知警报的监控工具,例如 Xabbix。它有助于避免服务中断。
5.服务器安全
检查系统配置、操作系统更新和其他潜在的安全风险。使用远程审计工具测试服务器、数据库和网络安全的状态。
- 使用 Web 应用程序防火墙
- 删除过时的软件
- 更新操作系统和应用程序
- 对所有用户帐户强制使用强密码
- 启用双因素验证
- 使用 TLS/SSL 证书
- 维护数据和系统备份
- 执行服务器恶意软件扫描
6. 查看服务器日志
查看您的日志以熟悉服务器上的操作。服务器在发生错误时生成日志。记录的错误允许您识别硬件问题。您可以在它导致服务器故障之前修复它。
7. 解决硬件错误
现代服务器操作系统跟踪并记录硬件错误。查看日志以确定硬件问题。在导致服务器崩溃之前解决硬件错误。
- 检查网络故障日志
- 检查磁盘读/写错误
- 执行所有驱动程序、控制器固件和软件更新
- 运行系统一致性检查
- 更换任何发生故障或显示故障迹象的驱动器
您可以使用应用程序配置服务器监控实用程序。当发生硬件错误时,它会发送警报。它可以帮助防止由硬件故障引起的问题。
8.远程管理工具
远程服务器管理的三个基本工具是:
- 远程控制台
- 远程重启
- 远程救援模式
远程管理工具可帮助您管理服务器。这些工具对于管理远程服务器或专用服务器必不可少。定期测试远程服务器管理工具以确保它们正常运行。
9.更新控制面板
控制面板用于管理服务器。为获得最佳服务器性能,请确保将其升级到最新版本。控制面板需要手动更新。您可能还需要更新它管理的应用程序。
10.更新操作系统
操作系统更新可以增强系统的安全性。操作系统更新包含具有增强功能的新软件和应用程序。您应该始终与生产系统并行进行更新。在开发/测试系统上完成更新后,检查所有应用程序是否正常运行。
结论
许多因素有助于保持服务器平稳运行。如果您正在管理自己的服务器,则上面的清单旨在为您提供指导。通过这份清单,您应该对服务器维护有更好的了解。您还可以使用控制面板来管理您的服务器。