数据中心运维服务
目前由于应用和资源的多元化,企业流行采用混合云架构。不少客户通常面对管理难,系统资源吃紧、系统缺乏安全保障、设备基本已经过保或将近淘汰等问题。我们为客户提供一整套成熟的运维管理的规范流程。
资产统计
为了快速接手,统计客户现有的机房服务器、虚拟服务器、云服务器等的IT资产:
机房地址、联系、商务信息统计记录;
平台系统结构图的详细补充完善;
硬件设备型号、数量、系统版本等信息统计记录;
软件名称、版本和补丁等信息统计记录;
集中管理
服务器网络集群需要有统一的管理平台,这样便于总体管理、资源调配、数据迁移。
系统监控
定时备份
现场巡检
检查机房硬件设备的物理状态,包括面板指示灯、温度、噪音等。发现并及时更换报警或故障设备、配件(有质保的联系质保厂商),统计并更新备件库。有针对性地向领导提出预警及解决建议,提早预防,最大限度地降低运营风险。
系统巡检
检查操作系统及其应用软件的运行状态和资源开销,统计扩容更新需求;
统计监控系统和系统日志中的非正常情况,分析原因,提出整改方法;
检查系统或软件版本的更新情况,提供书面文档进行开会讨论;
总结报告,提供阶段性的改进方案。
安全管理
安全管理在系统运维当中至关重要,不但要防止外部的网络攻击和黑客侵入,还要避免内部人员的误操作、操作不当、越权使用等问题。故障问题中通常人为因素占了大半,因此严格操作规范和操作流程、划清职责权限是十分重要的事情。
收缩服务器的登录入口。
建立完善的账户权限体系,限制账户登录权限和数据文件的访问权限。
信息系统的修改操作需要有负责人授权或监督的前提下进行。
规范新程序的发布流程,上线前对现有数据和配置备份,能够及时恢复回退。
冗余系统
由于服务器设备老旧,容易出现各种类型的设备故障,赶赴现场、检查问题、实施维修、更换配件都需要时间,修复设备会造成系统长时间的宕机。通过集群和双机手段实现业务系统的故障冗余。