新闻详情

News

网易云音乐因故障崩上热搜,全过程风险管控强化基础设施安全
新闻动态
2024-08-21

8月19日,网易云音乐APP遭遇重大技术故障,众多用户反馈无法正常使用该应用。根据网友反映的信息,不仅移动端受到影响,网页端也出现了“502 Bad Gateway”的错误提示。对此,网易云音乐官方迅速发布声明,证实此次故障是由其基础设施问题引发,导致服务大面积中断。这一事件迅速登上热搜榜首,不仅暴露了技术服务的脆弱性,也深刻反映了现代经济社会对数字化基础设施的高度依赖及其潜在风险。

一、政策引领下的基础设施发展

为适应快速发展的数字时代需求,国家层面出台了一系列相关政策和指导方针,旨在推动数字基础设施的安全建设与发展。

近年来,随着“中国制造2025”、“网络强国战略”、“国家大数据战略”等一系列国家战略的深入实施,以及云计算、大数据、物联网等新技术的蓬勃发展,中国数据中心行业迎来了前所未有的发展机遇。《数字中国建设整体布局规划》为数字基础设施的建设与升级指明了方向,强调了夯实数字基础设施和数据资源体系的重要性,标志着我国数字化转型进入了一个新的发展阶段。

《“十四五”数字经济发展规划》提出要适度超前布局数字基础设施,深入推进信息通信网络建设,加快建设全国一体化算力网,全面发展数据基础设施。

《关键信息基础设施安全保护条例》明确了关键信息基础设施的范围、职责分工以及保障关键信息基础设施安全的技术和管理要求,推动了我国关键信息基础设施安全保障体系的建设。

《信息安全技术 关键信息基础设施安全保护要求》规定了关键信息基础设施分析识别、安全防护、检测评估、监测预警、主动防御事件处置等方面的安全要求。

二、基础设施面临诸多严峻挑战

尽管有强大的政策支持和技术进步,基础设施仍然面临着多重挑战,这些问题的存在使得基础设施的安全保障成为了一个持续且复杂的任务。

访问控制执行不严:系统中访问权限设置不精确或执行不严格,可能导致未授权用户访问敏感资源,增加数据泄露和滥用风险。需加强访问策略的制定与执行,定期进行权限审查。

基础设施依赖关系不明确:系统各组件间的依赖关系不清晰,影响故障排查和恢复效率。应建立详细的依赖关系图,确保运维团队能快速定位问题根源。

物理隔离措施不足:关键系统或区域未采取足够的物理隔离措施,易受外部威胁。需增设门禁、监控等物理安全设施,提高物理防护水平。

环境监控系统局限性:现有环境监控系统覆盖范围有限或功能不足,难以全面监控关键参数。应升级系统,增加监控点,确保及时发现并处理环境问题。

基础设施监控范围有限:对基础设施的监控不够全面,可能导致潜在问题被忽视。应扩大监控范围,包括网络设备、服务器、存储等关键组件。

定期巡检流于形式:巡检过程未严格执行或记录不全,未能及时发现隐患。应建立标准化巡检流程,加强巡检人员培训,确保巡检质量。

应急疏散规划不周:应急疏散预案缺乏针对性或操作性不强,影响紧急情况下的人员安全。需根据实际情况制定详细、可行的疏散计划,并定期组织演练。

应急电源切换不畅:在突发情况下,应急电源切换不及时或失败,可能导致系统停机。应定期检查应急电源系统,确保其可靠性,并优化切换流程。

复盘分析浅尝辄止:对安全事件或故障的复盘分析不够深入,未充分挖掘问题根源和改进空间。应建立全面的复盘机制,深入分析原因,提出针对性改进措施。

改进建议执行缓慢:针对发现的问题提出的改进建议未能及时有效执行,影响整体安全水平的提升。应建立快速响应机制,确保改进建议得到及时跟踪和落实。

三、全过程风险管控守护基础设施安全

在此背景下,道普信息风险管控专家提出了一套全面的风险管理体系,旨在通过全过程的风险识别、评估、监测与控制,有效提升数字基础设施的安全水平。这一理念的核心在于预防为主,通过前瞻性的策略降低潜在风险发生的可能性。

实施强访问控制策略:采用多因素身份验证,定期审计访问权限,确保最小权限原则得到执行。

强化基础设施依赖与冗余:建立清晰的基础设施依赖关系图,实施故障转移和冗余策略,减少单点故障风险。

加强物理访问控制:如设置门禁系统、安装监控摄像头,并实施严格的物理隔离措施。

扩展监控范围:提高监控精度,并集成智能分析技术,及时发现并处理潜在威胁。

全面监控基础设施:采用实时监控技术,设置合理的告警机制,确保系统异常能够迅速被发现并处理。

明确巡检内容和标准:加强巡检执行力度,建立巡检反馈机制,确保巡检工作得到有效执行。

制定详细的应急疏散预案:定期组织疏散演练,优化疏散环境,确保紧急情况下人员能够迅速、有序地疏散。

建立可靠的应急电源系统:定期测试和维护应急电源设备,制定应急电源切换预案,确保电力中断时能够迅速切换到应急电源。

深入进行安全事件复盘分析:总结经验教训,完善应急预案和防护措施,提升整体安全防护水平。

建立快速响应机制:对改进建议进行优先级排序并跟踪执行进度,确保重要改进建议得到及时执行并评估效果。

在国家政策的指引下,数字基础设施的安全需求日益凸显。随着数字化转型步伐的加快,基础设施的安全与否不仅关系到企业的生存和发展,更是关乎国家的整体稳定与繁荣。未来,我们需要继续深化对基础设施安全的研究与实践,不断完善相关政策法规,强化技术手段,确保数字化进程的稳健前行。