📢【事故通报】L1-135 电力中断事件
2025 年 5 月 6 日,我们上游数据中心合作方的 L1-135 机房发生两起电力相关事故,影响到了所有洛杉矶客户:
1️⃣ 主要故障 – 机房母线弧光爆炸
由于下游接地故障,主配电间天花板上的 4000A 母线槽发生电弧闪络爆炸,导致市电和发电机电源全部中断。机房电力在当天下午 5:33 恢复,UPS 系统于晚上 9:00 完全恢复正常运行。
2️⃣ 次要问题 – 客户设备 PDU 故障
一台 第三方客户自带 PDU(非 DMIT 设备)出现间歇性接地故障,导致 UPS 旁路模块跳闸,延缓了恢复过程。该设备已于 5 月 14 日移除。
⚠️ DMIT 立场声明:
虽然我们感谢机房方的调查,但 DMIT Cloud Service 不完全认同其结论。我们认为,单一 PDU 故障不应影响整个 UPS 系统,IDC 方应具备 更强的故障隔离机制 来避免类似问题影响整个区域。
✅ DMIT Cloud Service 后续行动:
🔁 网络架构优化: 将所有 三层网络设备迁出 W7C,确保其他机房的 IP 客户 不会因单点故障而受影响。
🧭 新增可用区: 计划于 2025 年底前在洛杉矶新增一个 独立可用区。
🔄 双可用区支持: 虚拟机客户将可选择部署在 不同可用区或启用 双可用区冗余。
🤝 与 IDC 合作优化: 正在与 IDC 方积极沟通,提升其电力系统稳定性与故障隔离能力。
感谢您的理解与信任。目前所有服务均已全面恢复并稳定运行。