数据中心着火了.是的你没听错.机房真的着火了.这样的事咱们IT人时常聊起,却又没人遇到的事真发生了.
坐标韩国,title国家级数据中心.

水冷服务器见过没?


不过不是近期.那为什么又被提起?
因为他*的才恢复.2025 年 9 月 26 日发生大火.2025 年 12 月 30 日,韩国行政安全部宣布受灾的 709 个政务系统“全部恢复”。
3个月带拐弯.心疼韩国同行三秒钟.
机房着火还是国家级数据中心.三月后才恢复.那还等啥呢.
聊起!~
那是在2025年9月26日晚8时15分左右,大田国家信息资源管理院(NIRS)的 5 楼电算室里,几个施工人员正忙着给 UPS(不间断电源)电池搬家。讽刺的是,这次搬迁原本是为了提高安全性,把电池从服务器旁边挪走。
这不就是咱们做安全加固,然后变事故的故事么.
不出意外的出现了意外,这些已经超期服役了 11 年(建议寿命 10 年)的 LG 锂电池,在断电移动的过程中,疑似因电压波动直接发生了热失控。发生剧烈爆炸.点燃周围可燃物,火势瞬间失去控制。现场的工作人员甚至还没反应过来,机房就已经变成了炼狱。
很多人问,这种级别的机房,灭火系统是摆设吗?
有.那必须有,而且不光有还非常高级.
在大田中心,其实装有标准的气体灭火系统(如七氟丙烷或二氧化碳)。理论上,一旦感烟探测器报警,喷头就会喷出高浓度灭火气体,通过物理冷却和化学抑制瞬间灭火,且不伤电子设备。
但是,但可是
锂电池的“自带氧气”属性: 锂电池火灾最无解的地方在于,它发生的是剧烈的化学反应,即使排干氧气,电池内部依然在持续放热并产生易燃气体。
消防员的“投鼠忌器”: 当消防队赶到时,面临一个地狱级的选择题:喷水,数据中心彻底报废;不喷水,火灭不掉。
高温“热传导”: 由于电池和服务器的物理间距只有区区 60 厘米(这是一个巨大的设计缺陷),即便气体压住了明火,恐怖的辐射热也将旁边的机架烤到了 160°C 以上。
这里翻译一下,这玩意不着火也烫人,噼里啪啦蹦火星那种.
最终,这场火足足烧了 22 小时。为了保命,运维人员被迫切断了所有系统的电源。
接下来所有IT人共同发问的时刻.
备份呢?
在韩国的灾备体系里,是有 异地备份(大邱中心) 的。但问题是,这个名额有限。
-
• 警察、消防、金融系统: 这些是“亲儿子”,有实时镜像,大田火了,大邱顶上,数据几乎无损。 -
• 普通行政、办公系统: 比如倒霉的 G-Drive(政府云盘)。它竟然只做到了“本地异地”(即在大田机房内换个架子备份),而没有做跨城市的物理异地备份。
哈哈哈哈哈!~
忽然觉得全世界都一样.你要备份资源的时候,这里有困难,那里有预算的.先这样搁置吧.
等出事了没有备份的时候,那就是你为什么不早说?我什么时候说过?那你是干啥的?
对于那些没有远程备份的,韩国技术人员最后只能用最原始、也最硬核的方式——开盘提取。
他们把被烟熏过、甚至电路板都烧焦的磁盘阵列拆开,送进无尘实验室,通过更换受损的控制电路板,尝试读取残留磁记录来提取镜像。这就好比在废墟里拼凑被火烧过的存折。
针对 19.1 万公职人员、858 TB 的 G-Drive 丢失数据,政府甚至想出了一个奇招:向全国公务员发通知,让大家从自己电脑的本地缓存、离线同步盘里把文件传回去…… —
全世界领导好像也都一样.
这事韩国总统都感到“惊讶”,并不是因为火大,而是因为这种 “系统性裸奔”。
按照现代数据中心的基本逻辑,必须要遵循 3-2-1 备份原则:3 份副本,2 种介质,1 份异地。
韩国作为 IT 强国,居然让 75 万公务员的 7 年办公成果,处于一种“物理单点故障”的威胁之下。这意味着只要大田中心的 UPS 电池炸了,韩国政府的办公记忆就会断电重置。
这种“省钱省在刀刃上,结果切了自己大动脉”的做法,确实挺让人共鸣的——是不是像极了某些公司,平时不做容灾演练,一出事全靠技术员通宵“拼盘”?
目前,虽然系统重新上线了,但那丢失的几百个 TB 的数据,可能永远留在了 2025 年的那个火场里。

