Cloudflare 遭遇 2025 年 11 月 18 日大规模中断:内部配置变更导致全球互联网部分瘫痪

全球领先的网络基础设施提供商 Cloudflare 于 2025 年 11 月 18 日(UTC 时间)发生了一次持续数小时的重大服务中断,导致全球大量网站和在线服务出现访问故障,包括 X(原 Twitter)、ChatGPT、Spotify、Roblox、Grindr、Canva 等热门平台均受到波及。此次中断被视为近年来互联网基础设施领域又一起引人注目的事件,凸显了少数几家云服务巨头对全球网络的深远影响力。

中断时间线与影响范围

根据 Cloudflare 官方事后博客以及多家监测机构的数据,中断于 UTC 时间 11:20(北京时间 19:20 左右)开始显现,用户大量报告出现 HTTP 500/5xx 错误、页面加载失败或“内部服务器错误”。高峰期,Downdetector 等故障监测网站本身也因依赖 Cloudflare 而短暂下线,进一步放大了混乱。

核心流量在 UTC 14:30 左右恢复正常,但控制面板(Dashboard)、API、Workers KV、Access 等应用服务直到 UTC 17:06 才完全恢复,整个事件持续约 5 小时 46 分钟。Cloudflare 表示,此次中断影响了其全球网络,未限定特定地区,但依赖其 Bot Management、Workers 或 CDN 的客户几乎全部受到不同程度冲击。

多家媒体报道,受影响的服务包括:

  • 社交平台:X(原 Twitter)
  • AI 服务:OpenAI 的 ChatGPT
  • 流媒体:Spotify
  • 游戏:Roblox、Runescape 等多人在线游戏
  • 其他:麦当劳官网、部分加密货币平台、Letterboxd 等

Reuters、纽约时报、Engadget 等外媒均称,此次事件虽未达到 2024 年 Crowdstrike 全球 IT 熔断或近期 AWS 大规模中断的破坏性,但仍导致“半个互联网”短暂失灵。

官方披露的根本原因

Cloudflare 在中断发生后数小时内发布详细的事故分析博客(标题《Cloudflare outage on November 18, 2025》),明确指出这并非外部 DDoS 攻击或恶意行为,而是内部一次常规数据库权限调整引发的连锁反应。

具体过程如下:

  1. 运维团队对某数据库系统的权限进行了变更,导致 ClickHouse 查询输出行为异常,产生了大量重复的“feature”行。
  2. 这些重复行被写入 Bot Management(机器人管理)系统的“feature file”(一个用于实时更新机器人威胁特征的配置文件)。
  3. 该文件体积瞬间膨胀一倍,超过边缘路由软件的内置大小限制。
  4. 当全球机房的代理软件尝试加载新文件时,直接崩溃,导致依赖 Bot Management 模块的流量无法正常处理,返回 5xx 错误。
  5. 旧版代理(FL)虽未完全崩溃,但机器人分数全部归零,可能引发误杀合法流量。

Cloudflare 强调,该文件需要“高频、快速”推送以应对不断演化的机器人威胁,但此次权限变更未经过充分的大小影响评估,导致灾难性后果。

Cloudflare 的应对与道歉

公司在事件初期曾短暂怀疑是超大规模 DDoS,但很快锁定内部原因。随后立即停止问题文件的传播,回滚至上一版本,并逐步缓解流量回涌带来的二次负载高峰。

Cloudflare 高管在官方博客中罕见地使用了强烈措辞进行道歉:

“我们对给客户和整个互联网带来的影响深表歉意。在互联网生态中,Cloudflare 的地位使得任何系统中断都是不可接受的。今天我们无法路由流量,这让团队每一个人都深感痛苦。我们让你们失望了。”

公司承诺将公布完整的事故复盘,并采取措施防止类似事件重演,但博客中尚未列出具体改进计划。

市场与业界反响

中断当日,Cloudflare(NYSE: NET)股价下跌约 3%-4%,收盘价约 196 美元,较 11 月初历史高点 260 美元已回调超过 24%。分析人士指出,频繁的云基础设施中断(AWS、Azure、Cloudflare 在一个月内接连出事)正引发投资者对“单点故障风险”的担忧。

专家评论称,云服务集中化在提升效率的同时,也放大了连锁反应。布朗大学计算机教授 Timothy Edgar 表示:“Cloudflare 处理着全球约五分之一的网页请求,任何宕机都是系统性风险。”

截至目前,Cloudflare 已宣布所有服务恢复正常,并将于近期发布更详细的预防措施报告。此次事件再次提醒互联网行业:即便再强大的基础设施,提供“永不宕机”的承诺也越来越艰难。

-=||=-收藏赞 (0)
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《Cloudflare 遭遇 2025 年 11 月 18 日大规模中断:内部配置变更导致全球互联网部分瘫痪》
文章链接:https://topstip.com/cloudflare-outage-november-18-2025/
转载说明:请注明来自“TopsTip”并加入转载内容页的超链接。
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

评论前必须登录!

立即登录   注册