事件回放:
北京时间2019年8月23日12时05分,亚马逊云计算服务平台(AWS)东京ap-northeast-1a组的部分服务器出现联通性故障,约12:15 亚马逊通过Dashboard 推送消息,称部分EC2和redis用户在此次事件中受到影响。首次故障发生后约70分钟,下午1:22:50秒,AWS 1a组机器的RDS(俗称数据库),部分开始宕机。至此,亚马逊云计算服务平台东京业务区 1a、1b、1c 三个可用区中,1a 区遭受较大的影响,1b和1c受影响轻微。
故障发生后约5分钟,约12时10分,追币交易所(www.bidream.cn)即发现部分线上服务受到影响,并紧急联系AWS技术支持部门。AWS技术部门向追币交易所确认了故障信息后,并随即通过其Dashboard向波及到的用户推送此次故障消息。
作为亚马逊云计算服务平台的用户,追币交易所随后与 AWS 在台湾的技术团队沟通,寻求可靠的解决方案。在与其沟通中,追币与 AWS 台湾团队发现了更多的问题。如,1a 组由于机器硬件设备故障,导致 AWS 自己也无法连通。部分多可用区的服务只能勉强维持,随着影响范围地逐渐扩大,AWS 东京的 Redis 服务器的创建等服务全部宕机。
事件发生后约5分钟,追币技术团队启动交易所数据安全紧急预案,及时修改可用区,并通过技术手段积极规避此次故障带来的继发影响。因此,实际受影响服务,大概在故障发生后15分钟左右,即得到有效的恢复。Amazon Web Service一直以来是追币基础数据架构的首选品牌。对追币来说,也是绝对值得信赖的伙伴。目前,AWS正在排错,而此次事件对追币造成的影响非常轻微。
国内行业带来的影响与反思:
国内各相关交易机构的正常交易服务受到比较大的影响,一些交易所已暂停相关业务。
另据稍晚一些的国内媒体报道,在服务器故障期间一些交易机构出现了数据异常的事件。如,有用户“用0.3美元购买到40多个比特币”。
针对AWS的这一事件,有业界人士表示,金融系统的安全性与稳定性是非常核心的技术指标。一些交易所的技术架构难以抵御意外情况的发生。随着行业的加速发展,相信会有更多的用户在选择交易机构时,“安全”将成为首选要素。
截止至本文发出时,AWS尚未完全恢复服务。
发表评论 取消回复