http://www.7klian.com

Cosmos 产物总监:Cosmos Hub 3 进级失败的复盘与应对法子

这个 bug 使得 Cosmoshub-3 不能凭据进级 提案 1 中提供的说明启动。验证人随后凭据提案的规复打算从头启动 Cosmoshub-2,该链在 UTC 时间下午 1:54 规复运行。此失败进级的总停机时间为 2 小时 15 分钟。

作者:Jack Zampolin,Cosmos 产物总监

5. 将来的进级应该包罗「未能启动 1」尺度来消除恍惚性,详细 参考。

4. 改造应急和回滚文档,以确保验证人可以或许更好地从任何状态规复。一些大型验证人或 ICF/AiB 大概会在 S3 bucket 中维护 ~/.gaiad/ directories 的最新副本,以辅佐验证人在呈现妨碍时快速启动。

3. 建设答允验证人从主网的克隆中轻松启动测试网的东西。此东西将替换创世文件中的验证人公钥,并答允少量验证人测试针对主网克隆的任何进级 / 迁移。今朝有一个社区正致力于推出一个由主网分叉出的带有补丁的测试网。可以进入 电报 5 群 中交换。

进级失败袒露了测试和进级进程以及一些内部流程中的缺陷。在上周与验证人接头的进程后,Cosmos 将采纳 5 个法子以低落呈现雷同问题的大概性。

原文标题:《对 Cosmos Hub 3 进级失败的复盘反思》(Cosmos Hub 3 Upgrade Post-Mortem)

进级失败袒露了我们的测试和进级进程以及一些内部流程中的缺陷。在上周与验证人接头的进程中,应采纳以下法子以低落呈现雷同问题的大概性:

这个 bug 好像是在 gaia-13004 (v0.34.7)到 gaia-13005 (v1.0.0-rc3)期间被捕捉的,可是在 gaia-13005 到 gaia-13006 (v2.0.0)进级期间,,有一些对付迁移 逻辑 3 的附加变动没有颠末测试。迁移问题 3 已经被 kwun-yeung 修复,SDK 团队正在开拓 gaia 版本(v2.0.2),请继承 存眷。

在为筹备进级的进程中,验证人在 UTC 时间上午 11:39 遏制了 Cosmoshub-2。迁移了约莫 25 分钟后,多个验证人发明导出的创世文件存在一个问题,该问题是由迁移呼吁中的 bug 引起的。

1. 应该优先思量由 Regen Networks 团队(已经与 ICF 签订条约)举办的「自动进级 7」的相关事情,以缓解后续版本的问题(详细 参考)。这种进级要领实现了去中心化网络的完全进级,停机时间不高出 2.5 分钟。对比之下,Cosmoshub-3 进级估量停机 1 小时。

2. 针对每个版本的模仿器,运行主网的完整导出 / 迁移。这是添加到宣布进程中的一个简朴步调,原来可以防备呈现此问题。

一个努力的方面是,这个问题很快被定位,验证人可以或许从头启动区块链,而不会产生双重签名事件和宕机处罚。这展示了 Cosmos 验证人们优秀的运维本领,以及他们作为一个团队在紧张状况下的执行本领。在进级失败的杂乱中,也有几个验证人设法编写脚原来修复创世文件。感激来自 StakeWithUs14 的 Oliver,请 参考。

值得留意的是:多个渠道之间的相同分歧是一个有争议的话题。一些人认为这是去中心化和努力的,而另一些人但愿所有的相同都在一个渠道举办。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

说点什么吧
  • 全部评论(0
    还没有评论,快来抢沙发吧!

相关文章阅读