事件回首
2020年12月19日,Filecoin网络经验了链上间断,这意味着可以在一段时间内建设新的区块,但矿工无法就发生的状态告竣共鸣,每个区块计较出差异的代价。由于社区成员、矿工和开拓人员之间的快速响应——在四个小时内宣布了修复措施,而且实现了网络在七个小时内完全规复。
间断原因
潜在的问题是对存储矿工参加者实现中的工具映射举办潜在的不确定性迭代。参加者在Go中实现。众所周知,对Go映射的迭代是不确定的,而且参加者在利用迭代之前实施了始终对迭代功效举办排序的模式(强制执行静态阐明)。不幸的是,两个映射在举办排序时利用的较量函数中的错误导致排序无效。因此,差异的节点以差异的顺序处理惩罚map条目标顺序差异,从而导致差异的功效和Gas耗损。
该代码路径实际上只有通过(a)一个矿工声明多个扇区当即终止,或(b)一个矿工当即规复超过多个分区的妨碍,才气达到此代码路径。(其他两个代码路径到了这一点,但实际上极不行能)。在此之前,主网中都没有利用这两种路径,没有将多个扇区作为数据,从而袒露了不确定性。所以多个扇区的同时终止激发了这一间断。
Filecoin参加者的测试涵盖了所接头的代码,但不包罗验证差异测试运行时确定性执行的机制。Lotus节点实现的集成测试未涵盖终止多个扇区。
间断影响
固然产生了这样大局限的时间,最重要的是,在间断期间没有丢失任何数据。固然无法建设新的数据块临时抑制了网络上的生意业务,但存储供给商提供的所有数据都是安详的,而且一旦网络规复运行就可以利用。另外,值得留意的是,纵然在链间断的环境下,Filecoin协议的类型也提供了数据检索。因此,尽量在事件一连时间内不行能举办链上生意业务,但Filecoin网络的焦点成果仍保持稳定。另外,已采纳的修复法子确保采矿功课自己不会因停机而受到惩罚;取而代之的是,为了低落优先级并勉励网络规复,临时低落了共鸣削减。
快速应对
首次发明,识别,修复和陈设速度也很明明:
● 事件产生后十五分钟内,自动监控触发了警报;
● 在三十分钟内,矿工和实施开拓人员聚积在一起;
● 在四个小时内,开拓人员确定并宣布了此问题的修复措施;
● 在七个小时之内,足够多的节点回收了此修复措施,以通过大都共鸣的功率阈值,使网络规复。
对付刚宣布的漫衍式存储网络而言,这个响应的速度令人难以置信。纵然成立blockchains经验链断和分叉,Filecoin办理这个事件时间可以与已经运行多年的区块链相媲美。整个社区应该为处理惩罚此事件的速度感想孤高。
只有活着界各地多个集体的配合尽力下才气实现这种修复。整个生态系统中的各方举办了协作以实现这一方针:矿工发明并陈诉了该问题,引起了开拓人员的留意;工程团队举办协调,以针对潜在问题宣布颠末同行评审的补丁措施,同时通过社区渠道转达此修复措施的状态;全球各地的网络参加者都在尽力应用补丁措施,并使网络尽快规复在线。固然如此紧张的事件不会再产生,但这是Filecoin生态系统内参加度和专注度最令人印象深刻的展示。
下一步将会做什么
成立区块链就像造火箭。它们长短常巨大的技能,因此很难在第一次实验中就将所有工作都做好。就像真正的火箭一样,工作大概以意想不到的方法堕落。当产生这种环境时,重要的是要有适当的基本架构以尽快办理问题,最洪流平地淘汰影响并淘汰再次产生问题的大概性。
为了到达这个目标,多个团队举办了过后验收的编写和执行,确定了对参加者的测试包围范畴以及网络基本设施/通信的警报和问题进级的其他改造,以辅佐减轻将来大概产生的事件。
由于Filecoin社区成员的辛勤事情和投入,,这种新颖技能的缺点不绝获得办理。在发明并办理所有问题后,网络将进一步成长成为一个不变、靠得住且颠末验证的平台。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。