http://www.7klian.com

硬核:ProgPoW 背后的算法开拓团队亲自解读 ASIC 芯片设计本钱

假如你看看 AMD 的 Polaris 20 系列产物和英伟达的 GP 104 产物,会在模仿镜头下发明这些 GPU 中陈设了大量微小的「可拆卸」子模块构成。

现阶段,ETHash 挖矿更有利可图,针对该算法的内存需求明明增加,对付高带宽存储器的需求不绝增长也促使下一代高速存储器技能被开拓了出来,好比 GDDR6 (带宽速度到达 768 GB/s) 和 HMB2 (带宽速度到达 256 GB/s)。

有些「硬件砖家」正在不遗余力向软件工程师担保他们可以或许战胜加密钱币生态系统 —— 我们已经在门罗币(Monero)、比特币(Bitcoin)、以及 ZCash 等加密钱币上看到了这种环境已经呈现。但现实是,这种挑战至今仍没有产生,想想看,假如比特大陆或 Innosilicon 试图制造 CPU,你认为他们可以或许战胜英特尔和 AMD 吗?

由于时间跨度较长,随之会激发出另一个问题:为什么浮点运算(floating point operation)被省略掉了?这个问题的谜底其实也很是简朴:浮点运算不能跨芯片移植,差异芯片往往会以差异方法来处理惩罚与非凡值(好比下确界、非数字数值、以及相关变体等)相关的界线案例(corner case)。边角案例也被成为病态案例(pathological case),是指其操纵参数在正常范畴以外的问题或是景象,并且多数是几个情况变数或是条件都在极度值的景象,纵然这些极度值都还在参数规格范畴内(或是界线)。个中最大的分歧在于非数字数值(NaN)的处理惩罚,这会在利用随机输入时自然产生,引用维基百科页面的表明:

ProgPoW 焦点开拓团队 IfDefElse 的最后一点想法

ProgPoW 其实针对是一种挖矿硬件,这种硬件受到了局限经济的支持,具有高可见性并得到了较大竞争优势。

问题二:由于 ProgPoW 现有架构和算法与 ETHash 存在相似之处,Innosilicon 的下一款 ASIC 芯片将会为 ProgPoW 量身定制吗?

事实上,ProgPoW 和 ETHash 之间独一的相似之处就是在全局内存(global memory)中利用了无环图(DAG)。从计较的角度来看,ETHash 只需要一个牢靠的「keccak_f1600」内核和一个模数函数(modulo function)。另一方面,ProgPoW 需要的则是可以或许执行 16 通道宽的随机数学序列,同时还要可以或许会见高带宽一级缓存(L1 cache)。设计一个可以或许执行 ProgPow 数学序列的计较内核,比设计一个可以或许实现雷同「keccak」这样的牢靠函数哈希要可贵多。

同样地,一名硬件设计师大概也会涉猎差异的规模,好比为一款电动牙刷设计芯片,或是为网络设备构建一个芯片架构(silicon architect)。出产 10 万个电动家牙刷芯片的工程师大概不会领略出产 100 万个芯片的网络工程师所思量的可用局限经济,同样一个加密钱币 ASIC 芯片设计师大概对 GPU-ASIC 芯片设计知之甚少 —— 这些行业互相之间的接洽并不是许多,有的甚至是国与国之间的差距。

不行否定,真正敦促内存市场的是一些「长周期买家」,好比游戏机、GPU 等,他们也倾向于支持容量更大的内存。事实上,如今的内存供给商没有动力去大批量出产一个 4GB 的内存,究竟市场对这种内存容量的需求并不大。

问题四:对比于 GPU,ASIC 芯片出产商可以利用较小的 GDDR6 内存来得到本钱优势。在保持内存本钱程度的同时,16 个 GDDR6 4GB 的内存条可以或许实现两倍的带宽优势,是这样吗?

首先,拥有两倍的带宽优势就需要两倍的计较,这其实是一种线性扩容(linear scaling),并不能看做是一种优势。

问题一:不管挖矿算法是 ProgPoW,照旧 ETHash,哈希值都是由外部动态随机存取存储器(DRAM)的存储带宽抉择的,是这样吗?

事实并非如此。ProgPoW 的哈希值是由两个因素抉择的:

(注:Ethash 是今朝以太坊基于事情量证明的挖矿共鸣算法,ProgPoW 是一个试图减弱 ASIC 矿机优势的挖矿算法。扇出是一个界说单个逻辑门可以或许驱动的数字信号输入最大量的专业术语。大大都的 TTL 逻辑门可以或许为 10 个其他数字门或驱动器提供信号,因此一个典范的 TTL 逻辑门有 10 个扇出信号;上升时间是脉冲技能里的一个专业名词,电压上升两个时刻的时距离断就是网络变压器的上升时间。)

假如有多个非数字数值(NaN)输入,其有效负载功效应该来自个中一个非数字数值输入,但尺度却没有详细说明。

计较焦点

1)假设你有一个大芯片「Giant ChipA」,它占据了整个晶片。这个「Giant ChipA」是由 10 万个可拆卸子组件构成,可是个中必需确保 80% 的子组件是无缺陷的,才气担保「Giant ChipA」正常事情,而在嵌入进程中,坏的子组件会被绕过;

假如想有一个更好类比的话,或者 AMD RX 5xx 系列或是英伟达 GTX 1xxx 系列是个不错的参照。正如我们之前所述,GPU 中也有部门成果没有被 ProgPoW 操作,好比:浮点逻辑、二级(L2)缓存、以及纹理缓存和 ROP 等。分片单位是向量数学被执行的处所,这绝对是 ProgPoW 所要求的。用于加密钱币挖掘的 ASIC 芯片还但愿添加可以或许实现「keccak」成果的区域。作为 ProgPoW 算法的开拓团队,我们预计 ProgPoW ASIC 芯片的模片区面积会比同等 GPU 小 30%——可是,即即是在最好的环境下,其功耗最多也只会低落 20%。对比之下,固然 GPU 上有些逻辑模块没有被充实应用而造成部门芯片模片区面积挥霍,但功耗却是最小的。

局限经济老是普遍存在的——不管是从本钱角度,照旧履历角度。对付 ASIC 芯片设计本钱, 芯片设计师们好像老是存在很大争论,下面我们团队就为各人具体

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

相关文章阅读