微电子或集成电路 (IC) 是许多前沿应用的核心,其工艺进步直接影响各种应用的创新。但在机器人、太空探索、航空航天、核电站、精密检测、医学成像、甚至环境保护和食品安全等应用中,工艺的先进性并不是全部,“辐射”是这些领域的 IC 需要解决的核心问题。辐射可能会导致机器人发生故障,使医学成像不准确,或者工业应用机器出现停转等等。
对于 IC 设计师来说,在所有上述应用中,宇宙空间应该说是最具挑战性的应用场景。失去地球大气层的保护,电子系统在阿尔法 ( Alpha ) 和贝塔 ( Beta ) 粒子、伽马 ( Gamma ) 和 X 射线以及银河宇宙辐射等高能(电离)辐射面前,相当脆弱,所以能够抗衡此类辐射的航空级IC 代表了防辐射IC 技术的塔尖。
电离辐射有足够的能量让电子脱离轨道。如果这个电子代表存储器中的一个数位或总线接口上的一个值,该值就可能被改变或“翻转”。这种状况有多种叫法,包括单粒子效应 (SEE)、单粒子翻转或单粒子闩锁。无论具体叫什么,如果错误的数位发生翻转,例如应用代码中的指令或寄存器中的控制数位,整个系统就会崩溃。
耐辐射 (Radiation-tolerant)和抗辐射加固 (Radiation-hardened)的区别
为了在宇宙空间中运行,电子系统需要具有防范辐射风险的能力。某些 IC 制造商采用标准半导体晶圆中加入防护衬底的方式提供“ 加固 ( hardened ) ”组件。虽然抗辐射加固 IC 具有更强的耐辐射能力,但却不能彻底免疫。与此同时,因为抗辐射芯片设计要求更复杂且产量更低,因而价格也明显更加昂贵。
此外,即便所需要的组件可以被设计成抗辐射加固IC,因为其投产速度的滞后性,也阻碍了航天器设计人员对抗辐射加固 IC 选用。
在遭遇电离辐射时,除了采用抗辐射加固IC的设计方法提供抗辐射能力,设计人员还可以通过运用器件和设计方法进行检测并予以纠正。
这就是所谓的耐辐射。
这种方法的主要优势在于,可以将大量组件都制作成耐辐射组件。例如,众多存储器技术采用纠错码技术来检测和纠正存储器内的位翻转。
三重模块冗余
如果寄存器内发生了位翻转,或由存储器检索的数据在总线接口传输的过程中发生了翻转,对此类事件进行检测则极为复杂。开发者通常使用三重模块冗余技术 (triple modular redundancy, TMR)来检测和纠正此类性质的事件。通过TMR,主要电路采用完全相同的设计提供并行三冗余,由“票决”电路比较这些相同路径的输出,按少数服从多数的原则决定输出。(参见图 1)
如果其中一条电路遭遇影响输出的事件,其输出将不同于其余两条电路的输出。如果只使用两条完全相同的电路进行比较,输出不同将提示有事件发生,但无法辨别具体发生在哪条电路上。
哪个输出是正确的?使用三条电路,可以确定正确的输出(可以进行合理假设,在两条电路上发生完全相同的 SEE 的概率基本为零)。
开发者随即可以采纳多数输出或重新评估设备运行。大量 OEM 厂商对自己的设计采用定制 IC,因此为了实现 TMR,他们在电路板上并行布局 IC 的三个副本并追加一个投票器 IC。

图 1:采用三模冗余的情况下,使用“票决”电路对并行的三个相同的电路开展评估,确保电路产生正确(大多数)输出。