编辑: 旋风 | 2013-02-27 |
地图与 导航、音乐与娱乐、智慧型手机使用者介面的投射显 示及其他 IVI 应用程式占用更多汽车的主记忆体空间: 研究显示在高阶车辆中的使用者资料储存需求(在2014 年一般大约为 32GB)於2020 年可能会攀升到
256 至512GB. 传统硬碟 (HDD) 曾是车用高容量储存技术的主要选择, 但因为可靠性及产品使用寿命等因素,现今逐渐被固态 硬碟 (SSD) 及eMMC 记忆体所取代. 资料储存的固态解决方案显然从根本上更适合车厂的需 求,因为车厂对其产品内建元件和模组有极度严谨的制 程和资格审查准则,以保持高品质和高可靠性的标准. 不同於 HDD,SSD 或eMMC 不包含可动性零件,不会 遇到机械故障的情况,而且不易因撞击或震动而损坏. 然而,SSD 和eMMC 是以 NAND Flash 阵列为基础, 若里面的 NAND Flash 未妥善管理,其固有的特性会 导致资料损毁或资料遗失.因此,就其本身而言,以 固态系统取代电机机械系统并不保证能增加产品可靠 性或延长使用寿命.本文概述固态资料储存系统的故 障模式,并解说现今用来密切控制最新高容量 SSD 和eMMC 之可靠性和生命周期的技术与流程. 汽车产业偏好使用 MLC NAND NAND Flash 是现今数十亿电脑、笔记型电脑、智慧 型手机、平板电脑、媒体播放器和机上盒中常见的基 本记忆体类型,而且也是 SSD 和eMMC 中的储存媒 体.NAND Flash 有三种主要类型:单层单元 (SLC)、 多层单元 (MLC) 和三层单元 (TLC).最新版 TLC (3D TLC) 采用了堆叠组态,以实现甚至高於 TLC 的记忆体 容量.MLC Flash 的记忆体容量低於 TLC,但高於 SLC. 在汽车 SSD 和eMMC 应用中,目前偏好使用 MLC NAND,因其以经济实惠的价格提供高容量和高可靠 性,而且相较於 TLC NAND,受资料遗失与损毁的影 响较小 .现今采用 MLC NAND 的eMMC 最高可提供 64GB 的资料储存容量,而采用 MLC NAND 的SSD 最高可提供 512GB 的储存容量. 然而,使用 MLC NAND Flash 确实带来一些资料完整 性与留存方面的风险.什麽是需要面对的风险,以及 汽车使用者应如何期待 SSD 和eMMC 制造商来管理 相关风险? -1- WHITE PAPER -2- 对SSD/eMMC 产品整个使用寿命的风险评估 NAND Flash 阵列固有的故障或资料遗失风险可能会 在其生命周期三个阶段的其中之一发生: .早期故障在制造新装置后很快发生.NAND Flash 制 程中的固有变异性无可避免地产生了脆弱或不良的 区块或单元. .在装置的额定生命周期期间,有各种资料遗失与损 毁的可能原因,包括主机与 NAND Flash 阵列之间 的传输的位元错误、突发断电事件、影响资料留存 的热应力,以及读取干扰所产生的错误. .生命周期结束 C NAND Flash 产品有根淌/抹除 (P/E) 循环次数额定的生命周期,而当此数字已超过 任何指定记忆体单元时,单元可能会发生故障. 在车用系统中,前两项故障类别最令人无法接受.为此,慧荣在 Ferri 系列资料储存产品中开发了多项技术 和技巧,尽可能在 NAND Flash 阵列的额定生命周期 期间降低或消除故障风险和资料遗失. 透过这些技术,慧荣能够为使用者提供其通过AEC-Q100 认证之 FerriSSD 和Ferri-eMMC 产品的信 任度,符合汽车产业毫不妥协的可靠性和长生命周期 的需求.增强资料完整性、使用寿命和 SSD 开机载入 程式效能之 Ferri 系列产品的功能包括: .在出货前对每个单元、分页和区块的 100% 筛选以 及全面品质控管,产生极低的每百万件零件不良 (dppm) 率 .采用 NANDXtend ECC 技术的端对端资料保护可延 长运作生命周期 .IntelligentScan 与DataRefresh 技术可主动防御位 元遗失及延长资料留存 此外,Ferri 系列产品具备 NAND 故障分析功能.慧荣 运用累积多年的 NAND Flash 记忆体专业知识,对任 何可能发生的问题有效率地进行除错,并且提供深入 故障分析报告及修正行动方案. 筛选初期故障 晶粒中脆弱的记忆体区块(导致初期故障的区块)最有 可能在其指定之作业温度围的极端温度中发生故障. 对於慧荣的 Ferri 解决方案产品,其温度围为 -40°C 至+85°C.透过对每个 NAND Flash 晶粒中的每个单元、 分页和区块执行高低温 (-40 ~ 85°C) 烧机测试,慧荣可 因而筛选出包含不良区块的所有装置.慧荣会将这些零 件报废处理,不会送交到消费者手上. 此政策带来的影响是降低了 Ferri 系列装置的产量,但 慧荣为了在送交到汽车客户手上的 Ferri 解决方案产品 中达成的极低 dppm,这是值得付出的代价(请参阅 图1). 图1:不良区块的高温筛选让慧荣能够消除初期故障 Program Erase Cycle with in usage life under normal operation SMI proprietary Screening (stress mode) early bad blocks SMI Specified Max PE Failure Rate Early Failure Stage Random Failure Stage FerriSSD are designed for robust product life . Screen off weak blocks, physical defects, etc . Ensure no data lost during the product life . Extreme low failure rate during usage Other SSDs at Shipping Wear-out Failure Stage FerriSSD at Shipping -3- 防止一般操作中的资料遗失 慧荣独家压力测试技术筛选出初期错误.然而,即使 是状态健全的 NAND Flash 装置在一般操作中就容易 发生资料遗失和损毁.这种故障可能在三种主要情况 中发生: .突发断电事件的风险 .传输中的资料遗失 .高温下出现有缺陷的资料留存 正确处理 SPOR 汽车系统容易因为各种因素而发生突发断电事件,而 车辆的系统软体未必具有可向 SSD 或eMMC 触发正确 「断电」命令的设计.若未导入「突发断电和复原」 (Sudden Power Off and Recovery, 简称 SPOR)程序,此类事件会导致资料遗失或储存系统当机.为消 除此风险,Ferri 系列产品在 SSD 或eMMC 控制器中 包含导入 SPOR 程序且保证 100% 资料完整性的慧荣 独家韧体. 全新更强大的正向错误校正 能够管理「错误修正码」(ECC) 是NAND Flash 控制 器的一般功能.ECC 的用途在於修正因 NAND Flash 阵列的资料流写入或读取而产生的位元错误.在以 NAND Flash 为基础的系统中,有各种实作 ECC 的方 法, 有些方法可达到比其他方法更高的错误修正率 . 汽车制造商向来秉持极高品质标准,而且他们的理想 目标是达到零不良率 (0 dppm).为因应此宗旨,慧荣 已在供应汽车市场的 Ferri 解决方案产品中采用更强大 的错误修正功能. 首先,慧荣在整个资料路径中导入端对端错误修正(请 参阅图 2).这不只修正 NAND Flash 阵列中的读取/ 写入作业错误,也修正缓冲记忆体(SRAM 或DRAM 装置)中的错误.透过在 NAND Flash 阵列、在缓冲 记忆体以及在 Ferri 系列装置与系统主机处理器之间的 介面的 CRC 总和检查测试,进一步验证达成的资料传 输有效性. 图2:适用於汽车系统的 Ferri 解决方案产品中提供的端对端资料路 径保护 SSD 的内部 新一代 目前这一代 新一代 目前这一代 介面 CRC 内部 CRC 内部 CRC 主机 介面 前端 传输 缓冲区 NAND SRAM/DRAM ECC NAND ECC 新一代 :受端点对端点资料路径防护的保护 -4- 第二,慧荣已扩展其资料保护的围,允许 NAND Flash 区块经历许多程式/抹除循环次数时经常遇到的升高位元 错误率.适用於 ECC 的传统 BCH 或RS 技巧能够在低位 元错误率达到 100% 资料修正,但位元错误率会随著 NAND Flash 阵列老化而升高.传统消费型 SSD 和MMC 保留超越 BCH 或RS 演算法功能的未修正错误. 然而,针对汽车应用,Ferri 系列产品导入额外的错误修 正(如图