摘要:分析表明,新能源以及无人驾驶汽车的迅速发展,车规芯片的作用愈加重要,这是芯片产业应用的一重要方向。阐述集成电路设计公司进入车规芯片领域的相关验证流程及规范标准,车规芯片的相关可靠性验证以及失效分析,探讨了车规芯片量产化的零缺陷目标,分析国内车规芯片发展中存在的问题与其局限性,展望发展方向。随着汽车电子的深入发展,以及汽车行业确立的新四化(电动化、网联化、智能化、共享化)发展方向,这给半导体芯片在汽车领域的应用带来新的机遇。近年的需求更是飞速发展,这给汽车市场带来新的产业变革。使得车规芯片在电源控制、底盘控制和信息娱乐等应用领域扮演着越来越重要的角色[1]。过去5年的时间全球汽车半导体市场年复合增长率约为4.8%,而中国汽车半导体市场规模复合增速更是达到11.6%。这主要是因为新能源汽车电子化程度越来越高,带来各类汽车半导体需求的大幅上涨[2]。据德勤预测,汽车半导体收入将在2022年突破600亿美元[3],势必会吸引更多芯片厂商参与其中。相比消费类电子芯片,车规芯片要求更加苛刻,(1)车规芯片是高于消费类以及工业芯片标准;(2)车规芯片对工作环境有更严苛的要求,如,温度,湿度,EMC以及有害气体侵蚀等方面,根据其不同的应用有不同的需求;(3)车规芯片开发验证花费多,门槛高,周期长;(4)需要通过相应的审核标准。车规芯片有两个条件,(1)符合零失效的供应链质量管理标准IATF 16949规范;(2)满足由北美汽车产业所推的AEC可靠性标准。由于车规芯片较长的设计周期和较高的技术壁垒,整个汽车芯片行业呈现国外巨头垄断的格局,如英飞凌,瑞萨等专注于高端车规芯片的细分市场。同时国内亦涌现出了几十家芯片设计公司成为汽车电子芯片的供应商,类型范围涵盖辅助驾驶、中控、电池管理、图像传感器和信号处理器等[4]。国际传统车企如丰田、福特和大众等更是积极投身汽车电子芯片的研发中,国内一些主流车厂也加入芯片的研发当中,像比亚迪、上汽等以各种形式参与芯片研发,拥抱汽车芯片产业的新革命,他们更容易结合自身应用场景以及财力来推动芯片设计的快速导入。以新能源为代表的特斯拉更是推出FSD芯片,一场围绕高级别自动驾驶的竞争也已经开始,汽车行业加速进入智能化时代。本文结合车规芯片的巨大市场,根据其应用特点以及进入该领域的标准要求,重点会对进入该领域的验证条件IATF 16949规范和AEC可靠性标准进行探讨,通过老化筛选测试及失效芯片的根因分析,确保车规芯片的可靠性以实现零失效的目标。最后围绕车规芯片验证规范的标准化,可靠性验证的全面化,高效的老化筛选测试以及专业的失效分析进行展望。在汽车行业,质量认证活动在世界各个地区均有自己的行业认证标准和要求,例如汽车制造强国德国汽车工业的 VDA6.1标准、法国的EAQF标准、意大利的AVSQ标准以及美国的QS-9000标准。成立于1997年的国际汽车特别工作组(IATF)为实现汽车行业统一的全球质量体系标准和认证,与国际标准化组织(ISO/TC 176)合作,以各国汽车工业标准为基础,并于1999年制定并推出质量要求ISO/TS16949技术规范,《IATF16949》是当前的最新版质量管理体系标准[5]。IATF16949是国际汽车小组是以顾客为导向同时兼顾其特殊要求,针对近年汽车行业比较关注的一些问题,如汽车安全等,在标准中增加了新的条款[6,7]。IATF16949规范适用于汽车制造厂和其直接的零部件供应商,这些厂家直接与汽车生产有关,可以加工制造活动,并通过这种活动使的产品得以增值。例如在芯片整个产业链中,晶圆制造厂、封装厂等需要严格按照IATF16949标准开展汽车芯片的制造。而那些只具备支持功能的单位,如设计和配送中心等,不需要获得该认证[8]。汽 车 电 子 委 员 会 ( A E C : A u t o m o t i v e Electronics Council)由三大北美汽车公司(克莱斯勒、福特和通用汽车)在1994年为建立一套通用的质量系统标准而设立[9]。AEC建立了产品质量控制的标准,推动了汽车零部件通用性的实施,同时为市场的快速发展打下良好的基础。其规范标准主要包括AEC-Q100(集成电路IC)、AEC-Q101(离散组件)、AEC-Q102(离散光电LED)、AEC-Q104(多芯片组件)、AEC-Q200(被动组件)。其中AEC-Q100是专门针对IC集成电路的验证规范,其目的是要确定器件在应用中能够通过应力测试达到某种要求的品质和可靠度[10]。从产品的使用功能,工作条件(电压、频率范围等),以及芯片所用的单元设计库技术等方面进行验证,确定电路设计原则,满足车规芯片要求。执行的过程可以识别潜在的故障模式及对系统和客户的影响,确定其严重程度以及可能的原因。考虑冗余设计,该设计可以通过纠错码的形式避免潜在的数据保留错误,替换有缺陷的单元。建立自我检测机制,通过芯片合理的测试时间,在电路中增加一些路径节点进行测试,及时发现有问题单元,并进行相关的处理,降低因为工艺波动带来的影响。在芯片设计阶段,就要开始着手芯片可靠性实验的考量,使用计算机辅助工程分析和仿真工具可以更短的时间内提高产品可靠性。有限元分析,热分析以及可靠性预测模型等工具正在得到越来越广泛的应用,这样车规芯片在设计之初主动来提高器件可靠性和稳定性。晶圆制造主要步骤有离子注入,光刻,蚀刻和镀膜等工艺流程。在每一道工序中,均需要通过数学统计研究分析工具,找出最优参数,以达到提高芯片良率和品质的要求。fab厂通过检测每道工序具体测试参数,芯片数量,频率等信息,可以保证制程的稳定性。在合理的时间内尽可能实现最大的测试覆盖率提前筛选出不良品,避免流到客户端。芯片测试更快更有效的一种重要方式是通过芯片的自测设计来实现,也可以减少对外部ATE资源的依赖。良品测试limit标准设定可以采用AEC_Q004文档中的建议,基于一定的数据量标准差公式来设定,Static PAT Limits=Robust Mean±6 Robust Sigma。通过大数据分析,管控工艺波动,保证产品质量稳定性,该方法可以定期进行Review和更新。产品使用之前的失效为良率,产品使用过程中的失效为可靠性,因此芯片的测试直接关系到芯片的可靠性。浴盆曲线是由三部分组成,早妖期、稳定期和损耗期。老化筛选测试(Burn in)是ATV(Automotive)芯片测试很重要的一个步骤,其主要作用是在芯片出货前去除产品的早期失效芯片实现用户端的高可靠性。早妖期是失效率相对较高的阶段,芯片失效原因通常是因为芯片天生的缺陷或问题所导致,如设计缺陷,工艺制造异常或材料固有的缺陷等。这些缺陷会引发与时间、应力相关的故障,其故障率通常按Dppm进行表征。具体方法是先对芯片进行一定时间的100%老化测试,例如加偏压,加高温等,然后再进行正常的ATE 测试进行筛选[11]。浴盆曲线(图1)中的稳定期代表着芯片在使用寿命期间失效率是相对稳定的,通常按FIT(failure in time)或MTBF(Mean Time Between Failure)小时数来描述其失效。损耗阶段表明芯片的失效率开始因为芯片内在电路损耗而上升,代表已到达了芯片的极限使用寿命。
AEC-Q100作为汽车电子可靠性验证的标准,其主要目的:(1)客户有可以参考的标准规范;(2)芯片供货商可以排除芯片可能存在的潜在故障。表1是AEC-Q100根据器件工作环境温度分为不同的产品等级,这与芯片具体应用有关,其中最严格最高等级标准的工作温度范围是-40~150℃之间。芯片供应商需要不断的持续优化产品设计,采用先进稳定的制造以及封装工艺,同时采用严格的测试程序筛选达到车规芯片对工作温度和可靠度的高标准要求。
AEC-Q100明确了芯片在设计,制造,封装,测试和量产等各个阶段所需要的验证以及相关的卡控标准。从其内容来看,具体包含7大类别共41项的测试,如图2所示即为AEC-Q100 Rev-H 的验证流程及规范内容[12]。大致分为:Group A(加速环境应力测试)、Group B(加速工作寿命测试)、Group C(封装完整性测试)、Group D(晶圆级可靠性测试)、Group E(电性验证测试)、Group F (可筛选性测试)、Group G(密封型封装完整性测试)。目前AEC-Q100已成为车规芯片的重要规范,通常车规芯片供应商需要完成其项目的验证,然后以“自我宣告”的方式说明其产品通过了其相关的验证结果,AEC不会给予供应商任何认证。因为样本数量少,这些测试是必要不充分测试,反映此方法的局限性。测试项目可以用于否定器件的可用性,但不能确定大批量量产芯片在具体场景下均满足使用标准。所以量产车规芯片的老化筛选测试显得尤为重要,使得提供给客户的芯片处于稳定期,提高了车规芯片的可靠度。同时通过失效分析,一方面可以识别造成该芯片失效的根因,采取相应措施根除该问题,另一方面针对固有缺陷的问题,可以优化以及加严测试进行筛除,从而实现车规芯片零失效率的目标。半导体在研制、生产和使用过程中失效是不可避免发生的。通过有针对性的失效分析:(1)可以协助设计人员找出芯片设计上的缺陷,例如通过FIB电路修补的方式亦可验证该结果。(2)可以找出芯片在制造,封装等工艺中存在的缺陷,提出切实可行的改善方案。(3)评估不同测试向量的有效性,为生产测试提供必要的补充。芯片的失效分析主要是立足于微观世界,从电性、物理,化学和材料的角度对其进行观察和分析,从本质上找出造成芯片失效的原因[13],其主要分析工具和试验方法如图3所示。半导体芯片工艺制程复杂度越来越高,这也为失效分析带来更多的难度,例如线宽的减小对电镜的分辨率要求更高,金属层间距的减小对样品制备增加了难度等。通过失效现象,同时结合芯片设计以及工作原理,掌握准确的芯片信息资料与数据,才能进行正确的分析和判断。一般半导体芯片使用后的失效机理可分为以下几类[14]。(1)芯片设计存在缺陷,主要体现芯片功能不能实现。(2)本体类的相关失效,如半导体材料缺陷或封装中所用基板本身存在的问题。(3)工艺波动造成的失效。①芯片介质层相关失效,如栅氧,金属间介质层等缺陷;②硅衬底和SiO2界面间存在缺陷,如Dislocation等;③芯片后端金属互联层由于金属的电迁移或含卤素及卤化物的污染造成的金属腐蚀等;④封装工艺参数不合理导致的管脚连线造成的短路或者开路等。(4)测试引入的失效,主要是测试向量电压设置不合理等造成芯片的Overkill。
车规芯片的安全性和可靠性是其首要考虑因素,这不仅反应在芯片设计和开发阶段,在测试筛选以及可靠性的验证也尤为重要。其广阔的市场前景,使得更多芯片供应商开始进入此领域,加入车规芯片的产业规划。结合供应链质量管理标准IATF16949规范以及AEC-Q100可靠性的要求,当前车规芯片验证的流程和体系需要更加完善。(1)车规芯片标准化系统的建立,应由技术专家(汽车整机,芯片设计、制造,封装以及芯片测试等领域)来建立一套更加专业化,规范化,流程化的标准是必要的。(2)芯片可靠性验证需更加全面,产品的可靠性是需要考虑设计进去以及制造出来。(3)老化测试需更加高效,车规芯片采用100%老化的方法可去除早期失效器件,对于服从威布尔Weibull分布参数β小于1,即早期故障率呈现明显下降趋势的情况,会凸显老化测试的作用。在达到消除芯片早期失效这一目的前提下,老化测试时间越短越好;(4)针对失效芯片根因的分析需要形成闭环。特别需要找出因为工艺制造参数卡控不合理或者测试覆盖不够全面而漏掉的失效芯片,因为可能会带来批次性的问题。不同的失效案例需要从芯片设计、工艺制造、封装测试、器件使用等角度进行数据收集和综合分析,找出失效根因进而反馈形成解决方案。同时芯片制造产线需要应用更多主动的专业监控技术,例如,CPK技术、SPC技术和PPM技术,可以对生产能力、工艺稳定性进行分析和预测[15]。在实际的工作中,经常会遇到TSP数据准备以及TSP数据可视化问题,本文利用实际工作经验,总结出上述两种制作TSP数据可视化的两种方法,以解决TSP数据处理问题。
来源:电子技术 第 50 卷 第 6 期(总第 535 期)