峰值电流控制在高端显卡设计中的应用

分享到:

1.引言

超大规模高性能并行图像处理器常常集成了数十亿计的晶体管,工作频率达GHz以上。这样当处理复杂图像应用程序时,GPU将在微秒时间内急剧上升到数百瓦功耗,这对电源分布系统(PDS)将产生巨大的冲击,导致GPU芯片电压不足,从而出现系统功能异常。

2.系统异常的原因分析

GPU中CMOS工艺的要求:

为了降低功耗,GPU芯片工作电压较低,并允许在宽的范围工作,如0.7V-1.2V。电压越高时,内部开关MOS管的Vgs越高,MOS管导通电阻越 小,因而传输时间常数减少,工作频率提高;当电压过低时,MOS管将无法形成正常导电沟道,引起逻辑错误。因次,一个电压相对稳定的电源供应系统 (PDS)是系统正常工作的前提。

GPU动态工作模式的需求:

高性能GPU采用了很多先进功率控制技术,使得最大功 耗达到几百瓦,而待机功耗约几瓦,动态性能模式切换(DPM)便是其中技术之一。通常DPM时钟频率设置在100MHz-1000MHz范围,电压在 0.7V-1.2V之间。如图1所示,GPU可在不同DPM状态切换,当GPU处理负载加重时,将快速转换到高性能模式,如HCLK1-HCLK4,电压 V3,而如果电压不足,内部电路将不能维持这个模式,而引起系统故障。

  1

  图1 GPU动态工作模式

PDS性能限制

开关电源本身性能的限制。开关电源供电能力强,体积小,成本便宜,带有OCP、OVP保护功能。但是开关电源周期性地打开和关闭MOS管,会产生很大的电源纹波和噪声。

电源分布网络参数限制。它是指从电源至负载的所有电气分布参数的总和,即线路的R、L、C、G的整体效应,来源于PCB材料、层叠、印制线、过孔、屏蔽以及GPU封装以及内部硅电路设计。所有这些分布参数,会在电路中产生分压、分流以及反射、衰减损耗等多种影响。

对GPU负载而言,交流高频信号来源于负载的动态切换引起的电流瞬态变化,加之电源分布网络中的阻抗不连续,而在LC分布网络中产生高频噪声信号。对大电流(如200A以上)的GPU来说,电压跌落达数百毫伏,超出DPM设置范围。

3.峰值电流控制技术

GPU瞬态电流变化过大,必然造成供电网络损耗增大,GPU可获得电压降低。为了避开电压跌落造成的冲击,GPU须及时向下切换动态模式,降低时钟频 率,降低工作电压。峰值电流控制技术正是基于这个目的所设计的,它还需要软件一起协作。图2所示是峰值电流控制技术软件流程图。系统通过及时检测工作电流 变化,可快速调整工作状态,减少芯片功耗,避免系统死机。

  2

  图2 峰值电流控制技术软件流程图

4.GPU工作电流感应的硬件电路实现

如图3所示,为了对GPU瞬间大电流变化做出及时反应,电流检测由硬件电路完成。当GPU动态电流超过预定阈值时,硬件电路会产生一个逻辑信号通知软件 单元。本技术巧妙地利用电源网络分布电阻来感应在线路中损耗而产生的电压降。我们取电源输出端A点和负载端B点作为电流放大器的输入。当A、B点压降过大 时,GPU消耗的电流过大,电压比较器输出一个高电平通知软件及时调整GPU动态模式,降低频率和电压,从而保证GPU及电源均能够正常工作,避免死机。

  3

  图3 GPU电流感应的硬件实现框图

5.测试结果

该方案已经应用到某型号GPU产品上,经过调试及性能测试,取得了满意的效果。图4是GPU芯片电流瞬间变化时用示波器所测试得到的波形图。

  4

  图4 峰值电流控制技术波形图

图4所示中,通道1为预设电流阈值(约47.7A);通道2为实际A、B点压降,除以0.1ohm(线路分布阻抗)后表示最大电流约为55.2A;通道 3为迟滞比较器输出;通道4为GPU管脚电压波形。当电流超过阈值时,迟滞比较器被触发,产生高电平中断信号。软件开始切换动态工作模式,设置GPU电压 VLOAD降低约100mV。当电流减小并小于阈值时,比较器输出低电平,系统回归正常并继续监测。

6.结论

由上分析及测试结果可知,峰值电流控制技术是一种能够合理分配GPU负载,避免系统意外死机的很好的控制机制,可显著提高系统的稳定性和可靠性,可在高性能计算、图形处理芯片设计等领域投入实际应用。

继续阅读
如何正确理解功率因数?

功率因数(Power Factor是衡量电气设备效率高低的一个系数。它的大小与电路的负荷性质有关, 如白炽灯泡、电阻炉等电阻负荷的功率因数为1,一般具有电感性负载的电路功率因数都小于1。功率因数低,说明无功功率大, 从而降低了设备的利用率,增加了线路供电损失。

详解一种毫米波CMOS射频芯片偶极天线

本文讨论了一种带有集成微带过孔不平衡-平衡器,60GHz毫米波CMOS射频芯片嵌入式偶极子天线的设计,制造和晶圆上测量。这是为了利用集成低成本单 片集成CMOS射频前端电路的天线为60GHz无线电实现一种射频芯片嵌入式系统(SoC)。

VR硬件技术标准大起底 GPU性能要求高

2016年被称为VR元年,全球硬件、内容、资本巨头动作频频, VR设备将继电脑、手机后的下一个计算平台,到2025年VR和AR的硬件营收将高达1100亿美元。根据“全球VR技术标准”,首次明确VR产品三大关键技术标准——低于20ms延时、75Hz以上刷新率及1K以上陀螺仪刷新率,这将成VR新行业的游戏规则。

UHF RFID标签电路设计

射频识别(RFID)市场出现强劲增长,这些应用包括了库存跟踪、处方用药跟踪和认证、汽车安全钥匙,以及安全设施的门禁控制等。在很多以前的出版物中可以找到有关RFID应用与发展良机的细节。这些功能将可能通过EPC-Global Class 1 Gen 2(即欧洲和国际上的ISO-18006标准)协议所定义的超高频(UHF)系统来实现。这些功能还将利用最新的CMOS工艺节点通过标签/阅读器的技术创新来实现,例如射频/模拟以及混合信号集成电路(IC)设计。

北斗卫星使用国产CPU 由772所研制

7月25日在西昌发射的两颗新一代北斗导航卫星,全部使用国产微处理器芯片(CPU)。这是国产宇航级CPU首次在实用卫星上担当主纲。