文/李大地
今年以来,加密货币暴跌导致挖矿减少,外加以太坊取消挖矿机制,全球第一大显卡厂商英伟达因此销量暴跌,股价最高跌幅近7成。其最新推出的RTX4090系列显卡,售价1.3万元以上,问津者寥寥。可就在近日,它突然火了,别多想,是“着火”的“火”。
近日,接连有网友反映,高价买来的RTX4090显卡,才一周多时间,突然在使用过程中着火,供电口被烧烂,供电线也被烧得面目全非,画面惨不忍睹。
RTX4090显卡,一万多元的高端电子产品,竟然也会被烧烂!这不禁让人想起了大学宿舍时10元店买来放在暖水壶里偷着烧开水的“热得快”。二者拥有一个共同的特征,不仅“热的快”,“烧”的也快,动不动短路、冒烟、停电。
二者又极为不同,一个是小作坊生产的,多数场合下禁止使用的低端货;一个是高高在上,让无数人高攀不起的万元以上电子产品。想不到它浓眉大眼的、肯卖1.3万一块的RTX4090显卡,竟也会着火。
实际上,对于显卡着火,不必大惊小怪,从当前显卡行业发展态势来看,着火是迟早的事,如今终于发生了。一款蕴含了无数高科技的电子产品,未来实现元宇宙全靠它的显卡为什么会着火?这要从其功耗说起。
在摩尔定律还有效的年代,每隔18个月,集成芯片上的电路数目翻一翻,性能提高一倍,性价比提升一倍。可随着芯片制程的不断提升,保持摩尔定律式速度增长愈发困难,尤其进入当前的7nm以下时代,芯片性能提升愈发事倍功半,硅基芯片的制作工艺正在接近其极限。
技术不够,供电来凑!于是有了最近几年电脑硬件供电需求的直线飙升。拿这次着火的RTX4090显卡看,其最大功耗超过了600瓦,瞬时功耗极有可能冲破800瓦。如此高的功耗,在一个用户自己组装的铁皮机箱里工作,冒一点烟、着一点火,实在是预料之中的事。要知道,一台电冰箱功耗无非也就200瓦,洗衣机狂转甩干时也才500瓦,这些都是有专业电路设计的,且多属于机械功耗,而显卡的800瓦功耗,几乎全集中在一个指甲盖大小的硅片中。
伴随高功耗而来的是散热问题,看看显卡的风扇的变化就知道了,从无风扇到如今的三风扇,到着火的RTX4090已经推出水冷款,可是其温度依然越来越高,噪音越来越大。为此用户不得不在机箱上装上一圈风扇散热,开机仿佛开直升机。这种窘象,不免又让人想起了那尴尬的“热得快”,和电子产品高大上的形象完全相悖。
如此看来,显卡着火也就在所难免了。其实,为显卡供电的台式机电源着火、爆炸,早就已经成为家常便饭。毕竟电源还要为显卡之外的CPU等设备供电,功耗会更高。比如要为RTX4090显卡供电,通常就要搭配一个1200w的电源,这已经超越了“热得快”的功率,其价格又远不及显卡,难免粗制滥造一些,想不“火”都难。
对于这次英伟达显卡着火,根源还是芯片制作工艺不断地逼近极限,迈入瓶颈。芯片行业像过去那样,一味地靠堆晶体管、加电压提升性能的时代,即将走到尽头。其制作成本也已经令消费者吃不消。芯片行业亟需开辟新的增长模式,否则会越来越尴尬。
英伟达发布了哪些新显卡?
8月21日,Nvidia在德国拿兄乎Gamescom发布了新的GeForce RTX 2000系列显卡。发布会上,该公司发布了rtx2070、rtx2080和rtx2080 Ti,基于英伟达新的Turing架构,RTX 2080将取代流行的GTX 1080,并在即将到来的游戏中推出新的实时光线追踪效果。
RTX 2080 Ti是旗舰产品,主频为1350MHz,带有4352个CUDA内核和11GB GDDR6内存,而常规RTX 2080主频为1515MHz,内置2944个CUDA内核和8GB GDDR6内存 。同时,RTX 2070的主频为1410MHz,具有2304个CUDA内核和8GB的GDDR6内存。Nvidia推荐PC游戏玩家拥有650W电源,因为基础RTX 2080可以提供高达215瓦的功率。
光线追踪(Ray Tracing)是一种渲染技术,可以产生实时光反射和电影效果,使游戏看起来更像电影。光线跟踪是PC游戏玩家多年来一直承诺的事情,它一直被认为是电子游戏的“圣杯”。Nvidia现在的目标是实时向群众提供。Nvidia承诺,未来会有更多的游戏将获得光线追踪支持。该公司简要透尘戚露了21款游戏即将获得RTX支持,包括Hitman 2,We Happy Few,PUBG和Final Fantasy XV。
新RTX 2000系列的性能和光线跟踪支持完全归功于它基于Nvidia最新消悉的图灵架构。图灵大核心(TU102)集成了186亿个晶体管,核心面积达754平方毫米,相比Pascal帕斯卡架构核心分别增加了60%、58%,是有史以来第二大的芯片。它的内部有三种不同核心,一是传统的SIM CUDA核心阵列,浮点计算性能最大14TFlops,整数计算最大性能14TIPS,并支持浮点、整数并行执行,可变速率着色(Variable Rate Shading)。二是光线追踪专用核心RT Core,每秒钟可计算最多100亿条光线(10 Giga Rays/sec),三是深度计算辅助核心Tensor Core,FP16浮点性能110TFlops,INT8整数性能220TOPS,INT4整数性能440TOPS。
英伟达承诺将“新显卡将是前一代显卡的性能的6倍”。华硕、EVGA、gb、MSI、PNY和Zotac今天起都可以开始预定rtx2080和rtx2080 Ti,9月20日正式发货。RTX 2070 起价499美元,RTX 2080 起价699美元,RTX 2080 Ti起价999美元。
英伟达还为这三款显卡提供了Founders Edition版本。GeForce RTX 2070 Founders Edition售价为599美元,RTX 2080 Founders Edition售价为799美元,RTX 2080 Ti Founders Edition售价为1199美元。Founders Edition卡将于9月20日发货。
英伟达发布新显卡是什么?
在2018年德国科隆游戏展(Gamescom 2018)上,英伟达发布了3款基于全新图灵架构的GeForce RTX 20系列显卡——RTX 2080 Ti、RTX 2080、RTX 2070。发布会上英伟达CEO黄仁勋表示:“这是一种新的计算模式。图灵处理器像只怪物,令人难以置信。”他还演示了现有显卡和RTX系列的全新渲染技术。
德国科隆游戏展上发布的三款GeForce RTX GPU,RTX 2080 Ti属于旗舰产品,主频为1350MHz,配备了4352 CUDA内核以及11GB GDDR6显存。RTX 2080是高端产品,主频为1515MHz,内置2944 CUDA内核和8GB GDDR6显存。英伟达还表示RTX 2080专为超频而设计,旨在接替热门的GTX 1080。RTX 2070比较亲民,主频为1410MHz,配备2304 CUDA内核和8GB GDDR6显存。
英伟达承诺“GeForce RTX 20的性能将比上一代显卡的高6倍”,并实现实时光线追踪技术((Ray-Tracing))。新RTX 20系列的性能和光线跟踪支持完全归功于上周英伟达在SIGGRAPH 2018发布的新一代GPU架构——Turing(图灵),雷锋网(公众号:雷锋网)在《英伟达放出12年来最大招:全新图灵含扒架构登场,全球首批即时光线追踪GPU同步亮相》进行了详细的介绍。黄仁勋称图灵架构是自2006年CUDA GPU发明以来最大的飞跃,也是英伟达十多年来在计算机图形领域最重要的创新。
基于最新的图灵架构,图灵大核心(TU102)集成了186亿个晶体管,核心面积达754平方毫米,相比Pascal帕斯卡架构核心分别增加了60%、58%,是有史以来第二大的芯片,它的内部有三种不同核心:一游老销是传统的SIM CUDA核心阵列,浮点计算性能最大14TFlops,整数计算最大性能14TIPS,并支持浮点、整数并行执行,可变速率着色(Variable Rate Shading)。二是光线追踪专用核心RT Core,每秒钟可计算最多100亿条光线(10 Giga Rays/sec),三是深度计算辅助核心Tensor Core,FP16浮点性能110TFlops,INT8整数性能220TOPS,INT4整数性能440TOPS。
光线追踪技术过去只在影视作品的CG制作中出现,一般是用几天时间,渲染出几帧动画,光线追踪也一直被认为是电子游戏的“圣杯”。今年三月,英伟达发布 RTX光线追踪技术,这项新技术能够计算光线反射、折射、散射等路线,渲染出逼真的画面,可为游戏开发者提供电影级画质的实时渲染,也就是让游戏看起来更像电影。据悉,这些新GPU依靠自身的一个特殊部分来快速呈现高分辨率图形,完成图像的大部分成像工作后,使用人工智能技术来猜测未完成的像素。
发布会上的光线追踪演示让人印象深刻,但大多数仅限于物理模型材料,室内反射和照明。不过更重要的是对游戏的支持,英伟达承诺在《古墓丽影:暗影》中进行实时光线追踪,演示中夜间场景中显示了逼真的阴影显示并在《战地风云》和《地铁出埃及记》中提升照明和其他效果。
英伟达还承诺,未来会有更多的游戏将获得光线追踪支持,英伟达简要透露了21款游戏即将获得RTX支持,包括杀手2:沉默刺客,少数幸运儿,绝地求生和最终幻想15,但英伟达仍然需要不断推动游戏开发者采用这项新技术。另外,由于英伟达在Windows 10中采用了新的DirectX光线跟踪(DXR)API来补充英伟达的RTX工作,英伟达还将与微软合作推动光线跟踪。Epic Games还将在今年晚些时候为虚幻引擎开发人员提供实时光线跟踪。
GeForce RTX 20系列性能的提升以及实现光线追踪最重要的就是英伟达超过一万个工程师的努力成果——图灵架构,该架构承载了RT核心(RT Core)以及全新张量核心(Tensor Core)。RT核心专门用于实时光线追踪的处理器,能对光线神游和声音在3D环境中的传播进行加速计算,据称它的实时光线追踪能力提升到了Pascal架构的25倍。张量核心是为深度学习训练和推断加速的处理器,支持每秒500万亿次张量运算。
在RTX中,图灵架构将光线跟踪与传统光栅化相结合以充分利用两种技术的优势,英伟达表示,最快的GeForce RTX部件每秒可以投射10亿(千兆)射线,与未加速的Pascal相比,射线追踪性能提高了25倍。图灵结构也承载了Volta的张量核心,甚至比Volta还要强大。除了加速光线追踪本身之外,英伟达在其图灵开发工具包中的其他工具是通过使用AI去噪来减少场景中所需的光线量,这是张量核心所擅长的。
不过,即便英伟达称基于图灵架构的RTX显卡性能比Pascal架构的GTX显卡提升了6倍,但该公司正在尝试重新定义性能比较,这些比较仅限于新卡的性能。 英伟达甚至没有列出每秒传统的浮点运算(称为teraflops)。新卡对比了RTX-OPS,这是GPU在阴影、光线跟踪等操作中的平均性能,以及每秒千兆光线的测量结果,它可以测量新GPU的光线跟踪效果。