四海资讯
首页 > 科技资讯 > 互联网新闻

它被遗忘10年,现在正在崛起 | GPU虚拟化开启战国时代

时间:2017-11-17

现在我们已经身处云计算时代,新的软件定义数据中心概念也方兴未艾,CPU、内存、存储的虚拟化技术都已经非常成熟。随着开源软件浪潮的兴起,涌现了如KVM和Xen这样的平台,很多云计算的创业公司都在此基础上开发产品。但是这其中依然难见GPU的身影。

500360023.jpg

最近一直霸占头条的虚拟货币,人工智能,VR/AR等,背后都离不开GPU的支持。GPU已经和未来紧紧的绑在了一起。可是在云计算的架构里,GPU只能算是一只脚踏进云计算的门槛,另外一只脚还在传统的主机上。云服务器上的GPU,还主要是限定在纯数值计算上。GPU的老本行图形渲染,在云服务器的虚拟化上却总是缺位的,而这是提高目前VDI性能,在云端实现GPU图形渲染的主要方法。

新一代的操作系统和软件对GPU的依赖越来越重。据Lakeside的统计,Win10 比Win7 的GPU使用量增加了32%,Win10 中新版本应用的GPU使用量也更高,比如OUTLOOK对GPU的使用量提升了85%。使用GPU加速的应用数量也是过去 5 年的 2 倍,同时使用这些应用的用户数量也增加了60%。在这里我们可以很清晰的发现,不具备GPU运算能力的基础架构,比如传统VDI,是难以满足未来软件和系统的要求。

近几年工业3. 0 开始向4. 0 的升级,从智慧工厂到智能生产的转变,制造云、设计云等行业云开始涌现,运行着Dassault Catia,Siemens NX,PTC Creo,AutoCAD等软件,承担着所有制造设计任务的图形工作站,此次上云也是势在必行。在将这些设备上云后,一并解决了长久困扰行业的IP资产保护,数据管理,业务融合等问题。

从Gartner新发布的Hype Cycle for Compute Infrastructure,2017 报告中,可以看出GPU虚拟化(Server-Side Client Graphics)在经历了前期市场的喧嚣后,正处于市场爆发的黎明前。相关技术还垄断在少数厂商手里,并没有像CPU,内存,存储一样在开源社区推广普及。

未来已经到来,GPU虚拟化这个行业将会成为IT又一个新的爆发点。本文接下来将对该行业内的厂商做一些的概述,其中包括硬件厂商和软件厂商,软件厂商指能够提供GPU虚拟化平台和桌面传输协议的厂商。

硬件厂商

这里提到的硬件厂商,指的是GPU硬件厂商。他们为GPU虚拟化提供了相应的硬件和管理程序。下文将对三大显卡厂商的GPU虚拟化解决方案进行简单介绍。

NVIDIA

提到GPU,首先想到的最近风生水起,赶上了人工智能[这里应该和下文的“引领人工智能计算”相呼应。]风口的NVIDIA。近几年NVIDIA成功的实施了战略升级,当竞争对手还在致力于做一家更优 秀的GPU厂商的时候,NVIDIA将自己重新定义为“引领人工智能计算”的厂商,推出了自己的并行计算架构CUDA,以及相应的专为高性能计算打造的Tesla系列GPU。这种战略的实施一下子将自己和竞争对手之间拉出了代差,黄教主对行业未来的预见能力可见一斑。

早在 2013 年,NVIDIA就推出了行业内第 一款GPU虚拟化显卡GRID K1/K2,同期联合Citrix推出了商用的vGPU虚拟桌面解决方案,这比AMD提前了近 3 年。GPU虚拟化技术的出现,给一直被诟病性能不足的桌面虚拟化带来了转机。

在这 3 年时间里,行业内没有谁推出能够与GRID媲美的方案,NVIDIA处于竞争的真空期。直到 2016 年AMD推出自己的虚拟化显卡后,NVIDIA才开始推出第二款GPU虚拟化显卡,Maxwell架构的Tesla M6/M10/M60,新版的GRID将使用授权分为 3 个不同版本,依据版本不同收取额外软件授权使用费。这让用户又爱又恨。爱的是新一代显卡性能相比GRID K1/K2 有着大幅度提升,恨的是硬件加软件的双重收费方式有点太不地道,价格实在太贵。NVIDIA敢这么收费,也从侧面体验了一家独大的行业地位。和NIVIDA合作的虚拟化桌面厂商,如Citrix/VMware,则不幸沦为GRID的嫁衣,大部分利润都被NVIDIA攫取。

今年 8 月份NVIDIA推出了最 新版的GRID 5.0,虚拟化显卡新增Pascal架构的Tesla P4/P6/P40/P100,其中Quadro Virtual Datacenter Workstation版的授权支持vGPU在图形渲染模式和高性能计算模式之间切换,这是硬件厂商首次在vGPU层面将图形渲染和高性能计算进行了统一,又一次引领了行业趋势和市场需求。

NVIDIA的虚拟化显卡只是硬件,还需要相应的服务器虚拟化系统的支持,这和Intel的CPU需要操作系统Windows和Linux来配合一样。现在只有Xen和ESXi能够支持GRID virtual GPU solution,被大量第三方厂商采用的KVM虚拟化平台还没有出现在GRID的支持列表中,这也是为什么上文说GPU另外一只脚还没能踏进云计算时代。

今年 7 月份NVIDIA和Nutanix宣布将合作在年底推出AHV版本的GRID,这算是KVM虚拟化走出了第 一步。在解决GPU虚拟化后,如何将虚拟机的画面传送到客户端,这是KVM虚拟化可以商用的第二步。KVM上默认配置的Spice协议对3D的支持并不好,Nutanix以及其他KVM方案解决商还需自行开发出可用的桌面传输协议,这才算是彻底完成了GRID在KVM上的应用。

AMD

AMD是唯 一一家在CPU和独立显卡领域都通吃的芯片厂商。大部分时间都是被竞争对手压制,但也能十年磨一剑,冷不丁地祭出爆品,拳打NVIDIA脚踢Intel的时候,让市场为之一振。最近一个季度,AMD在CPU和GPU上都让竞争对手捏一把汗。新推出的Ryzen系列处理器让Intel一改往年挤牙膏的节奏,将产品性能一下子顶到天,推出了 18 核的Core i9。 8 月底推出的次旗舰Vega56 更是让NVIDIA慌忙应战,被逼着打算推出1070Ti应付局面,来不及等明年的Volta架构新品上架。

AMD在NVIDIA推出GRID K1/K2 的两年半后才推出了自己的GPU虚拟化产品MxGPU,算是姗姗来迟。共有三款FirePro S系列的GPU支持MxGPU,一块GPU最多可以支持 32 个用户。当MxGPU上的虚拟机比较少时,能够达到图形工作站的性能。随着虚拟机数量增多,每个虚拟机获得的GPU性能逐步降低。有别于NVIDIA GRID通过软件实现的显卡虚拟化方式,AMD MxGPU是“全球首款基于硬件的虚拟化GPU解决方案”。MxGPU每个虚拟机能分得一定数量的独享流处理器和显存空间,这样可以避免不同虚拟机对GPU资源的抢夺,造成用户噪音。这种噪音问题直到今年 8 月底推出NVIDIA GRID 5. 0 才得到解决。

MxGPU在定价上采用的是更符合买方逻辑的营销方法,只向用户收取需付硬件的购买费用。这不像NVIDIA GRID有那么强的市场地位,向用户再收一次软件授权费,用户还都无可奈何。相信随着AMD 的GPU性能的越来越接近NVIDIA同类产品,MxGPU的定价方式将对GRID形成冲击。

不过遗憾的是,目前只有VMware的ESXi支持MxGPU,Xen暂时只有技术验证版。没能同时支持两种主流化的虚拟化系统,一定程度上阻碍了MxGPU在市场的普及速度。Citrix的用户还是可以用过vSphere + XenDesktop的方案用上MxGPU,相比使用免费的XenServer,要多支付vSphere的费用。

Intel

要说哪家厂商的GPU市场份额最 大,答案不是传统GPU厂商NVIDIA和AMD,而是CPU厂商Intel,一次成功的跨界。据上个月研究机构JPR的数据显示,Intel凭借着CPU在市场上的垄断地位,带动了CPU中核心显卡占据了71.1%的GPU市场份额,NVIDIA 15.8%,AMD 13.1%。

Intel官方将不同的Intel GPU虚拟化技术分别命名为Intel GVT-s,Intel GVT-d和Intel GVT-g,分布对应API转发,直通,完全虚拟化。Intel GVT-g和NVIDIA vGPU类似,支持Xen/KVM平台,每个GPU最多能分享给 7 个用户同时使用。其中XenGT在 2016 年最早实现了业界的vGPU在线迁移,NVIDIA GRID直到这个季度才和Citrix合作完成了vGPU在线迁移。 2016 年的 2017 年 2 月份,Linux 4. 10 中加入Intel GVT-g for KVM。这是三大GPU厂商中,第 一个支持KVM平台的完全虚拟化方案,意味着第三方采用KVM的云计算厂商终于有了一个可用的vGPU方案。不过Intel GPU虚拟化,由于核显性能的原因,只能满足图像密集型的用户体验,不能像GRID vGPU和MxGPU一样满足图形渲染的重度使用场景。

Intel GPU虽然支持了大多数虚拟化桌面厂商使用的Xen/KVM两大类服务器虚拟化系统,可是硬件却和VDI高密度的使用场景不太搭。首先Intel的完全虚拟化只支持Broadwell架构以后的核芯显卡,作为VDI服务器中常用的Xeon E5/E7 v4 系列,以及第 一个的Xeon Scalable处理器,都没有核芯显卡。这在很大程度上限定了Intel GPU虚拟化在VDI的使用规模,有种落入有枪无弹的尴尬境地。

软件厂商

GPU虚拟化真正落地应用,软件层面至少还需要两套系统的支持:支持GPU虚拟化的虚拟化平台,以及将云端的虚拟机画面发送到客户端的桌面传输协议。接下来将要介绍四家分别基于不同的虚拟化平台的桌面虚拟化方案提供商。

Citrix

Citrix成立于 1989 年,早期提供共享桌面虚拟化和应用虚拟化产品,这两种产品都属于SBC(Server-Based Computing)技术范畴。其中作为远程交付核心的ICA协议从那时起就开始研发,至今快 30 年历史,技术积淀可见一斑。随着服务器虚拟化技术的成熟,催生了新的远程桌面交付方式VDI技术。VDI是在服务器上创建多个虚拟机,以虚拟机为最小单元交付给用户使用。Citrix的产品线中,应用虚拟化为XenApp,共享桌面虚拟化和VDI为XenDesktop。

Citrix从创立之初到现在,一直和Microsoft有着紧密的合作,甚至Microsoft曾持有Citrix的股份。Citrix协助过Microsoft开发MutiWin引擎,这后来成为 Terminal Service的基础。Terminal Service是目前很多云桌面厂商在交付远程桌面时的一种技术实现方式。通过允许多个用户同时登陆一个操作系统,利用操作系统完成GPU在不同用户之间的调度,绕过GPU虚拟化技术门槛,实现了GPU共享。

Citrix不仅在传统的VDI,而且在GPU虚拟化上也是一马当先。 2011 年成为第 一个推出GPU直通的虚拟化方案的厂商,将一台服务器变身为多台图形工作站。在 2013 年联合NVIDIA共同推出了首 个vGPU解决方案,在虚拟化层面实现了多个用户共享一块GPU的能力,提升了服务器的图形计算密度。

Citrix作为桌面虚拟化行业的世界第 一,一直能够行业保持领先地位,主要靠的自有技术,经历 30 年积累并不断完善的ICA协议。桌面传输协议直接关系到用户的使用体验,是桌面虚拟化产品的核心中的核心,能否开发出性能优异的协议成了考验厂商技术实力的试金石。在早期没有GPU虚拟化技术时,VDI的图形处理和视频播放任务,均由服务器的CPU模拟GPU进行处理或者通过重定向的方式交给客户端处理,此时桌面传输协议的性能直接影响着VDI的能力大小和应用范围。在GPU虚拟化技术出现后,VDI的性能已经没有了瓶颈,如何能够高效的将3D画面传输到客户端,确保用户的使用体验成了关键。

GPU虚拟化已经是未来VDI发展必然趋势,在移动网络办公的场景越来越多,这均对桌面传输协议提出了不小的挑战。Citrix在ICA协议加入了HDX技术,为GPU虚拟化的3D图像传输提供了保障,可以将所有的图形应用负载安排在服务器上的GPU上完成。今年初Citrix又成功将FrameHawk集成到ICA协议中,有效提高数据在复杂网络的传输能力,这极大的提高了用户在移动网络下的使用体验。这些发展让已经 30 年的ICA能够不断生长进化,适应现代IT环境的应用。

在公司战略上,Citrix和NVIDIA一样,都有着超越行业定势的能力。NVIDIA不满足于将自己定位为一家更好的GPU厂商,而是将目光投向更远方的人工智能计算。Citrix在经历了早期产品过于单一,研发过于依赖Microsoft对其开放部分源代码的困局后,开始了自我升级。不再将公司的业务仅仅局限于解决“服务器到客户端”的应用问题,而是将目光投向了如何为企业提供一整套完整解决方案。如何移动办公?如何保证数据的安全?并开始提供解决基于网络和面向桌面的应用问题。Citrix通过大规模收购相关领域的公司,并将被收够公司的产品整合进了自己的方案中来扩大自己的产品能力。这些公司包括Netscaler(负载均衡)、XenSource(XenServer)、Cloud.com(云计算)、Sharefile(云存储)、Zenprise(EMM)、Unidesk(应用分层)、FrameHawk(移动网络连接优化)等,截止到目前,Citrix都是整个IT界唯 一一家可以交付整个EMM领域解决方案的厂商,产品覆盖从用户的接入设备、网络接入层、虚拟化层、移动设备管理层、个人数据管理,以及公司协作。

Citrix在技术上的独步天下,换来了市场的成功,获得全球客户的青睐。Citrix的客户中包括了100%的财富 100 强企业,99%的全球财富 500 强企业,以及成千上万家小企业和个人用户。Citrix虽然在全球范围内获得成功,但是直到 2000 年,Citrix和北京四通投资合作通过签订代理销售的方式,才开始进入中国市场,随后在 2011 年建立研发技术支持办公室。 2015 年底,思杰中国研发技术支持中心在南京揭牌,成为Citrix全球五大研发中心之一,承担研发和技术支持的工作,显示出进一步发展中国市场的决心。只有这样的靠近市场端的研发投入,Citrix才能适应中国市场,和市场巨大的潜力和容量想匹配,获得进一步发展。

VMware

VMware在 1998 年推出了针对X86 系统的虚拟化技术,开创和引领了一个时代。和Google代表搜索,被微软视为威胁一样,VMware也成了虚拟化的代名词,直接对微软的后花园——操作系统的市场造成威胁。

在技术上,从服务器虚拟化向桌面虚拟化发展,是很自然的逻辑,两者之间只相差一套桌面传输协议而已。在服务器虚拟化市场已经无敌于天下的VMware,拓展一块新的桌面虚拟化市场,两套产品相互促进捆绑销售,可以很好的满足二级市场对自己业务增长的期望。这属于从后向前发展,将后端的数据中心和前端的最终用户都纳入自己的产品范围内。反过来看Citrix,通过 2007 年花 5 亿美元收购XenSource后获得了服务器虚拟化的核心技术,属于从前向后发展。

VMware在 2008 年,IPO的第二年推出了自己的桌面虚拟化产品VIEW,现改名为Horzion。其中最为关键的技术——桌面传输协议,租用的是Teradici的PCoIP,可是PCoIP原本不是为虚拟桌面准备的,还需另外再使用微软的RDP协议弥补PCoIP没有的功能,比如设备重定向。属于不同技术体系的RDP和PCoIP之间无法在线切换,使得用户体验受到很大影响。后来为了解决关键技术依赖于第三方的问题,VMware开发了自己的Blast协议,可以很好的支持GPU虚拟桌面场景下的视屏播放和3D显示。到现在为止,这三套协议同时存在于Horizon的产品体系中,用户需要依据不同场景,切换合适的协议。这和Citrix的ICA不可同日而语。

VMware支持GPU虚拟化的时间要晚于Citrix,在和NVIDIA合作推出支持ESXi的vGPU产品前,一直使用自己开发的vSGA方案解决GPU虚拟化共享的问题,和Intel GVT-s的原理类似。该方案需要在虚拟机中安装VMware定制的虚拟显卡驱动程序,再通过虚拟化层,将应用对图形API的调用转发到物理主机上,技术实现复杂,产品性能偏弱,仅能作为VDI性能的加强版本。当时关于vGPU和vSGA的性能高低成了业内热点话题。直到 2 年后,VMware才推出自己的vGPU产品。

商业的竞争是全面的,包括技术,商务和市场能力等的比拼。VMware的市场能力要比Citrix强不少。Horizon和ESXi的相关市场和产品文案经常出现在NVIDIA提供的官方资料下载中,资料的图形画面更丰富,设计感更强,相比Citrix的文档会更加友好,容易阅读。产品策略上Horizon也是明修栈道暗度陈仓,前期尽量淡化自己没有的功能,在新版本上线后,再大力宣传新功能的好处。

桌面虚拟化和服务器虚拟化,一个属于表示层,一个属于底层,前者需要使用后者提供的接口才能工作。而这刚好是Citrix和VMware各自擅长的领域,从这个角度分析,两家的主打产品完全是合作关系。如果没有Horizon和XenServer,两家应该是亲密无间的战友,一起平分天下。市场的现状也证明了在桌面虚拟化领域,Citrix和VMware更多的是合作关系,有不少用户采用的就是vSphere+XenDesktop的解决方案。

Huawei

华为早期的商业模式主要是ToB类型的,为电信运营商提供设备和服务。开始进入大众的视野,是ToC的手机业务的崛起。华为每年都会将收入的10%~15%投入研发, 2016 年投入了 110 亿美元,在过去十年总计投入 3100 亿元,排在全球企业研发投入排行榜的第八位。长期大规模的研发投入,换来的是华为持续不断的技术创新和业务增长。

华为 2008 年开始研究桌面虚拟化技术,在 2010 年宣布进入云计算领域。今年 3 月份成为亚洲首 个Openstack白金会员,社区的贡献率全球排名第二。其云计算操作系统FusionSphere自5. 0 后就全部基于Openstack开发。

坊间一直有华为的服务器虚拟化和桌面虚拟化均是OEM Citrix的传言。服务器虚拟化软件FusionCompute是华为基于Xen开源平台自研的虚拟化软件,并在性能、用户体验以及用户可用性方面做了很多优化工作。另外一个类似的项目是Citrix收购的XenServer。

在桌面虚拟化上,华为走的是一条先OEM,然后再研发出自己产品的道路。早期华为通过给研发桌面部署Citrix XenDesktop解决了资料统一管理等问题,并OEM Citrix的XenDesktop打包卖给高端客户,早期版本的FusionCloud使用的就是ICA协议。直到多年后研发出桌面虚拟化软件FusionAccess和远程桌面传输协议HDP(Huawei Desktop Protocol)协议,才摆脱对Citrix的依赖,真正拥有自己独立自主的产品。不过一直没有找到官方的材料介绍HDP协议。国内厂商在技术的开发程度上不如国外企业,这也导致了市场上在多年后一直留有OEM Citrix的猜疑,算华为在公关上的失策。

2014 年,在华为云计算大会上,和NVIDIA与联合展示了把NVIDIA GRID技术应用在华为FusionCloud云平台上,通过在华为桌面云(FusionAccess)解决方案中实现GPU虚拟化技术,从而帮助华为桌面云客户实现从云端随时随地获得3D图形工作站级别的桌面体验。华为成为国内第 一,目前仍然是唯 一一家能够支持vGPU的桌面虚拟化厂商。

2016 年底,IDC发布的MarketScape Worldwide Virtual Client Computing华中将华为凭借桌面虚拟化解决方案FusionAccess被评为全球桌面虚拟化市场主流玩家。

华为自己可能是全球规模最 大的虚拟化桌面的单一用户,部署的终端数量达十几万,分布在全球范围的分支机构。华为的桌面虚拟化解决方案最 大的特点是能够提供一整套自形研发的软件+硬件解决方案,从软件层面服务器虚拟化FusionCompute,桌面虚拟化FusionAccess和桌面传输协议HDP,到硬件层面的FusionCube一体机, FusionStorge存储客户端,NVIDIA认证的GPU服务器,高性能交换机,以及瘦客户端,包括提供X86 和ARM架构的海思麒麟。

ZETTAKIT

成立于 2014 年的ZETTAKIT泽塔云,作为国内最早一批做超融合的厂商,刚在 7 月份入选了Gartner Hype Cycle for ICT 2017 的推荐厂商。ZETTAKIT的服务器虚拟化平台和云管理平台基于KVM和OpenStack平台开发,在这两个平台的基础上,ZETTAKIT2016 年又发布了自己的GPU虚拟化解决方案和相应的桌面传输协议。

目前NVIDIA和AMD都没有推出基于KVM的商用GPU解决方案,直通方案成了大部分KVM厂商的技术选择。不过ZETTAKIT的GPU直通和其他厂商的有些不一样,zVision支持NVIDIA的主流显卡虚拟化,包括游戏卡GeForce,图形专业卡Quadro,高性能计算卡Tesla。目前另外一家能够商用的GeForce云,只有NVIDIA在北美运营GeForce Now。在上个月,ZETTAKIT更将AMD的主流显卡也加入了支持列表,将显卡们全部带入了云计算时代。对于很多性能要求高,对Quadro特性并不敏感的业务来说,GeForce在价格上具有极大的吸引力。另外这种直通方案,不需要支付类似NVIDIA GRID的软件授权费用。

GPU虚拟化产品的关键在于远程桌面传输协议。ZETTAKIT拥有自己研发的zVision桌面传输协议,支持H.264/H. 265 标准,可以将产品对带宽的要求降至5Mbps~22Mbps。通过硬件编解码,可以将图形延迟最 低降低到25ms。这能很好的解决虚拟化桌面一直被抱怨的鼠标不跟手,图形响应慢等问题,提供和本地一致的操作体验。 这能很好的满足需要精细快速操作的设计类软件使用需求。

zVision也是第 一个基于超融合基础架构推出的商用GPU虚拟化产品,可以为用户节省在存储系统上的投入,横向扩展升级方便。超融合系统结合GPU云,为用户交付一套完整的软件定义数据中心解决方案。

作为GPU虚拟化市场的新玩家,ZETTAKIT针对当前主流产品的痛点和市场空白,结合自身的技术方案特点,形成了差异化营销策略,将市场定位为“云端的图形工作站,和本地一致的使用体验”。可以将一台服务器变成多台云端的图形工作站,解决 Citrix等vGPU方案因为性能和图形工作站有差距,无法满足高端使用场景的问题。这种差异化营销策略有效的将用户和使用场景区隔,避免了和Citrix和VMware友商的直接竞争,可以一起推动GPU虚拟化市场的壮大。

  • 上一篇:AI大战中,腾讯,能否在阿里、百度的夹缝中杀出一条血路
  • 下一篇:小程序的“后半生”:挽救了张小龙的尴尬和无数开发者的梦