云科技:谷歌·云T2A实例发布,谷歌云的ARM主机要来了!

最近谷歌云发布ARM主机的消息传来,推出了搭载安培处理器的Tau T2A实例。到目前为止,几大云厂商都推出了ARM云主机。

云科技:谷歌·云T2A实例发布,谷歌云的ARM主机要来了! 第2张

受不了了,谷歌云的ARM主机来了

谷歌第八号员工、主管基础设施的副总裁乌尔斯·霍尔兹勒(urs hlz le)曾断言,如果性价比能提高20%,将导致从x86向Power架构的过渡。当然不一定是电源,其他架构也可以。

正如你所担心的,首先要解决的问题是如何使用ARM处理器。

不难想象,当谷歌构建自己的搜索引擎、广告和视频流平台时,可以迁移到ARM处理器上。然而,作为云服务提供商,Google Cloud将其现有应用从x86架构迁移到ARM架构并不容易。它如何说服客户也使用ARM主机?

行业内也有相当成熟的探索。

亚马逊的Graviton处理器是ARM阵营的一面旗帜。它告诉大家,ARM服务器真的可以。Graviton拥有高达40%性价比的众多优势。一方面是亚马逊云技术自己的云服务在用,另一方面是直接卖给云服务用户,所以要把应用迁移到ARM服务器上。

近两年来,国内公有云服务商UCloud、腾讯云、京东云相继推出基于Ampere的ARM云主机,阿里云也公布了基于自研处理器的盘九服务器。在国际市场上,甲骨文云(OCI)和微软Azure也推出了基于Ampere的ARM主机。

最近谷歌云推出了一款基于Ampere的ARM主机,多少有些让人意外,这是全球顶级云厂商中最后一家推出ARM主机的云厂商。

谷歌的T2A实例目前支持各种常见的Linux发行版,如RHEL(红帽企业版)、Suse Linux企业服务器、CentOS、Ubuntu和Rocky Linux,以及容器优化的操作系统。

云科技:谷歌·云T2A实例发布,谷歌云的ARM主机要来了! 第4张

此外,Google Cloud自带的Kubernetes容器引擎——Google Kubernetes引擎也可以运行在T2A上,Google Cloud托管的批处理服务和流媒体分析服务也可以运行在T2A上。

在实际使用中,Google也可能在内部使用,在Borg、Omega等云管理系统上,支持搜索引擎、广告、邮件等工作负载。随着内部工作负载逐步迁移到云端,更多的服务将提供给外部。

虽然大家都觉得现在的ARM生态系统还很弱,但实际上安培官网已经列出了135种常见的云原生应用,包括数据库、云原生软件和编程语言,而且这个数字还在增长。谷歌云表示,一些ISV合作伙伴顺利轻松地迁移到了T2A。

可能只是3上的引力又来了,微软、甲骨文、腾讯、阿里等云友都在搞ARM服务器。谷歌坐不住了,所以是这次发布的原因。

性价比高

有分析认为,很多云服务商都采用了安培的ARM芯片,因此安培的成本优势可能会进一步放大,从而更容易给超大规模数据中心市场带来变革。

虽然谷歌在自己的智能手机上有自研芯片,并且有消息称谷歌正在研究用于ChromeOS的ARM芯片,但是消费级芯片和服务器级芯片还是有很大差距的。

云科技:谷歌·云T2A实例发布,谷歌云的ARM主机要来了! 第6张

我不确定谷歌以后会不会用自研的ARM服务器芯片,像中国的阿里云一样两条腿走路。既有安培的第三方解决方案,也有自主研发的解决方案。

目前谷歌云的主机已经进化到第二代。第一代主要是Intel平台的解决方案。第二代开始分为两类,一类是通用型,一类是聚焦优化型。

其中优化的例子有计算优化的C2和C2D,内存优化的M2,机器学习加速优化的A2。

一般负荷包括E、N2和N2D。E2根据性能选择CPU平台,N2使用英特尔至强,N2D使用AMD皓龙处理器。

云科技:谷歌·云T2A实例发布,谷歌云的ARM主机要来了! 第8张

还有今天重点介绍的Tau的例子。Tau是一个希腊字符,代表黄金比例。这个名字表达了谷歌希望在计算、内存和I/O之间取得新的平衡,通过对处理器进行特殊调整,可以在某些工作负载下提供更好的性价比。

谷歌去年发布Tau系列实例时强调,通过使用AMD的米兰处理器,并优化核心数和时钟频率,性价比可以达到甚至超过一台ARM云主机。所以很多人以为谷歌短时间内不会考虑推出ARM主机。

Tau的第一个实例被称为T2D,它基于AMD的“米兰”单插槽Epyc 7003处理器。T2A是基于Ampere CPU的一个新的ARM实例。

Ampere在新闻稿中表示,在Google Cloud中,T2A虚拟机实例的性能比当前一代(第二代)x86虚拟机高31%,在性价比方面领先65%。

接下来统计T2A和T2D的关键信息,如上图所示。

目前谷歌的主机将CPU核心与内存的比例锁定在1: 4,而ARM主机最高配备48vCPU和192GB内存,亚马逊云技术则采用1: 2的重力3上C7g的比例。也许未来的内存优化例子会进一步提高内存比例。

从亚马逊云技术的Gravity on到阿里的永恒710,再到Ampere的ARM处理器,无一不是超线程技术。都采用单核输出单线程,优点是性能更稳定。

目前采用Ampere方案的云厂商都是使用80核的Ampere Altra,而不是128核的Ampere Altra Max。

而且所有云厂商都不提供80核配置的SKU。微软Azure最多提供64核,谷歌最多提供48核。这可能是考虑到产量和成本而做出的选择。

剩下的审计都做了些什么?去年T2D发布时,AMD的Epyc 7003最多可以提供64个核心,但用户最多可以使用60个核心,4个核心用于运行KVM hypervisior、存储和网络。

在过去的两年里,DPU一直很受欢迎。据称,微软Azure有类似于DPU的东西。谷歌云直接使用英特尔的IPU,所以它不应该被用来运行网络和存储部分。剩余的核心可以被分割给其他云主机。

内部基准ARM方案,外部基准x86阵营

接下来总结对比了微软Azure、谷歌云和亚马逊云技术的三类计算NextPlatform (AMD、Intel和Ampere)的性能和价格,如下图所示:

上图中的红字是基于现有的2017 SPEC Int Rate跑分数据估算的,主要基于Google Cloud和Amazon Cloud技术测得的数据。通常情况下,价格会随着vCPU的数量线性增加。

仔细看看,你会发现有趣的点。上图中的Google Tau T2A实例和微软Azure D系列在相同的CPU和内存配置下,价格完全一样。

从上图可以看出,ARM服务器在整数性能上的性价比非常高,比x86高40%到45%左右。

亚马逊C7g配备了比别人多一倍的内存,价格却比别人低不了多少,整数性能也比别人差不了多少。

另外,AMD骁龙7003可以扩展到64核,而英特尔冰湖最多只能扩展到40核。AMD可以用来构建更大的实例,在同一个服务器上创建更多的小实例。

在超大规模的云上,更多核的优势很明显,这可能就是安培128核处理器的意义所在。AMD还有机会推出96核热那亚和128核贝加莫。

还有一点需要注意的是,三家家庭云服务商的ARM服务器价格咬得很紧,可能是约定好的,也可能是价格战。

标签

总之,现在数据中心,尤其是超大规模数据中心市场的计算架构之战非常激烈。

一方面是x86内战,英特尔被AMD挤压市场份额;一方面,外敌ARM正在冲击x86市场,很多云厂商和少数服务器厂商已经站到了ARM一边;旁边还有一群DPU的摩拳擦掌。很热闹。

原文出处:声明:信息来源于原创或转载,转载此文是出于传递更多信息之目的。视点号尊重版权,请作者持权属证明与我们联系2889649679@qq.com,我们将及时更正、删除,谢谢!

(0)
上一篇 2022年 7月 29日 下午5:50
下一篇 2022年 7月 29日 下午5:56

相关推荐

发表回复

您的电子邮箱地址不会被公开。