云报告洞察,实例规格、性能、成本选择

最后更新: 2026-01-07, 作者: HAO022

实例资源类型

生产实践中,云厂商根据工作负载类型划分如下资源模型,此外相同的资源模型又分为不同的规格。

  • 通用型:cpu/memory = 1:4,适用于通用互联网应用、Web 网站、Java 应用服务、游戏服务等场景。
  • 计算型:cpu/memory = 1:2,适用于数据分析、批量计算、视频编码、机器学习等场景。
  • 存储型:cpu/memory = 1:4,适用于 Hadoop MapReduce、HDFS、Hive、HBase 等存储场景。
  • 内存型:cpu/memory = 1:8,适用于内存数据库、数据分析与挖掘、分布式内存缓存。

AWS/阿里云将实例类型分为上述几种类型,具体信息可以查看如下链接:

阿里云通用型实例规格族 g9ae,有 10 种资源规格。

实例规格 vCPU 内存(GiB) 网络带宽基础/突发(Gbit/s) 云盘带宽基础/突发(Gbit/s) 云盘IOPS基础
ecs.g9ae.large 2 8 2.5/最高25 2.5/最高20 最高20万
ecs.g9ae.xlarge 4 16 4/最高25 3/最高20 最高20万
ecs.g9ae.2xlarge 8 32 6/最高25 4/最高20 最高20万
ecs.g9ae.4xlarge 16 64 10/最高25 5.5/最高20 最高20万
ecs.g9ae.8xlarge 32 128 16/最高25 8/最高20 最高20万
ecs.g9ae.12xlarge 48 192 25/无 13/无 15万
ecs.g9ae.16xlarge 64 256 32/无 16/无 20万
ecs.g9ae.24xlarge 96 384 50/无 25/无 30万
ecs.g9ae.32xlarge 128 512 64/无 32/无 40万
ecs.g9ae.48xlarge 192 768 100/无 50/无 60万

AWS 通用型 M8g (New Generation),有 12 种资源规格。

Instance size vCPU Memory (GiB) Network bandwidth (Gbps) Amazon EBS bandwidth (Gbps)
m8g.medium 1 4 Up to 12.5 Up to 10
m8g.large 2 8 Up to 12.5 Up to 10
m8g.xlarge 4 16 Up to 12.5 Up to 10
m8g.2xlarge 8 32 Up to 15 Up to 10
m8g.4xlarge 16 64 Up to 15 Up to 10
m8g.8xlarge 32 128 15 10
m8g.12xlarge 48 192 22.5 15
m8g.16xlarge 64 256 30 20
m8g.24xlarge 96 384 40 30
m8g.48xlarge 192 768 50 40
m8g.metal-24xl 96 384 40 30
m8g.metal-48xl 192 768 50 40

实例大小选择

上述资源划的数据来自AWS,阿里云,但并未说明背后的思考。Cockroach Labs 2022 年对主流公有云 56 种实例类型和 107 种配置进行公正测试,以帮助用户选择最佳的工作负载实例(https://www.cockroachlabs.com/guides/2022-cloud-report),回答用户“使用更多较小的节点,还是使用较少的较大的节点更好?”。该报告给出丰富的数据样本,并开源所有测试用例(https://github.com/cockroachlabs/cloud-report)。为比较不同实例性能,基准测试均以 per-vCPU 性能展示。

报告洞察:** 小规格实例优于大规格实例且和 CPU 型号,云平台,实例类型无关**。

在 OLTP 和 CPU 基准测试中,可以发现在特定实例类型上运行的小型实例,总是占据性能优势,无论 CPU 平台、云提供商还是实例类型如何。根据实例类型,这些差距从 5% 到 30% 不等。

为了解释小型节点和大型节点之间的性能差异,进行了其他方面的测试,发现 NUMA,CPU 变速时钟技术会影响性能。但是这些因素不足以说明实例规模之间的性能差异。具体测试包括以下实验:

  • 控制特定 CPU/实例信息偏差。
  • 采样运行时处理器频率(Turbo Boost)。
  • 设计在大型节点和小节点之间具有相同 vCPU 的测试(16 x 8 vCPU 节点与4 x 32 vCPU 节点在相同压力复杂度下比较)。

实例内存计算比例

实例规格影响着整体性能,那么通用资源模型的内存计算比例为什么是1:4而非其他?云厂商除了资源管理,成本效率外,下面从技术角度分析为什么通用型计算内存资源占比为1:4。

  • 计算内存比例1:2 提升至1:4,实例性能提升较大(c5.2xlarge, c5n.2xlarge, m6i.2xlarge);
  • 计算内存比例1:4 提升至1:8,实例性能提升不明显,甚至略有下降(m6i.8xlarge,r5.8xlarege,r5n.8xlarege);

  • 计算内存比例影响性能一致性,计算内存比例1:1,1:2 表现出性能波动,而1:4,1:8 性能一致性较强。

上述所有实例型号信息见附录。

实例成本

无论您选择哪个云,所有三个提供商都提供具有竞争力的性价比解决方案。在固定的工作负载复杂度为 1,200 个仓库时,更大的节点提供了最佳的性价比,主要因为小节点的价格中存储占比更大。这确实赋予了大节点定价优势。

附录


篇尾: