大模型訓練
NVIDIA H100 SXM
80GB HBM3 顯存
目前性能最強的 AI 訓練 GPU,適合千億級大模型訓練和高吞吐推理,NVLink 互聯。
FP16 性能989 TFLOPS
記憶體帶寬3.35 TB/s
可選供應商阿里雲
詢價
國內合規訓練
NVIDIA H800
80GB HBM2e 顯存
H100 的國內合規版,互聯帶寬受限但訓練性能仍出色,適合大模型預訓練和微調。
FP16 性能989 TFLOPS
NVLink 帶寬400 GB/s
可選供應商火山雲
詢價
中大型訓練
NVIDIA A100 SXM
80GB HBM2e 顯存
上一代訓練旗艦,性價比優秀,廣泛用於 7B-70B 模型訓練和生產推理,生態成熟。
FP16 性能312 TFLOPS
記憶體帶寬2 TB/s
可選供應商阿里雲、騰訊雲
詢價
全新 · 推理首選
NVIDIA RTX 5090
32GB GDDR7 顯存
最新 Blackwell 架構消費旗艦,本地部署 70B 模型無壓力,推理性能大幅提升,正在詢價中。
架構Blackwell (2025)
顯存帶寬1.8 TB/s
可選供應商詢價
詢價
推理 / 微調
NVIDIA RTX 4090
24GB GDDR6X 顯存
消費級性能旗艦,7B-34B 模型推理和 LoRA 微調首選,性價比最高,供貨充足。
FP16 性能165.2 TFLOPS
顯存帶寬1 TB/s
可選供應商阿里雲、騰訊雲、火山雲
詢價
多模態推理
NVIDIA L40S
48GB GDDR6 顯存
專為推理優化的數據中心 GPU,48GB 顯存支持大上下文,適合多模態推理和視頻生成。
FP16 性能362 TFLOPS
顯存帶寬864 GB/s
可選供應商阿里雲
詢價
國產化替代
華為昇騰 910B
64GB HBM 顯存
國產 AI 芯片旗艦,適合政務、金融等需要國產化替代的行業,MindSpore 生態支持。
FP16 性能320 TFLOPS
顯存帶寬2 TB/s
可選供應商詢價
詢價