M2 Max 96GB vs RTX 5090

For running local LLMs · 15 reports across 4 models

Side A

Vendor: apple
VRAM: 96GB
Memory: Unified

Side B

Vendor: nvidia
VRAM: 32GB
Memory: Discrete

Tokens per second by model

Model	M2 Max 96GB	RTX 5090
Qwen3.6up to 35B	28.0n=3	3238.0n=7
Gemma 4up to 31B	—	578.0n=3
Kimi K2.6	—	—n=1
Qwen2.5	—	—n=1

More comparisons