M3 Max 36GB vs RTX 4090

For running local LLMs · 4 reports across 2 models

Side A

Vendor: apple
VRAM: 36GB
Memory: Unified

Side B

Vendor: nvidia
VRAM: 24GB
Memory: Discrete

Tokens per second by model

Model	M3 Max 36GB	RTX 4090
Gemma 4up to 31B	16.0n=1	149.6n=2
Qwen3.6up to 35B	—	25.0n=1

More comparisons