M3 16GB vs RTX 4090

For running local LLMs · 4 reports across 2 models

Side A

Vendor: apple
VRAM: 16GB
Memory: Unified

Side B

Vendor: nvidia
VRAM: 24GB
Memory: Discrete

Tokens per second by model

Model	M3 16GB	RTX 4090
Gemma 4up to 31B	21.0n=1	149.6n=2
Qwen3.6up to 35B	—	25.0n=1

More comparisons