💻 repo

Llama 2

2 mentions across 1 person

All mentions

youtube · 2026-04-10

Recommended

“Llama 2 performance apparently scales linearly at least as far as 32 chips which at peak can generate almost 2,000 tokens per second.”