Llama-3 系列
由 NVIDIA 提供 · 共 7 个变体
| 模型 | 变体 | 定位 | 上下文 | 速度(t/s) | 输入价格/M | 输出价格/M | 思考 | 能力 |
|---|---|---|---|---|---|---|---|---|
| llama-3_2-nemoretriever-300m-embed-v2 — NVIDIA Build | 标准 | Downloadable | - | - | $0.0000 | $0.0000 | - | |
| llama-3_2-nemoretriever-300m-embed-v1 — NVIDIA Build | 标准 | Free Endpoint | - | - | $0.0000 | $0.0000 | - | |
| llama3-chatqa-1.5-8b — NVIDIA Build | 标准 | Free Endpoint | - | - | $0.0000 | $0.0000 | - | |
| llama3-70b-instruct — NVIDIA Build | 标准 | Downloadable | - | - | $0.0000 | $0.0000 | - | |
| llama3-8b-instruct — NVIDIA Build | 标准 | Downloadable | - | - | $0.0000 | $0.0000 | - | |
| Llama 3 70B — 极速推理模型 | 标准 | Groq LPU 极速推理,Meta开源模型 | 8.2K | 330~330 | $0.5900 | $0.7900 | - | |
| Llama 3 8B — 超高速推理模型 | 标准 | Groq LPU 极速推理,Meta开源模型 | 8.2K | 1250~1250 | $0.0500 | $0.0800 | - |