Llama-3.3 系列
由 NVIDIA 提供 · 共 6 个变体
| 模型 | 变体 | 定位 | 上下文 | 速度(t/s) | 输入价格/M | 输出价格/M | 思考 | 能力 |
|---|---|---|---|---|---|---|---|---|
| llama-3.3-nemotron-super-49b-v1.5 — NVIDIA Build | 标准 | Downloadable | - | - | $0.0000 | $0.0000 | - | |
| llama-3.3-nemotron-super-49b-v1 — NVIDIA Build | 标准 | Downloadable | - | - | $0.0000 | $0.0000 | - | |
| llama-3.3-70b-instruct — NVIDIA Build | 标准 | Downloadable | - | - | $0.0000 | $0.0000 | - | |
| Llama-3.3-70B-Instruct-Turbo — 开源对话模型 | 标准 | - | 131.1K | - | $0.8800 | $0.8800 | - | |
| Llama 3.3 70B Versatile — 极速推理模型 | 标准 | Groq LPU 极速推理,Meta开源模型 | 131.1K | 394~394 | $0.5900 | $0.7900 | - | |
| Llama-3.3-70B-Instruct — 开源对话模型 | 标准 | - | 131.1K | - | ¥4.1300 | ¥4.1300 | - |