模型参数
推理速度: 765~765 token/s
输入模态: 文本
输出模态: 文本
能力矩阵
上下文窗口: 8.2K
最大输出: 8.2K
流式输出
定价与计费
计费方式: 按量付费
输入价格: $0.2000/百万token
输出价格: $0.2000/百万token
同系列变体 · Llama
llama-nemotron-rerank-1b-v2 — NVIDIA Build免费
-$0/M in
llama-nemotron-embed-1b-v2 — NVIDIA Build免费
-$0/M in
llama-guard-4-12b — NVIDIA Build免费
-$0/M in
Llama Guard 3 8B — 高级对话模型低成本
131.1K$0.02/M in
Llama Guard 3 8B — 超高速推理模型低成本
8.2K 765~765 t/s$0.20/M in
llama-nemotron-rerank-vl-1b-v2 — NVIDIA BuildVision免费
-$0/M in
llama-nemotron-embed-vl-1b-v2 — NVIDIA BuildVision免费
-$0/M in
Groq 其他模型
数据来源:groq_web ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制