Llama Guard 3 8B — 超高速推理模型

Name: Llama Guard 3 8B — 超高速推理模型
Brand: Groq
Price: 0.2 USD

Groq

低成本LlamaGroq LPU 极速推理，Meta开源模型

Llama Guard 3 8B — 超高速推理模型

Llama Guard 3 8B是通过Groq LPU极速推理平台提供的开源AI模型，Llama Guard 3 8B content safety classification model，推理速度可达765 tokens/sec，上下文窗口8K tokens，支持流式输出和API调用。

Groq·开源

对话低成本大语言模型

LPU 极速推理: 765tokens/sec

申请 KEY API 文档

厂商

Groq

模型参数

推理速度: 765~765 token/s

输入模态: 文本

输出模态: 文本

能力矩阵

上下文窗口: 8.2K

最大输出: 8.2K

流式输出

定价与计费

计费方式: 按量付费

输入价格: $0.2000/百万token

输出价格: $0.2000/百万token

同系列变体 · Llama

llama-nemotron-rerank-1b-v2 — NVIDIA Build免费

-$0/M in

llama-nemotron-embed-1b-v2 — NVIDIA Build免费

-$0/M in

llama-guard-4-12b — NVIDIA Build免费

-$0/M in

Llama Guard 3 8B — 高级对话模型低成本

131.1K$0.02/M in

Llama Guard 3 8B — 超高速推理模型低成本

8.2K 765~765 t/s$0.20/M in

llama-nemotron-rerank-vl-1b-v2 — NVIDIA BuildVision免费

-$0/M in

llama-nemotron-embed-vl-1b-v2 — NVIDIA BuildVision免费

-$0/M in

Groq 其他模型

Whisper Large V3 Turbo — 极速推理模型Turbo低成本

-

Whisper Large V3 — 极速推理模型低成本

-

Kimi K2 0905 — 极速推理模型中等

262.1K

Llama 3 8B — 超高速推理模型低成本

8.2K

Llama 3 70B — 极速推理模型低成本

8.2K

Qwen3 32B — 超高速推理模型低成本

131.1K

数据来源：groq_web ↗ · 中文优化：龙虾技能库

OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险，如需更匹配、更安全的方案，建议联系付费定制

了解定制服务