首页模型Llama-4 › Llama 4 Scout — 超高速推理模型

低成本Llama-4Groq LPU 极速推理,Meta开源模型

Llama 4 Scout — 超高速推理模型

Llama 4 Scout是通过Groq LPU极速推理平台提供的开源AI模型,Meta Llama 4 Scout MoE model with 17B active parameters and 16 experts,推理速度可达594 tokens/sec,上下文窗口131K tokens,支持流式输出和API调用。

Groq·开源
LPU 极速推理: 594tokens/sec

模型参数

推理速度: 594~594 token/s
输入模态: 文本
输出模态: 文本

能力矩阵

上下文窗口: 131.1K
最大输出: 8.2K
函数调用
流式输出

定价与计费

计费方式: 按量付费
输入价格: $0.1100/百万token
输出价格: $0.3400/百万token
数据来源groq_web ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务