首页模型GemmaGemma 2 9B — 超高速推理模型
低成本GemmaGroq LPU 极速推理,Google开源模型

Gemma 2 9B — 超高速推理模型

Gemma 2 9B是通过Groq LPU极速推理平台提供的开源AI模型,Google Gemma 2 9B open-source model for instruction following,推理速度可达500 tokens/sec,上下文窗口8K tokens,支持流式输出和API调用。

Groq·开源0
LPU 极速推理: 500tokens/sec

模型参数

推理速度: 500~500 token/s
输入模态: 文本
输出模态: 文本

能力矩阵

上下文窗口: 8.2K
最大输出: 8.2K
00
流式输出
00

定价与计费

计费方式: 按量付费
输入价格: $0.2000/百万token
输出价格: $0.2000/百万token
0
查看 Gemma 系列全部模型 →
数据来源groq_web · 中文优化:龙虾技能库