首页AI模型目录

AI 模型

浏览主流大模型,了解能力与定价。

热门搜索 GPTClaudeDeepSeek通义千问文心一言Gemini

厂商: openrouter · 类型: vision

OpenAI: GPT-4o-mini — 多模态视觉模型OpenRouterMini低成本OpenAI:
OpenAI: GPT-4o-mini是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解能力,上下文窗口128K tokens,最大输出16K tokens,输入价格$0.15/百万tokens。
128K文本 图片视觉理解低成本视觉
Qwen: Qwen3.5-35B-A3B — 多模态视觉模型OpenRouter低成本Qwen: 思考开源
Qwen: Qwen3.5-35B-A3B是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解、开源能力,上下文窗口262K tokens,最大输出66K tokens,输入价格$0.16/百万tokens。
262.1K文本 图片 视频视觉理解低成本推理
Arcee AI: Spotlight — 多模态视觉模型OpenRouter低成本Arcee
Arcee AI: Spotlight是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备视觉理解能力,上下文窗口131K tokens,最大输出66K tokens,输入价格$0.18/百万tokens。
131.1K图片 文本视觉理解低成本视觉
Meta: Llama Guard 4 12B — 多模态视觉模型OpenRouter低成本Meta:开源
Meta: Llama Guard 4 12B是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备视觉理解、开源能力,上下文窗口164K tokens,输入价格$0.18/百万tokens。
163.8K图片 文本视觉理解低成本视觉
Qwen: Qwen3.5-27B — 多模态视觉模型OpenRouter低成本Qwen: 思考开源
Qwen: Qwen3.5-27B是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解、开源能力,上下文窗口262K tokens,最大输出66K tokens,输入价格$0.20/百万tokens。
262.1K文本 图片 视频视觉理解低成本推理
OpenAI: GPT-5.4 Nano — 多模态视觉模型OpenRouterMini低成本OpenAI: 思考
OpenAI: GPT-5.4 Nano是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口400K tokens,最大输出128K tokens,输入价格$0.20/百万tokens。
400K图片 文本视觉理解低成本推理
Mistral: Ministral 3 14B 2512 — 多模态视觉模型OpenRouterMini低成本Mistral开源
Mistral: Ministral 3 14B 2512是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解、开源能力,上下文窗口262K tokens,输入价格$0.20/百万tokens。
262.1K文本 图片视觉理解低成本视觉
xAI: Grok 4.1 Fast — 多模态视觉模型OpenRouter低成本xAI: 思考
xAI: Grok 4.1 Fast是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口2.0M tokens,最大输出30K tokens,输入价格$0.20/百万tokens。
2M文本 图片视觉理解低成本推理
Qwen: Qwen3 VL 235B A22B Instruct — 多模态视觉模型OpenRouter低成本Qwen:开源
Qwen: Qwen3 VL 235B A22B Instruct是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解、开源能力,上下文窗口262K tokens,输入价格$0.20/百万tokens。
262.1K文本 图片视觉理解低成本视觉
xAI: Grok 4 Fast — 多模态视觉模型OpenRouter低成本xAI: 思考
xAI: Grok 4 Fast是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口2.0M tokens,最大输出30K tokens,输入价格$0.20/百万tokens。
2M文本 图片视觉理解低成本推理
Qwen: Qwen2.5 VL 32B Instruct — 多模态视觉模型OpenRouter低成本Qwen: 思考开源
Qwen: Qwen2.5 VL 32B Instruct是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、视觉理解、开源能力,上下文窗口128K tokens,输入价格$0.20/百万tokens。
128K文本 图片视觉理解低成本推理
ByteDance Seed: Seed 1.6 Flash — 多模态视觉模型OpenRouterFlash低成本ByteDance 思考
ByteDance Seed: Seed 1.6 Flash是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口262K tokens,最大输出33K tokens,输入价格$0.07/百万tokens。
262.1K图片 文本 视频视觉理解低成本推理
Mistral: Mistral Small 3.2 24B — 多模态视觉模型OpenRouter低成本Mistral开源
Mistral: Mistral Small 3.2 24B是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解、开源能力,上下文窗口128K tokens,输入价格$0.07/百万tokens。
128K图片 文本视觉理解低成本视觉
Google: Gemini 2.0 Flash Lite — 多模态视觉模型OpenRouterFlash低成本Google:
Google: Gemini 2.0 Flash Lite是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解能力,上下文窗口1.0M tokens,最大输出8K tokens,输入价格$0.07/百万tokens。
1.0M文本 图片 音频 视频视觉理解低成本视觉
Qwen: Qwen3 VL 8B Instruct — 多模态视觉模型OpenRouter低成本Qwen: 思考开源
Qwen: Qwen3 VL 8B Instruct是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解、开源能力,上下文窗口131K tokens,最大输出33K tokens,输入价格$0.08/百万tokens。
131.1K图片 文本视觉理解低成本推理
Meta: Llama 4 Scout — 多模态视觉模型OpenRouter低成本Meta:开源
Meta: Llama 4 Scout是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解、开源能力,上下文窗口328K tokens,最大输出16K tokens,输入价格$0.08/百万tokens。
327.7K文本 图片视觉理解低成本视觉
Reka Edge — 多模态视觉模型OpenRouter低成本Reka开源
Reka Edge是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解、开源能力,上下文窗口16K tokens,最大输出16K tokens,输入价格$0.10/百万tokens。
16.4K图片 文本 视频视觉理解低成本视觉
ByteDance Seed: Seed-2.0-Mini — 多模态视觉模型OpenRouterMini低成本ByteDance 思考
ByteDance Seed: Seed-2.0-Mini是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口262K tokens,最大输出131K tokens,输入价格$0.10/百万tokens。
262.1K文本 图片 视频视觉理解低成本推理
Mistral: Ministral 3 3B 2512 — 多模态视觉模型OpenRouterMini低成本Mistral开源
Mistral: Ministral 3 3B 2512是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解、开源能力,上下文窗口131K tokens,输入价格$0.10/百万tokens。
131.1K文本 图片视觉理解低成本视觉
Google: Gemini 2.5 Flash Lite Preview 09-2025 — 多模态视觉模型OpenRouterFlash低成本Google: 思考
Google: Gemini 2.5 Flash Lite Preview 09-2025是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口1.0M tokens,最大输出66K tokens,输入价格$0.10/百万tok
1.0M文本 图片 音频 视频视觉理解低成本推理
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务