类型: vision
Kimi-K2.5 — NVIDIA BuildMoonshot AI免费Kimi-K2 思考开源
Kimi K2.5 是月之暗面 (Moonshot AI) 推出的先进多模态大语言模型,具备视觉理解和推理能力,在 NVIDIA Build 平台上提供免费 API 端点。
文本 图片视觉理解免费国产
Kimi-K2.5 — 多模态视觉模型SiliconFlow低成本Kimi-K2开源
Kimi-K2.5是通过SiliconFlow(硅基流动)平台提供的开源AI模型,Kimi K2,上下文窗口262K tokens,支持流式输出和API调用。
262.1K文本 图片视觉理解低成本国产
Llama-4-Scout-17B-16E-Instruct — 多模态视觉模型SiliconFlow低成本Llama-4开源
Llama-4-Scout-17B-16E-Instruct是通过SiliconFlow(硅基流动)平台提供的开源AI模型,Meta Llama 4 Scout MoE model with 16 experts,上下文窗口328K tokens,支持流式输出和API调用。
327.7K 17B x 16E文本 图片视觉理解低成本国产
Llama-4-Maverick-17B-128E-Instruct — 多模态视觉模型SiliconFlow低成本Llama-4开源
Llama-4-Maverick-17B-128E-Instruct是通过SiliconFlow(硅基流动)平台提供的开源AI模型,Meta Llama 4 Maverick large MoE model with 128 experts,上下文窗口1.0M tokens,支持流式输出和API调用
1.0M 17B x 128E文本 图片视觉理解低成本国产
Qwen3-VL-235B-A22B-Instruct — 多模态视觉模型SiliconFlow低成本Qwen3开源
Qwen3-VL-235B-A22B-Instruct是通过SiliconFlow(硅基流动)平台提供的开源AI模型,Qwen3 VL 235B multimodal vision-language model,上下文窗口131K tokens,支持流式输出和API调用。
131.1K文本 图片视觉理解低成本国产
GLM-5V-Turbo — 多模态视觉模型SiliconFlowTurbo低成本GLM-5开源
GLM-5V-Turbo是通过SiliconFlow(硅基流动)平台提供的开源AI模型,GLM-5V-Turbo is Z,上下文窗口203K tokens,支持流式输出和API调用。
202.8K文本 图片视觉理解低成本国产
Anthropic: Claude Opus 4.1 — 多模态视觉模型OpenRouter高端Anthropic: 思考
Anthropic: Claude Opus 4.1是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口200K tokens,最大输出32K tokens,输入价格$15.00/百万tokens。
200K图片 文本视觉理解高端推理
OpenAI: GPT-4o (extended) — 多模态视觉模型OpenRouter中等OpenAI:
OpenAI: GPT-4o (extended)是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解能力,上下文窗口128K tokens,最大输出64K tokens,输入价格$6.00/百万tokens。
128K文本 图片视觉理解标准视觉
OpenAI: GPT-5 Image — 多模态视觉模型OpenRouter高端OpenAI: 思考
OpenAI: GPT-5 Image是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口400K tokens,最大输出128K tokens,输入价格$10.00/百万tokens。
400K图片 文本视觉理解高端推理
OpenAI: o3 Deep Research — 多模态视觉模型OpenRouter高端OpenAI: 思考
OpenAI: o3 Deep Research是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口200K tokens,最大输出100K tokens,输入价格$10.00/百万tokens。
200K图片 文本视觉理解高端推理
OpenAI: GPT-4 Turbo — 多模态视觉模型OpenRouterTurbo高端OpenAI:
OpenAI: GPT-4 Turbo是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解能力,上下文窗口128K tokens,最大输出4K tokens,输入价格$10.00/百万tokens。
128K文本 图片视觉理解高端视觉
OpenAI: GPT-5 Pro — 多模态视觉模型OpenRouterPro高端OpenAI: 思考
OpenAI: GPT-5 Pro是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口400K tokens,最大输出128K tokens,输入价格$15.00/百万tokens。
400K图片 文本视觉理解高端推理
Anthropic: Claude Opus 4 — 多模态视觉模型OpenRouter高端Anthropic: 思考
Anthropic: Claude Opus 4是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口200K tokens,最大输出32K tokens,输入价格$15.00/百万tokens。
200K图片 文本视觉理解高端推理
OpenAI: o3 Pro — 多模态视觉模型OpenRouterPro高端OpenAI: 思考
OpenAI: o3 Pro是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口200K tokens,最大输出100K tokens,输入价格$20.00/百万tokens。
200K文本 图片视觉理解高端推理
Auto Router — 多模态视觉模型OpenRouterAuto 思考
Auto Router是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口2.0M tokens。
2M文本 图片 音频 视频视觉理解推理视觉
OpenAI: o1-pro — 多模态视觉模型OpenRouterPro高端OpenAI: 思考
OpenAI: o1-pro是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、视觉理解能力,上下文窗口200K tokens,最大输出100K tokens,输入价格$150.00/百万tokens。
200K文本 图片视觉理解高端推理
OpenAI: GPT-5.4 Pro — 多模态视觉模型OpenRouterPro高端OpenAI: 思考
OpenAI: GPT-5.4 Pro是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口1.1M tokens,最大输出128K tokens,输入价格$30.00/百万tokens。
1.1M文本 图片视觉理解高端推理
OpenAI: GPT-5.2 Pro — 多模态视觉模型OpenRouterPro高端OpenAI: 思考
OpenAI: GPT-5.2 Pro是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口400K tokens,最大输出128K tokens,输入价格$21.00/百万tokens。
400K图片 文本视觉理解高端推理
Anthropic: Claude Opus 4.6 (Fast) — 多模态视觉模型OpenRouter高端Anthropic: 思考
Anthropic: Claude Opus 4.6 (Fast)是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口1.0M tokens,最大输出128K tokens,输入价格$30.00/百万tokens。
1M文本 图片视觉理解高端推理
OpenAI: o1 — 多模态视觉模型OpenRouter高端OpenAI: 思考
OpenAI: o1是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口200K tokens,最大输出100K tokens,输入价格$15.00/百万tokens。
200K文本 图片视觉理解高端推理
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制