首页AI模型目录

AI 模型

浏览主流大模型,了解能力与定价。

热门搜索 GPTClaudeDeepSeek通义千问文心一言Gemini

定价: standard · 标签: 视觉理解

OpenAI: GPT-5.2-Codex — 多模态视觉模型OpenRouterCode中等OpenAI: 思考
OpenAI: GPT-5.2-Codex是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口400K tokens,最大输出128K tokens,输入价格$1.75/百万tokens。
400K文本 图片视觉理解标准推理
OpenAI: GPT-5.3-Codex — 多模态视觉模型OpenRouterCode中等OpenAI: 思考
OpenAI: GPT-5.3-Codex是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口400K tokens,最大输出128K tokens,输入价格$1.75/百万tokens。
400K文本 图片视觉理解标准推理
OpenAI: GPT-5.3 Chat — 多模态视觉模型OpenRouter中等OpenAI:
OpenAI: GPT-5.3 Chat是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备函数调用、视觉理解能力,上下文窗口128K tokens,最大输出16K tokens,输入价格$1.75/百万tokens。
128K文本 图片视觉理解标准视觉
Google: Gemini 2.5 Pro Preview 05-06 — 多模态视觉模型OpenRouterPro中等Google: 思考
Google: Gemini 2.5 Pro Preview 05-06是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口1.0M tokens,最大输出66K tokens,输入价格$1.25/百万tokens。
1.0M文本 图片 音频 视频视觉理解标准推理
Google: Gemini 2.5 Pro Preview 06-05 — 多模态视觉模型OpenRouterPro中等Google: 思考
Google: Gemini 2.5 Pro Preview 06-05是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口1.0M tokens,最大输出66K tokens,输入价格$1.25/百万tokens。
1.0M图片 文本 音频视觉理解标准推理
OpenAI: GPT-5 — 多模态视觉模型OpenRouter中等OpenAI: 思考
OpenAI: GPT-5是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口400K tokens,最大输出128K tokens,输入价格$1.25/百万tokens。
400K文本 图片视觉理解标准推理
Perplexity: Sonar — 多模态视觉模型OpenRouter中等Perplexity:
Perplexity: Sonar是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备视觉理解能力,上下文窗口127K tokens,输入价格$1.00/百万tokens。
127.1K文本 图片视觉理解标准视觉
Anthropic: Claude Haiku 4.5 — 多模态视觉模型OpenRouter中等Anthropic: 思考
Anthropic: Claude Haiku 4.5是通过OpenRouter平台提供的AI模型,支持文本和图像输入的多模态模型,具备深度推理、函数调用、视觉理解能力,上下文窗口200K tokens,最大输出64K tokens,输入价格$1.00/百万tokens。
200K图片 文本视觉理解标准推理
InternVL3-38B — InternVL3视觉百度文心中等InternVL3
InternVL3-38B是百度文心提供的AI模型,支持视觉理解。
32K文本 图片视觉理解标准国产
Qwen2.5-VL-32B-Instruct — Qwen2.5 VL中型百度文心中等Qwen2.5-VL
Qwen2.5-VL-32B-Instruct是百度文心提供的AI模型,支持视觉理解。
32K文本 图片视觉理解标准国产
SenseNova V6 Reasoner — 深度推理商汤日日新reasoner中等SenseNova-V6 思考
商汤日日新融合模态深度推理模型,支持复杂慢思考推理,输出思维链和最终答案。
128K文本 图片视觉理解标准国产
Qianfan-VL-70B — 千帆视觉大模型百度文心中等Qianfan-VL
百度千帆自研70B视觉理解大模型,支持图像理解和多模态推理
32K文本 图片视觉理解标准国产
Hunyuan-Vision — 视觉旗舰模型腾讯混元中等Hunyuan
腾讯混元视觉旗舰模型,提供最高质量的图像理解和多模态融合能力,适合专业视觉分析场景。
32K文本 图片视觉理解标准国产
QVQ-Max — 视觉推理旗舰通义千问中等QVQ 思考
通义千问QVQ视觉推理旗舰模型,具备深度思考能力,在复杂图像理解和分析任务上表现卓越,适合高精度视觉推理场景。
131.1K文本 图片视觉理解标准国产
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务