首页AI模型目录

AI 模型

浏览主流大模型,了解能力与定价。

热门搜索 GPTClaudeDeepSeek通义千问文心一言Gemini

标签: 视觉

Qwen-Omni-Turbo — 全模态Turbo通义千问Turbo低成本Qwen-Omni
通义千问全模态Turbo模型,支持文本/图片/视频/音频输入,极低价格
文本 图片 视频 音频低成本国产视觉
Nemotron-Nano-12B-VL — 轻量视觉模型NVIDIAnano-12b-vl低成本Nemotron开源
Nemotron-Nano-12B-VL是NVIDIA提供的AI模型,128K上下文,支持视觉理解。
128K 12B文本 图片视觉理解低成本视觉
Nemotron-OCR — 文字识别模型NVIDIAocr免费Nemotron开源
Nemotron-OCR-v1是NVIDIA提供的AI模型,高速推理。
文本 图片视觉理解免费视觉
llama-nemotron-rerank-vl-1b-v2 — NVIDIA BuildNVIDIAVision免费llama开源
llama-nemotron-rerank-vl-1b-v2是NVIDIA Build平台提供的AI模型,提供高质量AI推理能力。免费使用(有速率限制)。
文本 图片视觉理解免费视觉
nemotron-table-structure-v1 — NVIDIA BuildNVIDIA免费nemotron开源
nemotron-table-structure-v1是NVIDIA Build平台提供的AI模型,提供高质量AI推理能力。免费使用(有速率限制)。
文本 图片视觉理解免费视觉
nemotron-page-elements-v3 — NVIDIA BuildNVIDIA免费nemotron开源
nemotron-page-elements-v3是NVIDIA Build平台提供的AI模型,提供高质量AI推理能力。免费使用(有速率限制)。
文本 图片视觉理解免费视觉
nemotron-graphic-elements-v1 — NVIDIA BuildNVIDIA免费nemotron开源
nemotron-graphic-elements-v1是NVIDIA Build平台提供的AI模型,提供高质量AI推理能力。免费使用(有速率限制)。
文本 图片视觉理解免费视觉
llama-nemotron-embed-vl-1b-v2 — NVIDIA BuildNVIDIAVision免费llama开源
llama-nemotron-embed-vl-1b-v2是NVIDIA Build平台提供的AI模型,提供高质量AI推理能力。免费使用(有速率限制)。
文本 图片视觉理解免费视觉
nemoretriever-page-elements-v3 — NVIDIA BuildNVIDIA免费nemoretriever开源
nemoretriever-page-elements-v3是NVIDIA Build平台提供的AI模型,提供高质量AI推理能力。免费使用(有速率限制)。
文本 图片视觉理解免费视觉
DeepSeek-OCR — 高性能文字识别深度求索ocr免费DeepSeek
DeepSeek-OCR是深度求索提供的AI模型,提供高质量AI推理能力。
8K文本 图片视觉理解免费国产
Kimi-K2.5 — 多模态智能体月之暗面k2.5低成本Kimi-K2
Kimi-K2.5是月之暗面提供的AI模型,提供高质量AI推理能力。
128K文本 图片视觉理解低成本国产
Qwen3.5-397B-A17B — 多模态智能体旗舰通义千问397b-a17b低成本Qwen3.5开源
Qwen3.5-397B-A17B是通义千问提供的AI模型,MoE混合专家架构。
256K 397B(17B激活)文本 图片视觉理解低成本国产
Qwen3.5-35B-A3B — 高效MoE多模态通义千问35b-a3b低成本Qwen3.5开源
Qwen3.5-35B-A3B是通义千问提供的AI模型,MoE混合专家架构。
128K 35B(3B激活)文本 图片视觉理解低成本国产
HunyuanOCR — 混元文字识别腾讯混元ocr免费Hunyuan开源
HunyuanOCR是腾讯混元提供的AI模型,提供高质量AI推理能力。
32K文本 图片视觉理解免费国产
ERNIE 5.0 — 文心旗舰全模态百度文心低成本ERNIE-5.0 思考
百度文心大模型5.0正式版,原生全模态大模型,基础能力全面升级,支持深度思考模式,128K上下文,阶梯定价
128K文本 图片对话低成本国产
ERNIE-4.5-VL-28B-A3B — 轻量视觉MoE百度文心vl-28b-a3b低成本ERNIE-4.5 思考
百度文心4.5轻量视觉MoE模型,28B参数仅激活3B,支持图像理解和思考模式,性价比极高
32K 28B(3B激活)文本 图片视觉理解低成本国产
Qianfan-VL-70B — 千帆视觉大模型百度文心中等Qianfan-VL
百度千帆自研70B视觉理解大模型,支持图像理解和多模态推理
32K文本 图片视觉理解标准国产
Qianfan-VL-8B — 千帆视觉轻量百度文心8b低成本Qianfan-VL
百度千帆自研8B视觉理解轻量模型,性价比高
32K文本 图片视觉理解低成本国产
Qianfan-VL-1.5-Flash — 千帆视觉快速百度文心1.5-flash低成本Qianfan-VL
百度千帆VL 1.5 Flash视觉快速模型,极低价格适合大批量图像理解
32K文本 图片视觉理解低成本国产
Qianfan-Check-VL — 质检视觉百度文心check-vl低成本Qianfan
百度千帆质检视觉模型,专为工业质检和图像检测场景设计
32K文本 图片视觉理解低成本国产
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务