AI 模型目录 | 龙虾技能库

热门搜索 GPT Claude DeepSeek 通义千问文心一言 Gemini

类型: vision · 定价: budget

Yi-Vision-V2 — 视觉语言模型零一万物Vision低成本Yi

零一万物视觉语言集成模型，提供高性能图片理解和分析能力，适用于基于图片的聊天和分析场景。

16K文本图片视觉理解低成本国产

Step-3 — 推理大模型阶跃星辰低成本Step-3 思考

阶跃星辰推理大模型，支持视觉感知和复杂推理，阶梯定价，适用于多模态推理场景。

64K文本图片视觉理解低成本国产

Nemotron-Nano-12B-VL — 轻量视觉模型NVIDIAnano-12b-vl低成本Nemotron开源

Nemotron-Nano-12B-VL是NVIDIA提供的AI模型，128K上下文，支持视觉理解。

128K 12B文本图片视觉理解低成本视觉

Kimi-K2.5 — 多模态智能体月之暗面k2.5低成本Kimi-K2

Kimi-K2.5是月之暗面提供的AI模型，提供高质量AI推理能力。

128K文本图片视觉理解低成本国产

Qwen3.5-397B-A17B — 多模态智能体旗舰通义千问397b-a17b低成本Qwen3.5开源

Qwen3.5-397B-A17B是通义千问提供的AI模型，MoE混合专家架构。

256K 397B(17B激活)文本图片视觉理解低成本国产

Qwen3.5-35B-A3B — 高效MoE多模态通义千问35b-a3b低成本Qwen3.5开源

Qwen3.5-35B-A3B是通义千问提供的AI模型，MoE混合专家架构。

128K 35B(3B激活)文本图片视觉理解低成本国产

ERNIE-4.5-VL-28B-A3B — 轻量视觉MoE百度文心vl-28b-a3b低成本ERNIE-4.5 思考

百度文心4.5轻量视觉MoE模型，28B参数仅激活3B，支持图像理解和思考模式，性价比极高

32K 28B(3B激活)文本图片视觉理解低成本国产

Qianfan-VL-8B — 千帆视觉轻量百度文心8b低成本Qianfan-VL

百度千帆自研8B视觉理解轻量模型，性价比高

32K文本图片视觉理解低成本国产

Qianfan-VL-1.5-Flash — 千帆视觉快速百度文心1.5-flash低成本Qianfan-VL

百度千帆VL 1.5 Flash视觉快速模型，极低价格适合大批量图像理解

32K文本图片视觉理解低成本国产

Qianfan-Check-VL — 质检视觉百度文心check-vl低成本Qianfan

百度千帆质检视觉模型，专为工业质检和图像检测场景设计

32K文本图片视觉理解低成本国产

QVQ-Plus — 视觉推理轻量通义千问Plus低成本QVQ 思考

通义千问QVQ-Plus视觉推理轻量模型，¥2/¥5，适合大批量视觉推理任务

文本图片视觉理解低成本国产

Qwen-VL-Max — 视觉理解旗舰通义千问max低成本Qwen-VL

通义千问VL-Max视觉理解旗舰模型，支持Batch调用和上下文缓存

文本图片视觉理解低成本国产

Qwen-VL-OCR — 文字识别专用通义千问ocr低成本Qwen-VL

通义千问VL-OCR文字识别专用模型，极低价格¥0.3/¥0.5，支持Batch调用半价

文本图片视觉理解低成本国产

Hunyuan-TurboS-Vision — 视觉快速版腾讯混元Turbo低成本Hunyuan

腾讯混元视觉快速版模型，支持图像理解和多模态对话，推理速度快，适合实时视觉交互。

32K文本图片视觉理解低成本国产

Hunyuan-T1-Vision — 视觉思考版腾讯混元Thinking低成本Hunyuan 思考

腾讯混元视觉思考版模型，支持视觉内容的深度推理和思维链分析，适合复杂图像理解任务。

32K文本图片视觉理解低成本国产

ERNIE-4.5-Turbo-VL — 视觉语言模型百度文心Turbo低成本ERNIE-4.5

百度文心ERNIE 4.5视觉语言模型，支持图像理解和多模态对话，128K上下文窗口。

128K文本图片视觉理解低成本国产

Qwen3-VL-Plus — 视觉Plus模型通义千问Vision低成本Qwen3 思考

通义千问视觉语言Plus模型，256K上下文，支持图像和视频理解，具备深度思考模式，阶梯定价适合多种视觉任务。

256K文本图片视频视觉理解低成本国产

Qwen3-VL-Flash — 视觉Flash模型通义千问Flash低成本Qwen3 思考

通义千问视觉语言Flash模型，256K上下文，支持图像和视频理解，输入价格低至¥0.15/百万token，高速低价视觉处理。

256K文本图片视频视觉理解低成本国产

Doubao-Seed-1.6-Vision — 视觉理解模型豆包Vision低成本Doubao-Seed

豆包视觉理解模型，支持图像和文本多模态输入，256K上下文，适合图像分析、文档理解等视觉任务。

256K文本图片视觉理解低成本国产

GLM-5V-Turbo — 多模态编程基座智谱 AITurbo低成本GLM-5

智谱AI多模态Coding基座模型，支持图像理解和文本生成，200K上下文，适合视觉编程任务。

200K文本图片视觉理解低成本国产

«1 2 3 4 5 6 7 »

OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险，如需更匹配、更安全的方案，建议联系付费定制

了解定制服务