标签: 视觉理解
Qianfan-VL-70B — 千帆视觉大模型百度文心中等Qianfan-VL
百度千帆自研70B视觉理解大模型,支持图像理解和多模态推理
32K文本 图片视觉理解标准国产
Qianfan-VL-8B — 千帆视觉轻量百度文心8b低成本Qianfan-VL
百度千帆自研8B视觉理解轻量模型,性价比高
32K文本 图片视觉理解低成本国产
Qianfan-VL-1.5-Flash — 千帆视觉快速百度文心1.5-flash低成本Qianfan-VL
百度千帆VL 1.5 Flash视觉快速模型,极低价格适合大批量图像理解
32K文本 图片视觉理解低成本国产
Qianfan-Check-VL — 质检视觉百度文心check-vl低成本Qianfan
百度千帆质检视觉模型,专为工业质检和图像检测场景设计
32K文本 图片视觉理解低成本国产
PaddleOCR-VL — 文档解析OCR百度文心免费PaddleOCR
百度飞桨PaddleOCR视觉语言模型,先进高效的文档解析模型,专为文档元素识别设计,按页计费¥0.09/页(限时5折)
文本 图片视觉理解免费国产
QVQ-Plus — 视觉推理轻量通义千问Plus低成本QVQ 思考
通义千问QVQ-Plus视觉推理轻量模型,¥2/¥5,适合大批量视觉推理任务
文本 图片视觉理解低成本国产
Qwen-VL-Max — 视觉理解旗舰通义千问max低成本Qwen-VL
通义千问VL-Max视觉理解旗舰模型,支持Batch调用和上下文缓存
文本 图片视觉理解低成本国产
Qwen-VL-OCR — 文字识别专用通义千问ocr低成本Qwen-VL
通义千问VL-OCR文字识别专用模型,极低价格¥0.3/¥0.5,支持Batch调用半价
文本 图片视觉理解低成本国产
Hunyuan-TurboS-Vision — 视觉快速版腾讯混元Turbo低成本Hunyuan
腾讯混元视觉快速版模型,支持图像理解和多模态对话,推理速度快,适合实时视觉交互。
32K文本 图片视觉理解低成本国产
Hunyuan-T1-Vision — 视觉思考版腾讯混元Thinking低成本Hunyuan 思考
腾讯混元视觉思考版模型,支持视觉内容的深度推理和思维链分析,适合复杂图像理解任务。
32K文本 图片视觉理解低成本国产
Hunyuan-Vision — 视觉旗舰模型腾讯混元中等Hunyuan
腾讯混元视觉旗舰模型,提供最高质量的图像理解和多模态融合能力,适合专业视觉分析场景。
32K文本 图片视觉理解标准国产
ERNIE-4.5-Turbo-VL — 视觉语言模型百度文心Turbo低成本ERNIE-4.5
百度文心ERNIE 4.5视觉语言模型,支持图像理解和多模态对话,128K上下文窗口。
128K文本 图片视觉理解低成本国产
Qwen3-VL-Plus — 视觉Plus模型通义千问Vision低成本Qwen3 思考
通义千问视觉语言Plus模型,256K上下文,支持图像和视频理解,具备深度思考模式,阶梯定价适合多种视觉任务。
256K文本 图片 视频视觉理解低成本国产
Qwen3-VL-Flash — 视觉Flash模型通义千问Flash低成本Qwen3 思考
通义千问视觉语言Flash模型,256K上下文,支持图像和视频理解,输入价格低至¥0.15/百万token,高速低价视觉处理。
256K文本 图片 视频视觉理解低成本国产
QVQ-Max — 视觉推理旗舰通义千问中等QVQ 思考
通义千问QVQ视觉推理旗舰模型,具备深度思考能力,在复杂图像理解和分析任务上表现卓越,适合高精度视觉推理场景。
131.1K文本 图片视觉理解标准国产
Doubao-Seed-1.6-Vision — 视觉理解模型豆包Vision低成本Doubao-Seed
豆包视觉理解模型,支持图像和文本多模态输入,256K上下文,适合图像分析、文档理解等视觉任务。
256K文本 图片视觉理解低成本国产
GLM-5V-Turbo — 多模态编程基座智谱 AITurbo低成本GLM-5
智谱AI多模态Coding基座模型,支持图像理解和文本生成,200K上下文,适合视觉编程任务。
200K文本 图片视觉理解低成本国产
GLM-4.6V — 视觉推理模型智谱 AIVision低成本GLM-4
智谱AI视觉推理模型,支持图像理解和函数调用,128K上下文,32K输出。
128K文本 图片视觉理解低成本国产
GLM-OCR — 轻量图文解析智谱 AILite低成本GLM
智谱AI轻量级OCR模型,支持图像文字识别和PDF文档解析,适合文档数字化场景。
文本 图片视觉理解低成本国产
AutoGLM-Phone — 手机智能助理智谱 AI低成本AutoGLM
智谱AI手机智能助理模型,支持手机自动化操控,通过视觉理解实现移动设备智能交互。
20K文本 图片视觉理解低成本国产
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制