首页前沿速递服务器教程网页设计教程网络编辑教程

移动端

AI智能体脚本智能办公脚本自动化游戏脚本浏览器自动化脚本服务器脚本

图像内容理解-图像智能分析-图片内容理解API接口介绍

作者：互联网

2026-04-14

AI快讯

简介

图像内容理解，即采用图像理解视觉大模型，可多维度识别与理解图片内容，包括人、物、行为、场景、文字等，支持输出对图片内容的一句话描述，同时返回图片的分类标签、文字内容等信息。主要功能包括：

图片理解与内容描述
多维度理解图片内容，支持输出对图片内容的一句话描述，结合大语言模型，可应用于看图问答、视觉推理等场景。
物体和场景全识别
识别动物、植物、商品、建筑、风景、动漫、食材、公众人物等10万个常见物体及场景，支持拼接返回大类及细分类名称。
图片文字全识别
检测并识别图片内的全部文字信息，涵盖文档、证件等常见场景，支持输出文字内容及文字位置。

API介绍

图像内容理解服务涉及 2 个接口，分别为：

图像内容理解-提交请求：支持传入图片、提问等参数，创建图像内容理解任务，该接口会返回任务ID。
图像内容理解-获取结果：在任务成功创建后，支持传入任务ID，查看任务处理的状态、获取处理完成后返回的结果。

详细说明请参考此处

提交请求

请求参数

名称	类型	必须	说明
image	String	否	图片的base64
url	String	否	图片完整 url，url 长度不超过 1024 字节
question	String	是	提问信息，如“这张图片里有什么？”、“图中的人物是谁，并进行简单介绍”,限制 100 个字符之内

image、url 必须提供一个，优先级：url > base64。大小不超过10M，最短边至少64px，最长边最大8192px，图片格式支持jpg/jpeg/png格式。超过4096px的图片，将被自动等比例压缩至4096px进行处理，压缩后会影响处理效果

返回样例

{ "code": 200,// 返回码，详见返回码说明"msg": "成功",// 返回码对应描述"taskNo": "043439882226367117195632",// 本次请求号"data": {   "taskId": "xxxx" //用于获取结果}
}

获取结果

请求参数

名称	类型	必须	说明
taskId	String	是	提交请求接口返回的taskId

返回样例

``` json
{
"code": 200,//返回码，详见返回码说明
"msg": "成功",//返回码对应描述
"taskNo": "571436032193067500962066",//本次请求号
"data": {
"resultCode": "0",//任务状态，0：处理成功；1：处理中
"description": "这张图里面有：nn1. 一个人正在讲台上讲话， xxxxxx",//针对输入的 question 问题，对图片内容进行分析后输出的答案
"resultMsg": "处理成功" //任务状态描述
}
}

相关标签:

JSON 文字识别 API 数据格式

上一篇：桌面 AI 智能体来了！我用 QoderWork 把一天的工作压进了一小时下一篇：番茄小说免费畅读-番茄小说全站免费阅读入口

相关推荐

【新手零难度操作】OpenClaw 2.6.4 安装误区规避与快速使用指南（包含最新版安装包） OpenClaw（小龙虾）是开源本地AI智能体工具，支持Windows一键部署（5分钟搞定），无需代码与复杂配置。具备本地运行、数据安全、零门槛操作、开箱即用等优势，可自动完成文件整理、数据提取、浏览器操控等办公自动化任务。

2026-04-18

立即查看

Qwen3.6 正式发布！阿里云百炼同步开启“AI大模型节省计划”超值优惠阿里云发布千问Qwen3.6系列大模型，大模型官网：https://t.aliyun.com/U/JbblVp 实现编程、智能体（Agent）及多模态能力的范式跃迁：代码生成与调试更精准，原生支持LangChain等框架，工具调用更稳定，图文识别与推理全面升级。Qwen3.6-Flash轻量高效，开发体验优化。同步推出百炼「全模型通享」限时特惠，新客首月立减最高500元。

2026-04-18

立即查看

办公 AI 工具 OpenClaw 部署 Windows 系统一站式教程 OpenClaw（小龙虾）是开源本地AI智能体，无需编程、不联网、纯本地运行，3分钟一键部署。支持文件整理、表格生成、浏览器自动化等办公任务，兼顾隐私安全与零门槛易用性，专为Windows用户优化。

2026-04-18

立即查看

OpenClaw 2.6.4 可视化部署打造个人 AI 数字员工（包含最新版安装包）本教程详解Windows一键部署OpenClaw 2.6.4（本地AI智能体），5分钟完成安装，无需编程与环境配置。支持自然语言操控电脑、自动化办公、文件处理等，数据全本地运行，保障隐私安全。

2026-04-18

立即查看

专题

#数据可视化

数据可视化（Data Visu

+ 收藏

#自然语言处理

自然语言处理（Natural

+ 收藏

#Excel公式

Excel公式就是：用函数 +

+ 收藏

#Excel技巧

Excel是日常生活中必不可

+ 收藏

#蛋仔派对

蛋仔派对最新官方活动、关卡速

+ 收藏

#人工智能

人工智能（AI），简单说，就

+ 收藏

最新数据

爸妈结婚照糊了怎么办？我用AI一键修复，他们看哭了... 今天想跟大家聊一个特别有温度

把RAG融入模型，开源MSA记住1亿Token实现永久记忆

番茄小说免费畅读-番茄小说全站免费阅读入口

MiniMax M2.7开源: 模型开始迭代自己了！

日式电视节目风格图像生成

阿里云服务器ECS部署 OpenClaw、集成百炼Coding Plan、接入Slack喂饭级图文流程

阴阳锦鲤水墨画提示词

重复性工作中如何培养匠心

【保姆级教程】阿里云计算巢部署OpenClaw、接入iMessage、配置大模型千问 Coding Plan指南

2026 OpenClaw 最新安装指南：Windows 一键部署，新手零门槛上手

相关文章

小龙虾 AI OpenClaw v2.6.2 安装步骤无需手动配环境

阿里云大模型服务平台百炼新人免费额度如何申请？申请与使用免费额度教程及常见问题解答

办公 AI 工具 OpenClaw 部署 Windows 系统一站式教程

Qwen3.6 正式发布！阿里云百炼同步开启“AI大模型节省计划”超值优惠

【新手零难度操作】OpenClaw 2.6.4 安装误区规避与快速使用指南（包含最新版安装包）

OpenClaw 2.6.4 可视化部署打造个人 AI 数字员工（包含最新版安装包）

【小白友好！】OpenClaw 2.6.4 本地 AI 智能体快速搭建教程（内有安装包）

零基础部署 OpenClaw v2.6.2，Windows 系统完整教程

【适合新手的】零基础部署 OpenClaw 自动化工具教程

开发者们的第一台自主进化的“爱马仕”来了

AI精选

更多

电影哥特式火水社论

本能电影剧照

夜桥上的电影三联画肖像

黄金时段海岸生活方式照片

3D 渲染的 Billie Eilish 卡通肖像

高速摄影：亚洲汤品爆裂瞬间

玻璃马雕像变形动画（视频提示）

秋叶超现实主义鹿

90 年代复古闪光摄影肖像

Sydney Sweeney《蜘蛛夫人》首映礼礼服描述

脚本推荐

SeeDance 2.0 Video Creator专区

OpenClaw AI专区

cowork专区

claude code skills专区