AI lesson 07 · 多模态 AI

AI 不只会读文字，也能看图片

体验多模态 AI：让 AI 观察图片、描述图片、提取信息，同时区分确定内容和推测内容。

开始本课返回 AI 路线

图片输入观察描述推测隐私图片

Lesson story

先把这一课放进真实学习场景里。

AI 可以从图片中识别物体、场景和关系。但它不是亲眼在现场，也不知道图片背后的全部故事。

因此，图片分析要分成两类：我确定看到了什么，以及我只是根据画面推测了什么。

Core ideas

画面中清楚可见的物体、颜色、位置和数量。

可能发生的事情、人物意图、地点背景等。

包含人脸、住址、证件、车牌、学校账号的图片不用于课堂项目。

把 AI 观察和自己的补充观察放在一起。

Workflow

Example

先不要急着复制。读完后想一想：它给了 AI 哪些角色、任务、背景、格式和限制？如果换成你的学习目标，应该改哪几处？

示例 Prompt

请观察这张图片，并回答：
1. 图片中有哪些主要物体？
2. 可能发生了什么？
3. 哪些内容是你确定的？
4. 哪些内容只是你的推测？

Practice

选择一张植物、文具或风景图，让 AI 写出确定内容和推测内容。

拍一张非隐私图片，让 AI 生成观察报告，禁止上传人脸、家庭住址、证件、车牌等敏感图片。

Lesson complete

图片输入 观察 描述 推测 隐私图片

上一课返回 20 课目录下一课：事实核查