AI lesson 07 · 多模态 AI

AI 不只会读文字,也能看图片

体验多模态 AI:让 AI 观察图片、描述图片、提取信息,同时区分确定内容和推测内容。

图片输入 观察 描述 推测 隐私图片

Lesson story

先把这一课放进真实学习场景里。

AI 可以从图片中识别物体、场景和关系。但它不是亲眼在现场,也不知道图片背后的全部故事。

因此,图片分析要分成两类:我确定看到了什么,以及我只是根据画面推测了什么。

第 07 课 3D 插图:机器人和小朋友学习 AI 不只会读文字,也能看图片
每一课都用“学生 + AI 伙伴”的方式,把概念转成可操作的学习任务。

Core ideas

本课要抓住的核心概念。

确定内容

画面中清楚可见的物体、颜色、位置和数量。

推测内容

可能发生的事情、人物意图、地点背景等。

隐私图片

包含人脸、住址、证件、车牌、学校账号的图片不用于课堂项目。

观察报告

把 AI 观察和自己的补充观察放在一起。

Workflow

把学习过程画成流程图。

  1. 1选择非隐私图片step 1
  2. 2让 AI 描述主要物体step 2
  3. 3区分确定和推测step 3
  4. 4补充自己的观察step 4
  5. 5完成观察报告step 5

Example

示例 Prompt 或代码。

先不要急着复制。读完后想一想:它给了 AI 哪些角色、任务、背景、格式和限制?如果换成你的学习目标,应该改哪几处?

示例 Prompt
请观察这张图片,并回答:
1. 图片中有哪些主要物体?
2. 可能发生了什么?
3. 哪些内容是你确定的?
4. 哪些内容只是你的推测?

Practice

课堂练习与检查点。

课堂练习

选择一张植物、文具或风景图,让 AI 写出确定内容和推测内容。

自我检查

  • 图片不包含隐私。
  • AI 没有把推测当事实。
  • 我加入了自己的补充观察。

课后作品

拍一张非隐私图片,让 AI 生成观察报告,禁止上传人脸、家庭住址、证件、车牌等敏感图片。

Lesson complete

学完这一课,你应该能把 AI 用得更清楚、更安全。

图片输入 观察 描述 推测 隐私图片