跳转至

Segment Anything / SAM(视觉感知基础模型代表作)

📌 一句话:可提示(点/框)就能分割"任何东西"的通用分割模型,零样本泛化强;机器人视觉感知前端(物体/区域分割、抓取候选)常拿它当现成模块。 🎬 项目页 · 代码 ⚠️ 代表作占位卡:基于公认出处/摘要,未精读全文;SAM 本身非机器人专用,是被机器人广泛复用的视觉工具。

🧰 对我们(速判)

  • 感知层即取即用工具:分割/物体定位/抓取前处理,省去自训分割。
  • 真实性:高(Meta、ICCV23、全开源、业界标配)→ 证据 A。
  • 能借:✅ 代码 + ✅ 权重 + 大量下游(SAM2/机器人 fork)。
  • 注意:通用视觉模型,不含动作/触觉;只是感知一环。

与我们的关系

  • 感知层(视觉),与触觉是同层不同模态;机器人系统里常"SAM 出物体掩码 → 喂给大脑(VLA)/抓取"。

来源