从 imagegen 开始认识 Codex Skill:普通用户快速上手

Posted May 29, 2026 by XAI 技术团队 ‐ 7 min read

很多人第一次看到 SKILL.md,会以为它是给开发者看的配置文件。其实对普通用户来说,skill 更像是 给 Codex 装上的专门能力包

你不需要先理解复杂的插件系统,也不需要自己写代码。先从一个最直观的例子开始:imagegen

imagegen 是 Codex 内置的系统 skill,用来生成或编辑图片。比如你可以让 Codex 生成博客封面、产品概念图、网站 hero 背景、游戏素材、UI mockup,或者根据参考图做视觉变体。

一句话理解:

普通 prompt 是临时说一遍怎么做。
skill 是把一类任务的做法长期保存下来,需要时直接调用。

先看一个最小例子

打开 Codex 后,在对话里输入:

用 $imagegen 生成一张 16:9 博客封面图,主题是 Codex Skills,风格干净、科技感、适合文档站首页。

这不是在终端里执行命令,而是在 Codex 对话框里输入

如果当前 Codex 环境支持这个内置 skill,Codex 会加载 imagegenSKILL.md,理解它应该如何处理图片生成任务。它不仅知道“要作图”,也知道生成图片后应该如何保存、什么时候需要放进项目目录、什么时候只是预览。

这就是 skill 和普通 prompt 的区别。


SKILL.md 到底是什么

一个 skill 通常是一个文件夹,核心文件叫 SKILL.md。最小结构类似这样:

imagegen/
  SKILL.md
  scripts/
  references/
  assets/

其中 SKILL.md 会告诉 Codex:

  • 这个 skill 适合什么任务
  • 什么时候不该用它
  • 具体工作流程是什么
  • 是否需要脚本、参考资料或素材
  • 结果应该如何交付

所以 SKILL.md 不是普通说明文档。它更像是 Codex 可读取的工作手册。

imagegen 为例,它会告诉 Codex:图片生成默认走内置作图工具;如果用户只是普通生成或编辑图片,不需要单独配置 OPENAI_API_KEY;只有用户明确选择 CLI/API fallback 时,才会进入需要 API Key 的路径。


imagegen 适合做什么

普通用户最容易理解的场景有这些:

1. 生成博客封面

用 $imagegen 生成一张适合博客文章的封面图。
主题:AI agent 的技能库
比例:16:9
风格:清爽、现代、适合技术博客
不要文字,不要 logo。

2. 给网站做视觉素材

用 $imagegen 为当前文档站生成一个 SKILL.md 技能库页面的背景图。
要求:抽象卡片网格、轻量科技感、不要文字,适合浅色和深色模式。
如果结果要用于项目,请保存到 static/images/skills-library-cover.png。

这个例子里,最后一句很重要。如果你希望图片进入项目,就要明确说保存路径。Codex 才能把最终图片放到仓库里,而不是只停留在临时预览。

3. 根据现有图片继续改

用 $imagegen 把这张封面图改得更适合产品文档站:
减少装饰元素,增加信息秩序感,保留整体色调。

如果你上传了图片,Codex 可以把它当作编辑目标或参考图。你也可以明确说明:

第一张图作为编辑目标,第二张图只作为风格参考。

这种角色说明越清楚,结果越稳定。


system skill 和 curated skill 有什么区别

SKILL 页面 里,你会看到两类 skill:

  • .system:Codex 内置,通常不需要安装
  • .curated:OpenAI 精选技能,需要用安装器安装

imagegen 属于 .system,所以不需要执行安装。

如果你看到的是 chatgpt-appslinearpdfvercel-deploy 这类 .curated skill,安装方式是在 Codex 对话里输入:

$skill-installer chatgpt-apps

注意:这仍然是在 Codex 对话里输入,不是在系统终端里执行。

不要这样做:

$skill-installer chatgpt-apps

在 shell 里,$skill-installer 会被当作环境变量展开,它不是命令。

安装完成后,通常需要重启 Codex,新的 skill 才会出现在可用列表里。


怎么知道自己有哪些 skill

最简单的方式是在 Codex 里试:

/skills

或者直接输入 $,看 Codex 是否弹出可用 skill 列表。

你也可以从本站顶部的 技能库 入口进入 SKILL 技能库,按名称、用途或分类搜索。比如:

  • 想作图:搜 imagegen
  • 想读 PDF:搜 pdf
  • 想部署网站:搜 vercel-deploynetlify-deploy
  • 想处理 GitHub CI:搜 gh-fix-ci
  • 想做安全分析:搜 security-threat-model

普通用户的推荐用法

刚开始不需要学所有 skill。按下面这个顺序就够了:

  1. 先用内置 skill:比如 $imagegen$skill-creator$skill-installer
  2. 有明确任务时再搜索:去 𝑆𝐾𝐼𝐿𝐿 页面找对应 skill
  3. 看到 .curated skill 后,用 $skill-installer <name> 安装
  4. 安装后重启 Codex
  5. 下次对话里直接点名调用:比如 用 $pdf 检查这个文件

如果你不知道该不该点名 skill,可以直接自然语言描述任务。Codex 有时也会根据任务自动选择合适的 skill。但对新手来说,显式写 $imagegen$pdf$linear 更容易理解,也更可控。


常见误区

误区一:把 skill 当成新模型

Skill 不是模型。imagegen 不是一个新模型名,它是一套工作流程说明。

模型负责生成或推理,skill 负责告诉 Codex:这类任务应该按什么步骤做。

误区二:把 $skill-installer 当终端命令

$skill-installer chatgpt-apps 应该输入到 Codex 对话里。

终端命令通常长这样:

codex

或者:

npm i -g @openai/codex@latest

两者不要混淆。

误区三:所有 skill 都要安装

不需要。.system 类型已经内置,例如:

  • imagegen
  • openai-docs
  • skill-installer
  • skill-creator
  • plugin-creator

只有 .curated 或第三方 skill 才需要安装。

误区四:第三方 skill 可以随便装

不要把 skill 只当成“提示词”。一个 skill 可能包含脚本、参考文件和自动化步骤。安装第三方来源前,最好先看它的 SKILL.md 和脚本内容。


最后,用一句话记住

如果你只记住一件事:

Skill 是 Codex 的可复用工作流。imagegen 是最容易上手的例子:在 Codex 里输入 $imagegen,然后用自然语言描述你想要的图片。

想找更多现成 skill,可以从站点顶部的 技能库 开始。想系统理解 skill、prompt 和 plugin 的区别,可以继续看《OpenAI Skills 是什么?普通用户也能看懂的上手指南》。

参考资源: