从 imagegen 开始认识 Codex Skill:普通用户快速上手
Posted May 29, 2026 by XAI 技术团队 ‐ 7 min read

很多人第一次看到 SKILL.md,会以为它是给开发者看的配置文件。其实对普通用户来说,skill 更像是 给 Codex 装上的专门能力包。
你不需要先理解复杂的插件系统,也不需要自己写代码。先从一个最直观的例子开始:imagegen。
imagegen 是 Codex 内置的系统 skill,用来生成或编辑图片。比如你可以让 Codex 生成博客封面、产品概念图、网站 hero 背景、游戏素材、UI mockup,或者根据参考图做视觉变体。
一句话理解:
普通 prompt 是临时说一遍怎么做。
skill 是把一类任务的做法长期保存下来,需要时直接调用。先看一个最小例子
打开 Codex 后,在对话里输入:
用 $imagegen 生成一张 16:9 博客封面图,主题是 Codex Skills,风格干净、科技感、适合文档站首页。这不是在终端里执行命令,而是在 Codex 对话框里输入。
如果当前 Codex 环境支持这个内置 skill,Codex 会加载 imagegen 的 SKILL.md,理解它应该如何处理图片生成任务。它不仅知道“要作图”,也知道生成图片后应该如何保存、什么时候需要放进项目目录、什么时候只是预览。
这就是 skill 和普通 prompt 的区别。
SKILL.md 到底是什么
一个 skill 通常是一个文件夹,核心文件叫 SKILL.md。最小结构类似这样:
imagegen/
SKILL.md
scripts/
references/
assets/其中 SKILL.md 会告诉 Codex:
- 这个 skill 适合什么任务
- 什么时候不该用它
- 具体工作流程是什么
- 是否需要脚本、参考资料或素材
- 结果应该如何交付
所以 SKILL.md 不是普通说明文档。它更像是 Codex 可读取的工作手册。
以 imagegen 为例,它会告诉 Codex:图片生成默认走内置作图工具;如果用户只是普通生成或编辑图片,不需要单独配置 OPENAI_API_KEY;只有用户明确选择 CLI/API fallback 时,才会进入需要 API Key 的路径。
imagegen 适合做什么
普通用户最容易理解的场景有这些:
1. 生成博客封面
用 $imagegen 生成一张适合博客文章的封面图。
主题:AI agent 的技能库
比例:16:9
风格:清爽、现代、适合技术博客
不要文字,不要 logo。2. 给网站做视觉素材
用 $imagegen 为当前文档站生成一个 SKILL.md 技能库页面的背景图。
要求:抽象卡片网格、轻量科技感、不要文字,适合浅色和深色模式。
如果结果要用于项目,请保存到 static/images/skills-library-cover.png。这个例子里,最后一句很重要。如果你希望图片进入项目,就要明确说保存路径。Codex 才能把最终图片放到仓库里,而不是只停留在临时预览。
3. 根据现有图片继续改
用 $imagegen 把这张封面图改得更适合产品文档站:
减少装饰元素,增加信息秩序感,保留整体色调。如果你上传了图片,Codex 可以把它当作编辑目标或参考图。你也可以明确说明:
第一张图作为编辑目标,第二张图只作为风格参考。这种角色说明越清楚,结果越稳定。
system skill 和 curated skill 有什么区别
在 SKILL 页面 里,你会看到两类 skill:
.system:Codex 内置,通常不需要安装.curated:OpenAI 精选技能,需要用安装器安装
imagegen 属于 .system,所以不需要执行安装。
如果你看到的是 chatgpt-apps、linear、pdf、vercel-deploy 这类 .curated skill,安装方式是在 Codex 对话里输入:
$skill-installer chatgpt-apps注意:这仍然是在 Codex 对话里输入,不是在系统终端里执行。
不要这样做:
$skill-installer chatgpt-apps在 shell 里,$skill-installer 会被当作环境变量展开,它不是命令。
安装完成后,通常需要重启 Codex,新的 skill 才会出现在可用列表里。
怎么知道自己有哪些 skill
最简单的方式是在 Codex 里试:
/skills或者直接输入 $,看 Codex 是否弹出可用 skill 列表。
你也可以从本站顶部的 技能库 入口进入 SKILL 技能库,按名称、用途或分类搜索。比如:
- 想作图:搜
imagegen - 想读 PDF:搜
pdf - 想部署网站:搜
vercel-deploy、netlify-deploy - 想处理 GitHub CI:搜
gh-fix-ci - 想做安全分析:搜
security-threat-model
普通用户的推荐用法
刚开始不需要学所有 skill。按下面这个顺序就够了:
- 先用内置 skill:比如
$imagegen、$skill-creator、$skill-installer - 有明确任务时再搜索:去
𝑆𝐾𝐼𝐿𝐿页面找对应 skill - 看到
.curatedskill 后,用$skill-installer <name>安装 - 安装后重启 Codex
- 下次对话里直接点名调用:比如
用 $pdf 检查这个文件
如果你不知道该不该点名 skill,可以直接自然语言描述任务。Codex 有时也会根据任务自动选择合适的 skill。但对新手来说,显式写 $imagegen、$pdf、$linear 更容易理解,也更可控。
常见误区
误区一:把 skill 当成新模型
Skill 不是模型。imagegen 不是一个新模型名,它是一套工作流程说明。
模型负责生成或推理,skill 负责告诉 Codex:这类任务应该按什么步骤做。
误区二:把 $skill-installer 当终端命令
$skill-installer chatgpt-apps 应该输入到 Codex 对话里。
终端命令通常长这样:
codex或者:
npm i -g @openai/codex@latest两者不要混淆。
误区三:所有 skill 都要安装
不需要。.system 类型已经内置,例如:
imagegenopenai-docsskill-installerskill-creatorplugin-creator
只有 .curated 或第三方 skill 才需要安装。
误区四:第三方 skill 可以随便装
不要把 skill 只当成“提示词”。一个 skill 可能包含脚本、参考文件和自动化步骤。安装第三方来源前,最好先看它的 SKILL.md 和脚本内容。
最后,用一句话记住
如果你只记住一件事:
Skill 是 Codex 的可复用工作流。imagegen 是最容易上手的例子:在 Codex 里输入 $imagegen,然后用自然语言描述你想要的图片。想找更多现成 skill,可以从站点顶部的 技能库 开始。想系统理解 skill、prompt 和 plugin 的区别,可以继续看《OpenAI Skills 是什么?普通用户也能看懂的上手指南》。
参考资源: