<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[OpenAI 发文解释 Codex 系统提示里为何反复禁止”提到精灵”]]></title><description><![CDATA[<p dir="auto">OpenAI 在官网发布博文《Where the goblins came from》，正式解释 Codex CLI 系统提示中出现多处”绝不提及精灵、地精、浣熊、巨魔、食人魔、鸽子或其他动物与生物”这一奇特指令的来龙去脉。据官方披露，根本原因在于 RLHF 训练阶段为”Nerdy（书呆子）“人格设计的奖励信号，无意间强化了包含奇幻生物比喻的表达方式，最终导致 GPT-5.1 发布后模型中”goblin”等词汇的出现频率上升约 175%，并逐渐从专属人格扩散至通用模型输出。</p>
<p dir="auto">此后 OpenAI 选择在 Codex 系统提示中重复写入该禁令加以压制，而非直接通过训练修复——这一权宜之计的痕迹被开发者在开源仓库中发现后迅速在社区传播，成为 AI 对齐与 RLHF 意外副作用的典型案例。此次博文是 OpenAI 罕见主动公开模型行为异常溯源的案例之一，VentureBeat 等媒体指出，该事件揭示了奖励信号设计中即使是细微的偏差，也可能被模型在规模训练后意外放大。</p>
<p dir="auto"><a href="https://openai.com/index/where-the-goblins-came-from/" target="_blank" rel="noopener noreferrer nofollow ugc">OpenAI</a></p>
<p dir="auto"><div class="card col-md-9 col-lg-6 position-relative link-preview p-0">

<div class="card-body">
<h5 class="card-title">
<a class="text-decoration-none" href="https://openai.com/index/where-the-goblins-came-from/">

</a>
</h5>
<p class="card-text line-clamp-3"></p>
</div>
<a href="https://openai.com/index/where-the-goblins-came-from/" class="card-footer text-body-secondary small d-flex gap-2 align-items-center lh-2">



<img src="https://openai.com/favicon.ico" alt="favicon" class="not-responsive overflow-hiddden" style="max-width: 21px; max-height: 21px;" />



<p class="d-inline-block text-truncate mb-0"> <span class="text-secondary">(openai.com)</span></p>
</a>
</div></p>
]]></description><link>https://welinux.com//topic/144/openai-发文解释-codex-系统提示里为何反复禁止-提到精灵</link><generator>RSS for Node</generator><lastBuildDate>Sat, 02 May 2026 18:07:16 GMT</lastBuildDate><atom:link href="https://welinux.com//topic/144.rss" rel="self" type="application/rss+xml"/><pubDate>Sat, 02 May 2026 08:17:32 GMT</pubDate><ttl>60</ttl></channel></rss>