最近我做了一个实验,用了 Claude Code ,让 AI 自己从头到尾生成了一部都市种田网文。从建项目、写总纲和详细大纲,到逐章生成正文,全程 AI 独立完成。我不做任何人工修改,包括那些明显的错误和别扭的地方,全部原样保留。
结果就是这本书:《我在城市种田养鸡》——320 章,7 卷,约 78 万字。
小说的设定本身挺典型:38 岁失业男青年方远背了一身债,突然获得「农场系统」,在自家楼顶种出品质逆天的灵植,被人质疑、自证、打脸,最后建立城市农业帝国、收获爱情。
但接下来我要说的,才是这个项目的重点。
实验是怎么做的
我先让 AI 自己生成了完整的大纲体系:总纲(全书概览、卷划分、核心设定)、爽点规划(核心卖点与爽点密度安排),以及 7 卷各一份的详细大纲、节拍表和时间线表。然后让 AI 依照这个自己生成的大纲体系逐章生成正文。
约 78 万字,320 章,平均每章约 2437.5 字。
这个过程里我完全退出,只负责看。
翻车实录:AI 写长文到底哪里不行
- 碎片化水文
AI 一旦不知道该写什么,就会开始写水文。
【第一……浇水。】
系统说。
【幼苗期……保持土壤湿润。】
【但不能积水。】
【每天早晚……各浇水一次。】
【早上……日出前。】
【晚上……日落后。】
【浇水量……要适中。】
【土壤表面湿润……即可。】
——第 50 章
系统用七八条短句把“适量浇水”说了个遍,就是单纯的水字数,严重影响阅读体验。
- 非主要人物的NPC 千人一面
群聊场景里,角色之间的区分度几乎为零:
李敏:“天啊,长得好快!才4天就这么大了!”
王强:“方远,你真专业!每天都记录!”
张婷:“嫩绿色的叶子,好治愈!”
陈静:“期待收获!”
周梅:“方远辛苦了!”
赵敏:“方远,你真用心!”
——第 50 章
全部是人类看到植物长得好的标准反应模板。
- 系统人设反复横跳
一个有固定身份和人格的角色,在 AI 笔下变成了“薛定谔的系统”:
第 50 章,系统用“【】”加省略号说话
【宿主。】系统的声音响起。【恭喜你。】
第 75 章,系统突然变成正常对话引号
“检测完成,”系统的声音里带着一丝惊讶,”宿主,变异体的营养成分比我们预想的还要好。”
第 125 章,系统又变成“【系统:】”的格式
【系统统:宿主,你犹豫什么?】
第 175 章,两种风格混着用
【早上好,方远。】 / 系统说。“趋势向好。”
同一个角色,AI 写了 100 章之后,连它的“说话格式”都不记得了。
- 数据灌水
6月12日:
早上6:30,28颗幼苗,平均株高2.1cm,子叶完全展开。
中午12:00,阳光很好,温度26度,幼苗状态良好。
晚上19:00,土壤湿度76%,幼苗挺立,无倒伏现象。
6月13日:
早上6:30,平均株高2.5cm,生长稳定。
中午12:00,温度27度,微风拂过,幼苗随风轻摇。
晚上19:00,土壤湿度77%,部分幼苗子叶开始微微变大。
6月14日:
早上6:30,平均株高3.0cm,生长速度加快。
中午12:00,温度28度,天气晴朗。
——第 50 章
这不是科研论文的数据记录,是 AI 在凑字数。当 AI 不知道怎么写成长过程的时候,就指挥列数据。
- 情感表达词库极其贫乏
方远眼睛亮了。——第 50 章(该章出现多次)
方远深吸一口气。——第 125 章、第 275 章、第300 章
方远笑了。——第 175 章
一个 78 万字的小说,主角表达情绪的方式就那么三四种。
- 剧情推进极其缓慢
前 100 章(约 25 万字)的故事时间线:
- 第 1 章:方远获得系统,种下种子
- 第 10 章:番茄开花
- 第 20 章:第一次收获
- 第 50 章:还在记录幼苗每天长了几毫米
- 第 100 章:农业协会调查员才出场
100 章、25 万字的时间跨度为 6 个月。 中间被大量的“浇水指南”“数据记录”填充得极为松散。
README 里没写的:我还设计了一个自动审查 SubAgent
上面这些翻车,其实我在设计时已经预料到了。所以我给整个系统加了一个“自动审查机制”,这部分在 README 里没有细说。
设计思路
- 主 Agent:负责逐章生成正文,每次只写一章。
- 每章写完后,主 Agent 不碰这一章的内容(防止自己审自己的思维固化)。
- 主 Agent 调用一个独立的 SubAgent(审查 Agent),把新章节正文丢给它。
- 审查 Agent 的任务:分别根据设定、提示词、文章内容以及自己负责的具体板块(包括consistency-checker、continuity-checker、ooc-checker、reader-pull-checker、high-point-checker、pacing-checker),输出修改建议。
- 主 Agent 拿到修改建议,将审查结果落库并修改原始章节。
关键设计:非同源上下文,防止污染。
- 主 Agent 有自己的 system prompt 和记忆(大纲、前情提要)。
- 审查 Agent 是全新上下文,只看到当前章节 + 一份“审查规则清单”。(当然,审查Agent在运行时也会自动读取大纲和设定文件)
- 理论上,这样审查 Agent 不会继承主 Agent 的“写作惯性”,能更客观地挑错。
实际结果却不尽如人意。
审查和修改的效果远没有达到预期。那些水文、NPC脸谱化、人设漂移等核心问题,审查 Agent 基本抓不住,哪怕抓住了主 Agent 也因为上下文污染而修改得不好。
这个失败说明:当前 LLM 的能力,还不足以胜任长文本的自动质检和修正——哪怕是专门设计的独立 SubAgent,也难以解决长程一致性和风格统一的问题。
💡 但这反而成了最有价值的地方
这个项目最大的价值,恰恰来自于 AI 的失败——包括主 Agent 的写作失败,和 SubAgent 的审查失败。
- 如果你只是想看小说: 它确实是一部完整的种田爽文,有系统、有打脸、有感情线、有大结局。写得不算好,但 AI 自己写完的 78 万字,确实挺能读。
- 如果你关注 AI 写作工程化: 给 AI 配一个审查 AI 并没有想象中那么美好。“非同源上下文防污染”听起来高级,但实际执行效果并不理想。
- 如果你是做 AI Agent 的: 长上下文和长程质量是两码事。78 万字暴露出来的问题(水文、人设漂移、审查失灵)不是把模型做大就能解决的,是架构和记忆机制的硬瓶颈。
这篇文章我刻意不吹 AI 多厉害,也不唱衰 AI 没前途。这是一个实验的真实结果。AI 能完成 78 万字的超长程任务,但它会犯的错、它审稿能力的边界,上面都写清楚了。
如果你对 AI 生成内容、AI Agent 架构、网文创作感兴趣——可以来玩,帮点个 Star,或者提个Issue,让更多人打破“AI迷信”。
码字不易,点个赞再走吧。


