我用 AI 自己写了一部 78 万字的网文,结果却出乎我的意料

最近我做了一个实验,用了 Claude Code ,让 AI 自己从头到尾生成了一部都市种田网文。从建项目、写总纲和详细大纲,到逐章生成正文,全程 AI 独立完成。我不做任何人工修改,包括那些明显的错误和别扭的地方,全部原样保留。

结果就是这本书:《我在城市种田养鸡》——320 章,7 卷,约 78 万字

小说点这里直接看

小说的设定本身挺典型:38 岁失业男青年方远背了一身债,突然获得「农场系统」,在自家楼顶种出品质逆天的灵植,被人质疑、自证、打脸,最后建立城市农业帝国、收获爱情。

但接下来我要说的,才是这个项目的重点。


实验是怎么做的

我先让 AI 自己生成了完整的大纲体系:总纲(全书概览、卷划分、核心设定)、爽点规划(核心卖点与爽点密度安排),以及 7 卷各一份的详细大纲、节拍表和时间线表。然后让 AI 依照这个自己生成的大纲体系逐章生成正文。

约 78 万字,320 章,平均每章约 2437.5 字。

这个过程里我完全退出,只负责看。

翻车实录:AI 写长文到底哪里不行

  1. 碎片化水文

AI 一旦不知道该写什么,就会开始写水文。

【第一……浇水。】

系统说。

【幼苗期……保持土壤湿润。】

【但不能积水。】

【每天早晚……各浇水一次。】

【早上……日出前。】

【晚上……日落后。】

【浇水量……要适中。】

【土壤表面湿润……即可。】

——第 50 章

系统用七八条短句把“适量浇水”说了个遍,就是单纯的水字数,严重影响阅读体验。

  1. 非主要人物的NPC 千人一面

群聊场景里,角色之间的区分度几乎为零:

李敏:“天啊,长得好快!才4天就这么大了!”

王强:“方远,你真专业!每天都记录!”

张婷:“嫩绿色的叶子,好治愈!”

陈静:“期待收获!”

周梅:“方远辛苦了!”

赵敏:“方远,你真用心!”

——第 50 章

全部是人类看到植物长得好的标准反应模板。

  1. 系统人设反复横跳

一个有固定身份和人格的角色,在 AI 笔下变成了“薛定谔的系统”:
第 50 章,系统用“【】”加省略号说话

【宿主。】系统的声音响起。【恭喜你。】

第 75 章,系统突然变成正常对话引号

“检测完成,”系统的声音里带着一丝惊讶,”宿主,变异体的营养成分比我们预想的还要好。”

第 125 章,系统又变成“【系统:】”的格式

【系统统:宿主,你犹豫什么?】

第 175 章,两种风格混着用

【早上好,方远。】 / 系统说。“趋势向好。”

同一个角色,AI 写了 100 章之后,连它的“说话格式”都不记得了。

  1. 数据灌水

6月12日:

早上6:30,28颗幼苗,平均株高2.1cm,子叶完全展开。

中午12:00,阳光很好,温度26度,幼苗状态良好。

晚上19:00,土壤湿度76%,幼苗挺立,无倒伏现象。

6月13日:

早上6:30,平均株高2.5cm,生长稳定。

中午12:00,温度27度,微风拂过,幼苗随风轻摇。

晚上19:00,土壤湿度77%,部分幼苗子叶开始微微变大。

6月14日:

早上6:30,平均株高3.0cm,生长速度加快。

中午12:00,温度28度,天气晴朗。

——第 50 章

这不是科研论文的数据记录,是 AI 在凑字数。当 AI 不知道怎么写成长过程的时候,就指挥列数据。

  1. 情感表达词库极其贫乏

方远眼睛亮了。——第 50 章(该章出现多次)

方远深吸一口气。——第 125 章、第 275 章、第300 章

方远笑了。——第 175 章

一个 78 万字的小说,主角表达情绪的方式就那么三四种。

  1. 剧情推进极其缓慢

前 100 章(约 25 万字)的故事时间线:

  • 第 1 章:方远获得系统,种下种子
  • 第 10 章:番茄开花
  • 第 20 章:第一次收获
  • 第 50 章:还在记录幼苗每天长了几毫米
  • 第 100 章:农业协会调查员才出场

100 章、25 万字的时间跨度为 6 个月。 中间被大量的“浇水指南”“数据记录”填充得极为松散。

README 里没写的:我还设计了一个自动审查 SubAgent

上面这些翻车,其实我在设计时已经预料到了。所以我给整个系统加了一个“自动审查机制”,这部分在 README 里没有细说。

设计思路

  • 主 Agent:负责逐章生成正文,每次只写一章。
  • 每章写完后,主 Agent 不碰这一章的内容(防止自己审自己的思维固化)。
  • 主 Agent 调用一个独立的 SubAgent(审查 Agent),把新章节正文丢给它。
  • 审查 Agent 的任务:分别根据设定、提示词、文章内容以及自己负责的具体板块(包括consistency-checker、continuity-checker、ooc-checker、reader-pull-checker、high-point-checker、pacing-checker),输出修改建议。
  • 主 Agent 拿到修改建议,将审查结果落库并修改原始章节。

关键设计:非同源上下文,防止污染

  • 主 Agent 有自己的 system prompt 和记忆(大纲、前情提要)。
  • 审查 Agent 是全新上下文,只看到当前章节 + 一份“审查规则清单”。(当然,审查Agent在运行时也会自动读取大纲和设定文件)
  • 理论上,这样审查 Agent 不会继承主 Agent 的“写作惯性”,能更客观地挑错。

实际结果却不尽如人意。

审查和修改的效果远没有达到预期。那些水文、NPC脸谱化、人设漂移等核心问题,审查 Agent 基本抓不住,哪怕抓住了主 Agent 也因为上下文污染而修改得不好。

这个失败说明:当前 LLM 的能力,还不足以胜任长文本的自动质检和修正——哪怕是专门设计的独立 SubAgent,也难以解决长程一致性和风格统一的问题。

💡 但这反而成了最有价值的地方

这个项目最大的价值,恰恰来自于 AI 的失败——包括主 Agent 的写作失败,和 SubAgent 的审查失败。

  • 如果你只是想看小说: 它确实是一部完整的种田爽文,有系统、有打脸、有感情线、有大结局。写得不算好,但 AI 自己写完的 78 万字,确实挺能读。
  • 如果你关注 AI 写作工程化: 给 AI 配一个审查 AI 并没有想象中那么美好。“非同源上下文防污染”听起来高级,但实际执行效果并不理想。
  • 如果你是做 AI Agent 的: 长上下文和长程质量是两码事。78 万字暴露出来的问题(水文、人设漂移、审查失灵)不是把模型做大就能解决的,是架构和记忆机制的硬瓶颈。

这篇文章我刻意不吹 AI 多厉害,也不唱衰 AI 没前途。这是一个实验的真实结果。AI 能完成 78 万字的超长程任务,但它会犯的错、它审稿能力的边界,上面都写清楚了。

如果你对 AI 生成内容、AI Agent 架构、网文创作感兴趣——可以来玩,帮点个 Star,或者提个Issue,让更多人打破“AI迷信”。

项目传送门

码字不易,点个赞再走吧。