小说文本整理器

小说文本整理器 是专门为网络小说、电子书等长篇文本设计的整理工具。它能自动修复格式错乱、清理无用内容、优化排版,让杂乱的小说文本变得整齐易读。

这个工具能解决什么问题?

从网上下载的小说经常遇到这些问题:

  • 排版乱:段落不分、章节混在一起
  • 有垃圾内容:广告信息、下载器标记、群号推广
  • 格式不统一:有的是繁体字,有的字符显示异常
  • 换行混乱:该分段的地方没分,不该分的地方乱分行

小说文本处理器可以一键解决这些问题,让您获得干净、整齐的阅读文本。

如何使用这个工具?

第一步:上传文件

  • 文件上传:点击上传区域或直接把 TXT 文件拖进去
  • 批量处理:可以一次上传多个小说文件,工具会自动逐个处理
  • 直接粘贴:也可以直接把文本内容粘贴到输入框里

第二步:选择处理功能

基础功能(建议都勾选):

  • ✅ 智能换行:自动判断哪里该合并,让文本排版更合理
  • ✅ 段落缩进:每段开头自动空两格,看起来更像正规书籍
  • ✅ 处理章节标题:识别"第X章"这样的标题,自动格式化
  • ✅ 智能清理:去掉多余的空格和特殊符号

可选功能

  • 繁体转简体:如果是繁体小说,可以转成简体字
  • 清除行尾数字:去掉每行末尾的页码或编号
  • 智能分段:把太长的段落分成更小的段落,手机阅读更舒服
  • 删除重复行:自动删除相邻的重复行,减少冗余内容

过滤设置

  • 过滤词:输入不想要的内容,比如"群号"、"下载器",工具会自动删除包含这些词的行
  • 特殊起始文本:如果小说名字总是出现在不该出现的地方,输入小说名,工具会特殊处理

第三步:开始处理

  1. 点击"整理文本"按钮
  2. 等待几秒钟,工具自动完成处理
  3. 处理完成后,内容会自动复制到剪贴板,同时显示在结果区域

第四步:保存结果

  • 复制文本:点击"复制结果"把处理好的文本复制出来
  • 导出文件:点击"导出文件"直接保存为 TXT 文件
  • 自动导出:勾选"自动导出文件",处理完直接保存,不显示预览

特别实用的功能

批量处理模式

  • 一次可以处理几十个小说文件
  • 每个文件都会自动保存,文件名保持不变
  • 特别适合整理下载的小说合集

章节分割功能

  • 单独的"章节分割"按钮,专门处理章节标题格式
  • 适合那些章节名没有正确换行的文本

大文件优化

  • 处理超大文件时,勾选"大文件优化"避免页面卡顿
  • 系统会隐藏预览,直接处理和导出

使用建议和注意事项

注意事项

  • ⚠️ 备份原文件:处理前最好备份原始文件,万一效果不满意可以重新调整
  • ⚠️ 逐步调整:如果文本很重要,建议先处理一小部分测试效果
  • ⚠️ 过滤谨慎使用:过滤词功能很强大,但要小心不要误删正文内容

什么情况下最有用?

  • 从小说网站下载的格式混乱的文本
  • 通过爬虫或下载器获取的小说文件
  • 需要批量整理的小说合集
  • OCR识别后格式不规整的文本
  • 准备导入电子书软件前的文本清理

这个工具完全在浏览器本地运行,不会上传您的文件到任何服务器,可以放心使用。

技术细节说明

如果你想了解工具具体如何处理文本,这里是详细的处理流程:

自动处理步骤

  1. 统一换行符:将不同系统的换行符统一为标准格式
  2. 清理垃圾内容:移除下载器标记、"分卷阅读"等无用信息
  3. 字符标准化:将全角英文和数字转为半角,清理乱码字符
  4. 繁体转简体:使用 OpenCC 引擎进行准确转换
  5. 章节格式化:识别并规范化章节标题格式
  6. 智能换行处理:根据中文标点判断合并或分段

高级处理规则

对于复杂的垃圾文本,如被特意变形的推广信息,可参考以下正则表达式:

样本文本 正则表达式
每'.日."更;新.'新:壹!小'说?群!.5;9":9;9':;5,9,",3,8!:.9? 每'(.{44})
群陆⑨⑨九⑨六壹叁⑤ 群(.{9})