小说文本整理器
小说文本整理器 是专门为网络小说、电子书等长篇文本设计的整理工具。它能自动修复格式错乱、清理无用内容、优化排版,让杂乱的小说文本变得整齐易读。
这个工具能解决什么问题?
从网上下载的小说经常遇到这些问题:
- 排版乱:段落不分、章节混在一起
- 有垃圾内容:广告信息、下载器标记、群号推广
- 格式不统一:有的是繁体字,有的字符显示异常
- 换行混乱:该分段的地方没分,不该分的地方乱分行
小说文本处理器可以一键解决这些问题,让您获得干净、整齐的阅读文本。
如何使用这个工具?
第一步:上传文件
- 文件上传:点击上传区域或直接把 TXT 文件拖进去
- 批量处理:可以一次上传多个小说文件,工具会自动逐个处理
- 直接粘贴:也可以直接把文本内容粘贴到输入框里
第二步:选择处理功能
基础功能(建议都勾选):
- ✅ 智能换行:自动判断哪里该合并,让文本排版更合理
- ✅ 段落缩进:每段开头自动空两格,看起来更像正规书籍
- ✅ 处理章节标题:识别"第X章"这样的标题,自动格式化
- ✅ 智能清理:去掉多余的空格和特殊符号
可选功能:
- 繁体转简体:如果是繁体小说,可以转成简体字
- 清除行尾数字:去掉每行末尾的页码或编号
- 智能分段:把太长的段落分成更小的段落,手机阅读更舒服
- 删除重复行:自动删除相邻的重复行,减少冗余内容
过滤设置:
- 过滤词:输入不想要的内容,比如"群号"、"下载器",工具会自动删除包含这些词的行
- 特殊起始文本:如果小说名字总是出现在不该出现的地方,输入小说名,工具会特殊处理
第三步:开始处理
- 点击"整理文本"按钮
- 等待几秒钟,工具自动完成处理
- 处理完成后,内容会自动复制到剪贴板,同时显示在结果区域
第四步:保存结果
- 复制文本:点击"复制结果"把处理好的文本复制出来
- 导出文件:点击"导出文件"直接保存为 TXT 文件
- 自动导出:勾选"自动导出文件",处理完直接保存,不显示预览
特别实用的功能
批量处理模式
- 一次可以处理几十个小说文件
- 每个文件都会自动保存,文件名保持不变
- 特别适合整理下载的小说合集
章节分割功能
- 单独的"章节分割"按钮,专门处理章节标题格式
- 适合那些章节名没有正确换行的文本
大文件优化
- 处理超大文件时,勾选"大文件优化"避免页面卡顿
- 系统会隐藏预览,直接处理和导出
使用建议和注意事项
注意事项
- ⚠️ 备份原文件:处理前最好备份原始文件,万一效果不满意可以重新调整
- ⚠️ 逐步调整:如果文本很重要,建议先处理一小部分测试效果
- ⚠️ 过滤谨慎使用:过滤词功能很强大,但要小心不要误删正文内容
什么情况下最有用?
- 从小说网站下载的格式混乱的文本
- 通过爬虫或下载器获取的小说文件
- 需要批量整理的小说合集
- OCR识别后格式不规整的文本
- 准备导入电子书软件前的文本清理
这个工具完全在浏览器本地运行,不会上传您的文件到任何服务器,可以放心使用。
技术细节说明
如果你想了解工具具体如何处理文本,这里是详细的处理流程:
自动处理步骤
- 统一换行符:将不同系统的换行符统一为标准格式
- 清理垃圾内容:移除下载器标记、"分卷阅读"等无用信息
- 字符标准化:将全角英文和数字转为半角,清理乱码字符
- 繁体转简体:使用 OpenCC 引擎进行准确转换
- 章节格式化:识别并规范化章节标题格式
- 智能换行处理:根据中文标点判断合并或分段
高级处理规则
对于复杂的垃圾文本,如被特意变形的推广信息,可参考以下正则表达式:
样本文本 |
正则表达式 |
每'.日."更;新.'新:壹!小'说?群!.5;9":9;9':;5,9,",3,8!:.9? |
每'(.{44}) |
群陆⑨⑨九⑨六壹叁⑤ |
群(.{9}) |