文本分割器
文本分割器 是一款长文本处理工具,适用于 ChatGPT、DeepSeek 等 AI 模型的上下文切分,以及文档编辑、社交媒体内容整理等场景。工具提供三种切分模式:按长度切分、中文分段、英文分段,并支持批量导出与 ZIP 打包。

三种切分模式
三种模式通过顶部的 Segmented 选择器切换,每种模式只会显示相关的配置项,配置互不干扰。
1. 按长度切分
按设定的字符数把文本切成块。默认 2000 字符,适合 LLM 上下文切分。分隔符输入框始终显示,是否生效完全由字段是否填写决定,无需额外开关:
- 字符数 > 0 + 分隔符填写:按长度切块,切点自动对齐到最邻近的分隔符,避免句子被截断
- 字符数 > 0 + 分隔符留空:硬按长度切,不管句子边界
- 字符数 = 0(或留空)+ 分隔符填写:忽略长度,直接在每个分隔符处切一次(必须填分隔符)
分隔符输入框支持:
- 手动输入,如
。 ? !(多个符号用空格分隔) - 点击「中日韩」一键填充
。 ? ! - 点击「英文/拉丁」一键填充
. ? ! - 转义字符:
\n(换行)、\r(回车)、\t(制表符)、\s(空格)、\\(反斜杠)
分隔符切分会把符号保留在每段末尾。
2. 中文分段
点击即可按中文段落规则切分:根据中文标点和换行符智能识别段落边界,不改变段落内的换行。适合中文文章、博客内容的段落化。
3. 英文分段
使用英文句子算法识别段落边界。适合英文文档、邮件、论文的段落化切分。
通用设置
所有模式共享以下两项设置:
- 隐藏结果:切分结果过多(默认 >500 段时自动触发)可开启本项隐藏预览,避免页面卡顿。此时仍可导出。
- 导出文件名:自定义导出文件的基础名。默认用上传文件名,未上传则用
split_text。后缀默认为.txt,也可手动填写其他后缀。
导出
- 导出合并文本:所有段落合并为单文件,段落间用双换行分隔。
- 批量导出:段落数 ≤ 3 时逐个下载,> 3 时自动打包 ZIP,避免一次下载过多文件。
- 单段复制:每段卡片右上角的复制按钮,点击后按钮图标变为打勾确认。
常见用法
- LLM 输入切分:按长度 2000–4000,分隔符填
。 ? !或. ? !,切点自动对齐到句末 - 按句切分:字符数填 0,分隔符填
。 ? !(或英文结束符),按任意一个分隔符就切一次 - 按段落切分:选中文分段或英文分段模式
- 代码/Markdown 切分:按长度 + 转义字符
\n\n作为分隔符
工具完全在浏览器本地运行,不会上传任何内容到服务器。

