文本分割器

文本分割器 是一款长文本处理工具,适用于 ChatGPT、DeepSeek 等 AI 模型的上下文切分,以及文档编辑、社交媒体内容整理等场景。工具提供三种切分模式:按长度切分、中文分段、英文分段,并支持批量导出与 ZIP 打包。

文本分割器界面

三种切分模式

三种模式通过顶部的 Segmented 选择器切换,每种模式只会显示相关的配置项,配置互不干扰。

1. 按长度切分

按设定的字符数把文本切成块。默认 2000 字符,适合 LLM 上下文切分。分隔符输入框始终显示,是否生效完全由字段是否填写决定,无需额外开关:

  • 字符数 > 0 + 分隔符填写:按长度切块,切点自动对齐到最邻近的分隔符,避免句子被截断
  • 字符数 > 0 + 分隔符留空:硬按长度切,不管句子边界
  • 字符数 = 0(或留空)+ 分隔符填写:忽略长度,直接在每个分隔符处切一次(必须填分隔符)

分隔符输入框支持:

  • 手动输入,如 。 ? !(多个符号用空格分隔)
  • 点击「中日韩」一键填充 。 ? !
  • 点击「英文/拉丁」一键填充 . ? !
  • 转义字符:\n(换行)、\r(回车)、\t(制表符)、\s(空格)、\\(反斜杠)

分隔符切分会把符号保留在每段末尾。

2. 中文分段

点击即可按中文段落规则切分:根据中文标点和换行符智能识别段落边界,不改变段落内的换行。适合中文文章、博客内容的段落化。

3. 英文分段

使用英文句子算法识别段落边界。适合英文文档、邮件、论文的段落化切分。

通用设置

所有模式共享以下两项设置:

  • 隐藏结果:切分结果过多(默认 >500 段时自动触发)可开启本项隐藏预览,避免页面卡顿。此时仍可导出。
  • 导出文件名:自定义导出文件的基础名。默认用上传文件名,未上传则用 split_text。后缀默认为 .txt,也可手动填写其他后缀。

导出

  • 导出合并文本:所有段落合并为单文件,段落间用双换行分隔。
  • 批量导出:段落数 ≤ 3 时逐个下载,> 3 时自动打包 ZIP,避免一次下载过多文件。
  • 单段复制:每段卡片右上角的复制按钮,点击后按钮图标变为打勾确认。

常见用法

  • LLM 输入切分:按长度 2000–4000,分隔符填 。 ? !. ? !,切点自动对齐到句末
  • 按句切分:字符数填 0,分隔符填 。 ? !(或英文结束符),按任意一个分隔符就切一次
  • 按段落切分:选中文分段或英文分段模式
  • 代码/Markdown 切分:按长度 + 转义字符 \n\n 作为分隔符

工具完全在浏览器本地运行,不会上传任何内容到服务器。