正则文本助手

正则文本助手 是一款强大的文本批量处理工具,专门解决各种复杂的文本清理、提取、格式化需求。无论是数据清洗、内容整理还是格式转换,都能一键搞定。

这个工具能解决什么问题?

在日常工作中,我们经常遇到这些文本处理难题:

  • 提取特定内容:从大量文本中找出网址、邮箱、数字等特定信息
  • 清理垃圾内容:删除不需要的文字、符号或格式标记
  • 批量格式化:统一给每行添加前缀后缀,整理成需要的格式
  • 数据排序整理:对文本行进行排序、反转或重新组织
  • 复杂文本处理:需要多个步骤组合完成的文本转换任务

正则文本助手可以快速解决这些问题,让原本需要手工处理几小时的工作,几秒钟就能完成。

如何使用这个工具?

第一步:输入要处理的文本

  • 直接粘贴:把文本内容粘贴到输入框里
  • 上传文件:支持 TXT、MD、JSON 等多种格式的文件上传
  • 大文件优化:处理大文件时可以勾选"大文件优化"避免页面卡顿

第二步:选择处理方式

基础功能(最常用)

  • 正则匹配:输入匹配规则,提取符合条件的内容
  • 过滤:输入关键词,删除包含这些词的行
  • 排序:将文本行按字母顺序排序(升序/降序)
  • 反转:将文本行的顺序完全颠倒

格式化功能

  • 添加前后缀:给每行文本前后添加指定内容
  • 智能分段:将长段落分成更小的段落,方便阅读
  • 格式化:清理多余空格和空行,让文本更整齐

特殊功能

  • JSON 格式化:整理 JSON 数据的格式
  • 移除匹配项:删除匹配到的内容,保留其他部分

第三步:使用常用模板(推荐新手)

工具提供了常用的处理模板:

  • URL 提取:自动识别和提取网址链接
  • 去序号:移除"1. 2. 3."这样的序号
  • 提取 JSON 键名:从 JSON 文件中提取所有字段名
  • 清理引用标记:移除文献引用等标记

第四步:查看和使用结果

  • 处理完成后,结果会显示在下方的结果区域
  • 可以复制结果、导出为文件,或者继续编辑
  • 也可以把结果重新放回输入区域继续处理

实用功能详解

正则匹配功能

这是工具的核心功能,可以用简单的规则提取特定内容:

常用场景:

  • 提取所有网址:选择"URL(宽松匹配)"模板
  • 提取邮箱地址:输入邮箱匹配规则
  • 提取数字:输入数字匹配规则

正则标志设置:

  • ✅ 全局 (g):查找所有匹配项(建议开启)
  • 多行 (m):处理多行文本时使用
  • 忽略大小写 (i):不区分大小写匹配

过滤和清理功能

过滤词功能:

  • 输入不想要的关键词,用逗号分隔
  • 例如:输入"广告,推广,群号",会删除包含这些词的所有行

移除匹配项:

  • 与正则匹配相反,删除匹配到的内容,保留其他部分
  • 适用于清理特定的垃圾内容

批量格式化功能

添加前后缀:

  • 前缀框:在每行开头添加的内容
  • 后缀框:在每行结尾添加的内容
  • 例如:前缀填"- ",后缀填空,可以给每行添加列表符号

高级组合操作

右侧提供了几个预设的组合操作:

  1. 正则提取后添加前后缀:先提取符合条件的内容,再批量加前后缀
  2. 分类任务批量处理:专门处理链接和数据的复杂提取任务
  3. 临近两行交换:交换相邻两行的位置
  4. 常用链接替换:批量替换特定网址

使用建议和注意事项

新手建议

  • 先试试模板:不会写规则的话,先用右侧的常用模板
  • 小数据测试:处理重要数据前,先用小部分测试效果
  • 逐步处理:复杂任务可以分几步完成,用"结果=>原文本"功能

高效使用技巧

  • 智能清理开关:开启后会自动清理每行的多余空格
  • 结果循环处理:可以把处理结果重新放回输入框继续处理
  • 组合使用:先过滤,再提取,最后格式化,可以解决复杂需求

什么情况下最有用?

  • 从网页复制的混乱文本需要清理
  • 数据文件需要提取特定字段
  • 批量处理链接、邮箱等联系方式
  • 文档格式需要统一调整
  • 去除文本中的广告或无用信息

这个工具完全在浏览器本地运行,不会上传您的数据到任何服务器,可以放心处理敏感信息。