正则文本助手

正则文本助手 是一款强大的文本批量处理工具,专门解决各种复杂的文本清理、提取、格式化需求。无论是数据清洗、内容整理还是格式转换,都能一键搞定。

正则文本助手界面

这个工具能解决什么问题?

在日常工作中,我们经常遇到这些文本处理难题:

  • 提取特定内容:从大量文本中找出网址、邮箱、数字等特定信息
  • 清理垃圾内容:删除不需要的文字、符号或格式标记
  • 批量格式化:统一给每行添加前缀后缀,整理成需要的格式
  • 数据排序整理:对文本行进行排序、反转或重新组织
  • 复杂文本处理:需要多个步骤组合完成的文本转换任务

正则文本助手可以快速解决这些问题,让原本需要手工处理几小时的工作,几秒钟就能完成。

如何使用这个工具?

第一步:输入要处理的文本

  • 直接粘贴:把文本内容粘贴到"待匹配文本"卡片的输入框
  • 上传文件:点击上传按钮或拖拽文件,支持 TXT、MD、JSON 等多种格式
  • 智能清理开关:自动移除每行首尾空格(不影响过滤/移除操作)

第二步:在"正则引擎"卡片中输入规则

  • 输入正则表达式,或从下方的常用预设标签一键填入(URL、GPT 引用、JSON 键名等)
  • 设置匹配模式:全局 (g)、多行 (m)、忽略大小写 (i)
  • 两个主按钮:执行匹配(提取符合的内容)、移除匹配内容(从原文中删除并优化空行)

第三步:使用"行处理工具"卡片

所有行级操作都可见,按用途分组:

  • 整理:升/降序排列、反转顺序、去重、格式化文本
  • 排除(搭配去重使用):在此列出想跳过的行,去重时自动忽略它们
  • 筛选:输入关键词(逗号分隔),删除包含这些词的行
  • 前后缀:批量给每行加前缀和/或后缀
  • 转换:智能分段、JSON 美化、常用链接替换
  • 高级(折叠在最下方):正则提取 + 前后缀、分类任务批量处理、相邻行交换、自定义操作

第四步:查看和使用结果

  • 处理完成后,结果会显示在下方的结果区域
  • 可以复制结果、导出为文件,或者继续编辑
  • 也可以把结果重新放回输入区域继续处理

实用功能详解

正则匹配功能

这是工具的核心功能,可以用简单的规则提取特定内容:

常用场景:

  • 提取所有网址:选择"URL(宽松匹配)"模板
  • 提取邮箱地址:输入邮箱匹配规则
  • 提取数字:输入数字匹配规则

正则标志设置:

  • ✅ 全局 (g):查找所有匹配项(建议开启)
  • 多行 (m):处理多行文本时使用
  • 忽略大小写 (i):不区分大小写匹配

过滤和清理功能

过滤词功能:

  • 输入不想要的关键词,用逗号分隔
  • 例如:输入"广告,推广,群号",会删除包含这些词的所有行

移除匹配项:

  • 与正则匹配相反,删除匹配到的内容,保留其他部分
  • 适用于清理特定的垃圾内容

批量格式化功能

添加前后缀:

  • 前缀框:在每行开头添加的内容
  • 后缀框:在每行结尾添加的内容
  • 例如:前缀填"- ",后缀填空,可以给每行添加列表符号

高级组合操作

"行处理工具"卡片最下方的"高级"折叠区提供几个预设组合:

  1. 正则提取 + 前后缀:先提取符合条件的内容,再批量加前后缀
  2. 分类任务批量处理:专门处理链接和数据的复杂提取任务
  3. 相邻行交换:交换相邻两行的位置
  4. 常用链接替换:批量替换特定网址

使用建议和注意事项

新手建议

  • 先试试预设:不会写规则的话,点击"正则引擎"卡片里的"常用预设"标签一键填入
  • 小数据测试:处理重要数据前,先用小部分测试效果
  • 逐步处理:复杂任务可以分几步完成,用"结果=>原文本"功能

高效使用技巧

  • 智能清理开关:开启后会自动清理每行的多余空格
  • 结果循环处理:可以把处理结果重新放回输入框继续处理
  • 组合使用:先过滤,再提取,最后格式化,可以解决复杂需求

什么情况下最有用?

  • 从网页复制的混乱文本需要清理
  • 数据文件需要提取特定字段
  • 批量处理链接、邮箱等联系方式
  • 文档格式需要统一调整
  • 去除文本中的广告或无用信息

这个工具完全在浏览器本地运行,不会上传您的数据到任何服务器,可以放心处理敏感信息。