正则文本助手
正则文本助手 是一款强大的文本批量处理工具,专门解决各种复杂的文本清理、提取、格式化需求。无论是数据清洗、内容整理还是格式转换,都能一键搞定。
这个工具能解决什么问题?
在日常工作中,我们经常遇到这些文本处理难题:
- 提取特定内容:从大量文本中找出网址、邮箱、数字等特定信息
- 清理垃圾内容:删除不需要的文字、符号或格式标记
- 批量格式化:统一给每行添加前缀后缀,整理成需要的格式
- 数据排序整理:对文本行进行排序、反转或重新组织
- 复杂文本处理:需要多个步骤组合完成的文本转换任务
正则文本助手可以快速解决这些问题,让原本需要手工处理几小时的工作,几秒钟就能完成。
如何使用这个工具?
第一步:输入要处理的文本
- 直接粘贴:把文本内容粘贴到输入框里
- 上传文件:支持 TXT、MD、JSON 等多种格式的文件上传
- 大文件优化:处理大文件时可以勾选"大文件优化"避免页面卡顿
第二步:选择处理方式
基础功能(最常用)
- 正则匹配:输入匹配规则,提取符合条件的内容
- 过滤:输入关键词,删除包含这些词的行
- 排序:将文本行按字母顺序排序(升序/降序)
- 反转:将文本行的顺序完全颠倒
格式化功能
- 添加前后缀:给每行文本前后添加指定内容
- 智能分段:将长段落分成更小的段落,方便阅读
- 格式化:清理多余空格和空行,让文本更整齐
特殊功能
- JSON 格式化:整理 JSON 数据的格式
- 移除匹配项:删除匹配到的内容,保留其他部分
第三步:使用常用模板(推荐新手)
工具提供了常用的处理模板:
- URL 提取:自动识别和提取网址链接
- 去序号:移除"1. 2. 3."这样的序号
- 提取 JSON 键名:从 JSON 文件中提取所有字段名
- 清理引用标记:移除文献引用等标记
第四步:查看和使用结果
- 处理完成后,结果会显示在下方的结果区域
- 可以复制结果、导出为文件,或者继续编辑
- 也可以把结果重新放回输入区域继续处理
实用功能详解
正则匹配功能
这是工具的核心功能,可以用简单的规则提取特定内容:
常用场景:
- 提取所有网址:选择"URL(宽松匹配)"模板
- 提取邮箱地址:输入邮箱匹配规则
- 提取数字:输入数字匹配规则
正则标志设置:
- ✅ 全局 (g):查找所有匹配项(建议开启)
- 多行 (m):处理多行文本时使用
- 忽略大小写 (i):不区分大小写匹配
过滤和清理功能
过滤词功能:
- 输入不想要的关键词,用逗号分隔
- 例如:输入"广告,推广,群号",会删除包含这些词的所有行
移除匹配项:
- 与正则匹配相反,删除匹配到的内容,保留其他部分
- 适用于清理特定的垃圾内容
批量格式化功能
添加前后缀:
- 前缀框:在每行开头添加的内容
- 后缀框:在每行结尾添加的内容
- 例如:前缀填"- ",后缀填空,可以给每行添加列表符号
高级组合操作
右侧提供了几个预设的组合操作:
- 正则提取后添加前后缀:先提取符合条件的内容,再批量加前后缀
- 分类任务批量处理:专门处理链接和数据的复杂提取任务
- 临近两行交换:交换相邻两行的位置
- 常用链接替换:批量替换特定网址
使用建议和注意事项
新手建议
- 先试试模板:不会写规则的话,先用右侧的常用模板
- 小数据测试:处理重要数据前,先用小部分测试效果
- 逐步处理:复杂任务可以分几步完成,用"结果=>原文本"功能
高效使用技巧
- 智能清理开关:开启后会自动清理每行的多余空格
- 结果循环处理:可以把处理结果重新放回输入框继续处理
- 组合使用:先过滤,再提取,最后格式化,可以解决复杂需求
什么情况下最有用?
- 从网页复制的混乱文本需要清理
- 数据文件需要提取特定字段
- 批量处理链接、邮箱等联系方式
- 文档格式需要统一调整
- 去除文本中的广告或无用信息
这个工具完全在浏览器本地运行,不会上传您的数据到任何服务器,可以放心处理敏感信息。