深入浅析正则表达式捕获组_F11 - 专业站长和开发者的学习网站

分享到

深入浅析正则表达式捕获组

正则表达式 来源：互联网搜集作者：秩名发布时间：2019-05-03 08:14:28 人浏览

摘要

捕获组（capturing group）是正则表达式里比较常用，也是比较重要的概念，我个人觉得掌握这部分的知识是非常重要的。这篇文章内容不会很深入，但是尽量做到简单易懂又全面。接下来的内容主要是围绕以下7个点： 1: () 捕获组 2: (?:) non capturing group 3:

捕获组（capturing group）是正则表达式里比较常用，也是比较重要的概念，我个人觉得掌握这部分的知识是非常重要的。

这篇文章内容不会很深入，但是尽量做到简单易懂又全面。接下来的内容主要是围绕以下7个点：

1: () 捕获组
2: (?:) non capturing group
3: (?=) positive lookahead
4: (?!) negative lookahead
5: (?<=) positive lookbehind
6: (?<!) negative lookbehind
7: (?=), (?!), (?<=), (?<!)的捕获

1: () 捕获组

/go+/

以上的正则表达式表示一个字母g后面跟上一个或者多个字母o,他能匹配go或者goooo。但是如果我们想+不只是运用到字母o上，而是运用到go这个整体上怎么办呢？办法就是给go加括号：

/(go)+/

为了全局匹配以及不考虑大小写，我们接下来会给我们的正则加上ig,这两个flag：

let reg = /(go)+/ig;
'go is g gogo'.match(reg); //["go", "gogo"]

在上面的例子里面(go)就形成了一个捕获组（capturing group）。接下来看一个使用捕获组的例子来加深对它的理解：

let reg = /(\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
reg.test(originString); //true
RegExp.$1; //10
RegExp.$2; //25
RegExp.$2; //2017

在上面这个例子里，我们有三组括号，形成了三个捕获组，正则表达式（在javaScript里就是我们的RegExp）会缓存捕获组所匹配的串，以$n表示，n就代表这第几个捕获组。

假如现在我们有一个需求：把显示格式为 10.25.2017 的时间改为 2017-10-25 格式。

我们知道String的replace()方法经常和正则表达式一起使用。在replace()方法里，我们可以直接使用捕获组的结果：

let reg = /(\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
let newString = originString.replace(reg, '$3-$1-$2');
console.log(newString);//"2017-10-25"

2: (?:) non capturing group 非捕获型分组

有的时候我们可能只想匹配分组，但是并不想缓存（不想捕获）匹配到的结果，就可以在我们的分组模式前面加上?:。例如上面的时间的例子，我们不想捕获第一个分组的结果，就可以这么做：

let reg = /(?:\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
reg.test(originString); //true
RegExp.$1; //25
RegExp.$2; //2017
originString.match(reg);// ["10.25.2017", "25", "2017", index: 0, input: "10.25.2017", groups: undefined]

从上面的例子可以看出，我们的正则表达式依然是匹配的（test()的结果依然为true），但是RegExp.$1不是数字10，而是25，因为我们在第一个括号里加了?:，10就不会被捕获。match()的执行结果也会受?:的影响：match()的结果里不再有‘10'。

3: (?=) positive lookahead 正向前瞻型捕获

有一个句子：1 apple costs 10€. 我们想要匹配€前面的价格（这里是一个数字），但是注意不能匹配到句子开头的数字1。这种情况，就可以用到正向前瞻型捕获：

let reg = /\d+(?=€)/g;
let reg1 = /\d+/g;
let str = '1 apple costs 10€';
str.match(reg); //["10"]
str.match(reg1); //["1", "10"]

上面的例子里面reg1就只需要匹配数字，对于数字后面跟什么并没有要求，所以它能匹配到1，10。但是reg使用了前瞻型匹配，就只能匹配到10。

或许你已经能从上面的对比里了解到什么是正向前瞻型捕获了，意思是:

/x(?=y)/ 匹配x, 但是必须在x的【后面】【是】y的情况下

4: (?!) negative lookahead 负向前瞻型捕获

上面我们了解了什么是正向前瞻型匹配，从字面意思也能猜出来负向前瞻型捕获就是:

/x(?!y)/ 匹配x, 但是必须在x的【后面】【不是】y的情况下

例如下面的例子，我们要匹配数字1，而不要€前面的2，就可以用到?!：

let reg = /\d+(?!€)/g;
let str = '1 apple costs 2€';
str.match(reg); ['1']

5: (?<=) positive lookbehind 正向后顾型捕获

后顾型和前瞻型正好相反，意思就是：

/(?<=y)x/ 匹配x, 但是只在【前面】【有】y的情况下

来看一个例子：

let str = "1 turkey costs $2";
console.log( str.match(/(?<=\$)\d+/g) ); //["2"]

这里的要求是前面有$的数字，所以这里匹配到了数字2，而没有1.

6: (?<!) negative lookbehind 负向后顾型捕获

负向就是与正向相反，那么负向后顾型捕获就是：

/(?<=y)x/ 匹配x, 但是只在【前面】【没有】y的情况下

来看一个例子：

let str = "1 turkey costs $2";
console.log( str.match(/(?<!\$)\d+/g) ); //['1']

7: (?=), (?!), (?<=), (?<!)的捕获

默认情况下上面的前瞻后顾4种都是默认不匹配捕获组里面的内容的，也就是不匹配括号里的条件的。例如我们的正向前瞻/d+(?=€)/g，只会匹配到数字，并不会匹配到€。如果我们想要也匹配到€怎么办呢？答案就是给€也包上一个括号：

let str = "1 turkey costs 2€";
let reg = /\d+(?=(€))/;
str.match(reg); //["2", "€", index: 15, input: "1 turkey costs 2€", groups: undefined]

这样就匹配到了数字2和它后面的€。

下面再来看看后顾型：

let str = "1 turkey costs $2";
let reg = /(?<=(\$|£))\d+/;
console.log( str.match(reg) ); //["2", "$", index: 16, input: "1 turkey costs $2", groups: undefined]

需要特别注意到的一点是，对于后顾型，虽然条件在匹配项的前面，但是匹配出来的结果顺序依然是条件在匹配项的后面。所以这里match()出来的结果是2在$的前面。

您可能感兴趣的文章 :

原文链接 : https://segmentfault.com/a/1190000019032310

Tag : 正则表达式(69)

正则表达式校验日期时间格式的方法

日期部分校验概念首先，我们先了解2个概念： 1、合法的日期范围： DateTime值类型表示值范围在公元（基督纪元）0001 年 1 月 1 日午夜 12
如何使用正则表达式对输入数字进行匹配

最近有一个区间范围限制，一般255数字以下的都能在网上薅到，但是需要弄一个int16、int32、int64范围的输入限制......在网上逛了很久都没找
最实用的正则表达式的整理

想要白嫖正则是吧？本篇就一次给你个够！先冲 100 个！（如果还觉得不够就评论反馈后再加，本篇持续更新加码！！）点赞再看，养成好
停止编写API函数原因介绍

RESTFUL API 通常提供在不同实体上执行增删改查（CRUD）操作的一组接口。我们通常在我们的前端项目中为这些每一个接口提供一个函数，这些
正则表达式的基本语法汇总介绍

1.正则表达式的基本语法 1.1两个特殊符号 ^ 和 $ ^ 正则表达式的起始符 ^tom 表示所有以tom开头的字符串 $ 正则表达式的结束符 lucy$ 表示所有
正则表达式基础语法以及应用介绍

一、正则表达式 1、基本介绍 ? 概述一个正则表达式，就是用某种模式去匹配字符串的一个公式。很多人因为它们看上去比较古怪而且复杂
正则表达式从HTML中匹配img标签的图片地址

前言有玩过爬虫的人应该都有过在又臭又长的HTML中找寻信息的经历，虽然有各种工具和各种框架可以辅助查找，但是解析HTML的规则也是人
Snort中pcre和正则表达式的使用介绍

1. 题目描述 If snort see two packets in a TCP flow with first packet has login or Initial in payload, destination port is 3399;and second packet has a IPv4Address:Portstring(E.g
在nest.js中通过正则表达式正确设置验证的方法

下面看下nest.js正则表达式设置验证的方法，代码如下所示： 1 2 3 4 import { IsNotEmpty, Length, Matches, Max, Min } from class-validator; const phoneReg = /^1(3
shell脚本中的正则表达式介绍

正则表达式的概念及特点：正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成