티스토리 뷰

복잡한 정규식이라고 썼지만 별로 어렵지 않다.

찾고 싶은 정규식의 앞뒤로 오거나 오지말아야 하는 조건을 추가하는 방법이다.

 

아래 4가지 방식만 기억하고 있다가 필요할 때 찾아쓰면 된다.

 

  • X(?=Y) : X 다음에 Y 가 오는 경우 (Positive Lookahead)
  • X(?!Y) : X 다음에 Y 가 오지 않는 경우 (Negative Lookahead)
  • (?<=X)Y : Y 앞에 X 가 오는 경우 (Positive Lookbehind)
  • (?<!X)Y : Y 앞에 X 가 오지 않는 경우 (Negative Lookbehind)

 

Positive 의 경우 단순히 XY 로 정규식을 만들어도 동일하게 검색할 수 있는데 굳이 사용하는 이유는 무엇일까?

캡쳐(추출)할 수 있는 데이터의 차이가 있기 때문이다. 즉, 앞뒤로 오는 조건을 제외하고 문자열을 추출이 가능하다. 이는 주로 검색할 문자열과 replace 시킬 문자열이 다를때 사용된다.

위 기준으로 Lookahead 를 사용할때 X 만 캡쳐되고 괄호의 Y 조건문은 캡쳐되지 않는다. 반대로 Lookbehind 인 경우는 Y 만 캡쳐된다.

 

그리고, Lookahead 와 Lookbehind 를 동시에 사용하는 것도 가능하다.

 

  • (?<=X)Y(?=Z) : 앞뒤가 다 긍정인 경우 (Positive Lookahead & Positive Lookbehind)
댓글