<a href="/index.php?mid=test&document_url=15424">
에서 15424 만 뽑아내고 싶은데
/<a[^>]* href=(/[^0-9]*/s)\\1[^>]*>/is
이렇게 하면 다른 링크들까지 모조리 나와버리는데 document_url 뒤에 있는 숫자만 뽑으려면
정규표현식을 어떻게 써야될까요
<a href="/index.php?mid=test&document_url=15424">
에서 15424 만 뽑아내고 싶은데
/<a[^>]* href=(/[^0-9]*/s)\\1[^>]*>/is
이렇게 하면 다른 링크들까지 모조리 나와버리는데 document_url 뒤에 있는 숫자만 뽑으려면
정규표현식을 어떻게 써야될까요
글 쓰신 분은 링크 주소가 아니라 HTML 소스 전체를 갖고 작업하셔야 하는 상황인 것 같으니
일단 정규식으로 링크를 모두 뽑아낸 후, 이런 함수를 사용해서 문서번호를 추출해 내도 되겠네요.
explode 이하는 parse_str 함수로 대체하면 더욱 좋습니다 ㅎㅎ
/<a[^>]* href="[^">]*document_srl=([0-9]+)[^">]*"[^>]*>/is
document_url이 아니라 document_srl입니다 ㅎㅎ
근데 만약 짧은주소를 사용하신다면 저것도 안 되겠네요.