최근 수정 시각 : 2024-10-19 14:41:42

URL escape code

1. 개요2. 유니코드 문자의 URL escape code3. 나무위키의 URL escape code
3.1. GOTO

1. 개요

space 공백 %20 ( %28 : %3A [ %5B ` %60
! %21 ) %29 ; %3B \ %5C { %7B
" %22 * %2A < %3C ] %5D | %7C
# %23 + %2B = %3D ^ %5E } %7D
$ %24 , %2C > %3E _ %5F ~ %7E
% %25 - %2D ? %3F . . . .
& %26 . %2E @ %40 . . . .
' %27 / %2F . . . . . .

쿼리 문자열 URL 요청에 비 ASCII 문자를 사용할 때 쓰는 문자 인코딩. 그 정체는 %뒤에 아스키 코드의 hex(16진수)값을 붙여준 것. URL은 스페이스(space)를 포함할 수 없기 때문에, 스페이스는 %20으로 대체되는 것이 보통이다. 인코딩 형식에 %가 들어가기 때문에 퍼센트 인코딩이라고도 한다.

아스키 문자가 이미 다른 용도로 쓰이고 있어서 % 문자 뒤에 코드값을 넣어서 우회하거나, 아스키 코드 이외의 문자가 쓰일 때 아스키 문자로 돌려 쓰기 위하여 이런 방식이 사용된다.

이런 퍼센트 인코딩은 어떠한 문자 코드에도 대응시킬 수 있으나 점점 국제 표준인 UTF-8에 대응시키는 것으로 통일되는 추세이다. 과거 국내 웹 사이트에서 EUC-KR을 주로 사용하던 시절에는 한글 파일명을 찾지 못하는 경우가 많았으며, 이 때문에 'URL 경로를 UTF-8로 보내기'의 체크를 해제하라거나, 파일명을 영숫자만으로 적으라거나 하는 말들이 많이 보였다. 현재는 대부분 UTF-8로 통일하거나 아니면 서버 측에서 자동으로 변환해서 전송하기 때문에 아무래도 큰 문제는 없다.

다만 퍼센트 인코딩은 국제화 도메인 네임(IDN)의 대체 표기로는 쓰이지 않는다. IDN의 대체 표기는 퓨니코드(Punycode)라는 걸 이용해서 돌려 표기한다. 자세한 내용은 국제화 도메인 네임 문서 참고.

2. 유니코드 문자의 URL escape code

위 표는 ASCII 코드 문자를 URL encoding한 것이다. 유니코드 문자의 경우 일반적으로 UTF-8 방식을 따른다. (ASCII 문자는 UTF-8과 호환이 된다.)
http://namu.wiki/w/나무위키
크롬이나 파이어폭스에서 주소창이 위와 같이 나타난다고 하면 URL encoding 과정은 아래와 같다.
글자 유니코드 UTF-8 URL escape code
U+B098 EB 82 98 %EB%82%98
U+BB34 EB AC B4 %EB%AC%B4
U+C704 EC 9C 84 %EC%9C%84
U+D0A4 ED 82 A4 %ED%82%A4

참고로 한글은 UTF-8 기준으로 3바이트를 할당하기 때문에 위와 같이 글자 마디 하나당 %XX패턴이 세 번씩 나타난다.
인코딩 결과는 아래와 같이 나온다.
http://namu.wiki/w/%EB%82%98%EB%AC%B4%EC%9C%84%ED%82%A4

PC 브라우저 중 Internet Explorer Microsoft Edge는 퍼센트 인코딩된 주소를 표시한다. 모바일 브라우저 중 삼성 인터넷은 13.2.1.70 버전부터 퍼센트 인코딩만 지원한다. 이전 버전에서는 주소 표시줄에만 인코딩되지 않은 주소를 표시하고 링크를 길게 눌렀을 때 나타나는 메뉴에서는 퍼센트 인코딩된 주소를 표시한다.

3. 나무위키의 URL escape code

나무위키에서는 링크를 만들 때 항목명에 들어간 특수문자를 URL escape code로 풀어줄 필요가 없다. 단, # 기호는 특별처리한다.
MORE & MORE ([[MORE & MORE]])
도대체 왜?인구단 ([[도대체 왜?인구단]])

오히려 URL escape code를 사용했을 때 문제가 생긴다.
MORE & MORE ([[MORE%20%26%20MORE|MORE & MORE]])

나무위키에서 위 링크를 클릭하면 MORE%20%26%20MORE항목으로 연결을 시도하다가 실패할 것이다. 이러한 현상이 일어나는 이유는 문서 작성/수정 시점인 2015년 6월 현재 나무위키의 엔진이 링크의 항목명에 포함된 %를 %25로 치환하여 인식하기 때문이다(주소창에는 ".../MORE%2520%2526%2520MORE"로 나온다).

엔진이 다른 나무위키 미러에서는 위 링크가 대체로 정상 작동한다. (이름에 &가 들어간 항목은 빼고.)

해시 기호는 URL anchor(fragment)를 연결하기 위해 쓰이므로 페이지 이름에 # 문자가 포함된 경우는 [[C#]]와 같은 식이 아닌 [[C\#]]을 쓴다. 모니위키의 경우에는 URL escape code를 이용하여 [[C%23|C#]]으로 써야 한다.

3.1. GOTO

나무위키에서는 GOTO 문서로 가는 링크를 만들 때 [[GOTO]]를 쓸 수 있다.[1]
  • 대신에 [GOTO] 매크로는 나무위키에서 사용할 수 없게 되었다. 2015년 6월 1일 일부 문법 변경 안내 공지 참조.[2]
  • [[%47%4F%54%4F|GOTO]]처럼 URL escape code로 풀어주는 방법은 사용할 수 없다. 앞서 언급한, 나무위키 엔진이 %를 %25로 치환하는 문제가 있기 때문.

대략 2015년 5월까지는 나무위키 미러에서 이 항목을 보았을 때 [[GOTO]]가 문서 이동 창을 띄운 것을 확인할 수 있었으나, 수정 시점인 2015년 7월 현재 이 문제는 더 이상 확인되지 않는다. 나무위키의 문법 변경에 발맞추어 엔진을 고친 듯하다. 만약 당신이 미러를 사용중이고 이 문서가 나무위키에서 어떻게 보이는 지 궁금하다면 이 링크를 클릭하면 된다.

[1] 리그베다 위키는 모니위키 기반이었고, 모니위키에서 대괄호 두 개짜리는 원래 매크로 문법인데, 미디어위키식 링크를 도입하면서 매크로 문법과 같이 쓸 수 없는 경우가 생겼기 때문이다. 이 때문에 GOTO항목으로 가기 위해 대괄호 두 개짜리 링크를 걸면 GOTO 매크로가 작동하는 문제가 발생했고... 더 이상의 자세한 설명은 생략한다. [2] 이 문법 변경으로 인해 [문서], [문서|출력], [[wiki:"문서" 출력]], [[wiki:"문서]], [["문서"]]는 모두 막혔다.