한중일통합한자(韓中日統合漢字, CJK Unified Ideographs)
1. 개요
한중일 통합 한자는 유니코드에 수록되있는 부호화용 한자 집합으로 그 수는 현재 총 97,680자가 있다. 한중일 통합 한자(CJK Unified Ideographs)의 명칭은 중국어, 일본어, 한국어에 사용되고 있는 한자를 하나로 모았기에 그 나라별 첫글자를 따와 짓게 되었다.1994년 베트남어에서 사용되고 있는 한자( 쯔놈)도 포함했기 때문에 CJKV라 불리기도 하는데, 공식 명칭은 CJK Unified Ideographs가 맞다. 베트남어의 한자가 추가되기 전에 중국어, 일본어, 한국어에서 쓰는 한자만이 추가되어 저런 이름이 붙었는데 유니코드에서는 한 번 정해진 이름을 바꿀 수가 없어서 지금도 CJK 그대로이다.
2. 영역
- 한중일 통합 한자
- BMP
- 4E00-62FF, 6300-77FF, 7800-8CFF, 8D00-9FFF.
- 출처
중국 | G0 | GB 2312-80 | 6,763 |
중국 | G1 | GB 12345-90 | 2,202 |
중국 | G3 | GB 7589-87 traditional form | 4,834 |
중국 | G5 | GB 7590-87 traditional form | 2,841 |
중국 | G7 | Modern Chinese general character chart | 42 |
중국 | G8 | GB8565-88 | 290 |
중국 | G9 | GB18030-2000 | 8 |
중국 | GE | GB16500-95 | 3,779 |
중국 | GFC | Modern Chinese Standard Dictionary (现代汉语规范词典) | 2 |
중국 | GGFZ | General Chinese Standard Dictionary (通用规范汉字字典) | 1 |
중국 | GH | GB/T 15564-1995 | 59 |
중국 | GHZ | Hanyu Da Zidian | 1 |
중국 | GK | GB 12052-89 | 89 |
중국 | GKX | Kangxi Dictionary | 2 |
홍콩 | H | Hong Kong Supplementary Character Set | 2,292 |
홍콩 | HB0 | Computer Chinese Glyph and Character Code Mapping Table, Technical Report C-26 | 10 |
홍콩 | (電腦用中文字型與字碼對照表, 技術通報C-26) | ||
홍콩 | HB1 | Big-5, Level 1 | 5,401 |
홍콩 | HB2 | Big-5, Level 2 | 7,650 |
일본 | J0 | JIS X 0208-1990 | 6,356 |
일본 | J1 | JIS X 0212-1990 | 3,058 |
일본 | J13 | JIS X 0213:2004 level-3 characters replacing J1 characters | 1,037 |
일본 | J13A | JIS X 0213:2004 level-3 character addendum from JIS X 0213:2000 level-3 replacing J1 character | 2 |
일본 | J14 | JIS X 0213:2004 level-4 characters replacing J1 characters | 1,704 |
일본 | J3 | JIS X 0213-2004 Level 3 | 95 |
일본 | J3A | JIS X 0213-2004 Level 3 addendum | 7 |
일본 | J4 | JIS X 0213-2004 Level 4 | 301 |
일본 | JARIB | ARIB STD-B24 | 3 |
북한 | KP0 | KPS 9566-97 | 4,652 |
북한 | KP1 | KPS 10721-2000 | 10,359 |
한국 | K0 | KS C 5601-87 (now KS X 1001:2004) | 4,620[1] |
한국 | K1 | KS C 5657-91 (now KS X 1002:2004) | 2,855[2] |
한국 | K2 | PKS C 5700-1:1994 | 7,911 |
한국 | K3 | PKS C 5700-2:1994 | 1 |
한국 | K4 | PKS 5700-3:1998 | 4 |
한국 | KU | The source reference for this character has been moved. | 1[3] |
대만 | T1 | CNS 11643-1992 plane 1 | 5,413 |
대만 | T2 | CNS 11643-1992 plane 2 | 7,650 |
대만 | T3 | CNS 11643-1992 plane 3 | 4,144 |
대만 | T4 | CNS 11643-1992 plane 4 | 894 |
대만 | T5 | CNS 11643-1992 plane 5 | 63 |
대만 | T6 | CNS 11643-1992 plane 6 | 31 |
대만 | T7 | CNS 11643-1992 plane 7 | 16 |
대만 | TC | CNS 11643-1992 plane 12 | 1 |
대만 | TF | CNS 11643-1992 plane 15 | 158 |
베트남 | V0 | TCVN 5773-1993 | 593 |
베트남 | V1 | TCVN 6056-1995 | 3,310 |
베트남 | V2 | VHN 01-1998 | 763 |
베트남 | V3 | VHN 02-1998 | 91 |
n/a | UTC | UTC sources | 33 |
- 한중일 통합 한자 확장 A
- BMP
- 3400-4DBF.
- 한중일 통합 한자 확장 B
- SIP
- 20000-215FF, 21600-230FF, 23100-245FF, 24600-260FF, 26100-275FF, 27600-290FF, 29100-2A6DF.
- 한중일 통합 한자 확장 C
- SIP
- 2A700-2B73F.
- 한중일 통합 한자 확장 D
- SIP
- 2B740-2B81F.
- 한중일 통합 한자 확장 E
- SIP
- 2B820-2CEAF.
- 한중일 통합 한자 확장 F
- SIP
- 2CEB0-2EBEF.
- 한중일 통합 한자 확장 G
- TIP
- 30000-3134F.
- 한중일 통합 한자 확장 H
- TIP
- 31350-323AF.
- 한중일 통합 한자 확장 I
- SIP
- 2EBF0–2EE5F.
3. 역사
유니코드 버전 | 내용 | 위치 | 개수 | 누계 |
1.0 | 한중일 통합 한자 | 기본 다국어 평면(BMP, U+4E00부터 U+9FA5) | 20,902 | 20,902 |
1.0 | 한중일 호환용 한자에 있지만 실제로는 중복되지 않는 한자 | 기본 다국어 평면 | 12 | 20,914 |
3.0 | 한중일 통합 한자 확장 A | 기본 다국어 평면(U+3400부터 U+4DB5) | 6,582 | 27,496 |
3.1 | 한중일 통합 한자 확장 B | 보조 상형 문자 평면(SIP, U+20000부터 U+2A6D6) | 42,711 | 70,207 |
4.1 | HKSCS-2004와 GB 18030-2000에 없었던 ISO 10646 한자 | 기본 다국어 평면(HKSCS에서: U+9FA6부터 U+9FB3, GB 18030에서: U+9FB4부터 U+9FBB) | 22 | 70,229 |
5.1 | 일본 한자(U+9FBC~U+9FC2), U+4039의 분리(U+9FC3) | 기본 다국어 평면 | 8 | 70,237 |
5.2 | 한중일 통합 한자 확장 C | 보조 상형 문자 평면(SIP, U+2A700부터 U+2B734) | 4,149 | 74,386 |
6.0 | 한중일 통합 한자 확장 D | 보조 상형 문자 평면(SIP, U+2B740부터 U+2B81F) | 222 | 74,616 |
6.1 | 1개 한자 | 기본 다국어 평면 | 1 | 74,617 |
8.0 | 한중일 통합 한자 확장 E, 한중일 통합 한자 9가지 | 보조 상형 문자 평면(SIP, U+2B820부터 U+2CEAF), (U+9FCD부터 U+9FD5까지) | 5,780 | 80,397 |
10.0 | 한중일 통합 한자 확장 F | 보조 상형 문자 평면(SIP, U+2CEB0 부터 U+2EBE0) | 7,473 | 87,870 |
11.0 | 한중일 통합 한자 5가지 | 기본 다국어 평면(BMP, U+9FEB부터 U+9FEF까지) | 5 | 87,887 |
13.0 | 한중일 통합 한자 확장 G, 한중일 통합 한자 13가지, 한중일 통합 한자 확장 A 10가지, 한중일 통합 한자 확장 B 7가지 | 상형 문자 제3 평면(TIP, U+30000부터 U+3134F까지), 기본 다국어 평면(BMP, U+9FF0부터 U+9FFB까지), 기본 다국어 평면(U+4DB6부터 U+4DC6까지), 보조 상형 문자 평면(SIP, U+2A6D7부터 U+2A6DD까지) | 4,969 | 92,856 |
14.0 | 한중일 통합 한자 3가지, 한중일 통합 한자 확장 B 2가지, 한중일 통합 한자 확장 C 4가지 | 기본 다국어 평면(U+9FFC부터 U+9FFF까지), 보조 상형 문자 평면(SIP, U+2A6DE부터 U+2A6DF까지), 보조 상형 문자 평면(SIP, U+2B735부터 U+2B738까지) | 9 | 92,865 |
15.0 | 한중일 통합 한자 확장 H, 한중일 통합 한자 확장 C 1가지 | 상형 문자 제3 평면(TIP, U+31350부터 U+323AF까지), 보조 상형 문자 평면(SIP, U+2B739) | 4,193 | 97,058 |
15.1 | 한중일 통합 한자 확장 I | 보조 상형 문자 평면(SIP, U+2EBF0–2EE5F) | 622 | 97,680 |
[1]
KS X 1001에 지정된 한자중
중복 배당된 268자를 호환용 한자 영역에 넣고 남은 글자 수이다.
[2]
KS X 1002에 원래 배당된 한자는 2,856 자이지만, 유니코드 표준을 제정할 당시 한국 측에서 KS X 1002에 0x6B6B 자리에 배당된 𧳯( ⿰豸者)자를 ⿰𧰨者 형태로 잘못 제출하는 바람에
한자 통합 기준에 따라 U+8C6C자리의 豬(⿰豕者)로 통합되었다. 이후 𧳯자가 GKX-1202.34, T7-335F을 기반으로 한중일 통합 한자 확장-B 영역 U+27CEF자리에 별도로 배당 되었으나 한동안 유니코드 차트 데이터베이스에 K1-6B6B는 U+8C6C로 기재되어 있었다. 이후 해당 오류를 뒤늦게 발견한 유니코드 콘소시엄에서 유니코드 13.0 업데이트때 K1-6B6B에 배당된 한자를 U+8C6C에서 U+27CEF로 정정함으로써 한중일 통합 한자영역에 배당된 KS X 1002의 글자 수는 원래 글자 수보다 하나 적게 되었다.
참고 자료
[3]
K1-6B6B가 한중일 통합 한자 확장-B영역으로 옮겨가면서 부여된 코드이다.