한중일통합한자(韓中日統合漢字, CJK Unified Ideographs)
1. 개요
한중일 통합 한자는 유니코드에 수록돼있는 부호화용 한자 집합으로 그 수는 현재 총 97,680자가 있다. 한중일 통합 한자(CJK Unified Ideographs)의 명칭은 한국어, 중국어, 일본어에 사용되고 있는 한자를 하나로 모았기에 그 나라별 첫글자를 따와 짓게 되었다.1994년 베트남어에서 사용되고 있는 한자( 쯔놈)도 포함했기 때문에 CJKV라 불리기도 하는데, 공식 명칭은 CJK Unified Ideographs가 맞다. 베트남어의 한자가 추가되기 전에 중국어, 일본어, 한국어에서 쓰는 한자만이 추가되어 저런 이름이 붙었는데 유니코드에서는 한 번 정해진 이름을 바꿀 수가 없어서 지금도 CJK 그대로이다.
2. IRG 소스
Ideographic Research Group(IRG)는 ISO/IEC 10646 Universal Character Set 표준과 유니코드에 포함될 한자 목록을 준비하는 ISO 소속 위원회회로, 아래는 여기서 제출된 한자의 출처 목록이다.- kIRG_GSource(중국&싱가포르)
- [ 펼치기 · 접기 ]
- || 중국 || G0 ||
GB/T 2312-1980 (구 GB 2312-80) || 6,763 ||
중국 G1 GB/T 12345-1990 (구 GB/T 12345-90) 2,202 중국 G3 GB/T 13131 (unpublished GB/T 7589-1987 unsimplified forms) 7,226 중국 G5 GB/T 13132 (unpublished GB/T 7590-1987 unsimplified forms) 4,067 중국 G7 General Purpose Hanzi List for Modern Chinese Language, and General List of Simplified Hanzi 162 중국 G8 GB/T 8565.2-1988 (구 GB 8565.2-88) 199 중국 GE GB/T 16500-1998 3,772 중국 GK GB/T 12052-1989 (구 GB 12052-89) 89 싱가포르 GS 싱가포르 문자 226 중국 G4K 사고전서 477 중국 GDZ 지질출판사용 글자체 1 중국 GGH 고대한어사전 226 중국 GRM 인민일보용 글자체 3 중국 GWZ 한어대사전출판사용 글자체 12 중국 GXC 현대한어사전 86 중국 GXH 신화자전 4 중국 GZH 중화자해 39 중국 GBK 중국대백과전서 175 중국 GCH 사해 624 중국 GCY 사원 192 중국 GHC 한어대사전 601 중국 GKX 강희자전 9판 (1958) 부록 포함 20391 중국 GHZ 한어대자전 10850 중국 GHZR 한어대자전편집위원회:《한어대자전(제2판)》, 우한: 호북장강출판집단숭문서국 & 청두 : 사천출판집단사천사서출판사, 2010, ISBN 978-7-5403-1744-7 881 중국 GCE 전국과학기술명사심정위원회와 국가언어문자공작위원회에서 부여한 신규 화학 원소 이름; the value is the atomic number of the element 4 중국 GFC 현대한어규범사전제2판. 편집장:李行健。베이징:외어 교학여연구출판사 2010, ISBN:978-7-5600-9518-9 29 중국 GIDC 중국 공안부 신분증 체계, 2009 69 중국 GIDC23 중국 공안부 신분증 체계, 2023 622 중국 GOCD 옥스포드 영중중영 사전, 편집장:Julie Kleeman, 于海江。옥스포드:옥스포드 대학출판부, 2010, ISBN:978-0-19-920761-9) 2 중국 GXHZ 신화대자전 51 중국 GH GB/T 15564-1995 59 중국 GHF 鄭賢章:《한문불전의난속자휘석여연구》, 청두: 파촉서사, 2016, ISBN 978-7-5531-0700-4 1 중국 GLGYJ 《 장족료가연구》2008 광시민족출판사, ISBN78-7-5363-5069-4 12 중국 GPGLG 장족민가문화총서•핑궈료가 2004-2006, ISBN 7-5363-[4820-7 | 5012-0 | 5013-9 |5014-7 | 5015-5] 97 중국 GT 표준 전신 코드북(수정본), 1983 8 중국 GCYY 중국측회과학원용 글자체 153 중국 GJZ 상무인서관용 글자체 208 중국 GKJ Terms in Sciences and Technologies (科技用字) approved by the China National Committee for Terms in Sciences and Technologies (CNCTST) 81 중국 GZFY 한어방언대사전 915 중국 GZJW 은주 금문집성인득 1,808 중국 GZYS 중국민족고문자연구, 1984 2 중국 GFZ Founder Press System (方正排版系统) 66 중국 GGFZ 통용규범한자자전 14 중국 GLK 《 용감수감》(속고일총서) 1 중국 GZ 고 장자자전 1989, ISBN 7-5363-0614-8 2,471 중국 GXM Characters for use in personal names in China. Source from Public Order Administration, The Ministry of Public Security of the People’s Republic of China. 216 중국 GZA-1 A Vibrant and Unbroken Transmission—Filial Piety and Zhuang Funeral Songs 生生不息的传承•孝与壮族行孝歌之研究, 2010年北京民族出版社, ISBN 978-7-1051-0648-6 6 중국 GZA-2 Annotated Long Zhuang Morality Songs 壮族伦理道德长诗传扬歌译注, 2005 年广西民族出版社, ISBN 7-5363-4922-X 38 중국 GZA-3 Compendium of Old Zhuang Folksong Texts—Wooing Songs vol. 1—Liao Songs 壮族民歌古籍集成•情歌(一)嘹歌, 1993广西民族出版社, ISBN 7-5363-2714-5 2 중국 GZA-4 Compendium of Old Zhuang Folksong Texts—Wooing Songs vol. 1—Fwen Nganx 壮族民歌古籍集成•情歌(二)欢𭪤, 1997年南宁广西民族出版社, ISBN 7-5363-3298-X 11 중국 GZA-6 Zhuang Proverbs from China 中国壮族谚语 2015 广州世界图书出版广东有限公司, ISBN 978-7-192-0492-1 59 중국 GZA-7 Ancient Remembrance—Zhuang Creation Myth Songs 远古的追忆•壮族创世神话古歌研究, 2012 年北京民族出版社, ISBN 978-7-1051-2242-4 1 중국 GDM Place name characters from the Public Order Administration, Ministry of Public Security, People’s Republic of China 131 중국 GU The source reference for this ideograph has been moved; the value is its code point. 167
총 66,572자
- kIRG_HSource(홍콩)
- [ 펼치기 · 접기 ]
- || 홍콩 || H || Hong Kong Supplementary Character Set – 2008 || 4,579 ||
홍콩 HB0 Big-5: Computer Chinese Glyph and Character Code Mapping Table, Technical Report C-26, 電腦用中文字型與字碼對照表, 技術通報C-26, 1984, Symbols 9 홍콩 HB1 Big-5, Level 1 5,401 홍콩 HB2 Big-5, Level 2 7,652 홍콩 HD Hong Kong Supplementary Character Set – 2016 26 홍콩 HU The source reference for this ideograph has been moved; the value is its code point. 1
총 17,668자
- kIRG_JSource(일본)
- [ 펼치기 · 접기 ]
- || 일본 || J0 ||
JIS X 0208-1990 || 6,356 ||
일본 J1 JIS X 0212-1990 3,058 일본 J4 JIS X 0213:2004 level-4 665 일본 J3 JIS X 0213:2004 level-3 194 일본 J3A JIS X 0213:2004 level-3 addendum from JIS X 0213:2000 level-3 8 일본 J13 JIS X 0213:2004 level-3 ideographs replacing J1 ideographs 1037 일본 J13A JIS X 0213:2004 level-3 ideograph addendum from JIS X 0213:2000 level-3 replacing J1 ideographs 2 일본 J14 JIS X 0213:2004 level-4 ideographs replacing J1 ideographs 1,704 일본 JA Unified Japanese IT Vendors Contemporary Ideographs, 1993 575 일본 JA3 JIS X 0213:2004 level-3 ideographs replacing JA ideographs 18 일본 JA4 JIS X 0213:2004 level-4 ideographs replacing JA ideographs 67 일본 JARIB Association of Radio Industries and Businesses (ARIB) ARIB STD-B24 Version 5.1, March 14 2007 6 일본 JH 범용전자정보교환환경정비 프로그램, 2002-2009 107 일본 JK 일본국자집 782 일본 JMJ 문자정보기반정비사업 1647
총 16,226자
- kIRG_KPSource(북한)
- [ 펼치기 · 접기 ]
- || 북한 || KP0 ||
KPS 9566-97 || 4,653 ||
북한 KP1 KPS 10721-2000 19,477 북한 KPU The source reference for this ideograph has been moved; the value is its code point. 2
총 24,132자
- kIRG_KSource(한국)
- [ 펼치기 · 접기 ]
- || 한국 || K0 ||
KS X 1001:2004 (구 KS C 5601-1987) || 4,888 ||
한국 K1 KS X 1002:2001 (구 KS C 5657-1991) 2,856 한국 K2 KS X 1027-1:2011 (구 PKS C 5700-1 1994) 7,911 한국 K3 KS X 1027-2:2011 (구 PKS C 5700-2 1994) 1,834 한국 K4 KS X 1027-3:2011 (구 PKS 5700-3:1998) 172 한국 K5 KS X 1027-4:2011 (구 Korean IRG Hanja Character Set 5th Edition: 2001) 404 한국 K6 KS X 1027-5:2021 158 한국 KC 한국역사정보통합시스템 2,784 한국 KU The source reference for this ideograph has been moved; the value is its code point. 3
총 21,010자
- kIRG_MSource(마카오)
- [ 펼치기 · 접기 ]
- || 마카오 || MA || HKSCS-2008 code point in hexadecimal || 42 ||
마카오 MB Big Five code point in hexadecimal 17 마카오 MC MSCS reference 92 마카오 MD MSCS horizontal extensions 197
총 348자
- kIRG_SSource(다이쇼 신수 대장경[1])
- [ 펼치기 · 접기 ]
- || 대장경 || SAT || 다이쇼신수대장경, 1924–1934 || 3,455 ||
총 3,455자
- kIRG_TSource(대만)
- [ 펼치기 · 접기 ]
- || 대만 || T1 || TCA-CNS 11643-1992 1st plane || 5,413 ||
대만 T2 TCA-CNS 11643-1992 2nd plane 7,651 대만 T3 TCA-CNS 11643-1992 3rd plane with some additional ideographs 6,397 대만 T4 TCA-CNS 11643-1992 4th plane 7,287 대만 T5 TCA-CNS 11643-1992 5th plane 8,602 대만 T6 TCA-CNS 11643-1992 6th plane 6,386 대만 T7 TCA-CNS 11643-1992 7th plane 6,537 대만 TA TCA-CNS 11643-2007 10th plane 8 대만 TB TCA-CNS 11643-2007 11th plane 42 대만 TC TCA-CNS 11643-2007 12th plane 966 대만 TD TCA-CNS 11643-2007 13th plane 1,362 대만 TE TCA-CNS 11643-2007 14th plane 700 대만 TF TCA-CNS 11643-2007 15th plane 6,721 대만 T11 TCA-CNS 11643 17th plane (pending new version) 0 대만 T12 TCA-CNS 11643 18th plane (pending new version) 7 대만 T13 TCA-CNS 11643 19th plane (pending new version) 1,043 대만 TU The source reference for this ideograph has been moved; the value is its code point. 15
총 59,137자
- kIRG_UKSource(영국)
- [ 펼치기 · 접기 ]
- || 영국 || UK || IRG N2107R2과 IRG N2232R 문서 || 2,503 ||
총 2,503자
- kIRG_USource(유니코드 기술 위원회)
- [ 펼치기 · 접기 ]
- || 유니코드 || UTC || IRG U-source || 1,045 ||
총 1,045자
- kIRG_VSource(베트남)
- [ 펼치기 · 접기 ]
- || 베트남 || V0 || TCVN 5773:1993 || 2,329 ||
베트남 V1 TCVN 6056:1995 3,308 베트남 V2 VHN 01:1998 3,196 베트남 V3 VHN 02: 1998 532 베트남 V4 Kho Chữ Hán Nôm Mã Hoá (Hán Nôm Coded Character Repertoire), Hà Nội, 2007 1,950 베트남 VN Vietnamese horizontal extensions; the value is its code point 1,969
총 13,284자
3. 영역
유니코드에 배당된 글자 하나에는 복수의 출처를 포함하므로[2]아래의 출처 합계 수는 각 영역에 배당된 한자의 수보다 크다.모든 내용은 유니코드 15.1 기준이다.
3.1. 한중일 통합 한자
- 한중일 통합 한자
- BMP 20,992자
- 4E00-62FF, 6300-77FF, 7800-8CFF, 8D00-9FFF.
- 출처
- [ 펼치기 · 접기 ]
- || 중국 || G0 || 6,763 ||
중국 G1 2,202 중국 G3 4,834 중국 G5 2,841 중국 G7 42 중국 G8 199 중국 GCE 4 중국 GDM 2 중국 GE 3,772 중국 GK 89 중국 GKX 3 중국 GHZ 1 중국 GHZR 1 중국 GFC 2 중국 GH 59 중국 GT 8 중국 GKJ 16 중국 GZFY 1 중국 GGFZ 1 중국 GLK 1 중국 GU 92
홍콩 H 2,292 홍콩 HB0 9 홍콩 HB1 5,401 홍콩 HB2 7,650 홍콩 HD 24
일본 J0 6,356 일본 J1 3,058 일본 J4 301 일본 J3 95 일본 J13 1,037 일본 J13A 2 일본 J14 1,704 일본 J3A 7 일본 JARIB 3 일본 JMJ 2
북한 KP0 4,652 북한 KP1 10,358
한국 K0 4,620[3] 한국 K1 2,855[4] 한국 K2 7,911 한국 K3 1 한국 K4 4 한국 K6 49 한국 KC 1 한국 KU 1[5]
마카오 MA 29 마카오 MB 17 마카오 MC 3 마카오 MD 151
대만 T1 5,413 대만 T2 7,651 대만 T3 4,144 대만 T4 894 대만 T5 64 대만 T6 31 대만 T7 16 대만 TB 2 대만 TC 2 대만 TE 9 대만 TF 158
베트남 V0 599 베트남 V1 3,305 베트남 V2 759 베트남 V3 91 베트남 V4 19 베트남 VN 35
유니코드 UTC 77
- 한중일 통합 한자 확장 A
- BMP 6,592자
- 3400-4DBF.
- 한중일 통합 한자 확장 B
- SIP 42,720자
- 20000-215FF, 21600-230FF, 23100-245FF, 24600-260FF, 26100-275FF, 27600-290FF, 29100-2A6DF.
- 한중일 통합 한자 확장 C
- SIP 4,160자
- 2A700-2B73F.
- 한중일 통합 한자 확장 D
- SIP 224자
- 2B740-2B81F.
- 한중일 통합 한자 확장 E
- SIP 5,776자
- 2B820-2CEAF.
- 한중일 통합 한자 확장 F
- SIP 7,488자
- 2CEB0-2EBEF.
- 한중일 통합 한자 확장 G
- TIP 4,944자
- 30000-3134F.
- 한중일 통합 한자 확장 H
- TIP 4,192자
- 31350-323AF.
- 한중일 통합 한자 확장 I
- SIP 624자
- 2EBF0–2EE5F.
3.2. 한중일 호환용 한자
- 한중일 호환용 한자
- BMP 472자
- F900–FAFF.
- 출처
- [ 펼치기 · 접기 ]
- || 한국 || K0 ||
268 ||
한국 KU 2
- 한중일 호환용 한자 보충
- SIP 542자
- 2F800–2FA1F.
4. 역사
연도 | 유니코드 버전 | 내용 | 위치 | 개수 | 누계 |
1993 | 1.1 | 한중일 통합 한자 | BMP[6] | 20,902 | 20,915 |
한중일 기호 및 구두점 | BMP[7] | 1 | |||
한중일 호환용 한자에 있지만 실제로는 중복되지 않는 한자 | BMP[8] | 12 | |||
1999 | 3.0 | 한중일 통합 한자 확장 A | BMP[9] | 6,582 | 27,497 |
2001 | 3.1 | 한중일 통합 한자 확장 B | SIP[10] | 42,711 | 70,208 |
2005 | 4.1 | HKSCS-2004에 없었던 ISO 10646 한자 | BMP[11] | 14 | 70,230 |
GB 18030-2000에 없었던 ISO 10646 한자 부건 | BMP[12] | 8 | |||
2008 | 5.1 | 일본 한자 7자, U+4039(䀹)과 U+9FC3(鿃)의 분리[13] | BMP[14] | 8 | 70,238 |
2009 | 5.2 | 한중일 통합 한자 확장 C | SIP[15] | 4,149 | 74,395 |
일본 한자 2자, 새 한자 1자, 홍콩 한자 5자 | BMP[16] | 8 | |||
2010 | 6.0 | 한중일 통합 한자 확장 D | SIP[17] | 222 | 74,617 |
2012 | 6.1 | U+9FCC(鿌) | BMP[18] | 1 | 74,618 |
2015 | 8.0 | 한중일 통합 한자 확장 E | SIP[19] | 5,762 | 80,389 |
급용한자 3자, 화학용 5자, U+4CA4(鿐)와 U+9FD0(鿐)의 분리 | BMP[20] | 9 | |||
2017 | 10.0 | 한중일 통합 한자 확장 F | SIP[21] | 7,473 | 87,883 |
동방 정교회 20자 및 U+9FEA(鿪) | BMP[22] | 21 | |||
2018 | 11.0 | 화학용 3자, 일본 한자 2자 | BMP[23] | 5 | 87,888 |
2020 | 13.0 | 한중일 통합 한자 확장 G | TIP[24] | 4,939 | 92,857 |
급용 과학 기술 한자 13자, 분리가 필요한 한자 10자 | BMP[25] | 23 | |||
곤곡 공척보 한자 7자 | SIP[26] | 7 | |||
2021 | 14.0 | 한중일 통합 한자 3자 | BMP[27] | 3 | 92,866 |
한중일 통합 한자 확장 B 2자 | SIP[28] | 2 | |||
한중일 통합 한자 확장 C 4자 | SIP[29] | 4 | |||
2022 | 15.0 | 한중일 통합 한자 확장 H | TIP[30] | 4,192 | 97,059 |
한중일 통합 한자 확장 C 1자 | SIP[31] | 1 | |||
2023 | 15.1 | 한중일 통합 한자 확장 I | SIP[32] | 622 | 97,681 |
[1]
일제강점기 당시 일본에서
팔만대장경을 레퍼런스로 후대의 연구를 추가하여 제작한 대장경이다.
[2]
예를들어
一자는 G0-523B, HB1-A440, T1-4421, J0-306C, K0-6C69, KP0-FCD6, V1-4A21에 해당한다.
[3]
KS X 1001에 지정된 한자 중
중복 배당된 268자를 호환용 한자 영역에 넣고 남은 글자 수이다.
[4]
KS X 1002에 원래 배당된 한자는 2,856자이지만, 유니코드 표준을 제정할 당시 한국 측에서 KS X 1002의 0x6B6B 자리에 배당된 𧳯( ⿰豸者) 자를 ⿰𧰨者 형태로 잘못 제출하는 바람에
한자 통합 기준에 따라 U+8C6C 豬(⿰豕者)로 통합되었다. 이후 𧳯 자가 GKX-1202.34, T7-335F을 기반으로 한중일 통합 한자 확장-B 영역의 U+27CEF에 별도로 배당되었으나 한동안 유니코드 데이터베이스에서 K1-6B6B는 U+8C6C 위치에 있었다. 이후 해당 사기(?)를 뒤늦게 발견한 유니코드 콘소시엄에서 유니코드 13.0 업데이트 때 K1-6B6B를 U+8C6C에서 U+27CEF로 옮김으로써 한중일 통합 한자 영역에 배당된 KS X 1002의 글자 수는 원래 글자 수보다 하나 적게 되었다.
참고 자료
[5]
K1-6B6B가 한중일 통합 한자 확장-B 영역으로 옮겨가면서 부여된 코드이다.
[6]
U+4E00(一)부터 U+9FA5(龥)까지
[7]
U+3007(〇)
[8]
U+FA0E(﨎), U+FA0F(﨏), U+FA11(﨑), U+FA13(﨓), U+FA14(﨔), U+FA1F(﨟), U+FA21(﨡), U+FA23(﨣), U+FA24(﨤), U+FA27(﨧), U+FA28(﨨), U+FA29(﨩)
[9]
U+3400(㐀)부터 U+4DB5(䶵)까지
[10]
U+20000(𠀀)부터 U+2A6D6(𪛖)까지
[11]
U+9FA6 (龦)부터 U+9FB3(龳)까지
[12]
U+9FB4(龴)부터 U+9FBB(龻)까지
[13]
다른 글자이지만 같은 글자로 묶였던 오류가 있었다.
[14]
(U+9FBC(龼)부터 U+9FC2(鿂)까지), U+9FC3(鿃)
[15]
U+2A700(𪜀)부터 U+2B734(𫜴)까지
[16]
일본 한자: (ARIB #47, U+9FC4(鿄), #95, U+9FC5(鿅)), 새 한자: (ARIB #93, U+9FC6(鿆)), 홍콩 한자: (U+9FC7(鿇)부터 U+9FCB(鿋)까지
[17]
U+2B740(𫝀)부터 U+2B81D(𫠝)까지
[18]
U+9FCC(鿌)
[19]
(U+2B820(𫠠)부터 U+2CEA1 (𬺡)까지
[20]
U+9FCD(鿍)부터 U+9FCF(䥑)까지, U+9FD1(鿑)부터 U+9FD5(鿕)까지, U+9FD0(鿐)
[21]
U+2CEB0(𬺰) 부터 U+2EBE0(𮯠)까지
[22]
U+9FD6(鿖)부터 U+9FEA(鿪)까지
[23]
U+9FEB(鿫)부터 U+9FEF(鿯)까지
[24]
U+30000부터 U+3134F까지
[25]
U+9FF0부터 U+9FFC까지, U+4DB6부터 U+4DBF까지
[26]
U+2A6D7부터 U+2A6DD까지
[27]
U+9FFD부터 U+9FFF까지
[28]
U+2A6DE부터 U+2A6DF까지
[29]
U+2B735부터 U+2B738까지
[30]
U+31350부터 U+323AF까지
[31]
U+2B739
[32]
U+2EBF0부터 U+2EE5F까지