최근 수정 시각 : 2019-06-14 18:48:08

기계 번역

번역기에서 넘어옴
1. 개요2. 올바른 사용법3. 오역4. 주요 번역기5. 번역 평가 방법론
5.1. 필요성5.2. 사람이 직접 평가5.3. 자동 평가 방법
6. 기타7. 관련 문서

1. 개요

Machine translation, 機械飜譯

컴퓨터가 주체가 되어 언어를 번역해 주는 프로그램. 사람이 번역하는 것을 컴퓨터가 보조하는 경우는 CAT(Computer-assisted translation)라고 한다. 기계번역 분야는 인공지능과도 관련이 깊다. 번역은 인공지능의 목표 중 하나였으며 지금까지 연구되는 주제이기도 하다.

한국어 위키백과의 일본 오타쿠 문화 관련 콘텐츠의 대부분도 일본어 위키백과에 있는 내용을 네이버 번역기에 돌려 포풍복붙한 형식인데, 이러면 저작권에도 위반된다고 한다. 저작물 본래의 저작권과는 별개로, 기계 번역을 통한 번역에도 저작권이 따로 들어가기 때문.

2016년부터는 AI를 이용한 신경망 번역을 구글이 도입했고, 네이버 네이버 파파고 등 AI 번역기를 도입했다. AI의 학습량에 따라 진화하는 덕분에 번역 퀄리티가 전과는 비교가 안될 정도로 좋아졌다.

계속 발전이 거듭되면 사람을 통한 학습을 할 필요 없이 번역기를 통해 자연스레 외국인과 서로 대화를 하고 언어를 학습하는 날이 올 것이다. 현재의 시점에도 여행 회화 정도는 문제 없는 수준이다.

참고로 일본쪽 번역기를 사용하면 해외 아이피(IP)를 막아둔 사이트도 거뜬하게 들어갈 수 있다.

2. 올바른 사용법

기계 번역기는 개발 단계에서 기본적으로 '신문'과 같은 정형화된 문장을 기반으로 개발된다. 그렇기 때문에 맞춤법, 띄어쓰기, 문장부호(마침표, 물음표)들을 제대로 붙이고, 오타 신조어도 고쳐서 표준적인 문장을 사용하면 번역률이 훨씬 나아지는 경우가 많다. 사실 必要韓紙같은 예도 「필요한지」로 제대로 맞춤법에 맞게 쓰면 번역 제대로 된다. 그리고 서로 다른 여러 개의 문장은 문장부호를 이용해 확실히 구분해줘야 한다.

줄임말은 가급적 풀어서 쓰는 것이 좋다. 또 우리말에서는 주어가 생략되는 경우가 많은데 생략하지 말고 쓰는 게 좋다. 특히 영어와 같이 생략이 적은 언어로 번역하는 경우 고유명사가 엉뚱하게 번역되는 경우가 있는데, 이럴 때는 A씨, B사, C단체 등의 단어로 치환해서 문장을 작성하면 정상적으로 번역되기도 한다.

짧은 문장 즉 아프거나 위치를 묻거나 주문하거나 하는 수준에서만 사용하는 것이 좋다.

영어를 어느 정도 읽을 수 있는 경우, 타 언어를 번역기로 번역하고 싶다면 일단 영어로 번역해보는 편이 좋다. 우리가 주로 쓰게 되는 영미권 번역기는 영어 번역을 제일 잘하기도 하거니와, 인도유럽어족 언어들 간에는 번역기 효율이 꽤 좋아서 그럭저럭 정확한 번역 결과를 내놓기 때문.

3. 오역

파일:나무위키+넘겨주기.png   관련 문서: 오역

너무나 당연한 얘기지만, 번역기는 어디까지나 참고용으로, 2016년 이후로는 유럽언어기준 B1[1] 이하의 실력을 가졌지만 외국어로 의사소통할 수밖에 없을 상황에만 번역기를 사용한 문장을 사용하는 것이 바람직하다. 위에서도 언급하듯, 맞춤법 등을 제대로 지켜주지 않으면 심각한 수준의 오역된 문장이 나올 수 있으며, 설령 모든 요소를 완벽하게 갖춘 문장이라고 해도 번역기는 그 문장에 대한 완벽한 번역문을 제공해줄 수 없다.[2] 다시 말해서, 번역기를 사용한 문장을 어디 공적인 데에 가서 쓰려고 하면 제대로 엿먹을 수 있다는 뜻이다. 따라서 다음과 같은 경우에는 번역기를 사용하면 모두의 웃음거리가 될 수 있다.

파일:UVWSHbN.png
구글 번역기에서 번역한 거다.[3]
파일:빙GOD.jpg
2018년 11월 28일 기준 아직도 Bing 번역은 저렇게 나온다(!)

파일:SoD.jpg
히컵아 뭐 잘 못 먹었구나....

파일:external/cdnweb01.wikitree.co.kr/img_20140227180145_c0ed9821.jpg
번역기로 돌린 대륙의 간판.jpg[4]

파일:external/revealingerrors.com/translate_server_error.jpg
대륙의 기상 시리즈 중 하나기도 하다. 참고로 해당 간판은 허베이 성 스좌장에 있는 G5번( 베이징 - 쿤밍) 고속도로 휴게소에 있다. 간판의 원래 의미는 그냥 '식당'.

참고로 위 두 개의 간판은 번역 서버 오류가 나서 오류 문구가 떴는데 그걸 번역본으로 착각하고 해당 문구를 간판에 그대로 올린 것.

파일:external/blog.donga.com/donga_com_20120820_225937.jpg
잘못 번역된 결과를 다시 잘못 번역한 결과의 예. 한자를 영어로 기계번역한 뒤 다시 영어를 한글로 기계번역하는 과정에서 완전히 엉뚱한 뜻이 되어버렸다. 凉拌苦菊에서 凉拌은 무침, 苦菊는 루꼴라라는 뜻인데 이를 영어로 번역하면서 凉를 cold, 苦를 bitter, 菊를 발음 그대로 Ju라고 번역하여 Ju bitter cold라고 번역하였고, 이를 다시 한국어로 번역하면서 Ju를 '서부 아프리카 원주민의'(Juju가 서부 아프리카 원주민의 주술용 아뮬렛을 의미)로 번역하고 bitter cold를 쓰라린 추위로 번역한 듯하다.참고로 서부 아프리카 원주민의 쓰라린 추위를 중국어 번역기로 돌리면 西非洲原住民的严寒라고 뜬다.

파일:fuck-the-duck-until-exploded.jpg
직역하면 " 폭발할 때까지 오리를 강간해라"가 되어버린다.중국의 번역기가 干자를 모조리 Fuck으로 번역해 버려서[5] 이와 비슷한 일들이 생기는 것.(예시: 干菜类(마른 채소)→Fuck Vegetables(채소 X까)) 하도 파괴력이 컸는지 urban dictionary에도 등록되었다.

파일:오역.jpg
사실 중국만 비웃을 건 아니다. 한식 메뉴판에도 이렇게 번역기를 엉뚱하게 돌린 사례는 얼마든지 있다. 생고기도 raw meat가 아닌 lifestyle meat로 번역되었다. 그 위에도 '정식'을 proper form이라고 해석해 놓았다...

파일:translation-fail-2.jpg
아래 번역된 영어를 재번역하면, "남자 화장실은 당신을 외부 우측 계단에 매장합니다~"가 된다.

파일:external/www.dogdrip.com/3660896140_QsWI5NJO_981436525_44a87c26.jpg
토마스 뮐러의 새해인사.

파일:20160916_203544.jpg
위는 일본의 사례다.

파일:rsz_img_20180909_133207.jpg
도쿄 하네다 공항 국제선 터미널의 쓰레기통.
위상이 국제공항인 만큼 완벽한 번역을 해야 하는데 번역기를 돌려버렸다.

파일:Screenshot_20190329-194016.png
일본에서 중국어의 오역문제를 논하는 프로그램에서 나온 장면인데 잘 보면 한국어 영어도 잘못되었다.(...)
  • 숙제
    선생님께서 당신의 숙제가 번역기를 돌린 문장이란 것을 모를 것 같은가? 몇 가지 문법 상의 오류가 있는 문장과 번역기를 돌린 문장은 여러 면에서 차이가 난다. 먼저 기본적인 문장의 구조부터 어긋나는 경우가 생기며,[6] 번역기가 동음이의어를 착각해버려 상황과는 전혀 어울리지 않는 단어가 갑자기 튀어나오기도 한다. 즉 안 하느니만 못한 엉터리 숙제를 제출하게 되므로 애초에 숙제는 스스로 하자. 어차피 시험 보면 다 뽀록나게 되어 있다. 가볍게 끝난다면 그냥 선생님한테 단순히 혼나는 것으로 끝나겠지만, 학년이 올라갈수록 점점 자신한테 미치는 영향이 치명적이 되며, 대학교에서 이런 짓 하다간 그냥 망했어요. 상위버전으로 보고서를 번역기를 써서 제출해 내면? 더 이상의 자세한 설명은 생략한다.
  • 지식iN 답변
    일부 답변자들은 지식iN에서 활동할 때 번역해달라는 질문이 올라오면 곧바로 번역기를 돌려서 그걸 답변으로 올려 버리는데, 이 행위는 질문자뿐만 아니라 다른 답변자들한테도 민폐를 끼치는 행위다. 일단 질문자는 제대로 된 답변을 기대하고 질문을 올린 것인데, 누군가가 말도 안 되는 문장을 가지고 온 주제에 뻔뻔하게 채택해달라고 하면 매우 불쾌하며 만약 질문자가 답변이 번역기인 줄 모른다면 상황은 더 심각해진다. 번역기를 사용한 문장을 어디에 써먹을지 모르기 때문이다. 예를 들어 전문적인 글이나 보고서를 작성하는 상황이었더라면 바로 아웃이 되는 거다. 또한, 번역기를 사용하지 않은 제대로 된 번역가 답변자가 지식iN에는 널려 있다. 번역기를 써서 답변한다면 그들에게 제대로 된 답변을 할 기회도, 채택받을 확률도 앗아가는 것이 된다. 그러므로 지식iN에서 번역기를 써서 답변을 다는 것은 아무 성의도 없는 내공냠냠성 답변이랑 하나도 다를 바가 없다.
    다만 내용도 전문적인 데다 번역업체에 의뢰하면 최소 십수만 원이 들 분량을 내공 몇 푼에 날로 먹으려 드는 질문자도 문제가 있다. 애초에 전문적인 글이나 보고서라면 제대로 된 곳을 통해 번역하는 게 품질 면에서 더 낫다. 세상에 공짜 점심은 없다.

파일:external/www.tooli.co.kr/%E3%85%8B%E3%85%8B%E3%85%8B.jpg
[7]

컴퓨터 프로그램의 특성상 번역을 100% 완벽하게 할 수는 없기에 오역이 나올 수밖에 없다. 어떤 사람들은 현재의 번역기들을 「오역기」라고 비꼬아 부르기도 한다.

특히 구글 번역기로 일본어 번역을 하면 후반에 갈수록 번역이 안 되어 있다거나,[8] 이상한 단어가 나오기도 한다.[9] 번역 성능은 차치하고서라도 동형이의어의 처리 문제도 있다. 특히 동형이의어가 많은 한국어에서 이 문제가 잘 나타난다. 예를 들어 「 인도로 가다」라는 문장만 제시되면 그 문장의 '인도'가 사람이 다니는 길(人道)을 의미하는지 아니면 남아시아의 나라 중 하나인 인도(India, 印度)를 의미하는지 알 수 없다.

또한 일반명사에서 따온 고유명사[10]의 경우 이것이 일반명사인지 고유명사인지 번역기는 알길이 없기 때문에 단어 뜻 그대로 번역하는 경우가 있다. 그래서 외국 회사의 홈페이지를 통째로 번역기로 돌린다면 내용을 이해하는 데 언어적 센스가 필요하다.

추가로 숙어가 튀어나오면 거의 99% 확률로 오역이 되어버린다. Could not help V-ing를 '도울 수가 없고 그러나 ~하는 도중에'라는 식으로 번역하거나, be used to V-ing를 '~하는 데 사용되다' 같은 식으로 번역하는 게 대표적인 예. 그나마 후자는 원체 사용 빈도가 높은지라 지금은 왠만한 번역기는 '익숙하다'라고 제대로 뱉어주지만, 전자는 지금까지도 제대로 번역하는 번역기가 거의 없다.

기계 번역의 특성상 번역 대상이 되는 언어간의 유사성에 영향을 크게 받는다. 어순이 같고 한자 단어를 공유하는 한일 번역은 80~90% 정도의 번역을 보이고 영어와 프랑스어 같은 경우도 상당한 번역율을 보인다.[11] 어순이나 문법상의 차이가 큰 한영 번역 같은 경우 종종 무슨 내용인지 알기 어려울 정도로 번역율이 떨어진다. 중국어의 경우도 어순이 다른 데다가 중국어의 의차 음차 뒤섞은 무자비한 현지화 표기까지 존재한다.[12]

알타비스타의 바벨피쉬는 충격과 공포를 선사했다. 알타비스타 만담기라고 부를 정도였다. 한동안 바벨피쉬를 이용한 개그가 유행한 적이 있다. 참고로 2013년 현재 위 짤과 같은 'How are you?'를 넣으면 '어떻게 지내세요'라고 정상적으로 번역한다.

유명한 번역기의 오역으로 일본어로 필요한지를 오역한 必要韓紙가 있으며 영어로 "Time flies like an arrow"를 오역한 "시간 파리는 화살을 좋아한다."가 있다.[13]아예 영미권에선 "Fruit flies like a banana."라는 문장까지 앞 문장과 세트로 볼 지경.

심지어는 日本날책으로 번역하기도 한다.

한자로 이름을 표시하는 나라들[14]의 국적을 가진 사람들의 이름을 번역기로 돌리면 기상천외한 번역이 등장하곤 한다. 예시를 들자면....
  • 후지하라 쇼마(藤平 尚真): 핑은 여전히 참 포도나무이다
  • 야나기 유야(柳裕也): 리우 유도
  • 사카이 토모히토(酒居知史): 서식지는 와인의 역사를 알고
  • 도히 세이야(土肥星也): 토양과 비료도 스타

4. 주요 번역기

사라진 번역기는 취소선 처리.

4.1. 알타비스타

바벨피쉬 문서 참조. 구글 번역 이전에 세계적으로 유명한 번역 서비스였다. 엉터리같긴 하지만 그래도 인구어간 번역은 언어간의 구조적 유사성 덕분에 그럭저럭 쓸 만했었다고. 지금은 야후!를 거쳐 Bing에서 서비스 중.

4.2. Google 번역

구글 번역 문서 참조. 한국어를 영어로 번역할 경우 거의 100% 틀린 번역을 하여 유명하다. 2016년 9월 28(현지시각)부터 영어-중국어를 시작으로 딥 러닝 기술이 적용되었다.

4.3. 파파고

네이버에서 제작한 인공지능 기반 번역기.

4.4. 카카오 I 번역

카카오 I의 서비스 중 번역 서비스이다. 카카오 I 번역 문서 참조.

4.5. S 번역기

삼성전자에서 제작한 S 번역기 문서 참조. S 번역기를 제작한 회사는 구글 번역기를 만든 회사와 동일한 회사다.

4.6. 시스트란 번역기( 데모)


시스트란에서 인공신경망 기술을 기반으로 만든 번역기다. 하버드대와 공동연구하고 있으며 OpenNMT OpenNMT에 오픈 소스화 되어 있다.

4.7. 번역기


마이크로소프트에서 제작했다. 2013년 7월 현재 43개 언어를 지원한다. 기술문서 번역에서는 구글보다 좋은 결과를 보여준다. 이유는 방대한 MSDN 번역자료가 있기 때문이다. 트위터[15] 페이스북의 번역 기능이 바로 이 번역기 기반이다.

파일:external/thimg.todayhumor.co.kr/1440422666179.jpg
엉뚱한 오역을 범한다. 대표적으로는 프란치스코가 트위터에 'War never again! Never again war!'라고 쓴 것을 ' 결코 다시 전쟁! 결코 다시 전쟁!'이라고 출력하는 등의 사례가 있다. 교황님께서 십자군 전쟁을 원하신다! 2018년 5월 번역 결과도 그대로다.[16]

파일:BingBB.jpg
그리고 과거 구글 번역 때처럼 여기도 初音ミク( 하츠네 미쿠)가 이명박으로 변역된 적이 있었으나 지금은 올바르게 수정되었다. 저 단어 단독적으로 사용하면 정상으로 보이지만, 특수문자나 다른 수식어와 함께 사용하면 여전히 이명박으로 나온다. 더불어 도 특수문자와 수식어랑 같이 사용하면 박근혜로 나오며, yi를 치면 이순신이 나온다.

의외로 많은 번역 앱이나 사이트, 블로그 등이 빙 번역기에 번역 서비스를 의존하고 있다. 앱/웹 개발자에게 무료로 자신들의 서비스 API를 오픈하고 있는 혜자로운 정책 덕분. 사이트나 블로그 등에 부착할 수 있는 위젯에는 제한이 없고, 앱에서 사용할 수 있는 API는 월 200만 단어까지 무료다.

이렇듯 사람들 사이에 불만이 많았지만 2016년 11월 15일부터 신경망 기반 번역이 등장하면서 앞으로는 개선될 것으로 보인다.

4.8. 한↔일 전문 번역기

  • EZTrans 계열
    • EZTrans XP
      EZTrans 계열의 원조 프로그램.
    • 네이버 번역기: 인조이재팬 네이버 사전 번역기→NTransTalk→ 네이버 사전 번역기
      한때 NTransTalk로 대체되었다가 이후 NTransTalk가 네이버 번역기로 흡수된 것 같다. 네이버 파파고의 정식 서비스가 시작된 이후에는 서비스가 종료되었고, 그 자리를 파파고가 대체하였다.
    • 아네모네 + Ehnd( 꿀도르) 링크
      EZTrans XP의 비공식 확장 프로그램[17] 및 플러그인. 아네모네가 프로그램이고 Ehnd(꿀도르)가 플러그인이다. 2017년 기준으로 가장 성능이 좋은 일한 번역기이다. 물론 완전하지는 않다.
      다만 본래 게임용(이 경우에는 ITH를 비롯한 후커의 개별 설치가 필요)으로 개발된 프로그램이라, 웹사이트 번역 기능은 없다. 웹사이트의 문장을 따로 복사해서 텍스트 번역란에 붙여넣어야만 한다. 혹은 드래그가 허용되는 사이트일 경우 클립보드 기능을 사용해 실시간 번역을 할 수도 있다.
    • 야후 JAPAN 번역
      야후 JAPAN에서 서비스하는 번역기로, 크로스랭귀지의 번역 엔진을 사용하는 서비스다.
      한↔일/일↔한 모두 가능하며 번역 품질이 꽤나 좋다. 다만 유저 인터페이스가 일본어이기에 일본어에 익숙하지 않으면 사용에 난점이 있으며, 또한 2015년 겨울 이후부터는 야후 JAPAN 회원 계정이 있어야지만 세부 설정 기능을 사용할 수 있게 되었다.
      번역 품질에 관련해서 독특한 부분을 한 가지 언급하자면, 띄어쓰기에 관련해서 상당히 철저하게 띄어쓰기가 이루어진 결과를 출력하도록 되어 있는 것이 특징. 다만 이것이 좀 지나쳐져 과잉 교정이 발생되는 일도 많아서, 붙여쓰기를 해야 자연스러운 단어나 문장이 될 수 있는 부분에 대해서도 일괄적으로 띄어쓰기를 적용한 결과를 출력하는 경향을 보였다. 이 때문에 가독성을 위한 배려라는 점에서는 훌륭하지만 그와는 별개로 기본적인 문장 구성에 있어서 기계 번역을 거친 티가 무언가 부자연스러움을 줄 정도로 확 나는 결과가 출력되는 일이 많았었던 편. 또한 꽤 철저하게 띄어쓰기가 이루어진다고는 하지만 역시 완전하지는 않은 편이기도 해서, 띄어쓰기를 해야 자연스러운 단어나 문장이 될 수 있는 부분에 붙여쓰기를 적용한 결과를 출력할 때도 역시 있었다. 2017년 6월 29일자로 서비스가 종료되었다.
    • 고재팬
    • 인포시크 번역기
      라쿠텐 포털 사이트인 인포시크에서 서비스하는 번역기로, 야후 JAPAN에서 서비스하는 번역기인 야후 JAPAN 번역과 마찬가지로 크로스랭귀지의 번역 엔진을 사용하는 서비스다.
      한↔일/일↔한 모두 가능하며, 같은 회사의 번역 엔진을 사용하고 있기 때문에 번역 품질은 야후 JAPAN 번역과 크게 다르지 않다. 유저 인터페이스가 일본어이기에 일본어에 익숙하지 않으면 사용에 난점이 있다는 것도 동일. 띄어쓰기에 관련해서 상당히 철저하게 띄어쓰기가 이루어진 결과를 출력하도록 되어 있지만 그것이 좀 지나쳐져 과잉 교정이 발생되는 일 역시 많다는 것도 동일하다.
      다만 자잘한 차이점도 있기는 한데, 대표적으로 회원 계정이 없이도 세부 설정 기능을 사용할 수 있다는 점을 들 수 있다. TLS 프로토콜을 사용하는 웹사이트( 웹사이트 주소 http가 아닌 https로 시작되는 곳들)는 번역이 불가능하다는 점도 야후 JAPAN 번역과는 다른 부분. 모바일 웹 페이지 버전이 없다는 게 흠.
    • SO-NET 번역
      소니 포털 사이트인 SO-NET에서 서비스하는 SO-NET 회원 전용 번역기. 본래 야후 JAPAN 번역과 마찬가지로 크로스랭귀지 번역 엔진을 사용하는 번역기였지만, 2018년 4월 초에 있었던 리뉴얼 이후에는 YarakuZen이라는 다른 회사의 번역 엔진으로 교체된 상황이다.
      한↔일/일↔한 모두 가능하며, 번역 품질은 야후 JAPAN 번역과 비슷하다(다만 번역 품질이 약간 떨어지고 오역이 상당히 많은 편). 유저 인터페이스가 일본어이기에 일본어에 익숙하지 않으면 사용에 난점이 있다는 것도 동일. 띄어쓰기에 관련해서 상당히 철저하게 띄어쓰기가 이루어진 결과를 출력하도록 되어 있지만 그것이 좀 지나쳐져 과잉 교정이 발생되는 일 역시 많다는 것도 동일하다.
      야후 JAPAN 번역과 마찬가지로 TLS 프로토콜을 사용하는 웹사이트(웹사이트 주소가 http가 아닌 https로 시작되는 곳들)의 번역이 가능한 것이 특징. 번역 품질이 야후 JAPAN 번역보다는 뒤떨어지기는 하지만, 서비스가 종료된 야후 JAPAN 번역의 대체재로서 활용가치가 있다고 평가받고 있었다. 이 번역기도 모바일 웹 페이지 버전이 없다.
      2018년 4월 이전까지는 비회원도 웹사이트 번역 기능의 이용이 가능하였으나, 해당 기능은 2018년 4월 초에 있었던 리뉴얼 이후에 SO-NET 회원 전용 서비스로 전환되었다. 4월 말에 있었던 후속 패치로 직링크를 이용하는 우회 방법도 막힌 것이 확인되었다. 단문 번역 기능은 여전히 비회원에게도 제공되고 있지만, 번역 엔진이 교체되었기에 번역 품질에 약간의 변동이 있다는 점은 고려할 필요가 있다.
  • CROSS-Transer
    인포시크 번역기에서 이용중이며 과거에는 야후 JAPAN 번역이나 SO-NET 번역 등에서도 이용되었었던 번역 엔진의 개발사인 크로스랭귀지에서 직접 서비스를 제공하고 있는 번역기. 2017년 10월 11일부터 서비스가 개시되었다. 2018년 1월 30일부터는 네이버 파파고와 같은 인공지능 기반 번역 서비스도 제공되고 있지만, 이미 정식 서비스 단계로 돌입한 파파고와는 달리 아직 베타 서비스 단계이며 따라서 기존의 번역 엔진과 병용되고 있는 상태이다.
    한↔일/일↔한 모두 가능하며, 크로스랭귀지 번역 엔진의 개발사에서 직접 제공하는 서비스이기에 번역 품질은 인포시크 번역기나 과거의 야후 JAPAN 번역과 동일하다. 유저 인터페이스가 일본어이기에 일본어에 익숙하지 않으면 사용에 난점이 있다는 것이나, 띄어쓰기에 관련해서 상당히 철저하게 띄어쓰기가 이루어진 결과를 출력하도록 되어 있지만 그것이 좀 지나쳐져 과잉 교정이 발생되는 일 역시 많다는 것도 역시 동일하다.
    다만 아쉬운 점은 웹사이트 번역 기능은 아예 없으며 단문 번역 기능만 제공된다는 점.
  • KODENSHA 계열
    • excite 번역기
      EZTrans 계열에 비해 번역 품질이 상대적으로 떨어진다. TLS 프로토콜을 사용하는 웹사이트(웹사이트 주소가 http가 아닌 https로 시작되는 곳들)는 번역이 불가능하다는 점도 약점.

5. 번역 평가 방법론

5.1. 필요성

번역기를 만들어 놓고 번역이 잘되는지 만족하는 것에 끝나지 않고 얼마나 번역이 잘 되는지에 대한 수치적 데이터가 필요하기 때문이다. 번역 알고리즘끼리 성능을 비교할 때 사용된다.

5.2. 사람이 직접 평가

가장 정확도가 높은 번역으로 실제로 얼마나 제대로 번역했는지 인간이 직접 평가하는 방법이다. 번역 문장을 직접 읽고 사용하는 주체는 결국 사람이므로 기계 번역의 목적에 가장 알맞은 평가 방법이라고도 할 수 있다. 대체로 번역의 대상인 문장과 이 문장을 번역한 문장을 보여준 다음, 번역된 문장이 번역의 대상이 된 문장을 얼마나 잘 번역했는지 5택하는 설문조사를 사용한다.

단점으로는 인간 자원은 많은 비용이 든다는 점과 평가 시간이 오래 소모된다는 점, 그리고 사람마다 평가하는 기준이 다르다는 점, 평가를 할 때마다 평가를 진행하는 사람들의 집단이 동일해야 한다는 점 등이 있다.예를 들어 독해력의 차이도 있고 어떤 사람은 대충 뜻만 통하면 그러저럭 읽는다해도 딴 사람은 문맥이 좀만 이상해도 읽기 꺼림칙할수도 있다.[18]

5.3. 자동 평가 방법

사람이 직접 평가하는 방법의 단점(돈, 시간, 객관성 등)을 보완하기 위해 컴퓨터가 번역의 정확성을 평가하기 위해 만든 알고리즘.

사람이 번역한 문장(들)을 기준으로 하여 기계 번역한 문장을 평가한다. 사람이 번역한 문장이 100% 정답이라고 할 수 없는 경우가 많기 때문에 보통 여러 개의 기준을 두고 평가한다.

6. 기타

한때 인터넷에 외계어가 유행할 무렵에 외계어 번역기[19]라는 것도 존재했다. 한자는 그대로 한글 발음으로 옮겼기 때문에 因[20]을 '대'가 아닌 그냥 '인'으로 변환하는 등 번역기의 한계점이 드러나기도 했다.

7. 관련 문서



[1] 수능영어 3등급 이하 [2] 일례로, 어서와~ 한국은 처음이지?에서 태국인들이 감자탕집에서 주문을 흐려고 번역기를 돌렸는데, 해당 점포의 상호로 추정되는 '참'만 무한 인식해버리는 바람에 'charmcharmcharm......'으로 오역해버리는 참사가 터졌다. [3] 참고로 구글 번역기에서도 저렇게 나오던 시절이 있었다. [4] 조화석습이라 읽으며, 원래 의미는 '아침 꽃을 저녁에 줍다'라는 뜻이다. 루쉰의 산문집 제목이기도 하다. [5] 干자는 중국에서 Fuck이라는 뜻의 은어로 쓰이기 때문이다. [6] 이는 한국어와 영어처럼, 문장의 기본 어순이 완전히 다른 언어 사이에서 자주 일어나는 현상이다. [7] 100% 틀린 번역은 아니다. 지대공 미사일의 영어 약자가 SAM이기 때문. 다만 사람 이름을 저걸로 해석한건... [8] 이건 오역과는 상관없는 문제다. [9] 예를 들어 미도리바시역은 그냥 녹색 다리역으로 나온다, 금구슬을 번역하면 불알이 뜬다. [10] 대표적인 예시로 영어권 회사명 등이 있다. 애플(Apple), 밸브(Valve), 윈도우(Windows) 등. [11] 다만 위의 예시처럼 10% 정도의 오역도 전체 의미를 뒤바꿔 버릴 수 있어 주의가 필요하다. 뒤집어 말하면 문장의 10% 이상 오역으로 채워진다는 이야기다. [12] 과거 엠파스가 한·중 웹번역을 서비스한 적도 있으나 번역률이 극악했다. [13] 제대로 된 번역은 '시간은 화살과 같이 날아간다'이다. fly를 동사가 아닌 명사인 파리로 보고, like를 형용사가 아니라 동사로 보아서 나오는 사례 [14] 특히 훈독과 음독 때문에 같은 한자라도 읽는 법이 다른 일본. [15] 2018년 12월 20일경 이후로 앱에서는 구글 번역 사용. PC버전 웹사이트에서는 아직도 사용되고 있다. [16] 참고로 구글 번역의 결과는 '전쟁은 다시는! 다시는 전쟁을하지 마십시오!' [17] EZTrans XP를 이용하는 비공식 확장 프로그램은 아네모네 외에도 상당히 많이 있지만, 꿀도르하고의 결합 및 편의성으로 인해 일반 번역 용도라면 아네모네가 가장 흔히 사용된다. [18] 그래서 평가나 말뭉치 구축에 있어서 사람 사이의 통일성을 측정하는 kappa correlation 점수를 표기한다. [19] 번역기라기 보다는 변환기 수준. 유행이 지나간 지금은 사이트 폐쇄. [20] 원래 훈음은 '인할 인'이지만 에 네모를 씌운 형태로 주로 사용되었다.