최근 수정 시각 : 2022-06-24 07:42:26

생성문법

수학기초론
Foundations of Mathematics
{{{#!wiki style="margin:0 -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-6px -1px -11px"
{{{#!wiki style="letter-spacing: -1px"
다루는 대상과 주요 토픽
수리논리학 논리 · 논증{ 귀납논증 · 연역논증} · 공리 및 공준 · 증명{ 자동정리증명 · 귀류법 · 수학적 귀납법 · 반증 · PWW} · 논리함수 · 논리 연산 · 잘 정의됨 · 조건문( 조각적 정의) · 명제 논리( 명제, 아이버슨 괄호 · · · 대우) · 양상논리 · 술어 논리( 존재성과 유일성) · 형식문법 · 유형 이론
범주론 함자 · 수반 · 자연 변환 · 모나드 · 쌍대성
집합론 집합( 원소 · 공집합 · 집합족 · 곱집합 · 멱집합) · 관계( 동치관계 · 순서 관계) · 서수( 하세 다이어그램 · 큰 가산서수) · 수 체계 · ZFC( 선택공리) · 기수( 초한기수) · 절대적 무한
계산가능성 이론 튜링 기계 · 바쁜 비버 · 정지 문제 · 재귀함수 · 계산
정리
드모르간 법칙 · 대각선 논법 · 러셀의 역설 · 거짓말쟁이의 역설 · 뢰벤하임-스콜렘 정리 · 슈뢰더-베른슈타인 정리 · 퍼스의 항진명제 · 굿스타인 정리 · 불완전성 정리 · 힐베르트의 호텔 · 연속체 가설
기타
예비사항( 약어 및 기호) · 벤 다이어그램 · 수학철학 }}}}}}}}}}}}


과학의 범위
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
좁은 의미 [[자연과학|
자연과학
]] 물리학 · 화학 · 생물학 · 지구과학 · 천문학
넓은 의미 [[형식과학|
형식과학
]] 수학 · 통계학 · 전산학 · 논리학 · 암호학 · 언어학(생성이론)
[[응용과학|
응용과학
]] 거대과학 · 공학 · 건축학 · 경영학 · 법학 · 행정학 · 의학 · 치의학 · 한의학 · 간호학 · 약학 · 수의학 · 농학 · 임학 · 수산학 · 가정학
[[사회과학|
사회과학
]] 정치학 · 경제학 · 사회학 · 인류학 · 심리학 · 지리학 · 사회복지학 · 신문방송학 · 종교학
[[인문과학|
인문과학
]] 언어학 · 문학 · 사학 · 고고학 · 미술사학 · 음악사학 · 철학
비과학 변경지대의 과학 · 병적 과학 · 쓰레기 과학 · 유사과학 · 비과학 · 반과학 }}}}}}}}}


1. 개요2. 상세3. 생성문법의 언어관
3.1. 선천적 언어습득 능력
4. 생성문법의 이론관
4.1. 문법모형
5. 생성통사론
5.1. 변형생성문법
5.1.1. 촘스키주의 모형(표준이론에서 최소주의까지)5.1.2. 나노통사론(nanosyntax)
5.2. 비변형생성문법
5.2.1. 구구조문법 모형(GPSG, HPSG, IPSG)5.2.2. 어휘기능문법 모형(LFG)5.2.3. 모형이론적 통사론(RG, APG)
6. 생성음운론
6.1. 단선음운론
6.1.1. 영어의 음성체계(SPE)
6.2. 비단선음운론
6.2.1. 자립분절음운론(ASP)6.2.2. 지배음운론(GP)
6.3. 자연생성음운론(NGP)6.4. 최적성 이론(OT)
7. 생성형태론8. 생성문법에서의 의미론9. 인접학문과의 관계10. 비판 및 평가

1. 개요

생성문법(, Generative Grammar)은 언어학의 지배적 사조 중 하나이다. 1950년대 말에 시작되어 1980년대까지 언어학계에서 가장 지배적인 패러다임으로 자리하였고, 이후 대립 패러다임의 등장에도 불구하고 오늘날까지 내부변혁을 통해 정상과학으로 작동하고 있다. 놈 촘스키가 그 비조로 인정된다.

언어학의 세부분과 중에서 유일하게 형식과학의 요건을 갖추었으며, 자연과학적으로 연구가능한 단위로서의 '언어'가 바로 생성문법에서 정의하고 연구하는 언어다( Science 논문 PLOS Biology 논문 참조). 예를 들어, 생물학자들이 언어의 진화를 연구하려고 해도 손가락, (곤충의)날개 등 연구 단위로서의 '언어'가 정립되지 않은 상황에서 이는 불가능하다. 생성문법에서 제시한 언어개념은 연구가능한 단위이며 이에 대한 생물학적 진화 모델 또한 나와있다. 다윈의 문제 문서 참조.

2. 상세

생성문법 이전에도 언어학은 있었다. 19세기 소쉬르 이후 근대적 '언어학'이 정립되었고,[1] 20세기 중반에 오기까지 심리학의 행동주의, 철학의 구조주의 패러다임이 언어학 내에서 정상과학으로 작동하였다.[2]

1950년대에 등장한 촘스키의 생성문법은 구조주의 언어학의 핵심적 가정들에 대해 문제제기하며 패러다임 시프트를 이행했다. 생성문법은 언어를 '형식적 조합'으로 이해하였고, 조립의 단위[3]와 조립의 방식을 형식화하는 것으로 초점을 옮긴다. 특히 한정된 뇌[4]에서 무한한 언어표현이 나올 수 있는 이유를 설명하고자 하는 것이 생성문법에서 스스로에게 부여한 언어학의 과제이다. 자연과학에서 '한정된 장치(뇌)의 무한한 산출(언표)'이 가능한 과정은 생성과정(generative process)이다. 따라서 생성문법(generative grammar)이라 명명하였다.

생성문법은 초기 컴퓨터과학과 같은 사상적 뿌리를 가졌기 때문에 많은 개념을 공유한다. '메모리한정성', '연산효율성' 그리고 '생성' 등이 대표적이다.[5] 1950년대 촘스키가 고안한 언어기계로서의 초기 언어기관(Language Faculty)은 튜링머신에 해당한다. 규칙 또한 '2번째 단어와 3번째 단어를 교체한다' 등의 다시쓰기 형식이었다. 목표는, 인간 언어의 어순을 기계어로 변환하는 것이었고, UG의 초기개념도 모든 언어들이 공통문법을 가진다는 가정으로서 외국어(특히 러시아어)의 기계번역을 도모한다는 논리였다.

이러한 측면에서 보았을 때, 생성문법은 문학이나 문화나 역사를 연구하는 인문학이라기보다는 수학이나 논리학에 가까운 형식과학이다. 촘스키가 생성문법과 이전의 언어학을 생물학에 빗대어 표현한 말을 빌리자면, 생성문법은 '벌의 비행을 연구하기 위해 벌 한마리의 해부학적 구조를 보는 것'이고, 이전까지의 구조주의는 마치 '벌을 연구하는 생물학자가 벌의 비행을 비디오로 많이 녹화한 다음 그 영상자료만 계속 돌려보면서 "나 이제 벌에 관한한 박사요" 하는 것'이나 다음없다는 것이다. 생물학에서 '벌의 비행'은 실증적으로 주어진 것이니 '벌이 날 수 있다'는 사실을 계속 반복해서 확인하는 건 의미가 없다. 생물학의 일은 벌의 비행을 설명하기 위해 형식적 가설을 세우고 그것으로부터 연역적으로 연구를 하는 것이다. 언어학 역시 '물리적으로 한정된 뇌에서 무한한 수의 언어 표현이 생성된다'는 실증적 사실을 설명하기 위해서는 언어를 형식화하고 그것을 연역적 접근법을 통해 연구해야 한다는 것이 촘스키의 생각이다.

의미론 중심 언어이론인 생성의미론(generative semantics)과는 다르다. 의미론의 입장에서 본다면 생성문법은 해석의미론이며 따라서 생성의미론은 생성문법과는 언어관 자체가 아예 다른, 경쟁관계에 있는 언어이론이다. 자세한 것은 통사론 항목 및 본 문서 하단의 의미론 단락 참조.

생성문법만을 다루는 대표적인 저널로는 메사추세츠 공과대학교에서 발행되는 Linguistic Inquiry (링크)가 있다. [6] 한국 저널중에는 생성문법학회에서 발행하는 '생성문법연구' (링크)가 생성문법의 최신 연구를 다룬다.

3. 생성문법의 언어관

3.1. 선천적 언어습득 능력

인간의 언어습득과 관련하여 실증적으로 확실한 사실은 다음과 같다.
  • 사실1 인간은 불충분한 자극이 주어졌을 때도 의식적 교육 없이도 2년내에 어떤 하나의 언어를 구사할 수 있다. 그리고 이것은 종족특성(species-specific)한 인간의 특징이다.[7]
    • 사실1-1 그 이후 시기가 지날수록 언어를 새로 배우는 것이 어렵다.
  • 사실2 언어 능력은 가지되 다른 지능이 떨어지는 경우나, 다른 지능이 뛰어나나 언어 능력이 떨어지는 사례가 존재한다.

사실1을 자극부족의가정(poverty of stimulus hypothesis)이라고 하는데, 이것이 인간의 언어습득이 선천적이라는 가설의 결정적 증거이다. 사실1을 다시 말하자면, 인간은 언어 데이터가 충분히 주어지지 않은 상황에서도 언어능력을 습득할 수 있다는 관찰이다. [8] 이를 바탕으로 생성문법은 모든인간이 언어습득을 할 때, 선천적으로 주어진 언어습득장치(Language Acquisition Device)를 사용하고, 이 장치는 나이가 들어감에 따라 퇴화한다(사실1-1)고 주장한다. 해당 언어습득장치는 언어를 관장하는 뇌부위를 언급하는 것이 아니고 기능적인 지시어이다. 촘스키의 말을 빌리자면, '소화기관'이라고 부르는 것에 다양한 신체기관이 포함되고, 각 신체기관이 오롯이 소화만을 하는 것이 아니듯이, 뇌의 구조체 집합이 언어 처리를 위해 독립적인 장치로 존재한다고 보는 것이다. 이 기제가 특정 언어환경에 놓였을 때, 이 환경에서의 부족한 자극에 기반하여 완전한 언어체를 구성한다는 것이 생성문법의 언어습득관이다.[9][10]

이것과 상반되는 가설은 인간이 일반심리기제를 통해 언어를 습득한다는 '언어학습이론'이다. 행동주의 심리학과 이를 계승한 인지언어학에서 주장하는 가설로서, 인간이 가지고 있는 일반화, 패턴파악, 기억 등의 일반적인 심리 기제들을 활용하여 언어를 습득한다는 것이다. 그러나 생성문법에서는 이러한 심리 기제들과는 별개의 언어만을 담당하는 기제가 선천적으로 존재한다고 말한다. 이것이 선천적일 수밖에 없는 이유는, 언어능력이 인간만의 특징이고, 인간들 사이에서는 인종이나 문화에 상관없이 동일하기 때문이다. 무엇이 특정 종만의 특징이고 종 내에서 편차가 미미하다면 그것은 생물학적으로 선천적 자질로 설명되어야 한다.

정리하자면, 인간이 어떠한 행동이나 기술을 배우는 과정과 언어를 배우는 과정은 서로 전혀 다르게 이루어진다. 이에 따라 언어는 습득(Acquisition) 되는 것이고, 그 이외의 모든 행동[11]들은 학습(Learning)되는 것으로 이해한다. 인지언어학 을 지지하는 언어학자들과는 정반대되는 이론이다.[12]

또한, 인간은 한 번도 보지 않은 문장이라도 그 의미를 해석할 수 있다. 또한 인간에게는 한 번도 들어보지 않은 문장을 만들어내는 것이 기존에 들어본 문장을 토씨 하나까지 똑같이 반복하는 것보다 훨씬 쉽다. 이를 통해 인간은 언어자극을 정리하는 방식으로, 즉, 학습을 하는 것이 아니라, 언어생성장치에 메모리효율적으로 패러미터를 저장하고 그것으로부터 생성하는 방식으로 언어를 사용한다는 사실을 알 수 있다.

이것을 보여주는 아주 단편적인 예가 전치사/후치사의 선택과 어순의 문제다. 전치사를 사용하는 언어는 VO(동사-목적어) 어순이다. 영어나 여러 인도유럽어가 해당한다. 후치사를 사용하는 언어는 OV(목적어-동사) 어순이다. 한국어 터키어 등이 해당한다. 전치사/후치사와 어순은 겉으로 보기에는 별개의 언어적 정보이고, 선천적인 생성기제를 상정하지 않는다면 서로 독립적이어야 할 것으로 보인다.

그러나 생성문법의 '언어장치'에서 이 두 가지는 하나의 스위치에 해당한다. 스위치의 비유는 촘스키의 1980년대 지배결속이론에서 사용하는 것인데, 마치 스위치를 켜거나 끄듯이, 혹은 프로그래밍언어로 말하자면 특정 class의 attribute 값을 지정하듯이, 하나의 모듈에 값이 부여되면 그것의 파생으로 여러 언어현상이 결정된다는 것을 말한다. 어쨌든, 어순과 전/후치사는 하나의 값이 결정되면 다른 값도 결정되는 경우에 해당한다. 따라서 언어를 습득하는 아기는 어순과 전/후치사를 독립적으로 일반화하여 학습하지 않고 하나의 사건을 습득하면 다른 경우도 자동으로 습득된다.

다시 컴퓨터를 비유하여 생성문법의 언어습득관을 표현하자면, 언어는 인간의 일반사고영역을 관장하는 CPU와는 별개로 그래픽 카드 같은 외부장치가 삽입되어 있다고 가정하는 것이다. [13] 이 가정이 무슨 의미를 가지느냐하냐면 기존 언어학이나 논리학에서 언어가 다른 모든 인식관계와 동일하게 형성되었다면 기계어와 마찬가지로 언어는 완전히 논리적이며 따라서 언어학은 언어의 구조를 완전하게 분석하는 것이 임무이며 충분한 일이지만 별도로 그래픽 카드가 존재한다면 언어가 그 자체만으로 CPU에 로딩된 OS로 처리하기에는 오류로 가득찬 신호로 이루어져있어도 그래픽 카드에 내재하는 별도의 드라이버로 구동될 수 있기에 언어만 가지고 따져봐야 의미가 없다. 진짜 의미는 그래픽 카드의 기능을 알아야 해석가능하며 이 처리과정을 이해함으로서야 일상 언어와 고차원적 언어를 완전히 이해할 수 있다.

그래서 그래픽 카드의 기능을 CPU인 인간의 사고기능으로 시뮬레이션 해보는 것이 궁극적 목표다. 구시대 그래픽 카드나 오디오 카드를 충분한 고성능의 CPU로 충분한 시간동안 적절한 방법으로 돌리면 소프트웨어적으로 하드웨어인 그래픽 카드 및 그 드라어버를 OS안에서 시뮬레이션 할 수 있듯이 말이다. [14]

이 이론의 의의는 가정이 맞다면 이 방법으로 일상언어와 논리학적 도식간의 차이를 이해할 수 있다는 것. 방법론적으로 전혀 상관없어 보이는 여러 언어를 비교하여 공통된 규칙을 찾아내는 방식으로 시작하였고 그를 뒷받침하는 많은 증거로 현대 언어학계에 영향을 많이 끼쳤다.

4. 생성문법의 이론관

생성문법은 하나의 패러다임으로서 언어학 이론이 어떻게 구성되어야 하는지에 대한 지향점이 있고, 이에 따라 연구 프로그램이 구성된다. 연구자들이나 언어학도들이 흔히 '3대 타당성 논제'로 알고 있는 것이 이것이다. 생성문법의 이론관에 따르면 언어학 이론은 타당성의 충족 여부에 따라 우열을 가릴 수 있다. 관찰-기술-설명의 순으로 고차원의 타당성이라고 본다. 언어학 이론에 대한 튜링테스트라고 할 수 있다. 촘스키의 초기 이론에서 제창되었다[15]
  • 관찰적 타당성(observational adequacy): 언어이론은 언어데이터를 빠짐없이 설명할 수 있어야 한다. 어떤 언어데이터가 주어졌을 때 그것을 위한 이론이 있어야한다.
    • 학교문법은 관찰적 타당성만 충족한다. 기술주의 문법은 존재하지 않는 언어표현이 왜 존재하지 않는지는 설명하지 못하지만 존재하는 언어 데이터에 대해서는 모두 설명할 수 있기 때문에 관찰적 타당성만 충족한다. 일부 유사언어학들은 관찰적 타당성도 충족하지 못한다.
  • 기술적 타당성(descriptive adaquacy): 언어이론은 관찰적 타당성을 충족하는 것에 더하여, 언어데이터에 대한 유의미한 일반화와 형식적 원칙을 구성해야한다. 언어이론은 오직 언어데이터만을 기술해야 한다.('all and only' clause)[16]
    • 촘스키의 이론을 기준으로 하였을 때, 1960년대 및 1970년대까지의 확대 표준 이론이 기술적 타당성까지만 충족한다. 2020년대 기준 통용되는 형식주의 언어학 이론들은 모두 기술적 타당성을 충족한다.
  • 설명적 타당성(explanatory adequacy): 언어이론은 관찰적, 기술적 타당성을 충족하는 것은 물론 다양한 설명방식 중 가장 단순한 설명이어야 한다.( 오컴의 면도날을 말한다.) 또한 언어이론은 반증가능한 예측을 할 수 있어야 한다. 80년대 90년대부터 생성문법 문헌에서 언급되기 시작한 '플라톤의 문제'가 설명적 타당성과 관련된다. 플라톤의 문제는 불충분한 자극으로 어떻게 완전한 언어능력이 습득될 수 있는지에 대한 문제이다. 설명적 타당성을 충족한 이론은 플라톤의 문제에 대한 해답을 가지고 있다.
    • 이때, '단순한 설명'이라고 함은 개별언어의 차원이 아니라 모든 존재하는 것으로 보고된 언어 및 보고되지 않았으나 존재할 수 있는 언어적 조합 모두를 가장 단순하게 설명하는 것을 말한다. 따라서 당위적으로 추상적 '보편언어'가 상정된다.
      • 촘스키의 이론을 기준으로 하였을 때, 1980년대 이후의 원리매개변인이론(지배결속이론 및 최소주의)이 설명적 타당성을 갖추었다고 본다. 예컨대, 보편문법(UG)의 측면에서 가능한 매개변인 조합을 통해 존재하는 비록 관찰되지 않았더라도 어떤 언어가 존재할 수 있는지, 어떤 언어가 존재할 수 없는지 예측하는 것이 가능하다. '생득적인 보편문법이 존재하기 때문에 적은 자극에도 완벽한 언어능력이 습득된다'는 것이 플라톤의 문제에 대한 원리매개변인이론의 해답이다.
      • 최적성이론 역시 음운론으로 한정하였을 때 설명적 타당성을 갖추었다고 본다. 제약의 조합방식은 제약의 개수의 팩토리얼이기 때문에 한정된 수의 언어 조합만이 예측된다. 제약의 조합에 따라 어떤 언어가 존재할 수 없는지도 예측된다. 플라톤의 문제에 대해서는 제약 자체가 창출적이라는 견해와 제약이 UG의 일부를 구성한다는 견해가 상충하고 있으나 대체로 '언어습득자(신생아를 말한다)는 주어진 두 제약 간의 위계만 학습하면 되기 때문에 습득에는 많은 데이터가 필요하지 않다'고 답변한다.

그리고 촘스키는 2000년대 중반 이후 설명적 타당성을 넘어서 '진화가능성에 대한 설명'을 새로운 논제로 제시하였다. 이를 다윈의 문제라고 한다.
  • 설명적 타당성 너머(Beyond explanatory adaquacy): 언어이론은 인간 언어의 진화가능성을 설명할 수 있어야 한다.
    • 2022년 현재까지 이 단계에 도달한 언어이론은 존재하지 않는 것으로 보인다. 사실 촘스키언을 제외하고는 관심을 가지는 연구자들도 거의 없다. 참고로 촘스키언 통사론이 병합과 대병합으로 정리되었고, 이 두가지 작용은 더 이상 환원불가능한 것으로 보이기 때문에, 촘스키는 자신의 이론이 '...타당성 너머'를 충족했다고 자평한다.

4.1. 문법모형

5. 생성통사론

5.1. 변형생성문법

5.1.1. 촘스키주의 모형(표준이론에서 최소주의까지)

파일:상세 내용 아이콘.svg   자세한 내용은 통사론 문서
번 문단을
형식주의 부분을
참고하십시오.
생성언어학 전통 내에서도 특히 촘스키를 중심으로 하는 일파가 따르는 모형을 일컫는다. 최근 촘스키가 제안한 이론에 비춰볼 때에는 적절한 명칭이라고 할 수 없지만 대체로 통칭할 때는 변형생성문법이라고 불리며 촘스키적 접근(Chomskyan approach)과 같은 식으로 에둘러서 표현하는 경우도 있다. 그러나 촘스키주의 모형이 좋게 말하면 끊임없이 자기혁신을 거쳐왔고 나쁘게 말하면 일관되지 못한 몇 번의 단속적인 변화를 겪었기 때문에 한 단어로 촘스키가 제시한 모든 이론적 도구나 방법론, 메타 이론들을 포괄하기엔 무리가 따른다. 대신 촘스키주의 모형은 대체로 다음의 몇 가지 단계로 나눠지며 학계에서도 이러한 시대 구분을 따라 분류하는 편이다.
  • 고전적 촘스키주의(Classical Theory, Syntactic Structure 1957)
  • 표준 이론(Standard Theory, Aspects of the Theory of Syntax 1965)
  • 확대 표준 이론(Extended Standard Theory, 1968)
  • 수정 확대 표준 이론(Revised Extended Standard Theory, 1972)
  • 지배 결속 이론(Goverment and Binding Theory, 1981)
  • 최소주의 프로그램(Minimalist Program, 1995)

5.1.2. 나노통사론(nanosyntax)

2005년을 기점으로 탄생한 새로운 모형으로 최소주의 프로그램의 등장 이후 변형생성문법 주류와는 다소 다른 방향을 취하며 갈라졌다. 그러나 비변형생성문법이론에서 제안하는 모형들과 비교했을 때 최소주의 프로그램과 공통분모가 많으며 넓게는 촘스키주의 모형에 포함시킬 수 있을 것이다.

5.2. 비변형생성문법

5.2.1. 구구조문법 모형(GPSG, HPSG, IPSG)

변형 및 통사적 이동을 인정하지 않는 단층위적 생성통사론 모형. 제럴드 개즈다의 일반화구구조문법(GPSG), 폴라드와 사그의 핵중심구구조문법(HPSG), 지표구구조문법(IPSG) 등이 있다.
GPSG는 자연언어를 문맥자유문법(context-free grammar)으로 기술하려는 기획이었으나 현재는 실패한 것으로 평가되고 있다. HPSG를 실질적 후신으로 볼 수 있다. HPSG는 구문문법(Consturction Grammar)과 결합하여 기호기반구문문법(SBCG)을 탄생시키는 등 변화를 모색하고 있다.

5.2.2. 어휘기능문법 모형(LFG)

구구조문법과 마찬가지로 변형을 인정하지 않는 단충위적 생성통사론 모형. 핵심적인 아이디어는 문장의 성분구조(C-structure)와 기능구조(F-structure)를 별개의 것으로 보는 것이다. LFG에서 하나의 통사적 단위는 성분구조상의 역할과 기능구조상의 역할을 별개로 갖고 있다고 보기 때문에, 촘스키주의 모형에서처럼 통사적 단위가 위치를 "이동하여" 여러 역할을 얻거나 잃게 된다는 식으로 설명하지 않게 된다.
어휘기능문법은 생성통사론으로서는 특이하게도 코퍼스 언어학 및 데이터 지향 파싱(DOP)에도 많은 관심을 기울이며 전산언어학자들과 교류하고 있다.

5.2.3. 모형이론적 통사론(RG, APG)

관계문법(Relation Grammar), 그리고 사실상 동일한 이론의 다른 이름인 호쌍문법(Arc Pair Grammar). 모형이론적 통사론은 문법관계(주어, 목적어 등...)가 구구조보다 더 핵심적인 문법적 단위라는 주장을 기초로 발전한 생성통사론 모형이다. 이 이론은 1980년대 이후로 지지자를 얻지 못하고 사실상 사멸하였다.

6. 생성음운론

6.1. 단선음운론

6.1.1. 영어의 음성체계(SPE)

6.2. 비단선음운론

6.2.1. 자립분절음운론(ASP)

6.2.2. 지배음운론(GP)

6.3. 자연생성음운론(NGP)

6.4. 최적성 이론(OT)


최적성 이론 항목으로.

7. 생성형태론

생성언어학에서 형태론은 음운론이나 통사론과 같이 독립적인 영역을 이루지 못한다. 따라서 '생성형태론'이라는 조어는 어불성설이다. 그러나 생성문법에서 형태론의 지위에 대한 고민은 60년대 이후 줄곧 있어왔다. 오늘날 생성문법의 표준적 입장에서 말하자면, 통사론을 기준으로 형태론은 생성된 구조가 문자화(spell-out)되는 PF로 치부되며, 음운론을 기준으로는 음운규칙의 적용대상이 되는 기저형(underlying form)을 만들어내는 부분이 형태론에 해당한다. 즉, 가장 나이브한 교과서적인 관점에서 말하자면, 형태론은 통사론의 입장에서는 '음운론의 일부'요, 음운론의 입장에서는 '렉시콘의 일부'라고 말할 수 있다.

한편, 2000년대 이후 젊은 생성문법 학자들을 기준으로 각광받고 있는 분산형태론(distributed morphology)에서는 말그대로 통사구조의 각 부분에 분산되어 있는 형태론 모델을 상정한다. 분산되어있다는 말을 구체적으로 풀어쓰자면, 기존에 형태론의 일이었던 '형태소 결합'이, 통사부의 확대와 지연된 어휘삽입 이렇게 두가지로 분산되었다고 말할 수 있다. 렉시콘에 저장된 것은 어휘가 아닌 형태소들이며, 아직 소릿값을 갖지 않는 이 형태소들이 통사론적 결합을 한다. 즉, 전통적 통사론에서의 하위구조를 더 밑으로 내려버리는 것이다. 또한 음성값이 주어지지 않은 구조체에 대한 어휘삽입(vocabulary insertion)을 상당히 지연시켜서 구조가 국면에 다다라서 문자화할때 어휘삽입이 이루어지는 것으로 본다.

분산형태론은 GB시절 박사학위를 딴 보수적 기성 학자들이 보기에는 실패한 이론(생성의미론)의 재탕이 아니냐는 견해가 있지만, Morris Halle라는 대학자의 권위에 힘입어 젊은 연구자들을 중심으로는 사실상 표준으로 자리잡은 상황이다. 2020년 이후 강단에 새로 들어오는 통사론 연구자는 거의 분산형태론을 형태론 모델로 가지고 있다고 할 수 있다. 음운론의 경우, 기계학습이나 최적성이론을 하지 않는 전통적 의미의 생성음운론자의 대부분이 분산형태론을 상정한다. 반면 음운론에서의 최적성이론은 연구주제에 따라 형태론 자체가 불필요한 모델들을 상정하기도 한다.

정리하자면, 과거(90년대 이전)까지 생성문법에서 형태론은 렉시콘의 일부로서 '그것에 대해 말하지 않겠다'라는 견해가 강하였고, 분산형태론이 나온 이후에는 사실상 통사론에 포섭되어 통사론의 일부가 되어가고 있는 실정이다.[17] 여러모로, 형태론이 독립된 모듈로서 자리하기는 어려운 상황.

8. 생성문법에서의 의미론

생성문법에서 의미관계는 둘 중 하나이다. 통사부에 들어오는 기본형태(syntactic unit)로서 주어진 자질 혹은 구조 생성 이후에 이루어지는 해석. 의미가 오직 두 가지로만 인간언어에 관계한다는 것은 생성문법의 구체적인 틀이 바뀌어오는 와중에도 이론 초기 이후 지금까지 변하지 않고 있다. 즉, 여전히 Chomsky (1972) 체제 하에 있는 셈이다. 따라서 매우 역설적이게도 의미론은 생성문법의 모듈러한 문법관에 따른 각 모듈이 패러다임 변화를 겪어오는 과정 속에서도 여전히 매우 안정적이다.[18] 생성문법에서의 의미론은, 구조가 선행하고 이것이 해석됨으로서 의미가 파악된다고 하여 '해석의미론'이라고 부른다.

따라서 생성언어학에서의 의미론은 결코 생성의미론이 될 수 없다. 의미부는 생성의 대상이 아니기 때문이다. 더군다나 생성의미론(generative semantics)이라는 이름으로 불리웠던 언어학 사조가 별도로 존재하며 엄밀한 의미에서 생성문법의 해석의미론과 정반대의 위치에 서있다. 생성의미론 진영에서는 의미가 선행하고 특정 의미를 띄기 위한 수단으로 구조가 형성된다고 말하기 때문이다. 참고로 '의미가 생성된다'는 게 무엇인지 초심자들은 쉽게 개념화하기 어려울 수 있는데, 간단히 말하자면 다음과 같다.

한국어에는 '모르다' 라는 술어를 예로 들어보자.[19] 이것은 '알다'의 반의어이다. 반면 영어에는 '모르다'에 직접 대응되는 단일어가 존재하지 않는다. 따라서 영어를 통해 '모르다'의 의미를 창출해내려면 know의 부정을 함으로써 '모르다'라는 의미를 생성해야한다. 바로 이 지점에서 생성의미론은 모르다는 의미가 생성되고 거기에 맞추어서 언어별로 다른 구조가 뒤따른다고 주장한 것이다.

생성의미론은 1970년대 상당히 많은 연구자들에게 어필하였으며, 실제로 생성언어학 진영 내에서 언어학 전쟁이라고 불릴 정도의 이론논쟁이 있었다. ( 언어학의 4대 기수 문서 참조) 그러나 여러 결정적 증거는 생성의미론이 틀렸고 의미는 해석된다는 관점을 지지했다. 그러한 증거 중 하나가 한국어의 사동문이다. 한국어의 사동문에는 긴 사동과 짧은 사동이 있는데, '민준이가 철수에게 명령을 하여서 철수가 밥을 먹었다'라는 사건을 표상하기 위해 '민준이가 철수가 밥을 먹게 했다'(긴 사동)와 '민준이가 철수에게 밥을 먹였다'(짧은 사동)이 병존한다. 생성의미론에 따르면, 두 구문은 정확히 동일한 의미를 가져야 한다. 동일한 의미관계를 위해 구조가 병립하는 것으로 해석되기 때문이다. 그러나, 실제로 두 구문은 다른 의미를 가진다. 긴 사동에서 민준이는 철수가 밥 먹는 사건에 대해 간접적으로 영향을 미칠 뿐이고, 짧은 사동에서는 중의적이다. 바로 이 중의성이 생성의미론에서 설명하지 못하는 부분이다. 왜냐하면, 이 중의성은 구조가 해석될 때 발생하기 때문이고, 바로 이것이 구조가 선행하고 이 구조가 (구조 생성이 모두 완료된 후) 인식-의지(cognitive-intensional\[sic\]) 접면에서 처리될 때 의미가 해석'된다는 결정적 증거이기 때문이다.

다시 생성문법으로 돌아와서, 생성언어학계 내에서만 배타적으로 통용되는 독자적인 의미이론과 같은 것은 논리적으로 존재할 수가 없다. Cartography 이후 현대 생성문법에서 거대통사를 3분할하는데, VP부에서 논항술어관계의 의미 (주체:선생, 장소:교실, 이벤트:강의)를 다루고 IP에서 문법관계, 그리고 CP부에서 화용 및 인지부와의 접면을 다룬다 (주체+존경:선생, 장소+현위치와의관계:교실, 이벤트+현재시각과의관계:교실) 즉, 화용이나 인지부에 상관되는 존경이나 여기, 저기, 거기등의 공간지시, 이벤트시점과 현시각과의 차이계산인 시제 등을 CP부에서 받아 문법적 실현을 IP부에서 시키는 것으로 이해한다.

'의미'가 무엇이냐에 따라 다르겠지만, 사건의 관계에 해당하는 논항술어 관계를 담당하는 의미자질들은 죄다 VP이하로 통사부에 삽입되어 들어오는 External merge (혹은 MERGE)로 설명된다. 한편, CP부 이상에서의 화용-인지 접면에서는, 행위주 존경여부, 화자 존경여부, 사건의 시간과 발화시점 사이의 차이 계산, 사건의 장소와 발화장소 사이의 차이 계산이 통사부로 삽입되어 들어온다. 그리고 IP부에서는 CP부와는 Agree (혹은 이론에 따라 Concord로 보기도 한다) 하여 화용-인지 의미를 가져오고 VP부와는 기능핵에 의한 internal merge를 통해 사건관계를 가져와서 이것을 언어표현으로 표상한다. IP-CP 접면은 예컨대 사건이 현재보다 과거면 과거시제로 표상(\[Tense\] 값의 valuation)하고, 장소나 존칭관계또한 그렇게 문법자질의 값을 부여하는 방식으로 구성된다. IP-VP 접면은 예컨대, 이벤트가 stative한지 여부에 따라 논항자리에 이미주어진 행위자 논항을 해석하여 넣는 것을 예로 들 수 있다.

다시말해서, 생성문법에서 이해하는 '의미'는 대화맥락, 시공간 등의 고차원적인 부분 (통사부에는 CP부에 해당) 아니면 술어논리적인 저차원적 부분 (통사부로는 VP부에 해당)일 따름이고, 의미는 생성될 수 없다.

9. 인접학문과의 관계

10. 비판 및 평가

본 문서의 서론에서 언급한 것과 같이 생성문법은 오늘날 인간 언어에 관하여서는 정상 과학으로 작동하는 표준 패러다임이다. 생성문법 이전의 주류언어학은 언어를 문화나 생활방식(life style)의 일부로서 이해했고 따라서 이전까지는 언어를 심리학이나 역사, 문화 심지어는 문학과 같은 궤에 놓고 연구했다. 그러나 생성문법의 형식주의적 설명기제는 언어를 생물학적으로 진화가능하며 유전가능한 형질의 발현체(phenotype)로서 재정립했고, 문화나 여타 과학적으로 설명될 수 없는 인간의 종족특성(species-specific)으로서 언어의 보편성을 연구할 수 있는 장을 열었다.

인지언어학 등 언어학의 다른 진영에서는 생성문법이 설명하지 못하는 혹은 설명하기를 거부하는 '언어' 현상이 있다는 주장을 한다. 그러나 현재 생성문법 진영에서는 인지언어학을 대화의 대상으로조차 생각하지 않는다.[20] 이들의 문제점은 여전히 19세기 방식의 '문화적'언어관에 집착한다는 것이다. 또한 강단언어학이 아닌 대중들이 이해하고 대중문화에서 소비되는 언어의 개념 역시 지난세기의 구조주의에서 벗어나지 못하는 면이 있다. 영화 '콘택트'에 나오는 언어관이 대중들이 생각하는 언어의 현실적 모습이지만 이는 생성문법의 관점에서는 허구에 불과하다.

오늘날의 생성문법은 촘스키가 제창하기는 했지만, 촘스키 개인의 언어이론과는 상당히 다른 궤도에 올라있다. 그러나 언어에 대한 자연과학적 접근이라는 촘스키의 방법론은 오늘날에도 유효하다. 이는 촘스키가 천재이거나 우월해서가 아니라 촘스키 본인의 말대로 많은 연구자들이 생성문법의 논리적 설명적 당위성에 동조하기 때문이다.

촘스키를 중심으로 한 생성문법에 대한 언어철학적 비판에 대해서는 강명윤 교수의 논문 (링크)이 참고하기에 좋다.


[1] 참고로 'grammatica'라는 명칭이 영어에서 문법을 말하는 'grammar'와 유사하다는 이유만으로 중세 자유학예 분과의 grammatica를 언어학의 맹아로 생각할 수도 있는데, 이는 사실이 아니다. 그라마티카는 수사학과 함께 문학과 서지학으로 계보가 이어졌다. 소쉬르 이전에 언어학의 맹아를 찾으려면 파니니 문법에서 찾는 것이 더 타당하다. [2] 1950년대에 이르러 구조주의 언어학자들은 언어에 대해 '거의 모든 것을 다 밝혔다'고 자부하고 있었다. 이때까지 언어학에서 다루는 '언어'는 사회적 습관으로 정의되었다. 마치 한국에서 밥을 먹고 미국에선 빵을 먹는 게 과학적인 이유가 아니라 '문화'에 따른 것임과 마찬가지로, '언어'역시 특정 사회 내에서 그냥 그렇게 쓰기 때문에 그 '습관'을 학습 및 사용하는 것이라고 생각했다. 심지어 현대의 일반인과 수능 영어 강사들은 여전히 언어를 이런식으로 생각한다. 이런 관점에서 언어학자의 연구 과제는 그 '습관'을 기록하고 정리하며 '문화'별로 비교하는 것이 전부였다. [3] 화학의 분자 개념이 원자로 세분화되는 것과 마찬가지로 언어학에서의 조합의 단위 역시 형태소, 자질로 세분한다. 분자가 화학적 특성을 가지는 최소단위인 것처럼 형태소는 문법적 기능을 가진 최소단위이며, 분자가 원자로 세분되는 것처럼 형태소도 특정 성질을 가진 자질로 쪼개진다. [4] 한정된 뇌라는 개념은 뇌의 부피는 물론 인간의 인지능력이 한정되어있다는 뜻이기도 하다. [5] 수학적 과정으로 형식화된 알고리즘 역시 컴퓨터과학과 현대언어학이 공유하는 개념이다. 이것은 단순히 생성문법에 한정되는 것이 아니라 인지언어학이나 비교언어학 등 형식과학으로 포섭되지 않는 언어학 분과를 제외한 모든 현대언어학에 해당한다. [6] 많은 사람들이 착각하는 것과는 달리 Linguistic Inquiry는 통사론 저널이 아니다. 생성문법의 틀 안에서 이루어지는 연구라면 통사-형태론 뿐만 아니라 음운론이나 의미론 논문도 수록된다. 대표적으로 Morris Halle의 feature spreading 논문이 LI에 게재된 논문이다. # [7] '종특'이라는 용어는 실제로 생물학의 일부나 생성언어학에서, 다른 생명체에게 발견되지 않는 특정 생명체의 특이한 자질을 나타내는 전문용어로 사용된다. 예를들어, 조류의 비행능력이나 인간의 언어능력등이 '종특'에 해당한다. [8] 실제로 딥러닝이 상용화된 오늘날에 더욱 지지받는다. 기계학습을 할 때 파라미터를 엄청나게 설정하는데, 뇌가 완전히 발달하지 않은 인간이 수천 가지 파라미터를 설정해서 언어를 습득한다는 것은 논리적 설명이 아니다. [9] 오해하기 쉬운 부분이, 생성문법에서는 언어자극을 무시한다는 오해인데, 그렇지 않다. 다양한 언어가 존재하는 실증적 사실 자체가 언어자극에 따라 다른 언어가 습득된다는 결정적 증거이다. 단, 그 자극이 한 언어를 특정할 정도로 풍부하지 않다는 것이 사실이고, 이러한 상황에서도 완전한 언어가 습득될 수 있는 이유가 바로 '타고났다.'는 설명이 필요한 이유다. [10] 2000년대 초반까지, FOXP2 유전자가 촘스키의 생득주의 언어능력을 지지하는 증거로 제시되어왔다. 또한 일본어위키백과에서는 아직도 이러한 논지로 적었다. # 그러나 이것은 사실이 아닌 것으로 판명되었다. FOXP2는 언어의 표출, 즉 구조가 모두 생성된 다음 그것이 발음되는 능력을 설명하는 유전자이다. 실제로 FOXP2가 결여된 경우 인간에게는 언어능력은 가능하되, 그것이 표출되지 않는 장애로 나타난다. 또한 FOXP2는 조류에게서도 발견되는데, 오직 특정 songbird들에서만 발견되는 것으로 보아, 울음소리의 구조화를 담당하는 것으로 여긴다. [11] 외국어 학습 포함 [12] 행동,기술을 배우는 것은 몸으로 익혀서 '자연스럽게' 배우는 것이지만 언어는 그렇지 않고 언어습득장치를 통해 '습득된다'라는 주장이다. [13] 거듭 말하지만 이 장치가 물리적으로 독립된 영역에 존재하지 않을 수 있고 반대로 독립되어 있을 수도 있다. 거기 관심을 가지는 신경 통사론 같은 학문도 있지만 일단은 생성문법에서는 알 바가 아니며 알 수도 없다. [14] 최신기종의 가정용 컴퓨터라면 20년 전 os와 하드웨어로 이루어진 윈98과 380그래픽카드 정도로 부팅된 컴퓨터 화면을 동시에 20개는 시뮬레이션 할 수 있다. 그걸로 거상이나 대항해시대 온라인 같은 같은 구시대 온라인 게임 다중클라나 돌리겠지만... [15] 3대 타당성에 대한 구체적인 설명은 Chomsky, Noam (1964). Current Issues in Linguistic Theory. In The Structure of Language, eds. by Fodor, J., & Katz, J., 50-118. Prentice Hall.에서 처음 언급되었고 이 단락의 서술도 Chomsky (1964)에서 크게 벗어나지 않는다. [16] 이것을 부연해서 설명하자면, 자연 언어에서 의미가 없는 문자열 혹은 단어배열을 언어이론을 가지고서 '이것은 언어가 아니다' 라고 판단할 수 있어야 한다. 혹은 이를 '화자의 (문법성에 대한) 직관을 설명하여야 한다'고 이해하는 학자도 있다.( 고희정, 2018) [17] 개론교과서를 기준으로 말하자면, 아직 Carnie나 Radford 등 보수적 개론서에서는 분산형태론을 적극 지지하지는 않고 단지 '넌지시 뉘앙스를 풍기는' 정도에서 그치고 있으며, Sportiche, Koopman & Stabler 등 진보적 관점에서 쓰여진 교과서에서는 대놓고 분산형태론의 양상으로 형태론을 통사론의 일부로서 취급하고있다. [18] 이를 달리 말하면 촘스키의 70년대 이론이 상당히 선구안적이었다고도 말할 수 있다. Chomsky 1972 Studies on Semantics in Generative Grammar는 그 유명한 Remarks on nominalization 등 3편의 논문이 묶인 논문집이다. 생성문법 연구자 혹은 연구자가 되기를 희망하는 학부생이나 대학원생이라면, 기초를 다지는 것은 물론 새로운 인사이트를 얻기 위해서도 독서가 추천된다. [19] 형식적으로 말했을 때, 이것은 '모르-'라는 어근과 '-다'가 결합된 형태이고, 이것은 문법적 결합이기 때문에 의미의 생성 여부와는 별개의 문제이다. 따라서 이 단락에서 '모르다'는 기실 '모르-' 부분만을 지칭하는 것이다. 그러나 편의상 '모르다'로 통칭하기로 한다. [20] 언어학사에서 볼 수 있듯이 생성문법진영은 내외부 진영과의 활발한 이론전쟁을 통해 발전했다. 촘스키 본인조차도 스키너의 행동주의 언어학을 비판하며 커리어를 시작하였고, 이후 60년대까지의 변형의 심리적 실체 논쟁, 7-80년대의 생성의미론-해석의미론 논쟁, 구조에 대한 이동과 변형의 영향력 논쟁, 또한 오늘날까지 이어져오는 표상-도출 논쟁(최소주의자 대 최적성이론가들)과 MERGE의 언어보편성 논쟁(에반스 # 대 생성문법론자들 # #) 등 생성문법은 결코 방구석에서 눈가리고 아웅하는 책상발림 이론이 아니다. 과학적 실증적 데이터를 통한 논쟁에 생성문법은 언제나 열려있고, 또한 논쟁을 통해 생성문법 자신이 혹은 논쟁의 반대편에 선 이론이(즉, 인지심리학, 생성의미론, 비변형생성문법, 최적성이론 등) 발전하기도 하였다. 그러나 인지언어학이나 프랑스 발 소위 '문화언어학'과는 논쟁을 하지 않는 이유는, 논쟁을 할 수 있을 정도의 이론적 구체성을 가지고 있지 않기 때문이다.