최근 수정 시각 : 2022-06-30 18:01:20

변분법

해석학 · 미적분학
Analysis · Calculus
{{{#!wiki style="word-break: keep-all; margin:0 -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-6px -1px -11px"
{{{#!wiki style="letter-spacing: -1px"
<colbgcolor=#8f76d6> 함수 합성 · 항등원 · 역원 · 멱함수( 비례·반비례 ) · 초등함수( 대수함수 · 초월함수) · 특수함수 · 범함수 · 다변수 ( 동차 · 숨은 함수( 다가 함수 )) · 그래프 · 대칭 · 증감표 · 극값 · 연속 · 매끄러움 · 계단형 · 미끄럼틀형 · 볼록/오목 · 닮은꼴 함수 · 병리적 함수 · 해석적 연속 · 로그함수 · 지수함수 · 삼각함수
정리 · 토픽 좌표계 · 중간값 정리 · 최대·최소 정리 · 부동점 정리 · 오일러 동차함수 정리 · 립시츠 규칙
극한 부정형 · 어림( 유효숫자 ) · 근방 · 수열의 극한 · 엡실론-델타 논법 · 수렴 ( 균등수렴 ) · 발산 · 점근선 · 무한대 · 무한소 · 스털링 근사
정리 · 토픽 로피탈의 정리 · 슈톨츠-체사로 정리
수열
· 급수
규칙과 대응 · 단조 수렴 정리 · 멱급수 · 테일러 급수 ( 일람 ) · 조화급수 · 그란디 급수 · 망원급수 ( 부분분수분해 ) · 오일러 수열 · 베르누이 수열 · 파울하버의 공식 · 리만 재배열 정리
정리 · 토픽 바젤 문제 · 라마누잔합 · 0.999…=1 · 콜라츠 추측미해결
미분 도함수 일람 · 차분 · 유율법 · 변화량 · 변분법 · 도함수 ( 편도함수 ) · 곱미분 · 몫미분 · 연쇄 법칙 · 역함수 정리 · 임계점 ( 변곡점 · 안장점 ) · 미분형식 · 미분방정식 ( 풀이 ) · [math(boldsymbolnabla)] · 라그랑주 승수법
정리 · 토픽 평균값 정리 ( 롤의 정리 ) · 스토크스 정리 ( 발산 정리 ) · 라플라스 변환 · 푸리에 해석 ( 푸리에 변환 ) · 아다마르 변환
적분 역도함수 일람 · 부분적분 ( LIATE 법칙 · 도표적분법 · 예제 ) · 치환적분 · 정적분 ( 예제 ) · 이상적분 · 중적분 ( 선적분 · 면적분 ) · 르베그 적분 · 스틸체스 적분 · 코시 주요값
정리 · 토픽 미적분의 기본정리 · 2학년의 꿈 · 리시 방법 · 야코비안
실해석 측도론 ( 측도 · 르베그 측도 ) · 유계( 콤팩트성 ) · 칸토어 집합 · 비탈리 집합
정리 · 토픽
복소해석 복소평면 · 편각 · 코시-리만 방정식
정리 · 토픽 오일러 공식 ( 드 무아브르 공식 ) · 리우빌의 정리 · 바이어슈트라스 분해 정리 · 미타그레플레르 정리
여타 하위 학문 수치해석학 ( FEM ) · 미분기하학 · 해석기하학 · 해석적 정수론 ( 소수 정리 ) · 확률론 ( 중심극한정리 )
기타 뉴턴-랩슨 방법 · 디랙 델타 함수 · 리만 가설미해결 · 카오스 이론미해결 · merry=x-mas
응용 수리물리학 · 수리경제학( 경제수학) · 공업수학 }}}}}}}}}}}}

1. 개요2. 역사3. 변분법의 기본 보조정리
3.1. 증명
4. 오일러 방정식
4.1. 다변수함수 오일러 방정식4.2. 구속 조건이 있는 오일러 방정식
4.2.1. 일반 구속 조건4.2.2. 적분형 구속 조건4.2.3. 예제
5. δ 표기법

1. 개요

/ calculus of variations

변분법은 수학의 한 분야로서 범함수의 최소, 최대를 찾는 방법 등을 가리키는 용어이다. 예를 들어 [math( (x_1,y_1) )] 라는 점과 [math( (x_2,y_2) )] 라는 점을 연결하는 다양한 곡선들의 집합을 생각해 보자. 이들 중 가장 짧은 것, 즉 두 점 사이의 최단경로는 두 점을 연결한 직선이 된다. 직관적으로는 답을 쉽게 알 수 있지만 그것을 실제로 수학적인 엄밀성을 갖춰 증명하는 것은 쉽지 않다. 또 다른 예로, 일정한 길이의 닫힌 곡선으로 만들 수 있는 도형을 생각해 보자. 무수히 많은 가능한 도형들 중 가장 넓이가 큰 것은 원이 될 것이다. 그러나 그 증명을 위해 모든 가능한 도형들을 만들어 넓이를 비교해 볼 수는 없다.

다양한 물리학 문제가 무언가를 최소화하거나 최대화하는 것을 요구하고 있고 고전역학을 기술하기 위해 도입된 페르마의 원리, 해밀턴의 원리 등을 실제로 적용하기 위해서는 최소 경로, 최소 시간, 최소 액션 등을 주는 운동을 찾아야 하므로 물리학자들에게 오히려 더 친숙한 수학적인 도구라고도 할 수 있다.

변분법 문제를 푸는 방법은 최적화 문제의 1계 조건에서 얻어지는 방정식의 해를 구하는 것이다. 이 1계 조건이 오일러-라그랑주 방정식이다. 오일러-라그랑주 방정식은 풀기 쉬운 특수한 경우가 아니면 보통 비선형 2계 미분방정식이므로 풀기가 상당히 까다롭다. 또한 오일러-라그랑주 방정식은 최적화의 필요조건이므로 그 해가 충분조건도 만족하는지는 2계 조건을 따져 보아야 알 수 있다.

변수분리법과 햇갈리지 않게 주의하자.

2. 역사

1687년 뉴턴은 프린키피아에서 유체 내부에서 운동하는 물체의 저항을 최소로 만드는 표면의 모양에 대해서 논의한다. 이를 변분법의 시초라고 볼 것인지에 대해선 사람마다 의견이 다르다.

변분법은 1696년 6월 요한 베르누이Acta Eruditorum에 최속 하강 곡선(Brachistochrone curve) 문제를 다른 수학자들에게 난제로 제시하면서 시작되었다. 이 문제에 대해 라이프니츠, 아이작 뉴턴, 요한 베르누이 자신, 야코프 베르누이, 로피탈 등이 답을 제출하였다. 그 중에서 야코프 베르누이가 답을 구한 방식이 변분법의 아이디어의 단초가 되었다.

본격적인 변분법에 대한 연구는 오일러부터 시작되며 변분법이라는 이름도 오일러의 저서에서 비롯된다. 이후에 천재 소년 라그랑주가 오일러의 저서를 보고 연구하여 자신만의 개선점을 오일러에게 편지로 알리자 오일러가 자신의 방법을 버리고 라그랑주의 방법을 받아들였다는 것은 유명한 일화다.[1] 그래서 1계 조건 방정식이 오일러-라그랑주 방정식이라고 불린다.

이후에 야코비, 바이어슈트라스 등의 수학자들이 2계 조건에 관한 연구를 진척시켰다. 특히 힐베르트의 23가지 문제중 마지막 변분법에 대한 문제는 그 문제를 설명하면서 힐베르트가 2계 충분 조건의 기존 성과를 정리하고 자신의 연구결과를 덧붙이는 것을 발표하는 것으로 사실상 문제 아닌 문제가 되어버렸다. 이후 변분법은 좀더 유연한 최적제어론(Optimal control)과 동적 계획법(Dynamic programming)으로 계승되어 발전된다.

3. 변분법의 기본 보조정리

변분법의 기본 보조정리(Fundamental Lemma of Calculus of Variations)는 오일러-라그랑주 방정식의 증명에 있어서 핵심적인 보조정리이다.

[math(f\,:\, [a,\,b] \rightarrow \mathbb{R})]이 연속함수이고, 컴팩트 지지이자 매끄러운 임의의 함수 [math(\eta(x))]에 대하여 다음이 성립한다고 하자,
[math(\displaystyle \int_{a}^{b} f(x) \eta(x)\,dx=0 )]
그러면, [math(f \left( x \right) \equiv 0)]이다.

참고로, 매끄러운 함수는 무한번 미분가능한 함수를 뜻하고, 컴팩트 지지 함수는 [math(\{x\in \mathbb{R}|\eta(x)≠0\})]의 폐포(closure)가 유계 닫힌집합인것을 의미한다.

컴팩트 지지 대신에 좀 더 약한 조건인 [math(c \notin (a,\,b))]인 모든 점 [math(c)]에 관해 [math(\eta(c)=0)]인 조건을 넣기도 한다.

3.1. 증명

[math(f \left( x \right) \not\equiv 0)]이라 가정하자. 편의상 [math(x = \xi)]의 근방 [math(\mathcal{N} = \left\{ x \in \left[ a, b \right] : \xi_1 < x < \xi_2 \right\})]에서 [math(f \left( x \right) > 0)]이라 하자.
이때, compactly supported smooth한 함수 [math(\eta \left( x \right) = {\left( x - \xi_1 \right)}^4 {\left( x -\xi_2 \right)}^4 {\bold{1}}_{\mathcal{N}} \left( x \right))][2]이라 하자.

그러면,
[math(\displaystyle \int_{a}^{b}{f \left( x \right) \eta \left( x \right)}\mathrm{d}x)]
[math(\displaystyle = \int_{a}^{\xi_1}{f \left( x \right) \eta \left( x \right)}\mathrm{d}x + \int_{\xi_1}^{\xi_2}{f \left( x \right) \eta \left( x \right)}\mathrm{d}x + \int_{\xi_2}^{b}{f \left( x \right) \eta \left( x \right)}\mathrm{d}x)]
[math(\displaystyle = \int_{\xi_1}^{\xi_2}{f \left( x \right) \eta \left( x \right)}\mathrm{d}x)]
여기서 [math(f, \eta)] 모두 [math(\mathcal{N})]에서 양의 부호를 가지므로, 적분의 성질에 의해 [math(\mathcal{N})] 위의 적분 [math(\displaystyle \int_{\xi_1}^{\xi_2}{f \left( x \right) \eta \left( x \right)}\mathrm{d}x)]도 양의 부호를 갖는다.
따라서 [math(\displaystyle \int_{a}^{b}{f \left( x \right) \eta \left( x \right)}\mathrm{d}x > 0)]인데, 이는 가정에서 [math(\displaystyle \int_{a}^{b}{f \left( x \right) \eta \left( x \right)}\mathrm{d}x = 0)]라고 한 것과 모순이다.
같은 논지로 [math(f < 0)]인 경우도 증명할 수 있다.
그러므로 [math(f \left( x \right) \equiv 0)]이다.

4. 오일러 방정식

변수를 하나만 가지는 함수 [math(y\left(x\right))]와 그 도함수 [math(y^\prime \left(x\right))]를 변수로 가지는 어떤 범함수(functional)
[math(\displaystyle J = \int_{ x_1 }^{ x_2 }{ f \left\{ y \left( x \right) , y^\prime \left( x \right) ; x \right\} } dx )]

의 극값(극소 또는 극대)가 될 때, [math( f )]가 만족하는 미분방정식은 다음과 같다.
[math(\displaystyle \frac{ \partial f }{ \partial y } - \frac{ d }{ dx }\left( \frac{ \partial f }{ \partial y' } \right) = 0 )]

이를 오일러 방정식이라 한다. 증명 및 자세한 내용은 오일러 방정식 문서에 있다.

4.1. 다변수함수 오일러 방정식

범함수 [math( J )]가 [math( y(x) )]뿐만 아니라 다른 변수 [math( y_1 (x), y_2 (x), y_3 (x), \cdots )] 등을 가질 수도 있다. 이때는 단순히 각 변수에 대해 오일러 방정식을 여러 번 써 주면 된다. 예를 들어
[math(\displaystyle J = \int_{ x_1 }^{ x_2 }{ f \left\{ y \left( x \right) , y^\prime \left( x \right) ,z \left( x \right) , z^\prime \left( x \right) ; x \right\} } dx )]

가 극값이 될 때 [math( f )]가 만족하는 미분방정식은 다음 연립방정식이다.
[math(\displaystyle \frac{ \partial f }{ \partial y } - \frac{ d }{ dx }\left( \frac{ \partial f }{ \partial y' } \right) = 0 , \frac{ \partial f }{ \partial z } - \frac{ d }{ dx }\left( \frac{ \partial f }{ \partial z' } \right) = 0 )]

일반적으로 간단히 [math( J = \int_{ x_1 }^{ x_2 }{ f \left\{ y_i \left( x \right) , y_i^\prime \left( x \right) ; x \right\} } dx \quad (i=1,2,\cdots,n) )]가 극값이 되는 [math( f )]는 다음 연립방정식이 성립한다.
[math(\displaystyle \frac{ \partial f }{ \partial y_i } - \frac{ d }{ dx }\left( \frac{ \partial f }{ \partial y_{i}' } \right) = 0 )]

4.2. 구속 조건이 있는 오일러 방정식

라그랑주 승수법에 의하면, 어떤 조건 [math( g(x,y,z)=0 )]를 만족할 때 [math( f(x,y,z) )]의 극값의 좌표는, 어떤 실수 [math( \lambda )]가 존재하여 다음 식을 만족한다.
[math(\displaystyle \boldsymbol{\nabla} f(x,y,z) + \lambda \boldsymbol{\nabla} g(x,y,z) = 0 )]

그러면 위 식에서 나온 3개의 연립방정식과 구속 조건 [math( g(x,y,z)=0 )]까지 4개의 식을 연립하여 [math( x,y,z,\lambda )]를 구하면 된다. 구속 조건이 있는 오일러 방정식도 비슷한 방법으로 풀 수 있다.

4.2.1. 일반 구속 조건

비슷한 원리로, 구속 조건 [math( g(y,x)=0 )]를 만족하는 범함수 [math( J = \int_{ x_1 }^{ x_2 }{ f \left\{ y( x ) , y'( x) ; x \right\} } dx )]가 극값이 될 때, 어떤 함수 [math( \lambda (x) )]가 존재하여 다음 방정식을 만족한다.
[math(\displaystyle \frac{ \partial f }{ \partial y } - \frac{ d }{ dx } \frac{ \partial f }{ \partial y' } + \lambda (x) \frac{ \partial g }{ \partial y } = 0 )]

그런 다음 구속 조건 [math( g=0 )]이랑 연립해서 [math( y )]와 [math( \lambda )]를 둘 다 구할 수 있다.

일반적으로, [math( f )]가 여러 변수 [math( y_1, y_2, \cdots , y_m )]의 함수이고, 구속 조건도 [math( g_1, g_2, \cdots , g_n )]로 여러 개라면, [math( J )]가 극값이 되는 방정식은 다음과 같다. (각각의 [math( i )]마다 성립하는 [math( m )]개의 연립 방정식이고, 서로 다른 어떤 함수 [math( \lambda_1, \lambda_2, \cdots , \lambda_n )]가 존재한다.)
[math(\displaystyle \frac{ \partial f }{ \partial y_i } - \frac{ d }{ dx } \frac{ \partial f }{ \partial {y_i}' } + \lambda_j (x) \frac{ \partial g_j }{ \partial y_i } = 0 )]

그러면 위 [math( m )]개의 연립 방정식과 [math( n )]개의 구속 조건 [math( g_j = 0 )]를 연립해서 [math( y_1, y_2, \cdots, y_m, \lambda_1, \lambda_2, \cdots , \lambda_n )]를 구할 수 있다. ([math( m+n )]개의 식이 있으므로 [math( m+n )]개의 미지수를 풀 수 있다.)

4.2.2. 적분형 구속 조건

범함수 [math( J )]가 있을 때, 가끔 구속 조건이 단순한 [math( y,x )]에 대한 함수가 아니라 다음과 같은 적분으로 정의된 범함수의 꼴일 수도 있다.
[math( \displaystyle K = \int_{ x_1 }^{ x_2 }{ g \left\{ y( x ) , y'( x) ; x \right\} } dx )]

이런 경우 푸는 방법은 더 쉬워진다. 그냥 어떤 실수 [math( \lambda )]가 존재하여 [math( J + \lambda K )]가 극값이 되면 된다. 즉, [math( \int_{ x_1 }^{ x_2 }{ (f + \lambda g) } dx )]가 극값을 가지면 된다. 이때 만족하는 방정식은 다음과 같이 될 것이다.
[math(\displaystyle \frac{ \partial f }{ \partial y } - \frac{ d }{ dx } \frac{ \partial f }{ \partial y' } + \lambda \left( \frac{ \partial g }{ \partial y } - \frac{ d }{ dx } \frac{ \partial g }{ \partial y' } \right) = 0 )]

4.2.3. 예제

5. δ 표기법

가끔 변분법에서 [math( \frac{\partial x}{\partial \alpha} d \alpha )]를 간단히 [math( \delta x )]로 표시하기도 한다. 설명하자면 [math( \delta )]는 무한소만큼 벗어난 매개변수에 대한 차이이다. 예를 들어, 오일러 방정식의 유도 과정에서 다음 식을 보자. (먼저 오일러 방정식 문서를 읽고 와야 이해하기 쉽다)
[math( \displaystyle \frac{ \partial J }{ \partial \alpha } = \int_{ x_1 }^{ x_2 }{ \left[ \frac{\partial f}{\partial y} - \frac{d}{dx} \frac{\partial f}{\partial y'} \right] \eta \left( x \right) dx } )]

여기서 관계식 [math( \eta (x) = \frac{ \partial y }{ \partial \alpha } )]를 대입하고 양변에 [math( d \alpha )]를 곱하면 다음과 같은 형태로 쓸 수 있다.
[math( \displaystyle \frac{ \partial J }{ \partial \alpha } d \alpha = \int_{ x_1 }^{ x_2 }{ \left[ \frac{\partial f}{\partial y} - \frac{d}{dx} \frac{\partial f}{\partial y'} \right] \frac { \partial y }{ \partial \alpha } d \alpha dx } )]

이것을 [math( \delta )] 표기법으로 쓰면 다음과 같다.
[math( \displaystyle \delta J = \int_{ x_1 }^{ x_2 }{ \left[ \frac{\partial f}{\partial y} - \frac{d}{dx} \frac{\partial f}{\partial y'} \right] \delta y dx } )]

이때, [math( \delta y )]를 [math( y )]의 변분이라고 한다. 여기서 [math( \delta y )]가 의미하는 것은 실제 경로 [math( y(0,x) )]에서 무한소만큼 살짝 벗어난 경로와의 차이이다. 오일러 방정식에서와 마찬가지로, 이것은 임의의 [math( \delta y )]에 대하여 0이 되어야 한다. 따라서 [math( J )]가 극값을 가진다는 것은 다시 말하면 [math( \delta J = 0 )]로도 쓸 수 있다. 따라서 다음은 모두 동치이다.
[math( \displaystyle \delta J = 0 \Longleftrightarrow \left[ {\frac{ \partial J }{ \partial \alpha }} \right] _ {\alpha = 0} = 0 \Longleftrightarrow \frac{ \partial f }{ \partial y_i } - \frac{ d }{ dx }\left( \frac{ \partial f }{ \partial y_{i}' } \right) = 0 )]

그런데 여기까지만 보면 그냥 표기법만 달라진 것인데 굳이 왜 [math( \delta )]를 쓰는지 잘 이해가 되지 않을 수 있다. 지금까지 계속 '무한소만큼 벗어난 매개변수에 대한 차이'라는 표현을 썼는데, 이것이 직관적으로 의미하는 것이 무엇인지 알아보자. 예를 들어 [math( \delta y )]는 다음 그림과 같다.

파일:변분법_2.png

즉, [math( \delta y )]는 아주아주 살짝 벗어난 경로와의 차이라고 이해하면 된다. 이때 [math( J )]의 차이는 [math( \delta J )]이다. 그런데 [math( J )]의 정의를 보자.
[math(\displaystyle J = \int_{ x_1 }^{ x_2 }{ f \left\{ y \left( x \right) , y^\prime \left( x \right) ; x \right\} } dx )]
이 식에서 [math( f )]는 [math( y(x), y'(x), x )]의 함수이다. 그런데 [math( y(x), y'(x) )]는 또 [math( x )]의 함수이다. 이때, [math( y(x), y'(x) )]를 variable이라 하고, [math( x )]를 parameter라고 한다. 그런데 변분이란 [math( \alpha )]에 대한 작은 변화를 보는 것이다. 알다시피 [math( y, y' )]만이 [math( \alpha )]의 함수이고 [math( x )]는 독립이다. 즉 parameter인 [math( x )]는 제외하고 variable인 [math( y )]와 [math( y' )]의 변화만 보겠다는 것이다. 즉 변분은 일종의 variable만 고려하는 전미분과 비슷하다. 그래서 변분법을 영어로 calculus of variations라고 하는 것이다. 따라서 전미분과의 차이는 다음과 같다.
전미분: [math(\displaystyle df =\frac{ \partial f }{ \partial y } dy + \frac{ \partial f }{ \partial y' } dy' + \frac{ \partial f }{ \partial x } dx )]
변분: [math(\displaystyle \delta f =\frac{ \partial f }{ \partial y } \delta y + \frac{ \partial f }{ \partial y' } \delta y' )]

그러면 [math( \delta )]표기법을 써서 오일러 방정식을 증명할 수도 있다.
[math(\displaystyle \delta J = \int_{x_1}^{x_2}{ \delta f dx } = \int_{x_1}^{x_2}{ \left( \frac{ \partial f }{ \partial y } \delta y + \frac{ \partial f }{ \partial y' } \delta y' \right) dx} )]

그런데, [math( \delta y' = (\delta y)' )]가 성립한다. 따라서 오일러 방정식에서 했던 것처럼 두 번째 항을 부분적분하면
[math(\displaystyle \delta J = \int_{x_1}^{x_2}{ \left( \frac{ \partial f }{ \partial y } - \frac{ d }{ dx } \frac { \partial f }{ \partial y' } \right) \delta y dx} )]

따라서 [math( \delta J = 0 )]이 되려면 괄호 안이 0이 되어야 하고 오일러 방정식을 얻는다.

다만 주의할 것은, 이 표기법은 그저 편리를 위해 간단히 줄여 쓴 것일 뿐이지 수학적으로 아주 엄밀한 것은 아니라는 것이다. 그래서 이 표기법은 주로 물리학에서 사용한다.


[1] 현재의 변분법 과목에서도 라그랑주의 아이디어를 이용해서 1계 조건을 도출하는 방법을 설명한다. [2] [math({\bold{1}}_{\mathcal{N}})]은 근방 [math(\mathcal{N})]에 속하는 원소인지를 판별하는 집합 판별 함수이다.