1. 개요
導 函 數 / derivative도함수는 미분계수를 일반화한 개념으로, 함수의 접선의 기울기를 보여주는 함수이다. 미분계수를 구하는 과정(특정한 [math(x)] 값에서의 평균변화율의 극한값)을 하나의 연산으로 보았을 때, 다음과 같이 도함수를 정의할 수 있다. 영어에서는 미분계수와 도함수의 구별 없이 전부 derivative라고 부른다.
함수 [math(f)]의 정의역의 원소 [math(x)]에 다음 극한값: [math(\displaystyle m_x=\lim_{\Delta x\to 0}\frac{f(x+\Delta x)-f(x)}{\Delta x})]가 존재하면 [math(m_x)] 함수를 [math(f)]의 도함수라 한다.
함수 [math(y=f(x))]의 도함수를 기호 [math(y')], [math(f'(x))][1], [math(\displaystyle \frac {\mathrm{d}y} {\mathrm{d}x})][2], [math(\displaystyle \frac{\mathrm{d}}{\mathrm{d}x} f(x))], [math(f^{(1)}(x))], [math(\dot{y})][3] 등으로 나타낸다. 또한 도함수를 구하는 과정을 미분한다(differentiate)고 한다. 어떤 함수의 도함수가 미분 가능할 때 이 도함수를 한 번 더 미분한 함수를 '
이계도함수'라고 부르고[4], 어떤 함수가 [math(n)]번 미분이 가능할 때 [math(n)]번 미분하면 '[math(n)]계도함수'라고 부른다. (단, [math(n)]은 자연수) '이계도함수' 이상부터 통틀어서 '고계도함수'라고 부른다.도함수의 존재성은 실수인지 복소수인지에 따라 다른데, 복소수 위에서의 미분이 훨씬 까다롭기 때문에[5] 실수 위에서 미분 가능한 함수가 복소수 위에서는 미분 불가능할 수 있다.[6]
2. 미분법
합성함수의 도함수, 매개변수로 나타내어진 함수의 도함수, 음함수 꼴의 도함수 등이 있다.-
합성함수의 미분
[math(y=f(t))], [math(t=g(x))]일 때, [math(\displaystyle \frac {\mathrm{d}y} {\mathrm{d}x} = \frac {\mathrm{d}y} {\mathrm{d}t} \frac {\mathrm{d}t} {\mathrm{d}x})] 이므로 [math(y=f(g(x)))]이고 [math(\displaystyle \frac {\mathrm{d}y} {\mathrm{d}x} = g'(x)f'(g(x)))]
-
매개변수의 미분법
[math(x=f(t))], [math(y=g(t))] 라는 함수가 있을 때, [math(\displaystyle \frac {\mathrm{d}y} {\mathrm{d}x} = \frac {\dfrac {\mathrm{d}y} {\mathrm{d}t}} {\dfrac {\mathrm{d}x} {\mathrm{d}t}} = \frac {g'(t)} {f'(t)})]
-
절댓값 함수의 도함수는
부호 함수가 된다. 단, [math(x=0)]일 때는 미분 불가능하다.
[math(\dfrac{\mathrm{d}}{\mathrm{d}x}|x|=\mathrm{sgn}(x))] - 일반적인 함수에 대해서는 다음과 같다.
- [math(\dfrac{\mathrm{d}}{\mathrm{d}x}|f(x)| = (\mathrm{sgn} \circ f)(x)\cdot f'(x))]
- [math(\dfrac{\mathrm{d}^2}{\mathrm{d}x^2}|f(x)| = (\mathrm{sgn} \circ f'')(x) + 2(\delta \circ f)(x)\cdot [ f'(x) ]^2)][7]
2.1. 기본 공식
여기서는 도함수를 미분 연산자 [math(D)]를 이용하여 표현할 것이다. 즉, 함수 [math(\displaystyle y=f(x))]의 도함수 [math(\displaystyle y'=f'(x)=\frac {\mathrm{d}y} {\mathrm{d}x}=\frac{\rm d}{{\rm d}x}y=Dy=Df(x))]이다. 연산자에 대한 개념이 제대로 잡혀 있지 않은 독자의 경우, 간단하게 [math(\dfrac{\rm d}{{\rm d}x}=D)]라고 치환했다고 비유적으로 이해해도 괜찮다.각 함수의 도함수가 존재함(각 함수가 미분가능함)을 전제로 한다.
(1) [math(y=c)]이면 [math(Dy=0)] ([math(c)]는 상수)
(2) [math(y=x^n)]이면 [math(Dy=nx^{n-1})] ([math(n)]은 실수)
(3) 상수 [math(k)]에 대해 [math(D[ kf(x) ]=kDf(x))]
(4) [math(D[ f(x) \pm g(x) ]=Df(x) \pm Dg(x))]
(5) [math(y=f(x)\cdot g(x))]이면 [math(Dy=f'(x)g(x)+f(x)g'(x))]
(6) [math(\displaystyle y={f(x) \over g(x)})](단, [math(g(x)\ne 0)])이면 [math(Dy)]=[math(\displaystyle \frac{f'(x)g(x)-f(x)g'(x)}{\{g(x)\}^2} )]
여기서 미분연산자 [math(D)]가 (3)과 (4)를 만족시키므로, [math(D)]는 선형연산자이다.(2) [math(y=x^n)]이면 [math(Dy=nx^{n-1})] ([math(n)]은 실수)
(3) 상수 [math(k)]에 대해 [math(D[ kf(x) ]=kDf(x))]
(4) [math(D[ f(x) \pm g(x) ]=Df(x) \pm Dg(x))]
(5) [math(y=f(x)\cdot g(x))]이면 [math(Dy=f'(x)g(x)+f(x)g'(x))]
(6) [math(\displaystyle y={f(x) \over g(x)})](단, [math(g(x)\ne 0)])이면 [math(Dy)]=[math(\displaystyle \frac{f'(x)g(x)-f(x)g'(x)}{\{g(x)\}^2} )]
2.1.1. 공식 (2) 증명
[math(x^n)]의 도함수 [math(nx^{n-1})]은 [math(n)]의 범위에 따라 다른 증명법을 취한다.① [math(n)]이 임의의 양의 정수일 경우
[math(f(x)=x^n)] ([math(n)]은 양의 정수)이라 하면
[math(f'(x)=\displaystyle\lim_{h\to 0}\dfrac{f(x+h)-f(x)}h=\lim_{h\to 0}\dfrac{(x+h)^n-x^n}h)]
[math((x+h)^n)]을 이항정리로 전개하면
[math(\displaystyle\lim_{h\to 0}\dfrac{(\cancel{x^n}+{}_n\mathrm C_1x^{n-1}h+{}_n\mathrm C_2x^{n-2}h^2+\cdots+{}_n\mathrm C_{n-1}xh^{n-1}+{}_n\mathrm C_nh^n)-\cancel{x^n}}h)]
[math(x^n)]을 소거하고 [math(h)]로 약분하면
[math(\displaystyle\lim_{h\to 0}({}_n\mathrm C_1x^{n-1}+{}_n\mathrm C_2x^{n-2}h+\cdots+{}_n\mathrm C_{n-1}xh^{n-2}+{}_n\mathrm C_nh^{n-1})={}_n\mathrm C_1x^{n-1}=nx^{n-1})]
[math(f'(x)=\displaystyle\lim_{h\to 0}\dfrac{f(x+h)-f(x)}h=\lim_{h\to 0}\dfrac{(x+h)^n-x^n}h)]
[math((x+h)^n)]을 이항정리로 전개하면
[math(\displaystyle\lim_{h\to 0}\dfrac{(\cancel{x^n}+{}_n\mathrm C_1x^{n-1}h+{}_n\mathrm C_2x^{n-2}h^2+\cdots+{}_n\mathrm C_{n-1}xh^{n-1}+{}_n\mathrm C_nh^n)-\cancel{x^n}}h)]
[math(x^n)]을 소거하고 [math(h)]로 약분하면
[math(\displaystyle\lim_{h\to 0}({}_n\mathrm C_1x^{n-1}+{}_n\mathrm C_2x^{n-2}h+\cdots+{}_n\mathrm C_{n-1}xh^{n-2}+{}_n\mathrm C_nh^{n-1})={}_n\mathrm C_1x^{n-1}=nx^{n-1})]
② [math(n)]이 임의의 실수일 경우
[math(y=x^n)] ([math(n)]은 실수)의 양변에
자연로그 [math(\ln)]을 취하면
[math(\ln y=\ln x^n=n\ln x)]
후술할 음함수 미분법과 [math(\ln x)]의 도함수가 [math(1/x)]임을 이용해 양변을 [math(x)]에 대해 미분하면
[math(\displaystyle\frac1y\cdot\frac{{\rm d}y}{{\rm d}x}=\frac nx)]
[math({\rm d}y/{\rm d}x)]에 대해 정리하고 [math(y=x^n)]을 대입하면
[math(\displaystyle\frac{{\rm d}y}{{\rm d}x}=\frac nx\cdot x^n=nx^{n-1})]
[math(\ln y=\ln x^n=n\ln x)]
후술할 음함수 미분법과 [math(\ln x)]의 도함수가 [math(1/x)]임을 이용해 양변을 [math(x)]에 대해 미분하면
[math(\displaystyle\frac1y\cdot\frac{{\rm d}y}{{\rm d}x}=\frac nx)]
[math({\rm d}y/{\rm d}x)]에 대해 정리하고 [math(y=x^n)]을 대입하면
[math(\displaystyle\frac{{\rm d}y}{{\rm d}x}=\frac nx\cdot x^n=nx^{n-1})]
2.2. 연쇄 법칙 (합성함수 미분 = 속미분)
자세한 내용은 연쇄 법칙 문서 참고하십시오.미분연산자 [math(D)]의 다른 표기법은 다음과 같다. [math(y)]가 [math(x)]에 대한 함수이면, [math(y)]의 도함수를 [math(D_{x}y)]로 나타낸다. 예를 들어, [math(y=u^{10}, u=2x^2+10)]이면 [math(D_{u}y=10u^9)], [math(D_{x}u=4x)]이다. 그런데, [math(u=2x^2+10)]을 [math(y=u^{10})]에 대입하면 [math(y=(2x^2+10)^{10})]이다. 이를 미분하면 [math(y'=D_{x}y=10(2x^2+10)^9\cdot 4x)]로, 이 값은 [math(D_{u}y)]에 [math(D_{x}u)]를 곱한 값과 같다. 즉, 미분가능한 두 함수 [math(y=f(u))], [math(u=g(x))]에 의해 결정된 합성합수 [math(y=f(g(x)))]에서, [math(y)]는 [math(u)]보다 [math(D_{u}y)]배 만큼 변하고, [math(u)]는 [math(x)]보다 [math(D_{x}u)]배 만큼 변한다. 따라서 [math(y)]는 [math(x)]보다 [math(D_{u}y\cdot D_{x}u)]배 만큼 변한다. 이를 연쇄법칙(chain rule)이라고 한다.
[math(y)]가 [math(u)]에 대한 함수이고, [math(u)]가 [math(x)]에 대한 함수이며, 함수 [math(y)], [math(u)]가 각각 [math(u)], [math(x)]에서 미분가능하면 [math(y)]와 [math(u)]의 합성함수는 [math(x)]에서 미분가능하고 [math(D_{x}y=D_{u}y\cdot D_{x}u)]이다.
이러한 연쇄법칙은 다변수함수의 미분에서도 성립한다. 두 미분가능한 다변수 함수 [math(F : \mathbb{R}^n \rightarrow \mathbb{R}^m)]와 [math(G : \mathbb{R}^m \rightarrow \mathbb{R}^k)]에 대해서 둘의 합성함수 [math(G \circ F)] 또한 미분가능하며 그 도함수값(미분계수)은 [math(D(F\circ G)(a)=DF(G(a))DG(a))] 로 나타난다.
일반적으로 다변수의 도함수 값은 행렬이므로 뒤의 곱은 행렬의 곱이다.
[math(\displaystyle\frac{{\rm d}y}{{\rm d}x}\cdot f(g(x))=f'(g(x))\cdot g'(x)])
2.2.1. 역함수의 도함수
자세한 내용은 역함수 정리 문서 참고하십시오.2.3. 곱미분
자세한 내용은 곱미분 문서 참고하십시오.2.4. 몫미분
자세한 내용은 몫미분 문서 참고하십시오.2.5. 정적분으로 정의된 함수의 미분
[math(\displaystyle
\frac{\rm d}{{\rm d}x} \int_{g(x)}^{h(x)} f(x,t) \,{\rm d}t = f(x,h(x)) \cdot h'(x) - f(x,g(x)) \cdot g'(x) + \int_{g(x)}^{h(x)} \frac{\partial}{\partial x} f(x,t) \,{\rm d}t )] |
-
[math(f)]가 [math(t)]만의 함수이고 [math(g(x)=a)], [math(h(x)=x)]인 경우 (단, [math(a)]는 상수) (
미적분의 제1 기본정리)
\frac{\rm d}{{\rm d}x} \int_a^x f(t) \,{\rm d}t = f(x)
)]}}}||
-
[math(f)]가 [math(t)]만의 함수이고 [math(g(x)=x)], [math(h(x)=a)]인 경우
\frac{\rm d}{{\rm d}x} \int_x^a f(t) \,{\rm d}t = -f(x)
)]}}}||
-
[math(f)]가 [math(t)]만의 함수이고 [math(g(x)=a)]인 경우
\frac{\rm d}{{\rm d}x} \int_a^{h(x)} f(t) \,{\rm d}t = f(h(x)) \cdot h'(x)
)]}}}||
-
[math(f)]가 [math(t)]만의 함수이고 [math(h(x)=a)]인 경우
\frac{\rm d}{{\rm d}x} \int_{g(x)}^a f(t) \,{\rm d}t = -f(g(x)) \cdot g'(x)
)]}}}||
위의 네 식에서 볼 수 있듯이, [math(a)]는 정적분 함수 미분에서
그냥 장식이다. 이는 당연한 것인데, 정적분 계산법, 상수함수의 도함수와 합, 차의 미분법을 생각하면 쉽다.
* [math(f)]가 [math(t)]만의 함수인 경우
[math(\displaystyle* [math(f)]가 [math(t)]만의 함수인 경우
\frac{\rm d}{{\rm d}x} \int_{g(x)}^{h(x)} f(t) \,{\rm d}t = f(h(x)) \cdot h'(x) - f(g(x)) \cdot g'(x)
)]}}}||
여기까지의 다섯 개 식은 고교 교육과정에서 배우는 내용이므로 위 식들이 익숙할 것이다.
* [math(g(x)=a)]이고 [math(h(x)=b)]인 경우 (단, [math(a)], [math(b)]는 상수)
[math(\displaystyle* [math(g(x)=a)]이고 [math(h(x)=b)]인 경우 (단, [math(a)], [math(b)]는 상수)
\frac{\rm d}{{\rm d}x} \int_a^b f(x,t) \,{\rm d}t = \int_a^b \frac{\partial}{\partial x} f(x,t) \,{\rm d}t
)]}}}||
적분의 위끝과 아래끝이 상수이고 피적분함수가 [math(x)]와 [math(t)]에 대한 함수인 경우이다. 이런 꼴의 정적분을 미분하는 것을 두고 "적분 기호 안에서 미분하기(differentiation under the integral sign)"라고 부른다.
여기서 [math(\partial)]는 편미분 기호이다. 자세한 내용은 이 문서의 편미분 문단을 참고하면 된다.
여기서 [math(\partial)]는 편미분 기호이다. 자세한 내용은 이 문서의 편미분 문단을 참고하면 된다.
2.6. 편미분
偏 微 分, partial derivative다변수 함수 [math(f(x, y, z, \cdots))]에서 하나의 변수만 남겨놓고 나머지 변수를 상수 취급하는 미분법이다.
다차원 함수식에서 워낙 중요한 연산자인지라 편미분된 함수를 편도함수라고 부르며, [math(\partial)]라는 기호를 따로 쓴다.[9][10] 당연하지만 원시함수의 변수가 둘 이상이기 때문에, 제대로 풀려면 순수 해석학만으로는 부족하고 선형대수학을 동원해야 한다.
이 편미분 기호 [math(\partial)][11]는 명칭이 여러가지로, '델', '디', '파셜', '라운드', '파셜 디', '라운드 디' 등이다. 공대에서는 '라운드'라고 많이 불린다. 그런데 이 중에서도 특히 '델'은 [math(nabla)](del)[12]과 이름이 겹치므로 헷갈리지 않도록 주의해야 한다. 대개 [math(\partial)]을 '델'로 읽는 사람은 [math(\nabla)]를 '나블라'로 읽는 경향이 있다.
고등학교에서 기초적인 편미분을 배울 수 있는데 바로 ' 이계도함수', ' 음함수의 미분'[13]이다. 하지만 그것 말고도 함수가 더럽게 뒤엉켜 있는 함수방정식과 도함수까지 나오는 미분방정식 중 고등학교 시험에 나오는 것들에 요긴하게 써먹을 수 있다. 사실 이런 문제들은 고등학교 수준에서는 꽤 어렵기 때문에 모의고사나 수능에 4점짜리로 종종 나오곤 했는데 요즘에는 절대로 나오지 않는다. 학생들이 다름아닌 편미분으로 너무 쉽게 풀어버리기 때문이다.
다변수함수는 모든 변수에 대한 편도함수가 존재하더라도 연속이 아닐 수 있다. 그러나 편도함수들이 모두 연속이라면 원 함수도 연속이며 미분가능하다.
경제학을 비롯한 사회과학에서도 편미분이 중시되는데, 그 이유는 사회과학에서 “여러 변수들이 동일하다( ceteris paribus)”라는 조건을 쓸정도로 변수처리에 대한 고려가 많기 때문이다. 즉 여러 변수를 ceteris paribus로 두고, 한 변수를 중점적으로 미분한다. 사회과학 관련 여러 변수들은 자연과학에서 요구되는 규칙보다 심오한 편[14]으로, 자연과학의 여러 방정식보다는 적용이 힘들기 때문에 자연과학에 편미분을 적용하는 것보다는 활발한 편까지는 아니다.
아래의 그림과 같이 [math(x)]와 [math(y)]가 곱해진 식을 편미분할 때 헷갈릴 수 있으니 주의한다.
파일:편미분3833.png
편미분 교환법칙
f를 x에 대해서 편미분한 뒤 y에 대해서 편미 분한 결과와, f를 y에 대해서 편미분한 뒤 x에 대해 편 미분한 결과가 같은지 생각해 볼 필요가 있다. 즉, fxy = fyx인가?
이 질문에 대한 답으로는 다음의 편미분 교환법칙을 보 면 된다. (오일러는 1734년에 이 법칙을 발견하였다. 클 레로(Clairaut, A. C. ; 1713~ 1765, 프랑스)의 정리 또는 슈바르츠(Schwarz, H. ; 1843~ 1921, 독일)의 정리라고 하기도 한다.)
R^2의 열린 집합에서 정의된 함수 f(x,y)가 정의역의 점 p에서 두번 미분가능하면, fxy(p) = fух (p ) 이다.
2.6.1. 활용 예시
-
접평면의 방정식
다음의 정리를 이용한다.
공간 상의 곡면 [math(S)] 위의 한 점 [math(X)]에 접하는 평면과 점 [math(X)]를 지나고 곡면 [math(S)]를 지나는 임의의 평면 [math(P)]의 교선은 [math(S)]와 [math(P)]의 교선 위의 점 [math(X)]에서의 접선이다.
위의 정리에서 3차원 좌표공간 상의 곡면 [math(S:z=f(x,\,y))] 위의 한 점 [math((x_0,\,y_0,\,z_0))]에 접하는 평면과... -
[math(P:x=x_0)]와의 교선은
x를 상수 취급하므로 접선 기울기는 [math(\dfrac{\partial z}{\partial y})]
즉, 접선의 방향벡터는 [math((0,\,1,\,\dfrac{\partial z}{\partial y}))] -
[math(P:y=y_0)]와의 교선은
y를 상수 취급하므로 접선 기울기는 [math(\dfrac{\partial z}{\partial x})]
즉, 접선의 방향벡터는 [math((1,\,0,\,\dfrac{\partial z}{\partial x}))] -
음함수의 미분
곡선 [math(f(x,\,y)=C)]는 곡면 [math(z=f(x,\,y))]와 [math(z=C)]의 교선이므로 위의 정리에 의해서
[math(t:\dfrac{\partial z}{\partial x}(x-x_0)+\dfrac{\partial z}{\partial y}(y-y_0)=0)]
[math(\dfrac{\mathrm{d}y}{\mathrm{d}x})]는 위 직선의 기울기이므로
[math(\dfrac{\mathrm{d}y}{\mathrm{d}x}=-\dfrac{\dfrac{\partial f(x,y)}{\partial x}}{\dfrac{\partial f(x,y)}{\partial y}})] - 기타
접평면은 이 두 직선을 포함하여야 하므로 법선벡터는 이 두 벡터에 수직인 벡터이다.
[math(\vec h\parallel(0,\,1,\,\dfrac{\partial z}{\partial y})×(1,\,0,\,\dfrac{\partial z}{\partial x})=(\dfrac{\partial z}{\partial x},\,\dfrac{\partial z}{\partial y},\,-1))]
그러므로 접평면의 방정식은
[math(T:\dfrac{\partial z}{\partial x}(x-x_0)+\dfrac{\partial z}{\partial y}(y-y_0)-(z-z_0)=0\\\therefore T:z=z_0+\dfrac{\partial z}{\partial x}(x-x_0)+\dfrac{\partial z}{\partial y}(y-y_0))]
2.7. 전미분
[math(\mathrm{d}f(x,y,z)=f_x(x,y,z)\mathrm{d}x+f_y(x,y,z)\mathrm{d}y+f_z(x,y,z)\mathrm{d}z)]
[15]전미분(total differential)은 편미분과는 반대로 미분꼴이 다수의 변수를 품은 형태이다. 이 개념을 일반화한 게 미분형식이다.
2.8. 음함수의 미분
음함수 [math(f(x,\,y)=0)]이 있을 때, [math(z \equiv f(x,\,y))]라 하고 양변을 전미분하면[math(\displaystyle {\rm d}z=\frac{\partial f}{\partial x}{\rm d}x+\frac{\partial f}{\partial y}{\rm d}y=0 )]
[math(\therefore\displaystyle \frac{\partial z}{\partial x}dx+\frac{\partial z}{\partial y}dy=0 )]
[math(\rightarrow\displaystyle \frac{dy}{dx}=-\frac{\dfrac{\partial z}{\partial x}}{\dfrac{\partial z}{\partial y}} )]
음함수의 미분법은 단순 음함수 표현을 띄는 초월함수식들부터 시작해서 특히 이차곡선에서 많이 쓰인다. 이들 곡선은 [math(x)]값 하나에 [math(y)]값 [math(2)]개가 대응되므로 함수가 아니다. 단, [math(x^2=4py)]는 이차함수이므로 다항함수의 미분법을 적용해도 미분이 가능하다.
-
포물선
[math(y^2=4px)]에서 [math(y=f(x))]라 하면 [math(\{ f(x) \} ^2=4px)]이므로 [math(2f(x)f'(x)=4p)]이고 [math(\displaystyle f'(x) = \frac {2p} {f(x)} = \frac {2p} y)]
-
타원
[math(ax^2+by^2=1)]에서 [math(y=f(x))]라 하면 [math(ax^2+b \{ f(x) \} ^2=1)]이므로 양변을 미분하면 [math(2ax+2bf(x)f'(x) = 0)]이므로 [math(2bf(x)f'(x) = -2ax)], [math(\displaystyle f'(x) = \frac {\mathrm{d}y}{\mathrm{d}x} = -\frac {ax} {bf(x)} = -\frac {ax} {by})]
-
쌍곡선
[math(ax^2-by^2=\pm 1)]에서 [math(y=f(x))]라 하면 [math(2ax-2bf(x)f'(x)=0)]이고 [math(2bf(x)f'(x)=2ax)]이다. 그러면 [math(\displaystyle\ f'(x) = \frac{\mathrm{d}y}{\mathrm{d}x}=\frac{ax}{by})]
원의 방정식 [math(x^2+y^2-1=0)]을 y에 대한 함수로 나타내면 [math(y=\pm \sqrt {1-x^2})]이다. 이처럼 [math(y)]가 [math(x)]에 대한 함수로 정의되면 [math(y)]를 [math(x)]에 대한 양함수(explicit function, 陽 函 數)라 하고, 원의 방정식처럼 여러 개의 변수들의 관계식, 즉 [math(F(x,\,y)=0)]의 꼴로 정의될 때 [math(y)]를 [math(x)]에 대한 음함수(implicit function, 陰 函 數)[16]라 한다. 관계식 [math(F(x,\,y)=0)]을 [math(y)]에 대한 함수로 나타내어 미분하는 것이 쉽지 않은 경우가 많기 때문에, 관계식 [math(F(x,\,y)=0)]를 그대로 미분하되 [math(y)]가 [math(x)]에 대한 식으로 표현됨에 유의하여 연쇄법칙을 적용한다. 예를 들어 [math(F(x,\,y)=x^2+y^2-1=0)]을 [math(x)]에 대해 미분하면 [math(2x+2y\cdot \dfrac {\mathrm{d}y} {\mathrm{d}x} =0)]이 되어 [math(\dfrac {\mathrm{d}y}{\mathrm{d}x}=-\dfrac x y)]가 된다. [17]
기하적인 의미로, 델 연산자를 사용하여 접선의 법선벡터를 구하는 방법으로 해석할 수도 있다.
음함수 [math(f(x,\,y)=0)]의 그래프 위의 점 [math((a,\,b))]에서의 접선의 법선벡터는 [math(\vec h=\nabla f(x,\,y)_{(a,b)})]
사실 음함수의 미분'법'이라고 하는 것은 chain rule에 의한 자명한 결과이다. 이변수 함수 [math(f(x,\,y))]와 일변수 함수 [math(g(x))]가 각각 미분가능하면 두 함수로 만들어낸 새로운 일변수 함수[math(f(x,\,g(x)))]또한 미분가능하고 그 값은 chain rule에 의해 구할 수 있게 된다.
3. 도함수의 응용(활용)
미분법을 배우는 주된 이유 중 하나는 함수의 그래프를 그리기 위해서이다. 도함수로 원래함수의 상태를 알아내 형태를 그릴 수 있기 때문. 함수의 형태와 특징을 알기 위해서는 도함수와 함께 몇가지 다른 개념들이 필요하다. 이 개념들을 이용하면 함수의 그래프를 그릴 수 있다.3.1. 최댓값과 최솟값
함수 [math(f)]가 [math(S)]에서 정의되고 [math(c\in S)]라 하자.
1. 모든 [math(x\in S)]에 대하여 [math(f(c)\ge f(x))]이면 [math(f(c))]는 [math(f)]의 최댓값(maximum value)이다.
2. 모든 [math(x\in S)]에 대하여 [math(f(c)\le f(x))]이면 [math(f(c))]는 [math(f)]의 최솟값(minimum value)이다.
1. 모든 [math(x\in S)]에 대하여 [math(f(c)\ge f(x))]이면 [math(f(c))]는 [math(f)]의 최댓값(maximum value)이다.
2. 모든 [math(x\in S)]에 대하여 [math(f(c)\le f(x))]이면 [math(f(c))]는 [math(f)]의 최솟값(minimum value)이다.
3.1.1. 최대·최소 정리
자세한 내용은 최대·최소 정리 문서 참고하십시오.3.1.2. 임계점 정리
[math(f)]가 [math(c)]를 포함하는 구간 [math(I)]에서 정의된 함수라 하자. [math(f(c))]가 최대 또는 최솟값이면 [math(c)]는 다음 중 하나이다.
1. [math(I)]의 끝점 (예를 들어, 구간 [math([a,\,b])]의 끝점은 [math(a)]와 [math(b)]이며, 구간 [math([a,\,b))]의 끝점은 [math(a)]이다)
2. [math(f)]의 정점(Apex) ([math(f'(c)=0)] 인 점)
3. [math(f)]의 특이점(Singular point) ([math(f'(c))]가 존재하지 않는 점으로 그래프가 꺾인 점, 접선의 기울기가 발산하는 점, 불연속인 점이 있다)
위의 세 종류의 점을
임계점이라 한다.[18]1. [math(I)]의 끝점 (예를 들어, 구간 [math([a,\,b])]의 끝점은 [math(a)]와 [math(b)]이며, 구간 [math([a,\,b))]의 끝점은 [math(a)]이다)
2. [math(f)]의 정점(Apex) ([math(f'(c)=0)] 인 점)
3. [math(f)]의 특이점(Singular point) ([math(f'(c))]가 존재하지 않는 점으로 그래프가 꺾인 점, 접선의 기울기가 발산하는 점, 불연속인 점이 있다)
3.2. 단조성과 오목·볼록
[math(f)]가 구간 [math(I)]에서 정의될 때 [math(I)] 내의 임의의 두 점 [math(x_{1})], [math(x_{2})]에 대하여
1. [math(x_{1}<x_{2})]일 때 [math(f(x_{1})<f(x_{2}))]이면 [math(f)]는 구간 [math(I)]에서 증가한다(increase)고 하고
2. [math(x_{1}<x_{2})]일 때 [math(f(x_{1})>f(x_{2}))]이면 [math(f)]는 구간 [math(I)]에서 감소한다(decrease)고 하며
3. 함수 [math(f)]가 1 또는 2를 만족하면 [math(f)]는 구간 [math(I)]에서 단조롭다(monotone)고 한다.
1. [math(x_{1}<x_{2})]일 때 [math(f(x_{1})<f(x_{2}))]이면 [math(f)]는 구간 [math(I)]에서 증가한다(increase)고 하고
2. [math(x_{1}<x_{2})]일 때 [math(f(x_{1})>f(x_{2}))]이면 [math(f)]는 구간 [math(I)]에서 감소한다(decrease)고 하며
3. 함수 [math(f)]가 1 또는 2를 만족하면 [math(f)]는 구간 [math(I)]에서 단조롭다(monotone)고 한다.
3.2.1. 단조성 정리
[math(f)]가 구간 [math(I)]에서 연속이며 [math(I)]의 모든 내점에서 미분가능할 때
1. [math(I)]의 모든 내점 [math(x)]에 대하여 [math(f'(x)>0)]이면 [math(f)]는 [math(I)]에서 증가하며,
2. [math(I)]의 모든 내점 [math(x)]에 대하여 [math(f'(x)<0)]이면 [math(f)]는 [math(I)]에서 감소한다.
이때 구간 [math(I)]의 모든 내점 [math(x)]에 대하여 증가 또는 감소임에 유의하자. 즉, 증가 또는 감소 구간은 양 끝점을 포함한다. 단조성 정리의 증명과 이로부터 도출되는 정리는 역도함수로 정의되는 부정적분에 있어 굉장히 중요한 의미를 갖는다. 이에 대한 내용은
평균값의 정리를 참조할 것.1. [math(I)]의 모든 내점 [math(x)]에 대하여 [math(f'(x)>0)]이면 [math(f)]는 [math(I)]에서 증가하며,
2. [math(I)]의 모든 내점 [math(x)]에 대하여 [math(f'(x)<0)]이면 [math(f)]는 [math(I)]에서 감소한다.
3.2.2. 오목성 정리
만약 접선이 그래프를 따라 왼쪽에서 오른쪽으로 이동할 때 반시계방향으로 회전하면 그래프는 위로 오목(concave up) 또는 아래로 볼록(convex down)이며, 시계방향으로 회전하면 아래로 오목(concave down) 또는 위로 볼록(convex up)이다.[19]정확한 정의는 다음과 같다. (반드시 미분 가능해야 할 필요는 없다.)
함수 [math(f)]가 열린구간 [math((a,\,b))]에서 연속일 때, 임의의 [math(0<e<1)]과 [math((a,\,b))]안의 모든 점 [math(x<y)]에 대해 [math(f(ex+(1-e)y)\le ef(x)+(1-e)f(y))]일 때 [math(f)]는 위로 오목(아래로 볼록)이며, [math(f(ex+(1-e)y)\ge ef(x)+(1-e)f(y))]일 때 [math(f)]는 아래로 오목(위로 볼록)이다.
함수가 미분가능하다면, 도함수를 이용하여 다음과 같이 표현할 수 있다. (위의 정의로부터 어떤 함수가 위로 오목/아래로 오목이면 연속이며 만약 미분가능하다면 도함수가 증가/감소함수임을 보일 수 있다.)
함수 [math(f)]가 열린구간 [math(I=(a,\,b))]에서 미분가능하다고 하자. [math(f')]이 [math(I)]에서 증가하면 [math(f)]는 위로 오목(아래로 볼록)이며 [math(f')]이 [math(I)]에서 감소하면 [math(f)]는 아래로 오목(위로 볼록)이다.
여기서 열린구간에서 미분가능한 함수임에 유의하자. 즉, 오목 또는 볼록 구간은 양 끝점을 포함하지 않는다. 또한[math(\ f)]이 양수이면 [math(f')]이 증가하고 [math(f)]이 음수이면 f'이 감소하므로 다음의 오목성 정리가 성립한다. [math(f)]를 열린구간 [math((a,\,b))]에서 두 번 미분가능한 함수라 하자. [math((a,\,b))]의 모든 점 [math(x)]에 대하여
1.[math(\ f''(x)>0)]이면 [math(f)]는 [math((a,\,b))]에서 위로 오목(아래로 볼록)이고,
2.[math(\ f''(x)<0)]이면 [math(f)]는 [math((a,\,b))]에서 아래로 오목(위로 볼록)이다.
2.[math(\ f''(x)<0)]이면 [math(f)]는 [math((a,\,b))]에서 아래로 오목(위로 볼록)이다.
[math(f)]를 [math(c)]에서 연속인 함수라 할 때, [math(f)]가 [math(c)]를 경계로 한쪽에서는 위로 오목(아래로 볼록)이고 다른 쪽에서는 아래로 오목(위로 볼록)이면 [math((c,\,f(c)))]를 [math(f)]의 변곡점(inflection point)이라고 한다. 여기서 [math(f(x)=0)]인 점이 항상 변곡점인 것은 아니라는 것에 유의하자. [math(\ f(x)=0)]이면서 좌우의 [math(f(x))]의 부호가 반대인 점이 변곡점이며 또한 [math(f(x)=0)]의 값이 존재하지 않는 점이 변곡점이 될 수도 있다.
3.3. 극댓값과 극솟값
자세한 내용은 극값 문서 참고하십시오.극댓값이란 주변값보다 큰 값을, 극솟값은 주변값보다 작은 값을 의미한다. 극댓값·극솟값의 정확한 정의는 다음과 같다.
[math(S)]는 [math(f)]의 정의역이고, [math(c\in S)]라 하자.
1. [math(c)]를 포함하는 열린구간 [math(I)]가 존재하여 [math(f(c))]가 집합 [math(I\cap S)]에서 [math(f)]의 최댓값이면 [math(f(c))]를 [math(f)]의 극댓값(local maximum value)이라고 한다.
2. [math(c)]를 포함하는 열린구간 [math(I)]가 존재하여 [math(f(c))]가 집합 [math(I\cap S)]에서 [math(f)]의 최솟값이면 [math(f(c))]를 [math(f)]의 극솟값(local minimum value)이라고 한다.
3. [math(f(c))]가 극댓값이거나 극솟값이면 [math(f(c))]를 [math(f)]의 극값(local extreme value)이라고 한다.
1. [math(c)]를 포함하는 열린구간 [math(I)]가 존재하여 [math(f(c))]가 집합 [math(I\cap S)]에서 [math(f)]의 최댓값이면 [math(f(c))]를 [math(f)]의 극댓값(local maximum value)이라고 한다.
2. [math(c)]를 포함하는 열린구간 [math(I)]가 존재하여 [math(f(c))]가 집합 [math(I\cap S)]에서 [math(f)]의 최솟값이면 [math(f(c))]를 [math(f)]의 극솟값(local minimum value)이라고 한다.
3. [math(f(c))]가 극댓값이거나 극솟값이면 [math(f(c))]를 [math(f)]의 극값(local extreme value)이라고 한다.
여기서 임계점 정리의 최대·최솟값을 극값으로 바꾸어도 성립한다. 즉 끝점, 정점 그리고 특이점이 극값이 될 수 있다. 이때 도함수를 이용하면 극값을 판정할 수 있다.
[math(f)]는 [math((a,\,b)-\{c\})]에서 미분 가능하고, 임계점 [math(c)]는 [math((a,\,b))]의 원소일 때,
1. [math((a,\,c))]의 임의의 점 [math(x)]에 대하여 [math(f'(x)>0)]이고, [math((c,b))]의 임의의 점 [math(x)]에 대하여 [math(f'(x)<0)]이면 [math(f(c))]는 [math(f)]의 극댓값이다.
2. [math((a,\,c))]의 임의의 점 [math(x)]에 대하여 [math(f'(x)<0)]이고, [math((c,b))]의 임의의 점 [math(x)]에 대하여 [math(f'(x)>0)]이면 [math(f(c))]는 [math(f)]의 극솟값이다.
3. [math(c)]의 양쪽에서 [math(f'(x))]의 부호가 같으면 [math(f(c))]는 극값이 아니다.
1. [math((a,\,c))]의 임의의 점 [math(x)]에 대하여 [math(f'(x)>0)]이고, [math((c,b))]의 임의의 점 [math(x)]에 대하여 [math(f'(x)<0)]이면 [math(f(c))]는 [math(f)]의 극댓값이다.
2. [math((a,\,c))]의 임의의 점 [math(x)]에 대하여 [math(f'(x)<0)]이고, [math((c,b))]의 임의의 점 [math(x)]에 대하여 [math(f'(x)>0)]이면 [math(f(c))]는 [math(f)]의 극솟값이다.
3. [math(c)]의 양쪽에서 [math(f'(x))]의 부호가 같으면 [math(f(c))]는 극값이 아니다.
3.4. 이계도함수
자세한 내용은 이계도함수 문서 참고하십시오.도함수의 도함수로써 그래프의 볼록한 방향을 구할때 쓴다.
3.5. 점근선
자세한 내용은 점근선 문서 참고하십시오.3.6. 리시 방법
자세한 내용은 리시 방법 문서 참고하십시오.초등함수의 도함수를 구하는 방법을 일반화시킨 것이다.
[1]
'에프 프라임 엑스'라고 읽는다. 영미권에서는 f prime of x.
[2]
디엑스 분의 디와이가 아니라 디와이디엑스라고 읽는다.
[math({rm d}y)]를 [math({rm d}x)]로 나눈다는 것이 아니다.
[3]
고전역학에서 자주 보이는 표기인데,
아이작 뉴턴이 물리학 이론을 전개하는 과정에서 이 표기를 썼기 때문이다.
물리학에서 변수 위에
점을 찍는 표기는 보통 시간 [math(t)]에 대한 미분일 때 많이 쓴다.
[4]
[math(y)], [math(f(x))], [math(f^{(2)}(x))], [math(\ddot{x})] 등으로 표기한다.
[5]
[math(\displaystyle \lim_{\Delta \Re(z)\to 0} \lim_{\Delta \Im(z)\to 0} \frac{f(z+\Delta z)-f(z)}{\Delta z})]의 꼴로 두 방향으로 미분하는데, 복소수의 특성상 실수에서 먹히던 방법이 안 먹히는 일이 많다.
[6]
참고로 복소수 위에서 도함수를 갖는 함수는 복소해석적(complex analytic)이라고 불린다.
[7]
[math(\delta(x))]는
디랙 델타 함수이다.
[8]
지수 적분 함수,
로그 적분 함수,
삼각 적분 함수 등
[9]
따로 쓰는 또 하나의 이유는 [math(\mathrm{d}x)]와 [math(\partial x)]는 다르기 때문이기도 하다.
[10]
편미분 기호 외에도 둘러싸는 부분을 뜻하는 경우도 있다. 예를 들어 [math(\partial V)]는 공간 [math(V)]의 표면이다.
[11]
니콜라 드 콩도르세가 고안한 기호이다.
[12]
그런데 이것도 편미분 연산자의 일종이다.
[13]
이건 오히려 편미분을 활용한 상위 테크닉이긴 하다. 음함수의 미분 시 편미분과 헷갈릴 수 있으니 주의하자. x와 y 중 한 문자에 대해서만 미분하는 편미분과 달리 음함수의 미분은 x와 y를 둘 다 변수로 본다. 상세 내용은
아래 문단 참조
[14]
자연과학의 연구 대상은 대개 의지가 없는 물질인 반면, 사회과학의 연구 대상은 의지가 있는 인간들이 모인 군집이다.
[15]
[math(f_u)]는 [math(f)]를 [math(u)]에 대해 편미분 하라는 의미이다.
[16]
간혹 함수의 정의에 입각해 음함수를 이해 못 하는 학생들이 종종 있다. 함수란 하나의(또는 한쌍의) 조작변수에 대해 하나의 종속변수가 대응하는 관계인데, 예시로 든[math(x^2+y^2-1=0)]의 식은 하나의 조작변수 x에 대응하는 값이 [math(y=\pm \sqrt {1-x^2})]로 두개이기 때문이다. 이것은 애초에 음함수라는 개념부터 엉성하게 이해하고 있기 때문에 발생하는 착각이다. 애초에 음함수 자체는 함수가 아니다. 음함수를 뜻하는 'implicit function'을 직역하면 '내재적 함수'로, 이는 공역을 잘 분리하면 '(명시적)함수'(explicit function)가 될 수 있다는 의미이다. 실제로 예시로 든[math(x^2+y^2-1=0)]는 공역을 [math(y_1,\in\{0≤y_1<∞\}, y_2\in\{-∞<y_2≤0\})]로 분리 할 경우 명시적 함수(explicit function)가 된다. 이러한 오해는 음함수를 배우는 이유나 음함수의 역할에 대한 설명 없이 바로 음함수의 미분법부터 배우는 잘못된 교육체계때문에 발생하는 것이며, '음'함수라는 한자식 표현이 'implicit' function이라는 의미를 제대로 표현하지 못하고 있기 때문이다. 그러므로 우리는 번역본을 멀리하고 원서를 가까이 해야합니다
[17]
즉, [math(y)]를 [math(f(x))]로 취급하고 미분하면 된다.
[18]
책에 따라 [math(f'(c)=0)] 인 점만 임계점이라 부르는 경우도 있다.
[19]
책에 따라 위로 오목(아래로 볼록)한 함수를 볼록함수(Convex Function), 아래로 오목(위로 볼록)한 함수를 오목함수(Concave Function)이라 부르는 경우도 있다.