||<table align=center><table bordercolor=#000000><table width=100%><bgcolor=white>
GPU
마이크로아키텍처 ||
}}}}}}}}} ||
{{{#!wiki style="margin: 0 -10px -5px;min-height:26px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -6px -1px -11px" |
<rowcolor=#fff,#000> 설계 기반 | CUDA 연산 능력 | 칩셋명 | 등장 시기 | 인코더 | 디코더 | 사용 제품 | 공정 노드 |
<colcolor=black,white> Tesla | <colcolor=black,white> 1.0 | <colcolor=black,white> G80 | <colcolor=black,white> | <colcolor=black,white> | <colcolor=black,white> | <colcolor=black,white> | <colcolor=black,white> | |
Fermi | 2.0 | GF100 | 2010년 | TSMC 40 nm | ||||
GF110 | 2010년 | TSMC 40 nm | ||||||
2.1 | GF104 | 2010년 | TSMC 40 nm | |||||
Kepler | 3.0 | GK104 | 2012년 3월 |
GeForce 600 GeForce 700 GeForce GTX TITAN |
TSMC 28 nm | |||
GK106 | 2012년 9월 | TSMC 28 nm | ||||||
GK107 | 2012년 6월 | TSMC 28 nm | ||||||
3.5 | GK110 | 2012년 11월 | TSMC 28 nm | |||||
Maxwell | 5.0 | GM107 | 2014년 2월 | GeForce GTX 750/750 Ti | TSMC 28 nm | |||
GM108 | 2014년 3월 | GeForce 800M | TSMC 28 nm | |||||
5.2 | GM200 | 2015년 3월 |
GeForce GTX TITAN X GeForce GTX 980 Ti |
TSMC 28 nm | ||||
GM204 | 2014년 9월 | GeForce 900 | TSMC 28 nm | |||||
GM206 | 2015년 1월 | TSMC 28 nm | ||||||
Pascal | 6.1 | GP102 | TSMC 16 nm | |||||
GP104 | 2016년 5월 | GeForce 10 | TSMC 16 nm | |||||
GP106 | 2016년 7월 | TSMC 16 nm | ||||||
GP107 | 2016년 10월 | Samsung 14 nm | ||||||
GP108 | 2017년 5월 | Samsung 14 nm | ||||||
Turing | 7.5 | TU102 | GeForce 20 | TSMC 12 nm | ||||
Ampere | 8.6 | GA102 | GeForce 30 | Samsung 8 nm | ||||
Ada Lovelace | 8.9 | AD102 | GeForce 40 | TSMC 4 nm | ||||
서버/HPC용 (배정밀도 연산 성능 특화) | ||||||||
Kepler | 3.7 | GK210 | 2014년 11월 | Tesla K80 | TSMC 28 nm | |||
Pascal | 6.0 | GP100 | 2016년 4월 |
Tesla P100 Quadro GP100 |
TSMC 16 nm | |||
Volta | 7.0 | GV100 | 2017년 5월 | TSMC 12 nm | ||||
Ampere | 8.0 | GA100 | TSMC 7 nm | |||||
Hopper | 9.0 | GH100 | TSMC 4 nm | |||||
저전력 |
1. 개요
2016년 출시된 NVIDIA GeForce 10 시리즈의 마이크로아키텍처.2. 공개된 정보
2.1. 주요 변경점
- TSMC 28 nm → TSMC 16 nm (공정 미세화)
- 코어(SM) 레벨 (Maxwell 대비)
- Compute Capability: 5.x → 6.x
- 프론트 엔드
- 백 엔드
- 스케줄러 개선
- SM당 레지스터 수는 유지
- 단정밀도 처리량이 사이클당 128 → 64로 감소
- FP16 연산 지원 (GP100 한정)
- PolyMorph Engine 4.0
- 메모리 서브시스템
- Atomic 메모리 지원 개선
- 기타
- 프로세서 레벨
- GDDR5X 메모리 지원
- HBM2 메모리 지원 (GP100 한정)
- NVLink 지원
- 메모리 압축 개선
- NVENC/NVDEC 개선
- 전작인 Maxwell 대비 클럭 주파수가 크게 향상되었다.
- 연산 유닛 대비 레지스터, 메모리 비율이 증가하였다.
- VR 성능이 크게 향상되었다.
VR, AI 등 신기술에 최적화하였다.