상위 문서: Apple Silicon
{{{#!wiki style="margin:-10px;" | <tablebordercolor=#fff,#ddd> |
[[Apple Silicon|
Silicon ]] |
}}} |
{{{#!wiki style="margin: 0 -10px -5px; min-height: calc(1.5em + 5px); color: #fff;" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -5px -1px -11px; word-break: keep-all;" |
<colbgcolor=#333><colcolor=#ddd>
A 시리즈 ( iPhone, iPad) |
A4 · A5 · A5X · A6 · A6X · A7 · A8 · A8X · A9 · A9X · A10 · A10X Fusion · A11 Bionic · A12 · A12X · A12Z Bionic · A13 Bionic · A14 Bionic · A15 Bionic · A16 Bionic · A17 Pro · A18 · A18 Pro | |
M 시리즈 ( Mac, iPad, Vision) |
M1 ·
M1 Pro ·
M1 Max ·
M1 Ultra M2 · M2 Pro · M2 Max · M2 Ultra M3 · M3 Pro · M3 Max M4 · M4 Pro · M4 Max |
||
S 시리즈 ( Watch, HomePod) |
S1 · S1P · S2 · S3 · S4 · S5 · S6 · S7 · S8 · S9 · S10 | ||
W 시리즈 ( AirPods, Beats, Watch) |
W1 · W2 · W3 | ||
H 시리즈 ( AirPods, Beats) |
H1 · H2 | ||
T 시리즈 ( Intel Mac 2016-2020) |
T1 · T2 | ||
U 시리즈 ( UWB) |
U1 · 2세대 초광대역 칩 | ||
R 시리즈 ( Vision) |
R1 | ||
기타 | 339S0196 |
1. 개요
iPad와 Mac에 사용되는 Apple Silicon의 고성능 라인업이다. 기존 A 시리즈의 강화판인 AX 시리즈의 연장선상에 있다.2. 목록
2.1. M1
<rowcolor=white> 패키지 샷[1] | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-2> APL1102-T8103 ||
CPU |
4코어
Apple Firestorm 0.6 ~ 3.2 GHz + 4코어
Apple Icestorm 0.6 ~ 2.06 GHz Firestorm: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / 12 MB L2 공유 캐시 Icestorm: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / 4 MB L2 공유 캐시 8 MB 시스템 캐시 |
|
GPU | Apple G13G 1,278 MHz | |
7코어 112 EU, 2.275 TFlops(FP32) |
8코어 128 EU, 2.6 TFlops(FP32), 82 GTex/s(TMU), 41 GPix/s(ROP) |
|
NPU |
16코어
Apple 4세대 Neural Engine 11 TOPS(FP16) |
|
메모리 |
64-bit 2 채널(128-bit) LPDDR4X 2,133MHz 통합 메모리 전송 속도: 4,266 MT/s, 대역폭: 68.2 GB/s |
|
8 GB | 16 GB | |
명령어 집합 | ARMv8.5-A | |
생산 공정 |
TSMC N5 다이 사이즈: 118.91 mm² / 트랜지스터 개수: 16B |
|
탑재 기기 | MacBook Air(M1, 2020년), MacBook Pro 13(M1, 2020년), Mac mini(M1, 2020년), iMac 24(M1, 2021년), iPad Pro 11(3세대), iPad Pro 12.9(5세대), iPad Air(5세대) |
Apple이 한국 시간 기준 2020년 11월 11일 Apple 이벤트에서 발표한 Apple M 시리즈의 첫 작품이며, 코드네임은 Tonga이다. Apple Silicon 기반 Mac에 처음으로 탑재되었다. 이후 2021년 4월 이벤트를 통해 iPad Pro 11(3세대), iPad Pro 12.9(5세대)도 동일한 칩을 사용하며, 2022년 3월 이벤트에서는 iPad Air(5세대)에도 이를 탑재하는 것이 밝혀졌다. 1개의 칩이 무려 6종의 제품에 그대로 쓰이는 것이다.
CPU는 ARM big.LITTLE 기술을 채용하여 4코어 Apple Firestorm을 빅 클러스터로, 4코어 Apple Icestorm을 리틀 클러스터로 총 8코어 CPU의 구성을 이룬다. Apple은 13형 MacBook Pro에 들어가던 Intel CPU 대비 Apple M1이 2.8배의 CPU 성능을 가지며, x86 CPU와 비교 시 3배의 전력 효율을 가진다고 밝혔다.
Apple Firestorm은 8-Wide 디코더 구조를 가지는데, 이는 A17 Pro의 Apple Everest 출시 전까지 현용 CPU 역사상 가장 넓은 아키텍처에 속했다. 아직 출시되지 않은 IBM POWER10, 그리고 태어나지 못한 채로 프로젝트가 드랍된 SARC의 Exynos M6만이 이 정도의 코어 규모를 가진다고 한다. 백엔드 면에서도 Apple의 Firestorm은 7개의 정수 실행 유닛과 전작 대비 33% 확장된 4개의 FP/Vector 연산 유닛을 보유한다. 이를 통하여 약 3 GHz의 클럭에서도 약 5 GHz 전후로 작동이 되는 x86 CPU들을 SPECint/fp 기준 1코어 성능 비교에서 비등한 성능을 내고 있으며, AMD, Intel의 x86 코어가 약 20 W로 작동할 때, Apple의 Firestorm은 코어당 약 4~5 W 선으로 전력소모를 억제하는 데 성공하였다. 최대 전력 소모량은 성능 코어가 4개가 최대 13.8 W, 효율 코어 4개가 최대 1.3 W이다. #
GPU는 Apple G13G를 8코어 구성으로 탑재했다. 이를 통하여 섀도 오브 더 툼 레이더를 구동 시 이전 세대의 MacBook Air와 비교하여 3.1배 더 빠른 게임 성능을 낼 수 있다고 한다. MacBook Air 기본형에는 7코어 구성으로 탑재된다. 128개의 실행 유닛(Execution Units)을 가지며, 2.6 TFlops의 FP32 연산 성능, 82 GTex/s의 텍스처 성능과 41 GPix/s의 ROP 성능을 가지며, 경쟁사 GPU와 비교 시 2배의 전력 효율을 가진다고 밝혔는데, 이는 데스크탑용 GPU인 GTX 1050Ti와 GTX 1650 사이 급에 해당하는 연산 성능 / TMU / ROP 성능을 보유한 셈이다. 다른 점이라면, 위의 데스크탑용 GPU는 TSMC의 N16, 그리고 N16의 하프 노드인 N12에서 생산되는 데 반해, Apple M1의 GPU는 N5 공정에서 생산되기 때문에 풀 노드 기준으로 생산 공정이 3세대 차이가 났고, 그로 인하여 TDP 10W대의 AP 내에 넣을 수 있을 정도로 다이 면적, 전력 효율이 개선되었다.
NPU는 A14 Bionic에 탑재된 4세대 Neural Engine을 16코어 구성으로 탑재했다. 동일하게 11 TOPS의 성능을 가진다고 한다.
RAM은 SoC 패키지 안에 통합되어 있으며, LPDDR4X 규격으로 8 GB와 16 GB를 제공한다. Apple에선 이를 '통합 메모리'라 부르며, CPU 다이 바로 옆에 메모리가 위치하여 레이턴시가 극단적으로 짧은데, 이는 M1이 높은 성능 경쟁력을 가지는 비결 중 하나로 꼽힌다. 이 때문에 RAM 확장이 어렵다고 볼 수도 있지만 LPDDR은 원래 일체형밖에 없으므로 별 문제가 되지 않는다. 실제로 LPDDR을 탑재한 노트북들은 모두 일체형 RAM을 쓴다.[2] 통합 메모리는 기존 RAM과 GPU의 VRAM을 통합한 방식이기 때문에 RAM 전체를 CPU와 GPU가 나눠 쓴다.[3] 대신 일반 RAM보다 성능이 더 좋다.
이외에도 ISP와 영상 인코딩/디코딩을 위한 전용 하드웨어를 탑재한 것으로 보인다. 그 외에도 PCIe 4.0 등의 I/O 규격을 지원한다.
생산 공정은 TSMC의 N5 공정이다. 트랜지스터 수는 A14 Bionic의 118억 개에서 160억 개로 약 35% 증가하였다고 한다. 다이 면적은 실측치 기준 약 120 mm² 수준이며, 트랜지스터 밀도는 약 133 MT/mm²이다. 이는 N5의 이론상 밀도보다는 부족한 수준이나, 2020H2 기준 최고로 미세한 공정을 사용한 것이라는 데에는 이견이 없다.
M1 MacBook Air에서 Cinebench R23 멀티코어 벤치마크 실행 시 2.65 GHz 클럭에서 최대 10W를 소모하며 7,400점이 나왔다. 그 후 50분간 다섯 번에 걸쳐 벤치마크를 실행하여 쓰로틀링을 유도하자 CPU 클럭은 2.35 GHz, 전력 소모는 7.4 W를 유지하며 한 자릿수 전력 소모라고는 믿을 수 없는 6,384점이 나왔다. 풀 로드 시의 전력 소모량은 대략 15 W 수준이고, CPU와 GPU 외에도 여러 컨트롤러들이 탑재되어 있는 SoC의 특성을 감안한다면 상당히 낮은 편이다. # #
벤치마크 결과는 Geekbench 5 버전에 MacBook Air(M1, 2020년) 기준으로 싱글 코어 약 1,700점, 멀티 코어 약 7,400점으로 확인되었다. # 이는 싱글코어 기준 iMac 27(Retina 5K, 2020년), MacBook Pro 16(2019년) 모델보다도 무려 400점 이상 더 높은 성능이라 기대를 모으고 있다. 또한 MacBook Pro의 Cinebench R23 점수가 나왔는데 #, 싱글 코어 약 1,500점, 멀티 코어 약 7,500점으로 이는 AMD Ryzen 5600X와 비슷한 싱글코어 점수, Ryzen 2600X와 비슷한 멀티코어 점수이다. 저전력 프로세서와 비교하면 싱글코어는 Intel Core i7-1165G7과 비슷하며 #, 멀티코어는 Ryzen 4600U보다 낮은 수준이다. # gizmochina에 따르면 M1의 안투투 점수는 1,119,243점이다. #
여러 회사들에게 큰 임팩트를 준 장본인이며 실제로 Intel은 대놓고 견제하는 중이다. Adobe에서 Apple Silicon용 포토샵을 내놓았고 성능 향상이 무척 컸다고 밝혔다. 실제 테스트에서도 무려 Intel H 시리즈를 능가하는 모습을 보이고 있으며, 미디어 가속기를 사용하는 일부 프로그램에서는 아예 데스크탑을 능가하는 성능을 보여줬다. Adobe 계열 툴은 싱글코어 성능이 제일 중요한데 여러 벤치마크 사이트에서도 M1의 싱글코어 성능이 매우 높은 것을 증명하고 있다.
ARM 기반이며 iOS, iPadOS용 앱들을 위한 API를 macOS에 통합했기에 별도의 에뮬레이터 없이도 돌릴 수 있다. 단, 기술적인 걸림돌은 사라졌으나 앱 개발자가 macOS에서도 사용할 수 있게 허가를 하지 않으면 다운로드가 불가능하다. 대부분의 앱과 게임들은 이를 허용해놓지 않아[4] Mac에서의 사용이 불가능하다. 이를 IPA 사이드로딩으로 우회해 해결하는 방법이 있었지만, 결국 Apple이 macOS Big Sur 11.2 버전에서 사이드로딩을 완전히 차단해 macOS의 일반 사용자용 앱 생태계는 인텔 이전보다 못해진 편.
최대 2대의 디스플레이를 지원한다.
많은 리뷰어들이 M1 칩의 매우 낮은 전력 소모를 믿지 못해 수 차례 테스트를 다시 하는 해프닝이 있었는데, Apple 마케팅 팀조차 M1 MacBook Air를 처음 테스트해보고는 배터리 측정 앱에 버그가 있을 것이라 생각했다고 한다. #
2.1.1. M1 Pro
<rowcolor=white> 패키지 샷 | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-2> APL1103-T6000 ||
CPU |
Apple Firestorm 0.6 ~ 3.23 GHz +
Apple Icestorm 0.6 ~ 2.06 GHz Firestorm: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / 24 MB L2 공유 캐시 Icestorm: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / 4 MB L2 공유 캐시 24 MB 시스템 캐시 |
|
6코어 + 2코어 | 8코어 + 2코어 | |
GPU | Apple G13S 1,296 MHz | |
14코어 224 EU, 1,792 ALU(4.58 TFLOPs) |
16코어 256 EU, 2,048 ALU(5.22 TFLOPs) |
|
NPU |
16코어
Apple 4세대 Neural Engine 11 TOPS(FP16) |
|
내장 엔진 |
하드웨어 가속형
H.264 /
HEVC /
ProRes / ProRes RAW 동영상 디코딩 엔진, 동영상 인코딩 엔진, ProRes 인코딩 및 디코딩 엔진, 디스플레이 엔진 |
|
메모리 |
128-bit 2 채널(256-bit) LPDDR5 3,200 MHz 통합 메모리 전송 속도: 6,400 MT/s, 대역폭: 204.8 GB/s |
|
16 GB | 32 GB | |
명령어 집합 | ARMv8.5-A | |
생산 공정 |
TSMC N5 다이 사이즈: 245 mm² / 트랜지스터 개수: 33.7B |
|
탑재 기기 | MacBook Pro 14(2021년), MacBook Pro 16(2021년) |
M1 APL1102의 강화형 칩으로 2021년 10월 Apple 이벤트에서 공개되었다. 코드네임은 Jade Chop이다.
CPU는 ARM big.LITTLE 기술을 채용하고, M1과 동일한 아키텍처의 8코어 Apple Firestorm을 빅 클러스터로, 2코어 Apple Icestorm을 리틀 클러스터로 하여 총 10코어 CPU의 구성을 이룬다. 단, 14형 MacBook Pro 기본형은 염가판으로 성능코어가 2개 죽은 8코어 제품이 사용된다.
GPU는 Apple G13S를 16코어 구성으로 탑재했다. 단, 14형 MacBook Pro 기본형은 염가판으로 코어가 2개 죽은 14코어 제품이 사용된다.
NPU는 4세대 Neural Engine을 16코어 구성으로 탑재했다. 전작인 M1과 동일한 성능을 가진다.
RAM은 전작과 동일한 개념의 통합 메모리로 구성되어 있으며, LPDDR5 규격으로 16 GB와 32 GB를 제공한다. 메모리 대역폭은 204.8 GB/s이다. 해당 대역폭은 AMD Radeon Pro 5600M의 VRAM 대역폭인 200 GB/s과 큰 차이가 없다.
이외에도 ProRes 코덱의 하드웨어 인코더/디코더, 외부 화면 연결과 ProMotion을 위한 디스플레이 엔진을 탑재했고, PCle 4.0, HDMI 2.0, Thunderbolt 4 등의 I/O 규격을 지원한다.
TSMC의 N5 공정으로 생산되었으며, 다이 사이즈는 245 mm²이다. 트랜지스터 개수는 대략 337억 개이다.
CPU 성능은 성능코어 2개가 죽은 8코어 버전의 경우, Cinebench R23 기준 싱글코어 1,562점, 멀티코어 12,340점이 나오며, GeekBench 5 기준 싱글코어 1,768점, 멀티코어 9,731점 가량이 나온다. 기존 M1 대비 큰 향상이 없는 싱글코어 기준으로는 대략 11700K와 비슷한 수준의 성능이 나오지만, 멀티코어로 따진다면 11900H와 비슷한 수준을 내 준다.
성능코어가 죽지 않은 10코어 풀칩 버전의 경우, 멀티코어가 GeekBench 기준 11,680점, Cinebench R23 기준 14,970점이며, 이는 AMD Ryzen 7 5800 ~ 5800X 사이, Intel Core i9-10900X ~ 10900K 사이 정도의 점수이다. Geekbench 5 기준으로 비교하면 Intel Core i9-11900K보다는 소폭 높고, AMD Ryzen 7 3900X보다는 소폭 낮은 점수가 나오는데, 둘 다 TDP가 100W를 넘어가는 데스크탑용 프로세서라는 사실을 고려하면, 깡성능 이전에 전성비가 높은 편. # #
최대 3대의 디스플레이를 지원한다.
2.1.2. M1 Max
<rowcolor=white> 패키지 샷 | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-2> APL1105-T6001 ||
CPU |
8코어
Apple Firestorm 0.6 ~ 3.23 GHz + 2코어
Apple Icestorm 0.6 ~ 2.06 GHz Firestorm: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / 24 MB L2 공유 캐시 Icestorm: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / 4 MB L2 공유 캐시 48 MB 시스템 캐시 |
|
GPU | Apple G13C 1,296 MHz | |
24코어 384 EU, 3,072 ALU(7.83 TFLOPs) |
32코어 512 EU, 4,096 ALU(10.44 TFLOPs) |
|
NPU |
16코어
Apple 4세대 Neural Engine 11 TOPS(FP16) |
|
내장 엔진 |
하드웨어 가속형
H.264 /
HEVC /
ProRes / ProRes RAW 동영상 디코딩 엔진, 동영상 인코딩 엔진 2개, ProRes 인코딩 및 디코딩 엔진 2개, 디스플레이 엔진 |
|
메모리 |
128-bit 4 채널(512-bit) LPDDR5 3,200 MHz 통합 메모리 전송 속도: 6,400 MT/s, 대역폭: 409.6 GB/s |
|
32 GB | 64 GB | |
명령어 집합 | ARMv8.5-A | |
생산 공정 |
TSMC N5 다이 사이즈: 432 mm² / 트랜지스터 개수: 57B |
|
탑재 기기 | MacBook Pro 14(2021년), MacBook Pro 16(2021년), Mac Studio(2022년) |
M1 APL1102의 강화형 칩으로 2021년 10월 Apple 이벤트에서 공개되었다. 코드네임은 Jade 1C이다.
CPU는 ARM big.LITTLE 기술을 채용하고, M1과 동일한 아키텍처의 8코어 Apple Firestorm을 빅 클러스터로, 2코어 Apple Icestorm을 리틀 클러스터로 하여 총 10코어 CPU의 구성을 이룬다. Apple M1 APL1102 대비 싱글코어 성능은 동일하지만[5], 멀티코어 성능은 약 67% 향상되었다.
GPU는 Apple G13C를 32코어 구성으로 탑재했다. 염가판으로 24코어 구성도 존재한다.
NPU는 4세대 Neural Engine을 16코어 구성으로 탑재했다. 전작인 M1과 동일한 성능을 가진다.
RAM은 전작과 동일한 개념의 통합 메모리로 구성되어 있으며, LPDDR5 규격으로 32 GB와 64 GB를 제공한다. 메모리 대역폭은 409.6 GB/s이다. 해당 대역폭은 모바일 RTX 3080의 VRAM 대역폭인 448 GB/s과 비슷하다.
이외에도 ProRes 코덱의 하드웨어 인코더/디코더, 외부 화면 연결과 ProMotion을 위한 디스플레이 엔진을 탑재했고, PCle 4.0, HDMI 2.0, Thunderbolt 4 등의 I/O 규격을 지원한다.
TSMC의 N5 공정으로 생산되었으며, 다이 사이즈는 432 mm²이다. 트랜지스터 개수는 570억 개이다.
CPU 성능은 벤치 테스트 중 하나인 Geekbench 5 기준 싱글코어 1,745점, 멀티코어 12,422점으로 Intel의 2년 전 일반 데스크탑 최상급 모델인 Intel Core i9-11900K[6]과 비교 시, M1 Max가 싱글코어에서는 약 5% 낮지만 멀티코어에서는 약 10% 더 높다. 다만 벤치마크에 따라 최대 20% 정도 차이가 있다. ARM 칩으로서 1년 만에 이뤄진 발전이란 것을 고려하면 괄목할 수준.
또 다른 테스트로 i9 12900HK + RTX 3080Ti를 탑재한 MSI의 Raider GE76과 M1 Max를 탑재한 MacBook Pro 16(2021년)을 비교한 결과, Cinebench R23 기준 M1 Max는 30 W로 12,322점, GE76은 120 W로 18,282점이 나왔다. 역시나 절대 성능은 떨어지지만 인상적인 수준의 전성비를 보인다. GFXbench 기준으로도 노트북용 RTX 3080급 성능을 보여주고 있다. #
VRAM의 경우, 64 GB 통합 메모리 기준 최대 48 GB까지 할당해서 사용할 수 있다.
최대 5대의 디스플레이를 지원한다.
2022년에 Intel Core i9-12900HK가 공개되었고 Intel이 M1 Max를 대상으로 비교한 결과를 공개하였다. 이 테스트에 의하면 12900HK의 절대 성능은 M1 Max를 능가한다. 하지만 전력 소모량의 차이가 있어 전성비는 M1 Max 쪽이 우위를 가지고 있다. # #. 12900HK는 싱글코어, 멀티코어 성능 모두 M1 Max보다 빠르지만 전성비는 M1 Max가 높은 편이며, 12900HK는 더 높은 전력 소모량인 것을 고려하면 싱글코어 외에는 유의미하게 큰 차이가 있다고 보기 힘들다. # #
2.1.3. M1 Ultra
<rowcolor=white> 패키지 샷 | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-2> APL1W06-T6002 ||
CPU |
16코어
Apple Firestorm 0.6 ~ 3.23 GHz + 4코어
Apple Icestorm 0.6 ~ 2.06 GHz Firestorm: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / 48 MB L2 공유 캐시 Icestorm: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / 8 MB L2 공유 캐시 96 MB 시스템 캐시 |
|
GPU | Apple G13C 1,296 MHz | |
48코어 768 EU, 6,144 ALU(15.7 TFLOPs) |
64코어 1,024 EU, 8,192 ALU(21.2 TFLOPs) |
|
NPU |
32코어
Apple 4세대 Neural Engine 22 TOPS(FP16) |
|
내장 엔진 |
하드웨어 가속형
H.264 /
HEVC /
ProRes / ProRes RAW 동영상 디코딩 엔진 2개, 동영상 인코딩 엔진 4개, ProRes 인코딩 및 디코딩 엔진 4개, 디스플레이 엔진 |
|
메모리 |
128-bit 8 채널(1,024-bit) LPDDR5 3,200 MHz 통합 메모리 전송 속도: 6,400 MT/s, 대역폭: 819.2 GB/s |
|
64 GB | 128 GB | |
명령어 집합 | ARMv8.5-A | |
생산 공정 |
TSMC N5 다이 사이즈: 864 mm² / 트랜지스터 개수: 114B |
|
탑재 기기 | Mac Studio(2022년) |
M1 Max APL1105의 확장형 칩으로 2022년 3월 Apple 이벤트에서 공개되었다. 코드네임은 Jade 2C이다. 동시에 공개된 Mac Studio(2022년)에 처음 탑재되었다.
M1 Max 다이 두 개를 UltraFusion 아키텍처로 연결해 하나의 칩으로 구성했고[7], 따라서 전작인 M1 Pro, M1 Max와 CPU, GPU, NPU 아키텍처는 모두 동일하다. 소프트웨어도 이를 칩 한 개로 인식하는데, 덕분에 기존의 멀티 프로세서 구조와는 다르게 앱의 코드를 다시 짜지 않아도 된다. 연결 버스의 대역폭은 2.5 TB/s이며, Apple의 발표에 따르면 현존하는 어떤 기술보다 연결 밀도가 두 배 높으면서도 극히 적은 전력을 사용한다.
CPU는 ARM big.LITTLE 기술을 채용하고, M1과 동일한 아키텍처의 16코어 Apple Firestorm을 빅 클러스터로, 4코어 Apple Icestorm을 리틀 클러스터로 하여 총 20코어 CPU의 구성을 이루며, 염가 버전은 없다. Apple의 발표에 따르면 Intel Core i9-12900K와 비교했을 때 M1 Ultra의 CPU는 100 W 더 적은 전력량으로 i9의 최대 성능을 내고, 같은 전력 엔벨로프에서 90% 더 높은 성능을 낸다.
GPU는 Apple G13C를 64코어 구성으로 탑재했다. 단, Mac Studio 기본형은 염가판으로 48코어 구성이 탑재된다. Apple의 발표에 따르면 NVIDIA GeForce RTX 3090과 비교했을 때, M1 Ultra의 GPU는 RTX 3090보다 더 높은 성능을 내면서도 전력은 200 W 더 적게 소모한다고 주장한다.
NPU 또한 전작과 동일한 Apple 4세대 Neural Engine이 탑재되었으나, 코어 개수가 두 배 증가한 32코어 구성으로 탑재되었다. 덕분에 성능도 22 TOPS로 두 배 상승하였다.
RAM은 819.2 GB/s 대역폭의 LPDDR5 규격으로, 64 GB와 128 GB 옵션을 제공한다. VRAM의 경우 128GB 통합 메모리 구성 기준 최대 96GB까지 할당한다.
이외에도 ProRes 코덱의 하드웨어 인코더/디코더 등 기타 가속 엔진이 들어갔으며, 전작과 동일하게 Thunderbolt 4 등의 다양한 I/O를 지원한다.
최대 5대의 디스플레이를 지원한다.
TSMC의 N5 공정으로 생산되었으며, 864 mm²라는 거대한 다이 사이즈를 자랑한다. 패키징 공정은 TSMC의 CoWoS-S를 사용한 것으로 추정된다. 트랜지스터 개수는 1,140억 개.
|
Mac Studio 로직 보드에서의 모습 |
|
AMD RYZEN 9 5900X의 히트스프레더를 제거한 모습 |
Apple의 발표에 따르면 Mac Studio(2022년)에 탑재된 M1 Ultra의 CPU 성능은 28코어 Xeon Mac Pro보다 60% 더 빠르며, GPU는 Mac Pro의 최고 사양인 Radeon Pro W6900X보다 80% 더 빠르다고 한다.
벤치마크 결과는 Geekbench 5 기준 싱글 코어는 1,793점, 멀티 코어는 24,055점으로 확인되었다. 싱글 코어 점수는 인텔 코어 i5-12600K보다는 소폭 떨어지고 i9-11900K와 비슷한 성능을 보여주고, 멀티 코어 점수는 16코어인 Intel i9-12900K보다 더 높으며, 32코어 64스레드인 AMD RYZEN Threadripper 3970X[8]에 근접한다. 다만, Cinebench R23 기준에서는 i9-12900K에 소폭 밀리는 결과를 보여준다.
Apple에서 직접 그래프를 통해 RTX 3090과 비교하며 성능을 어필한 것과는 달리 GPU 성능은 Geekbench 5 OpenCL 기준 RTX 3090의 절반도 못 미친다는 결과가 나왔다. 다만 GFX 벤치마크상에서는 RTX 3090에 근접하는 결과를 보여주고 있다.
Tech Notice에서 Blender 3.1 벤치마크를 돌린 결과, M1 Ultra는 RTX 3090은 고사하고 RTX 3050과도 매우 큰 차이가 나는 결과가 나왔다.
9to5mac에서는 Apple이 RTX 3090과 비교하며 제시한 그래프는 오해의 소지가 있으며, RTX 3090이 최대 성능에 가까워지기 전에 그래프를 잘라 잘못된 비교를 했다고 지적하였다. RTX 3090의 소비 전력을 약 320W로 줄여 잠재력을 심각하게 제한했다는 것이다. The Verge에서도 이에 대해 전기자동차가 람보르기니와 같은 속도에서 더 적은 연료를 소모한다는 사실만 보고(람보르기니는 그보다 훨씬 더 빨리 달릴 수 있다는 사실은 빼고) 더 나은 엔진을 가졌다고 주장하는 것과 같다고 비유하였다. 보다 하위 라인업의 NVIDIA GPU와 비교했으면 전성비 우위를 확실하게 보여주면서도 논란의 여지를 없앨 수 있었을 것이다.
이벤트에서 '마지막 칩'[9]이라고 언급한 것과, 공식 홈페이지에서 'M1 제품군의 최종 멤버'라 쓰인 것으로 보아 M1 시리즈의 마지막 칩이 될 것으로 예상되었고 M2가 나옴에 따라 사실이 되었다. 또한 Mac Pro가 Apple Silicon으로 이주할 것을 마지막에 암시했는데, M2 시리즈 중 하나를 탑재할 가능성이 높았고 실제로 M2 Ultra가 탑재되었다.
2.2. M2
<rowcolor=white> 패키지 샷 | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-4> APL1109-T8112 ||
CPU |
4코어
Apple Avalanche 3.49 GHz + 4코어
Apple Blizzard 2.42 GHz Avalanche: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / 16 MB L2 공유 캐시 Blizzard: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / 4 MB L2 공유 캐시 8 MB 시스템 캐시 |
|||
GPU | Apple G14G 1,398 MHz | |||
8코어 32 EU, 2,048 ALU, 2.88 TFLOPs |
9코어 36 EU, 2,304 ALU, 3.24 TFLOPs |
10코어 40 EU, 2,560 ALU, 3.6 TFLOPs |
||
NPU |
16코어
Apple 5세대 Neural Engine 15.8 TOPS(FP16) |
|||
내장 엔진 |
하드웨어 가속형
H.264 /
HEVC /
ProRes / ProRes RAW 동영상 디코딩 엔진, 동영상 인코딩 엔진, ProRes 인코딩 및 디코딩 엔진 |
|||
메모리 |
64-bit 2 채널(128-bit) LPDDR5 3,200 MHz 통합 메모리 전송 속도: 6,400 MT/s, 대역폭: 102.4 GB/s |
|||
8 GB | 16 GB | 24 GB | ||
명령어 집합 | ARMv8.6-A | |||
생산 공정 |
TSMC N5P 다이 사이즈: 141.7 mm² / 트랜지스터 개수: 20B |
|||
탑재 기기 | MacBook Air(M2, 2022년), MacBook Air 15(M2, 2023년), MacBook Pro 13(M2, 2022년), iPad Pro 11(4세대), iPad Pro 12.9(6세대), Mac mini(2023년), Apple Vision Pro, iPad Air 11(M2 모델), iPad Air 13(M2 모델) |
M1 APL1102의 후속작으로 WWDC22에서 공개되었다. 코드네임은 Staten이다. 처음 탑재된 제품은 동시에 공개된 MacBook Air, MacBook Pro이다.
CPU는 ARM big.LITTLE 기술을 채용하고, A15 Bionic에서 채용된 4코어 Apple Avalanche를 빅 클러스터로, 4코어 Apple Blizzard을 리틀 클러스터로 하여 총 8코어 CPU의 구성을 이룬다. Apple은 싱글코어 성능 향상폭을 공개하지 않았으나, 멀티코어 성능은 전작인 M1 대비 약 18% 향상되었다고 한다. Geekbench 5 기준 싱글코어는 10%, 멀티코어는 19% 향상된 것이 확인되었다.
발표 당시 갤럭시 북2 360에 탑재된 15 W급 Intel Core i7-1255U 프로세서와 MSI 프레스티지 14 에보에 탑재된 28 W급 i7-1260P 프로세서를 비교하였는데, M2의 CPU 멀티코어 성능은 i7-1255U보다 최대 20% 높고 같은 전력 소모량에서는 1.9배 더 높은 성능을 낸다. i7-1260P와 비교했을 때는 M2의 CPU 성능이 약 17% 낮지만 M2의 최고 성능 기준으로 같은 성능을 내는데 1/4의 전력을 사용한다.
GPU는 Apple G14G를 10코어 구성으로 탑재했다. 단, MacBook Air 기본형은 8코어 구성부터 시작한다. Apple의 발표에 따르면 10코어 GPU 기준으로 전작인 M1 대비 성능이 35% 향상되었으며, 96개의 EU를 탑재한 i7-1255U의 Iris Xe 그래픽과 비교해서 최대 성능 기준 2배 높은 성능을 보여주고, 1/5의 전력을 사용한다. GFX 벤치마크 기준 M1 대비 42% ~ 45% 향상되었다. 2024년에 출시된 iPad Air 11(M2 모델)과 iPad Air 13(M2 모델)에는 9코어 구성이 탑재되었다.
NPU는 A15 Bionic의 Apple 5세대 Neural Engine을 동일하게 16코어 구성으로 탑재했다. 성능은 15.8 TOPS로 전작인 M1 대비 43.6% 향상되었다.
RAM은 102.4 GB/s 대역폭의 LPDDR5 규격으로, 8 GB와 16 GB, 그리고 24 GB 옵션을 제공한다.
이외에 ISP와 ProRes 인코딩/디코딩 엔진을 포함한 미디어 엔진 등의 부가 요소를 탑재했으며, PCIe 4.0, Thunderbolt 3 등의 I/O 규격을 지원한다.
생산 공정은 TSMC의 N5P 공정이다. 트랜지스터 개수는 전작인 M1의 160억 개에서 200억 개로 증가하였다.
탑재된 제품들 기준으로 발열 문제가 보고되고 있다. 쿨링 팬이 탑재된 13형 MacBook Pro 기준, 최고 CPU 코어 온도가 108도를 찍는 상황이 나오고 있다. # 특히 MacBook Pro의 타겟층은 주로 전문 프로그램을 자주 돌리는 사용자인지라 여러모로 논란이 되는 상황. 한편 M2 MacBook Air 기준 저전력 모드를 켜면 발열이 대폭 감소하는데, 앞서 서술한 리틀 코어의 효율 향상으로 인한 것으로 추정된다. 발열 감소량이 상당히 체감되므로 본인이 가벼운 작업을 위주로 한다면 켜두는 것을 추천한다. 또한 M2 MacBook Pro는 i7-1260P가 탑재된 XPS 13 Plus보다 4배나 긴 사용 시간을 기록하는 등 여전히 전성비 측면에서 타사 대비 우위를 가지고 있기 때문에, 흔히 말하는 일상적인 사용 환경에서 테스트 영상과 같이 극단적인 발열을 경험할 정도는 아니다. 현재는 전문 사용자 대상으로만 문제가 되는 상황.
2.2.1. M2 Pro
<rowcolor=white> 다이 샷 | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-2> APL1113-T6020 ||
CPU |
Apple Avalanche 3.504 GHz +
Apple Blizzard 2.42 GHz Avalanche: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / 32 MB L2 공유 캐시 Blizzard: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / 4 MB L2 공유 캐시 24 MB 시스템 캐시 |
|
6코어 + 4코어 | 8코어 + 4코어 | |
GPU | Apple G14S 1,398 MHz | |
16코어 64 EU, 2,048 ALU, 5.76 TFLOPs |
19코어 76 EU, 2,432 ALU, 6.8 TFLOPs |
|
NPU |
16코어
Apple 5세대 Neural Engine 15.8 TOPS(FP16) |
|
내장 엔진 |
하드웨어 가속형
H.264 /
HEVC /
ProRes / ProRes RAW 동영상 디코딩 엔진, 동영상 인코딩 엔진, ProRes 인코딩 및 디코딩 엔진, 디스플레이 엔진 |
|
메모리 |
64-bit 4 채널(256-bit) LPDDR5 3,200 MHz 통합 메모리 전송 속도: 6,400 MT/s, 대역폭: 204.8 GB/s |
|
16 GB | 32 GB | |
명령어 집합 | ARMv8.6-A | |
생산 공정 |
TSMC N5P 다이 사이즈: 289 mm² / 트랜지스터 개수: 40B |
|
탑재 기기 | MacBook Pro 14(2023년), MacBook Pro 16(2023년), Mac mini(2023년) |
M2 APL1109의 강화형 칩으로 2023년 출시한 Mac mini와 함께 공개되었다. 코드네임은 Rhodes Chop이다.
CPU는 ARM big.LITTLE 기술을 채용하고, M2와 동일한 Apple Avalanche를 8코어로, Apple Blizzard를 4코어로 구성하여 총 12코어 CPU의 구성을 이룬다. 컷칩 버전으로는 빅 코어가 2개 죽은 10코어 구성이 있다.
GPU는 Apple G14S를 19코어 구성으로 탑재했다. 컷칩 버전으로는 16코어 구성이 있다.
NPU는 M2와 동일하게 Apple 5세대 Neural Engine을 16코어 구성으로 탑재했다. 성능은 15.8 TOPS로 전작인 M1 Pro 대비 43.6% 향상되었다.
RAM은 204.8 GB/s 대역폭의 LPDDR5 규격으로, 16 GB와 32 GB 옵션을 제공한다.
전작인 M1 Pro가 M1 Max와 동일한 128비트 규격 메모리를 2채널 구성으로 탑재한 것과 달리, 64비트 4채널 메모리 구성으로 바뀌었다. 공개된 칩의 사진을 보면 양 옆의 메모리 크기가 더 작아진 것을 확인할 수 있다. 이에 관해서 SemiAnalysis의 Dylan Patel은, 아지노모토의 반도체 절연체 필름( ABF) 보드 공급 부족 문제로, Apple에서 배선 복잡도를 줄여 보드 레이어를 축소시키기 위해 더 작은 64비트 모듈로 변경한 것이라는 분석을 내놓았다. 모듈 각각의 체급은 작아졌지만 그에 따른 보상으로 두 개가 더 탑재되었기 때문에, 메모리 속도나 성능 자체는 전작과 동일하다.
이외에 ISP와 ProRes 인코딩/디코딩 엔진을 포함한 미디어 엔진, 디스플레이 엔진 등의 부가 요소를 탑재했으며, PCIe 4.0, Thunderbolt 4 등의 I/O 규격을 지원한다.
생산 공정은 TSMC의 N5P 공정이다. 트랜지스터 개수는 전작인 M1 Pro의 337억 개에서 400억 개로 증가하였다.
최대 3대의 디스플레이를 지원한다.
2024년부터 M2 Ultra와 함께 Apple Intelligence의 Private Cloud Compute 서버를 구동하고 있다.
2.2.2. M2 Max
<rowcolor=white> 다이 샷 | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-4> APL1111-T6021 ||
CPU |
8코어
Apple Avalanche 3.667 GHz + 4코어
Apple Blizzard 2.42 GHz Avalanche: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / 32 MB L2 공유 캐시 Blizzard: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / 4 MB L2 공유 캐시 48 MB 시스템 캐시 |
|||
GPU | Apple G14C 1,398 MHz | |||
30코어 120 EU, 3,840 ALU, 10.8 TFLOPs |
38코어 152 EU, 4,864 ALU, 13.6 TFLOPs |
|||
NPU |
16코어
Apple 5세대 Neural Engine 15.8 TOPS(FP16) |
|||
내장 엔진 |
하드웨어 가속형
H.264 /
HEVC /
ProRes / ProRes RAW 동영상 디코딩 엔진, 동영상 인코딩 엔진 2개, ProRes 인코딩 및 디코딩 엔진 2개, 디스플레이 엔진 |
|||
메모리 |
128-bit 4 채널(512-bit) LPDDR5 3,200 MHz 통합 메모리 전송 속도: 6,400 MT/s, 대역폭: 409.6 GB/s |
|||
32 GB | 64 GB | 96 GB | ||
명령어 집합 | ARMv8.6-A | |||
생산 공정 |
TSMC N5P 다이 사이즈: 398 mm² / 트랜지스터 개수: 67B |
|||
탑재 기기 | MacBook Pro 14(2023년), MacBook Pro 16(2023년), Mac Studio(2023년) |
M2 APL1109의 강화형 칩으로 2023년 출시한 14형 / 16형 MacBook Pro와 함께 공개되었다. 코드네임은 Rhodes 1C이다.
CPU는 ARM big.LITTLE 기술을 채용하고, M2와 동일한 Apple Avalanche를 8코어로, Apple Blizzard를 4코어로 구성하여 총 12코어 CPU의 구성을 이룬다.
고성능 모드는 2021년형과 마찬가지로 16형 MacBook Pro에서만 사용 가능하다. 16형 모델 기준 M1 Max와 비교해 그래픽, CPU 양쪽에서 20%의 벤치마크 성능 향상이 있으나 최대 전력 소비량 또한 소폭 올랐다. 실성능은 하드웨어 가속과 연계되기 때문에 앱마다 성능 격차는 들쭉날쭉하며, 리틀 코어의 전성비가 좋아진 덕에 가벼운 작업 시 M1 Max 대비 배터리 사용 시간이 소폭 늘어났다.
GPU는 Apple G14C를 38코어 구성으로 탑재했다. 컷칩 버전으로는 30코어 구성이 있다.
NPU는 M2와 동일하게 Apple 5세대 Neural Engine을 16코어 구성으로 탑재했다. 성능은 15.8 TOPS로 전작인 M1 Max 대비 43.6% 향상되었다.
RAM은 전작과 동일한 409.6 GB/s 대역폭의 LPDDR5 규격을 사용한다. 128비트 모듈을 4채널 구성으로 탑재하였으며, 64 GB와 96 GB 옵션을 제공한다. 단, 96 GB 옵션은 38코어 GPU 구성을 선택해야만 사용할 수 있다.
이외에 ISP와 ProRes 인코딩/디코딩 엔진을 포함한 미디어 엔진, 디스플레이 엔진 등의 부가 요소를 탑재했으며, PCIe 4.0, Thunderbolt 4 등의 I/O 규격을 지원한다.
생산 공정은 TSMC의 N5P 공정이다. 트랜지스터 개수는 전작인 M1 Max의 570억 개에서 670억 개로 증가하였다.
최대 5대의 디스플레이를 지원한다.
2.2.3. M2 Ultra
<rowcolor=white> 다이 샷 | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-4> APL1W12-T6022 ||
CPU |
16코어
Apple Avalanche 3.667 GHz + 8코어
Apple Blizzard 2.42 GHz Avalanche: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / 64 MB L2 공유 캐시 Blizzard: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / 8 MB L2 공유 캐시 96 MB 시스템 캐시 |
|||
GPU | Apple G14C 1,398 MHz | |||
60코어 240 EU, 7,680 ALU, 21.473 TFLOPs |
76코어 304 EU, 9,728 ALU, 27.199 TFLOPs |
|||
NPU |
32코어
Apple 5세대 Neural Engine 31.6 TOPS(FP16) |
|||
내장 엔진 |
하드웨어 가속형
H.264 /
HEVC /
ProRes / ProRes RAW 동영상 디코딩 엔진 2개, 동영상 인코딩 엔진 4개, ProRes 인코딩 및 디코딩 엔진 4개, 디스플레이 엔진 |
|||
메모리 |
128-bit 8 채널(1,024-bit) LPDDR5 3,200 MHz 통합 메모리 전송 속도: 6,400 MT/s, 대역폭: 819.2 GB/s |
|||
64 GB | 128 GB | 192 GB | ||
명령어 집합 | ARMv8.6-A | |||
생산 공정 |
TSMC N5P 다이 사이즈: 796 mm² / 트랜지스터 개수: 134B |
|||
탑재 기기 | Mac Studio(2023년), Mac Pro(2023년) |
M2 Max APL1111의 확장형 칩으로 WWDC23에서 공개되었다. 코드네임은 Rhodes 2C이다.
CPU는 ARM big.LITTLE 기술을 채용하고, M2 Max 다이 두 개를 이어붙여 총 24코어 구성을 이루었다. 체급과 전성비를 고려했을 때 Intel Core i9-13900K 정도에 준하는 성능을 낸다.
GPU는 M2 Max와 동일한 G14C를 76코어 구성으로 탑재했다. 컷칩 버전으로는 60코어 구성이 있다. Metal 벤치마크 기준, 2019년형 Mac Pro의 최고급 그래픽 카드 옵션이었던 AMD Radeon Pro W6900X 대비 살짝 높은 점수를 얻었다.
NPU는 M2 Max와 동일한 Apple 5세대 Neural Engine을 32코어 구성으로 탑재했다. 성능은 31.6 TOPS로 M2 Max의 두 배이다.
RAM은 전작과 동일한 819.2 GB/s 대역폭의 LPDDR5 규격을 사용한다. 128비트 모듈을 8채널 구성으로 탑재하였으며 64 GB, 128 GB, 그리고 192 GB 옵션을 제공한다.
이외에 ISP와 ProRes 인코딩/디코딩 엔진을 포함한 미디어 엔진, 디스플레이 엔진 등의 부가 요소를 탑재했으며, PCIe 4.0, Thunderbolt 4 등의 I/O 규격을 지원한다.
생산 공정은 TSMC의 N5P 공정이다. 트랜지스터 개수는 전작인 M1 Ultra의 1,140억 개에서 1,340억 개로 증가하였다.
최대 8대의 디스플레이를 지원한다.
2024년부터 M2 Pro와 함께 Apple Intelligence의 Private Cloud Compute 서버를 구동하고 있다.
2.3. M3
<rowcolor=white> 다이 샷 | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-4> APL1201-T8122 ||
CPU |
4코어
Apple Everest 3.60(4.05[부스트]) GHz + 4코어
Apple Sawtooth 2.48(2.57[부스트]) GHz Everest: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / 16 MB L2 공유 캐시 Sawtooth: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / 4 MB L2 공유 캐시 8 MB 시스템 캐시 |
|||
GPU | Apple G16G 1,380 MHz | |||
8코어 128 EU, 1,024 ALU, ? TFLOPs |
10코어 160 EU, 1,280 ALU, ? TFLOPs |
|||
NPU |
16코어
Apple 6세대 Neural Engine 18 TOPS(FP16) |
|||
내장 엔진 |
하드웨어 가속형
H.264 /
HEVC /
ProRes / ProRes RAW 동영상 디코딩 엔진, 동영상 인코딩 엔진, ProRes 인코딩 및 디코딩 엔진, AV1 디코더, 디스플레이 엔진 2개 |
|||
메모리 |
64-Bit 2 채널(128-Bit) LPDDR5 3,200 MHz 통합 메모리 전송 속도: 6,400 MT/s, 대역폭: 102.4 GB/s |
|||
8 GB | 16 GB | 24 GB | ||
명령어 집합 | ARMv8.6-A | |||
생산 공정 |
TSMC N3B 다이 사이즈: 146 mm² / 트랜지스터 개수: 25B |
|||
탑재 기기 | iMac 24(2023년, 포트 2개), iMac 24(2023년, 포트 4개), MacBook Pro 14(2023년 11월), MacBook Air 13(M3, 2024년), MacBook Air 15(M3, 2024년) |
M2 APL1109의 후속작으로 2023년 10월 Apple 이벤트에서 공개되었다. 코드네임은 Ibiza이다.
CPU는 ARM big.LITTLE 기술을 채용하고, A17 Pro에서 사용된 2세대 Apple Everest 4코어와 2세대 Apple Sawtooth 4코어를 합쳐 총 8코어 구성을 이룬다. Apple의 발표에 따르면 M2 대비 성능 코어는 15%, 효율 코어는 30% 더 빠르다. 또한, MSI 프레스티지 A13M-050US에 탑재된 Intel Core i7-1360P와 비교했을 때 같은 성능에서 4분의 1의 전력을 사용한다.
성능 코어인 2세대 Apple Everest는 9-Wide 디코더로 더 넓어져 전작의 8-Wide 규모를 뛰어넘었다. Apple이 세운 가장 넓은 아키텍처의 기록을 Apple이 다시 갈아치운 것이다. 효율 코어인 2세대 Apple Sawtooth도 5-Wide 디코더로 확장되었다.[12]
GPU는 Apple G16G를 10코어 구성으로 탑재했다. 함께 공개된 MacBook Pro 14형은 10코어 풀칩이 탑재되며, 기본형 iMac에는 8코어 버전 컷칩이 탑재된다. 하드웨어 메시 셰이딩과 레이 트레이싱 가속 지원이 추가되었으며, Dynamic Caching을 새로 지원한다. 이를 통해 하드웨어가 메모리에 각 작업당 정확히 필요한 용량만을 능동적으로 할당하며, 낭비를 줄여 메모리를 더 효율적으로 활용할 수 있게 돕는다. 개발자 또한 이 기술을 자유롭게 활용할 수 있다. Apple의 발표에 따르면 M2 계열 칩보다 렌더링 성능이 1.8배 향상되었다. 또한, MSI 프레스티지 A13M-050US에 탑재된 Intel Core i7-1360P와 비교했을 때 같은 성능에서 5분의 1의 전력을 사용한다. 피크 성능은 M1 대비 최대 65% 빨라졌다.
NPU는 6세대 Neural Engine을 16코어 구성으로 탑재했다. 18 TOPS의 성능을 낸다.
RAM은 전작과 동일한 102.4 GB/s 대역폭의 LPDDR5 규격으로, 8 GB와 16 GB 그리고 24 GB 옵션을 제공한다. SK하이닉스에서 제조한 DRAM을 사용한다.[13]
이외에도 ISP와 ProRes 인코딩/디코딩 엔진을 포함한 미디어 엔진 등의 부가 요소를 탑재했다. 미디어 엔진에는 AV1 디코더가 추가되었다. 더하여 PCIe 4.0, Thunderbolt 3 등의 I/O 규격을 지원한다.
최대 2대의 디스플레이를 지원한다.
TSMC의 N3B 공정으로 생산되었으며, 다이 사이즈는 146 mm²이다. 트랜지스터 개수는 250억 개이다. 이는 전작 대비 50억 개 증가한 수치이다.
Geekbench 6 벤치마크 결과가 공개되었다. 싱글코어 점수는 3,095점, 멀티코어 점수는 11,724점이다. 전작 M2의 싱글코어 점수는 약 2,600점, 멀티코어 점수는 약 9,700점인 것을 고려하면 Apple의 주장대로 약 20% 향상되었다.
2.3.1. M3 Pro
<rowcolor=white> 다이 샷 | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-2> APL1203-T6030 ||
CPU |
Apple Everest 3.60(4.05[부스트]) GHz +
Apple Sawtooth 2.48(2.57[부스트]) GHz Everest: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / 16 MB L2 공유 캐시 Sawtooth: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / 4 MB L2 공유 캐시 12 MB 시스템 캐시 |
|
<rowcolor=#333> 5코어 + 6코어 | 6코어 + 6코어 | |
GPU | Apple G16S 1,380 MHz | |
<rowcolor=#333> 14코어 224 EU, 2,048 ALU, ? TFLOPs |
18코어 288 EU, 2,304 ALU, ? TFLOPs |
|
NPU |
16코어
Apple 6세대 Neural Engine 18 TOPS(FP16) |
|
내장 엔진 |
하드웨어 가속형
H.264 /
HEVC /
ProRes / ProRes RAW 동영상 디코딩 엔진, 동영상 인코딩 엔진, ProRes 인코딩 및 디코딩 엔진, AV1 디코더, 디스플레이 엔진 2개 |
|
메모리 |
64-Bit 3 채널(192-Bit) LPDDR5 3,200 MHz 통합 메모리 전송 속도: 6,400 MT/s, 대역폭: 153.6 GB/s |
|
18 GB | 36 GB | |
명령어 집합 | ARMv8.6-A | |
생산 공정 |
TSMC N3B 다이 사이즈: 207 mm² / 트랜지스터 개수: 37B |
|
탑재 기기 | MacBook Pro 14(2023년 11월), MacBook Pro 16(2023년 11월) |
M3 APL1201의 강화형 칩으로 2023년 10월 Apple 이벤트에서 공개되었다. 코드네임은 Lobos[16]이다.
CPU는 ARM big.LITTLE 기술을 채용하고, M3와 동일한 2세대 Apple Everest 6코어와 2세대 Apple Sawtooth 6코어를 합쳐 총 12코어 구성을 이룬다. 컷칩 버전은 성능 코어 5개, 효율 코어 6개로 총 11코어 구성을 이루는데, 전작 대비 성능 코어는 줄고 효율 코어가 늘어난 구성이다. Apple의 발표에 따르면, 12코어 기준 M1 Pro 대비 최대 20% 빨라졌다.
GPU는 Apple G16S를 18코어 구성으로 탑재했다. 컷칩 버전에는 14코어 구성으로 탑재된다. 이는 전작의 16 / 19코어 구성 대비 줄어든 것이다. 하드웨어 메시 셰이딩과 레이 트레이싱 가속 지원이 추가되었으며, Dynamic Caching을 새로 지원한다. 이를 통해 하드웨어가 메모리에 각 작업당 정확히 필요한 용량만을 능동적으로 할당하며, 낭비를 줄여 메모리를 더 효율적으로 활용할 수 있게 돕는다. 개발자 또한 이 기술을 자유롭게 활용할 수 있다. Apple의 발표에 따르면, 18코어 기준 M2 Pro 대비 최대 10% 더 빠르다.
NPU는 6세대 Neural Engine을 16코어 구성으로 탑재했다. 18 TOPS의 성능을 낸다.
RAM은 153.6 GB/s 대역폭의 LPDDR5 규격이다. 공개된 칩의 사진을 보면 64비트 메모리 모듈이 3개 존재하는데, 전작의 4개에서 모듈 하나가 빠졌다. 이 영향으로 전작 대비 대역폭이 25% 감소하였다. 대신 용량 자체는 증가하여 18 GB와 36 GB 옵션을 제공한다.
이외에도 ISP와 ProRes 인코딩/디코딩 엔진을 포함한 미디어 엔진, 디스플레이 엔진 등의 부가 요소를 탑재했다. 미디어 엔진에는 AV1 디코더가 추가되었다. 더하여 PCIe 4.0, Thunderbolt 4 등의 I/O 규격을 지원한다.
최대 3대의 디스플레이를 지원한다.
TSMC의 N3B 공정으로 생산되었으며, 다이 사이즈는 207 mm²이다. 트랜지스터 개수는 370억 개로, 전작인 M2 Pro 대비 오히려 30억 개 감소하였다.
다른 M3 시리즈 칩들이 모두 상당한 체급 향상을 받은 것과 반대로 유일하게 칼질을 당해 코어 구성, 메모리 모듈의 체급, 트랜지스터 개수 등을 고려했을 때 M1, M2 계열보다 Max와의 간극이 더욱 커졌다.
벤치마크 결과가 공개되었다. Geekbench 6 기준 싱글코어 점수는 3,083점이며 멀티코어 점수는 14,982점이다. 전작 M2 Pro 대비 각각 16%, 22% 정도 빨라졌다. Cinebench R23 기준으로는 싱글코어 점수가 1,878점, 멀티코어 점수가 17,534점으로 전작 대비 각각 12%, 16% 더 빨라졌다. M2 Max와 비교한 결과, Geekbench 6 기준 싱글코어 점수는 M2 Max의 2,775점 대비 11% 더 높으며, 멀티코어 점수는 M2 Max의 14,862점 대비 동일한 수준 내지 1% 더 높다. Cinebench R23 기준으로는 싱글코어가 M2 Max의 1,640점 대비 15% 정도 향상되었으며, 멀티코어가 M2 Max의 14,843점 대비 18% 정도 향상되었다.
|
2.3.2. M3 Max
<rowcolor=white> 다이 샷 | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-5> APL1204-T6031/T6034 ||
CPU |
Apple Everest 3.60(4.05[부스트]) GHz +
Apple Sawtooth 2.48(2.57[부스트]) GHz Everest: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / 32 MB L2 공유 캐시 Sawtooth: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / 4 MB L2 공유 캐시 48 MB 시스템 캐시 |
||||
<rowcolor=#333> 10코어 + 4코어 | 12코어 + 4코어 | ||||
GPU | Apple G16C 1,380 MHz | ||||
<rowcolor=#333> 30코어 480 EU, 3,840 ALU, ? TFLOPs |
40코어 640 EU, 5,120 ALU, ? TFLOPs |
||||
NPU |
16코어
Apple 6세대 Neural Engine 18 TOPS(FP16) |
||||
내장 엔진 |
하드웨어 가속형
H.264 /
HEVC /
ProRes / ProRes RAW 동영상 디코딩 엔진, 동영상 인코딩 엔진 2개, ProRes 인코딩 및 디코딩 엔진 2개, AV1 디코더, 디스플레이 엔진 4개 |
||||
메모리 |
<rowcolor=#333> 128-Bit 3 채널(384-Bit) LPDDR5 3,200 MHz 통합 메모리 전송 속도: 6,400 MT/s, 대역폭: 307.2 GB/s |
128-Bit 4 채널(512-Bit) LPDDR5 3,200 MHz 통합 메모리 전송 속도: 6,400 MT/s, 대역폭: 409.6 GB/s |
|||
<rowcolor=#333> 36 GB | 96 GB | 48 GB | 64 GB | 128 GB | |
명령어 집합 | ARMv8.6-A | ||||
생산 공정 |
TSMC N3B 다이 사이즈: 467 mm² / 트랜지스터 개수: 92B |
||||
탑재 기기 | MacBook Pro 14(2023년 11월), MacBook Pro 16(2023년 11월) |
M3 APL1201의 강화형 칩으로 2023년 10월 Apple 이벤트에서 공개되었다. 코드네임은 Palma이다.
CPU는 ARM big.LITTLE 기술을 채용하고, M3와 동일한 2세대 Apple Everest 12코어와 2세대 Apple Sawtooth 4코어를 합쳐 총 16코어 구성을 이룬다. 컷칩 버전은 성능 코어 10개, 효율 코어 4개를 합쳐 총 14코어 구성을 이룬다. Apple의 발표에 따르면, 16코어 기준 전작 M2 Max 대비 최대 50% 빨라져 상당한 진전을 이루었다.
GPU는 Apple G16C를 40코어 구성으로 탑재했다. 컷칩 버전에는 30코어 구성으로 탑재된다. 하드웨어 메시 셰이딩과 레이 트레이싱 가속 지원이 추가되었으며, Dynamic Caching을 새로 지원한다. 이를 통해 하드웨어가 메모리에 각 작업당 정확히 필요한 용량만을 능동적으로 할당하며, 낭비를 줄여 메모리를 더 효율적으로 활용할 수 있게 돕는다. 개발자 또한 이 기술을 자유롭게 활용할 수 있다. Apple의 발표에 따르면 전작인 M2 Max 대비 최대 20% 빨라졌다.
NPU는 6세대 Neural Engine을 16코어 구성으로 탑재했다. 18 TOPS의 성능을 낸다. macOS Sequoia 15.1 베타 버전에서 Apple Intelligence로 문서 작업을 수행한 결과, 최대 5.9W의 전력을 소모했고 메일 요약에는 1~2W 미만을 소모했다.
RAM은 전작과 동일한 LPDDR5 규격을 사용하지만, 용량 옵션 증가와 함께 대역폭 구성이 이원화되었다. 먼저 36 GB와 96 GB 옵션은 307.2 GB/s 대역폭을 지원하며, 30코어 GPU 구성에서만 선택할 수 있다. 다음으로 48 GB와 64 GB 그리고 128 GB 옵션은 409.6 GB/s 대역폭을 지원한다. 또한, 40코어 GPU 구성에서만 선택할 수 있다.
이외에도 ISP와 ProRes 인코딩/디코딩 엔진을 포함한 미디어 엔진, 디스플레이 엔진 등의 부가 요소를 탑재했다. 미디어 엔진에는 AV1 디코더가 추가되었다. 더하여 PCIe 4.0, Thunderbolt 4 등의 I/O 규격을 지원한다.
최대 5대의 디스플레이를 지원한다.
TSMC의 N3B 공정으로 생산되었으며, 다이 사이즈는 467 mm²이다. 트랜지스터 개수는 920억 개이다. 이는 전작 대비 250억 개 증가한 수치이다.
벤치마크 결과가 공개되었다. Geekbench 6 기준 싱글코어 점수는 3,187점이며 멀티코어 점수는 21,890점이다. 전작 M2 Max 대비 각각 15%, 47% 정도 향상되었다. Cinebench R23 기준으로는 싱글코어 점수가 1,963점이며 멀티코어 점수가 23,272점으로 전작 대비 향상폭은 각각 20%, 57% 정도이다. 또한 Geekbench 6 기준 M2 Ultra와 비교했을 때 싱글코어 점수는 14% 향상되었고, 멀티코어 점수 또한 3% 향상되어 M2 Ultra를 근소한 차이로 앞선다. 또한, Geekbench 6 기준 TDP가 125W인 24코어 Intel Core i9-14900K와 거의 동급의 점수를 낸다. 같은 모바일 플랫폼 칩인 24코어 Core i9-14900HX와 비교해도 싱글코어와 멀티코어 모두 M3 Max가 앞선 점수를 보여준다. Cinebench 2024 기준으로 비교하면 M3 Max의 싱글코어 점수는 148점으로, 135점인 Core i9-14900K의 싱글코어 점수 대비 9% 높다. 하지만 멀티코어 점수는 1692점으로, 2211점인 Core i9-14900K의 멀티코어 점수 대비 M3 Max가 30% 밀린다. 같은 기준으로 Core i9-14900HX와 비교했을 때[19] 싱글코어 점수는 각각 M3 Max 140점, Core i9-14900HX 127점으로 싱글코어는 M3 Max의 우세이다. 멀티코어 점수는 M3 Max 1695점, Core i9-14900HX 1626점으로 서로 비등한 모습을 보인다.
CPU 성능 향상은 딱 기대한 수준이지만, GPU는 40코어 풀칩 기준 경이로운 성능 향상을 이룩했다. 3D 성능에서 M2 Max가 RTX 3060보다도 뒤처지던 것과 달리 M3 Max는 RTX 4070 Laptop과 비슷한 수준까지 올라오고, 레이 트레이싱 하드웨어도 추가되어 괄목할 만한 렌더링 성능 향상폭을 보인다. 이로써 Mac 환경에서 돈을 아무리 지불해도, 기대할 수 있는 그래픽 성능이 너무 낮아 허덕였던 시절은 끝난 것으로 평가받고 있다. 다만 Mac의 성능은 소프트웨어 최적화에도 적지 않은 영향을 받기 때문에 M3 Max의 역량을 온전히 활용하려면 앱의 지원 또한 뒤따라야 할 것이다.
14형 MacBook Pro에서도 고성능 모드 사용이 가능해졌다.
이전 Max 라인업 칩과 달리 UltraFusion 연결 구획이 따로 존재하지 않는다. 따라서 차기 Ultra 라인업 칩은 더 이상 Max를 2개 이어붙인 형태로 나오지 않고, 각각 따로 설계될 것으로 보인다. 이렇게 되면 Mac Pro와 같은 워크스테이션에서 성능과 확장성의 잠재력을 더 뽑아낼 수 있다는 장점이 있다. 그러나 더 큰 규모의 단일 칩을 생산해야 하기 때문에 단가 상승의 여지 또한 존재한다. M2 Ultra의 한계가 증명된 상황에서 차후의 행보를 두고 봐야 할 부분이다.
2.4. M4
<rowcolor=white> 패키지 샷 | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-6> APL1206-T8132 ||
CPU |
Apple Everest 3.94(4.51[부스트]) GHz +
Apple Sawtooth 2.58(2.89[부스트]) GHz Everest: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / 16 MB L2 공유 캐시 Sawtooth: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / 4 MB L2 공유 캐시 8 MB 시스템 캐시 |
|||||
3코어 + 6코어 | 4코어 + 4코어 | 4코어 + 6코어 | ||||
GPU | Apple G16G 1,470 MHz | |||||
8코어 |
10코어 160 EU, 1,280 ALU, 4.1 TFLOPs |
|||||
NPU |
16코어
Apple 7세대 Neural Engine 38 TOPS(INT8) |
|||||
내장 엔진 |
하드웨어 가속형 8K
H.264 /
HEVC /
ProRes / ProRes RAW 동영상 디코딩 엔진, 동영상 인코딩 엔진, ProRes 인코딩 및 디코딩 엔진, AV1 디코더, 디스플레이 엔진 |
|||||
메모리 |
64-Bit 2 채널(128-Bit) LPDDR5 3,750 MHz 통합 메모리 전송 속도: 7,500 MT/s, 대역폭: 120 GB/s |
|||||
8 GB | 16 GB | 24 GB | 32 GB | |||
명령어 집합 | ARMv9.2-A[22] | |||||
생산 공정 |
TSMC N3E 다이 사이즈: 165.9 mm² / 트랜지스터 개수: 28B |
|||||
탑재 기기 | iPad Pro 11(M4 모델), iPad Pro 13(M4 모델), iMac 24(2024년, 포트 2개), iMac 24(2024년, 포트 4개), Mac mini(2024년), MacBook Pro 14(2024년) |
M3 APL1201의 후속작으로, 2024년 5월 Apple 이벤트에서 M3 시리즈가 등장한 지 6개월 만에 공개되었다. 그동안의 Apple M 시리즈 칩 중에서는 이례적으로 iPad와 함께 공개되었다. 코드네임은 Donan(도난)[23]이다.
CPU는 3세대 Apple Everest와 3세대 Apple Sawtooth 아키텍처가 탑재되었다. 분기 예측이 향상되었으며, 성능 코어는 디코더가 10-Wide로 넓어지고 실행 엔진이 확장되었다. 효율 코어도 실행 엔진이 심화되었다. 또한 성능 코어와 효율 코어 모두 차세대 ML 가속기가 탑재되었다.[24] SME 지원 추가에 따른 성능 향상분을 제외한 순수 IPC 향상폭은 약 6.4%, SME까지 포함한 전체 IPC 향상폭은 약 11.4%로 추정된다. 코어 구성은 기존 4코어였던 효율 코어를 6코어로 늘려 전성비와 멀티코어 성능을 향상시켰다. Apple의 발표에 따르면 M2와 동일한 성능을 절반의 전력으로 낸다고 한다. 그러나 M1, M2, M3에서 CPU 코어에 차등을 두지 않은 것과 달리 함께 공개된 iPad Pro 256 GB, 512 GB 모델에는 성능 코어 1개가 줄어든 9코어 컷칩을 탑재해 기본형 M 시리즈 칩 최초로 CPU 코어 구성이 세분화되었다.
GPU는 M3와 동일한 Apple G16G 10코어 구성이며, 기본형 iMac에는 8코어 컷칩이 탑재된다. Apple은 키노트에서 Next-generation이라고만 언급했다.
NPU는 A17 Pro와 동일한 7세대 Neural Engine을 탑재해 38 TOPS의 연산 성능을 낸다. M3에 탑재된 6세대 Neural Engine의 18 TOPS 대비 엄청난 상승폭처럼 보이지만, 기존의 측정 기준을 FP16에서 INT8로 수정해 수치가 부풀려졌다는 지적이 있다. INT8 기준으로 수치를 통일할 경우 NPU 성능 향상폭은 M3 대비 약 5% 수준이다. 어찌 됐든 NPU 성능의 향상은 Apple Intelligence의 원활한 구동을 염두에 둔 것으로 보인다.
RAM은 LPDDR5 규격이 채택되었으며 8 GB와 16 GB, 24 GB, 32 GB 구성을 제공한다. 대역폭은 120 GB/s로 전작의 102.4 GB/s 대비 소폭 향상되었다. 8 GB 구성의 경우 마이크론 테크놀로지의 48 Gbit(6 GB) 모듈 두 개를 탑재해 총 용량은 12 GB라는 추측이 있었으나, 진위 여부는 밝혀지지 않았다. RAM 규격은 LPDDR5X가 아닌 LPDDR5로 확인되었는데, RAM 레이턴시를 줄이기 위한 것으로 보인다.
iPad Pro 시리즈는 8 GB와 16 GB 구성을, iMac은 16 GB, 24 GB, 32 GB 구성을 제공한다. 24 GB와 32 GB 구성은 iMac 출시와 함께 공개되었다.
Secure Exclave라는 보안 프로세서가 새롭게 탑재되었다. ExclaveOS라는 별도의 운영 체제를 구동한다. 네이밍으로 보아 Secure Enclave의 발전형으로 추측된다. iPad Pro의 새로운 보안 표시등(Secure Indicator Light, SIL) 매커니즘과 연동되어 공격자가 카메라/마이크 표시등 점등 여부를 속일 수 없게 개선되었다고 한다.
이외에도 ISP와 ProRes 인코딩/디코딩 엔진을 포함한 미디어 엔진, 디스플레이 엔진 등의 부가 요소를 탑재했다. 미디어 엔진에는 8K 해상도 지원이 추가되었다. 디스플레이 엔진에는 탠덤 OLED 지원이 추가되었으며, 밝기 및 색조 보상도 처리한다. ProMotion 주사율도 10 Hz까지 낮출 수 있도록 개선되었다. 더하여 PCIe 4.0, Thunderbolt 4 등의 I/O 규격을 지원한다.
최대 지원 디스플레이가 3대로 늘어났으며 최대 해상도 또한 8K@60Hz로 증가했다.
TSMC의 N3E 공정으로 생산되었으며, 다이 사이즈는 165.9 mm²이다. 트랜지스터 개수는 280억 개이다.
CPU 싱글코어 부스트 클럭은 4.5 GHz, 2코어 4.4 GHz, 3코어 이상은 3.94GHz으로 작동하며, Geekbench 6에서 싱글코어 점수는 최대 3934점, 멀티코어 점수는 최대 14924점을 기록해 전작 대비 각각 22%, 26% 가량 향상된 성능을 보여준다. 멀티코어 점수는 M3 Pro 12코어 풀칩에 맞먹는 수준이다. 9코어 CPU 컷칩 버전의 Geekbench 6 점수는 싱글코어가 3630점, 멀티코어가 13060점으로 여전히 전작보다는 앞선 점수를 보여준다. Metal로 측정되는 Geekbench GPU 벤치마크 점수는 53792점으로, M3 대비 13.5% 향상되었다. 59546점을 기록한 결과도 확인되었다. 공개 직후에는 대폭 향상된 AI 성능으로 종합적인 CPU 성능 향상폭이 과대평가되었다는 분석이 지배적이었으나, AI 성능을 제외하더라도 CPU 자체 성능이 꽤 향상된 것으로 밝혀졌다.[25]
이후 기기 표면을 액체질소로 냉각하자 싱글코어 점수 4000점을 돌파한 결과들도 여럿 나왔다. #1 #2 #3 #4 #5 #6
GPU도 아키텍처 향상과 iPad Pro의 방열 구조 개선에 힘입어 성능과 성능 유지력이 많이 개선되었다. 3DMark Wild Life Extreme 기준 최고 8611점을 기록하며 최고 7012점을 기록한 M2에 비해 성능이 약 23% 향상되었고, M2 iPad Pro가 기록한 최고 점수를 큰 쓰로틀링 없이 평균적으로 유지해 내는 모습을 보여준다.
전작들과 달리 공식적으로 다이 샷이 공개되지는 않았다.
다이 분석이 공개되었다. 공개된 자료에 따르면 다이 사이즈는 M3보다 크지만 블록 구성은 M3와 동일하다. AMX 블록과 디스플레이 엔진의 크기도 커진 것이 확인되었다.
2.4.1. M4 Pro
파일:Apple M4 Pro package.jpg | |
<rowcolor=white> 패키지 샷 | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-4> APLxxxx-T6040 ||
CPU |
Apple Everest 3.94(4.51[부스트]) GHz +
Apple Sawtooth 2.58(2.89[부스트]) GHz Everest: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / ? MB L2 공유 캐시 Sawtooth: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / ? MB L2 공유 캐시 ? MB 시스템 캐시 |
|||
8코어 + 4코어 | 10코어 + 4코어 | |||
GPU | Apple G16S 1,580 MHz | |||
16코어 | 20코어 | |||
NPU |
16코어
Apple 7세대 Neural Engine 38 TOPS(INT8) |
|||
내장 엔진 |
하드웨어 가속형 8K
H.264 /
HEVC /
ProRes / ProRes RAW 동영상 디코딩 엔진, 동영상 인코딩 엔진, ProRes 인코딩 및 디코딩 엔진, AV1 디코더, 디스플레이 엔진 |
|||
메모리 |
64-Bit 4 채널(256-Bit) LPDDR5X 4,266 MHz 통합 메모리 전송 속도: 8,533 MT/s, 대역폭: 273 GB/s |
|||
24 GB | 48 GB | 64 GB | ||
명령어 집합 | ||||
생산 공정 | TSMC N3E | |||
탑재 기기 | Mac mini(2024년), MacBook Pro 14(2024년), MacBook Pro 16(2024년) |
M4 APL1206의 강화형 칩으로 2024년 10월 30일, Mac mini와 함께 공개되었다. 코드네임은 Brava Chop이다.
CPU는 ARM big.LITTLE 기술을 채용하고, M4와 동일한 3세대 Apple Everest 최대 10코어와 3세대 Apple Sawtooth 4코어를 합쳐 최대 14코어 구성을 이룬다. 컷칩 버전은 성능 코어 8개, 효율 코어 4개로 총 12코어 구성을 이룬다.
GPU는 Apple G16S를 20코어 구성으로 탑재했다. 컷칩 버전에는 16코어 구성으로 탑재된다.
NPU는 7세대 Neural Engine을 16코어 구성으로 탑재했다.
RAM은 LPDDR5X-8533 규격의 24 GB, 48 GB, 64 GB 옵션을 제공한다. 전작의 18 GB, 36 GB 구성에 비해 기본 용량과 최대 용량 모두 증가했다. 또 전작의 RAM 구성이 3 채널 192-Bit로 개악되었던 것과 다르게 M4 Pro는 4 채널 256-Bit로 돌아와 대역폭이 273 GB/s로 크게 증가했다. 그러나 MacBook Pro는 64 GB 옵션을 선택할 수 없다.
그 밖에 ISP와 ProRes 인코딩/디코딩 엔진을 포함한 미디어 엔진, 디스플레이 엔진 등의 부가 요소를 탑재했다. 더하여 Thunderbolt 5 등의 I/O 규격을 지원한다.
디스플레이 출력은 최대 3대까지 지원한다.
TSMC의 N3E 공정으로 생산되었으며, 다이 사이즈는 ? mm²이다. 트랜지스터 개수는 ? 개이다.
공개 직후 첫 Geekbench 6 벤치마크 결과가 공개되었다. 14코어 CPU + 48 GB 통합 메모리 구성 기준, 싱글코어 점수는 3925점, 멀티코어 점수는 22669점을 기록하여 싱글코어와 멀티코어 모두 전작 M3 Pro는 물론이고 M3 Max의 점수까지 뛰어넘었다. 코어가 10개 더 많은 M2 Ultra와 비교해도 M4 Pro가 더 높은 멀티코어 성능을 낸다.
GPU 벤치마크 점수는 Metal로 측정되는 Compute Bench 기준 110334점을 기록했다. 이는 4,000개 이상의 결과에서 평균 78681점을 기록한 M3 Pro 대비 약 40% 향상된 수치이다.
NPU 벤치마크 점수는 Core ML로 측정되는 Geekbench AI 테스트 기준 단정밀도 5737점, 반정밀도 36636점, 양자화 50802점을 기록했다. 각각 2741점, 16078점, 18053점을 기록한 M3 Max 대비 대략 43%, 44%, 35% 향상된 수치이다.
전 세대보다 개악된 점이 있었던 M3 Pro에 비해 다시 체급이 크게 향상되었고, M4 Max와의 차이는 CPU 성능코어 수(최대 2개), GPU 코어 수 및 메모리 용량, 대역폭 등을 제외하면 크게 줄었다.
2.4.2. M4 Max
파일:Apple M4 Max package.jpg | |
<rowcolor=white> 패키지 샷 | 일러스트 |
||<tablealign=center><tablewidth=1000><tablebordercolor=#333,#ddd><tablebgcolor=#fff,#1c1d1f><colbgcolor=#333><colcolor=#fff><width=10%> 파트넘버 ||<-4> APLxxxx-T6041 ||
CPU |
Apple Everest 3.94(4.51[부스트]) GHz +
Apple Sawtooth 2.58(2.89[부스트]) GHz Everest: 192 KB L1 명령어 캐시 + 128 KB L1 데이터 캐시 / ? MB L2 공유 캐시 Sawtooth: 128 KB L1 명령어 캐시 + 64 KB L1 데이터 캐시 / ? MB L2 공유 캐시 ? MB 시스템 캐시 |
|||
<rowcolor=#333> 10코어 + 4코어 | 12코어 + 4코어 | |||
GPU | Apple G16C 1,580 MHz | |||
<rowcolor=#333> 32코어 | 40코어 | |||
NPU |
16코어
Apple 7세대 Neural Engine 38 TOPS(INT8) |
|||
내장 엔진 |
하드웨어 가속형 8K
H.264 /
HEVC /
ProRes / ProRes RAW 동영상 디코딩 엔진, 동영상 인코딩 엔진 2개, ProRes 인코딩 및 디코딩 엔진 2개, AV1 디코더, 디스플레이 엔진 |
|||
메모리 |
<rowcolor=#333> 64-Bit 6 채널(384-Bit) LPDDR5X 4,266 MHz 통합 메모리 전송 속도: 8,533 MT/s, 대역폭: 410 GB/s |
64-Bit 8 채널(512-Bit) LPDDR5X 4,266 MHz 통합 메모리 전송 속도: 8,533 MT/s, 대역폭: 546 GB/s |
||
<rowcolor=#333> 36 GB | 48 GB | 64 GB | 128 GB | |
명령어 집합 | ||||
생산 공정 | TSMC N3E | |||
탑재 기기 | MacBook Pro 14(2024년), MacBook Pro 16(2024년) |
M4 APL1206의 강화형 칩으로 2024년 10월 31일, MacBook Pro 14(2024년), MacBook Pro 16(2024년)와 함께 공개되었다. 코드네임은 Brava(브라바)이다.
CPU는 ARM big.LITTLE 기술을 채용하고, M4와 동일한 3세대 Apple Everest 최대 12코어와 3세대 Apple Sawtooth 4코어를 합쳐 최대 16코어 구성을 이룬다. 컷칩 버전은 성능 코어 10개, 효율 코어 4개로 총 14코어 구성을 이룬다.
GPU는 Apple G16C를 40코어 구성으로 탑재했다. 컷칩 버전에는 32코어 구성으로 탑재된다.
NPU는 7세대 Neural Engine을 16코어 구성으로 탑재했다.
RAM은 LPDDR5X-8533 규격의 36 GB, 48 GB, 64 GB, 128 GB 옵션을 제공한다. 아쉽게도 M3 Max 때와 다르게 컷칩의 경우 96 GB 옵션이 없어졌다.
그 밖에 ISP와 ProRes 인코딩/디코딩 엔진을 포함한 미디어 엔진, 디스플레이 엔진 등의 부가 요소를 탑재했다. 더하여 Thunderbolt 5 등의 I/O 규격을 지원한다.
디스플레이 출력은 최대 5대까지 지원한다.
TSMC의 N3E 공정으로 생산되었으며, 다이 사이즈는 ? mm²이다. 트랜지스터 개수는 ? 개이다.
Geekbench 6 벤치마크 결과에서는 16코어 CPU 기준 싱글코어 4060점, 멀티코어 26675점을 기록했다. 전작인 M3 Max 대비 싱글코어 성능은 약 30%, 멀티코어 성능은 약 27% 향상된 것이다. x86 진영의 칩과 비교하면 Intel Core Ultra 9 285K 대비 싱글코어 성능은 약 19%, 멀티코어 성능은 약 16% 높은 수치이며, AMD RYZEN 9 9950X 대비 싱글코어 성능은 약 18%, 멀티코어 성능은 약 25% 높은 수치이다.
Cinebench 2024 싱글코어 테스트 결과에서는 174점을 기록하며, 145점으로 종전의 1위였던 Intel Core Ultra 9 285K를 제치고 M4, M4 Pro와 나란히 싱글코어 성능 1위를 차지했다.
GPU 벤치마크 점수는 Metal로 측정되는 Compute Bench 기준 192532점을 기록하였다. 이는 6,000개 이상의 결과에서 평균 154860점을 기록한 M3 Max에 비해 약 24% 향상된 수치이다.
|
Blender 버전 4.2.3 렌더링 테스트에서는 RTX 4080 SUPER 대비 소폭 열세인 모습을 보여주었다.
GPU 전력 소모도 개선되었다. MLX 프레임워크로 Whisper V3 Turbo 모델을 이용하여 3시간 분량의 비디오 자막을 전사하는 작업에서 25W를 소모했고, 표면 온도는 81ºC를 기록했다. 총 소모 시간은 2분 29초였다. 같은 작업에서 M3 Max는 2분 37초가 걸렸으며 105℃를 기록했다. 또한 14형 MacBook Pro에서 고부하 작업 테스트를 위해 15분 동안 Qwen2.5 Coder bf16 모델로 추론을 돌린 결과, 팬은 최대 속도로 회전했지만 쓰로틀링은 일어나지 않았다. 최고 표면 온도는 80ºC였다. 반면 M3 Max는 같은 작업에서 2분 만에 쓰로틀링이 걸렸다.
[1]
왼쪽이 AP이고, 오른쪽에 RAM이 2개 붙어 있다.
[2]
Intel 레이크필드처럼 아예 CPU 다이 위에 적층되어 있는 게 아니라
그냥 옆에 붙어 있기만 하기 때문에 온보드에 납땜되어 있는 노트북들과 비슷한 구조이다. 따라서 레이크필드와는 다르게 설계를 바꾸면 추가적인 RAM 증설이 불가능하진 않다. 실제로 리볼링을 통해서
16 GB로 업그레이드한 사례가 나왔다!
[3]
데스크탑까지 통합 메모리를 쓸 가능성이 높은데, 그러면 일반 컴퓨터보다 가용 메모리 총량이 줄어든다. 다만 이는 기존 서버 및 머신 러닝용 컴퓨터에서도 비슷하게 사용하는 방식이다. 예를 들면
NVIDIA의 Grace CPU가 LPPDR과 HBM2를 일체형으로 합친 칩 구조를 가지고 있다.
[4]
어른의 사정도 있지만 macOS에도 허용할 경우 거기에 맞춰 수정을 해야 하고 macOS 쪽에서 트러블이 생기면 그것도 같이 해결해야 하는 번거로움 때문에 허용하지 않는 것이다.
[5]
빅 코어, 리틀 코어 모두 M1과 동일하기 때문에 당연한 결과이다.
[6]
싱글코어 1,851점, 멀티코어 11,002점
#
[7]
M1 Max 공개 당시 키노트 상의 다이 샷에서는 생략됐지만, 출시 이후 다이를 갈아서 직접 촬영한 결과 MCM 인터커넥터 구획이 있다는
추측이 있었다.
[8]
싱글 코어는 1,273점, 멀티 코어는 25,133점이다.
#
[9]
We're adding one last chip to M1 family.
[부스트]
싱글 코어 부스트 클럭
[부스트]
[12]
각각
A16 Bionic에서는 전작들과 동일하게 8-Wide, 4-Wide였다.
[13]
M3 MacBook Air 13형의 시스템 정보에서 확인됨
[부스트]
[부스트]
[16]
스페인에 있는
로보스 섬에서 따온 것으로 보인다.
[부스트]
[부스트]
[19]
비교군의 사양은 Core i9-14900HX +
RTX 4090 Laptop이며, 고성능 모드에서 측정하였다.
[부스트]
[부스트]
[22]
LLVM 컴파일러의 주석에 따르면 Apple-m4 아키텍처는 사실상 ARMv9.2이지만 SVE(Scalable Vector Extension) 명령어가 구현되지 않았다. Arm의 아키텍처 레퍼런스 매뉴얼에 따르면 ARMv9에서 SVE는 선택 사항이므로 구현하지 않아도 ARMv9로 분류되지만, LLVM에서는 SVE를 필수로 규정하는 특이한 행태 때문에 LLVM 컴파일러 상에서는 ARMv9.2에 가장 가까운 ARMv8.7로 정의된다. 마찬가지로 퀄컴의
스냅드래곤 8 Gen 2,
8 Gen 3도 ARMv9로 분류되는 Cortex-X3, Cortex-X4를 탑재했지만 SVE 구현이 빠진 버전이 들어가 있다.
[23]
홋카이도의 도난(道南) 지방, 혹은
스코틀랜드의 엘일린 도난(Eilean Donan) 섬에서 따온 것으로 보인다.
[24]
AMX 블록이라고도 한다. CPU 내부에 있으며 Neural Engine과는 별개이다. AMX 블록이 탑재되기 시작한 것은
A13 Bionic부터이다.
[25]
이것 때문에 일각에서는
Apple에 편향적인
Geekbench가
Apple Silicon의 AI 확장만을 지원해서 점수가 부풀려진 것이며,
x86 등 다른 플랫폼의 칩과 비교하는 것이 불공정 혹은 무의미하다는 주장을 펼치기도 했다. 그러나 이것은 사실이 아니다. Geekbench 6는 x86 CPU의 AMX 명령어 집합을 사용하고
있으며
인텔 CPU의 AMX 블록도 Geekbench 6에서
작동한다. AMX가 없는
Core i7-12700T와 AMX를 탑재한
Xeon W5-3435X를 비교한
결과를 보면, 물체 탐지 점수에서 W5-3435X가 압도적으로 높은 점수를 보여주는 것을 알 수 있다. 같은
ARM 진영인
퀄컴 스냅드래곤 역시 Geekbench 6에서 SVE 명령어를 사용할 수 있다.
[부스트]
[부스트]
[부스트]
[부스트]