Содержание
A12 Bionic против A11 Bionic: тесты и характеристики
VS
A12 Bionic
A11 Bionic
Мы сравнили два 6-ядерных процессора: Apple A12 Bionic (с графикой Apple A12 Bionic GPU) и A11 Bionic (Apple GPU). Смотрите таблицу характеристик, преимущества каждого из чипов, а также результаты тестирования бенчмарков AnTuTu и Geekbench.
- Обзор
- Отличия
- Бенчмарки
- AnTuTu v9
- GeekBench 5
- Характеристики
- Комментарии (1)
Обзор
Сравнение показателей производительности и энергопотребления (от 1 до 100)
Производительность CPU
Скорость работы центрального процессора
A12 Bionic
64
A11 Bionic
49
Производительность в играх
Тесты графики в играх и OpenCL/Vulcan
A12 Bionic
52
A11 Bionic
41
Энергоэффективность
Рейтинг потенциальной энергоэффективности
A12 Bionic
77
A11 Bionic
63
Итоговая оценка
Общая оценка чипа по всем показателям
A12 Bionic
64
A11 Bionic
50
Основные отличия
Список главных плюсов каждого из процессоров
Преимущества Apple A12 Bionic
- В 2. 3 раза выше пропускная способность памяти (34.1 против 14.9 Гбит/с)
- Показывает на 72% лучшую производительность в вычислениях с плавающей запятой
- Меньший размер транзистора (7 против 10 нанометров)
- Набирает больше (на 32%) баллов в AnTuTu 9 – 525K vs 398K
- Более новый — выпущен на 1 год позже
- Лучшая архитектура набора команд
Тесты в бенчмарках
Результаты тестов в бенчмарках Geekbench, AnTuTu и других
Чип:
A12 Bionic
vs
A11 Bionic
AnTuTu 9
AnTuTu Benchmark измеряет скорость CPU, GPU, памяти и других компонентов системы
A12 Bionic
+32%
525724
A11 Bionic
398876
CPU | 143402 | 124988 |
GPU | 186891 | 147976 |
Memory | 91638 | 61076 |
UX | 107048 | 66430 |
Total score | 525724 | 398876 |
▶️ Добавьте ваш результат теста AnTuTu
GeekBench 5
GeekBench показывает однопоточную и многопоточную производительность CPU
Single-Core Score
A12 Bionic
+21%
1118
A11 Bionic
921
Multi-Core Score
A12 Bionic
+26%
2912
A11 Bionic
2315
Image compression | 132. 8 Mpixels/s | 122.9 Mpixels/s |
Face detection | 14.5 images/s | 21.6 images/s |
Speech recognition | 67.8 words/s | 35.8 words/s |
Machine learning | 54.1 images/s | 39.5 images/s |
Camera shooting | 14.6 images/s | 21 images/s |
HTML 5 | 3.27 Mnodes/s | 3.15 Mnodes/s |
SQLite | 745 Krows/s | 767.9 Krows/s |
3DMark
Кроссплатформенный бенчмарк, оценивающий производительность графики в Vulkan (Metal).
3DMark Wild Life Performance
A12 Bionic
+48%
5242
A11 Bionic
3552
Stability | 68% | 62% |
Graphics test | 31 FPS | 21 FPS |
Score | 5242 | 3552 |
Технические характеристики
Сравнительная таблица характеристик A12 Bionic и A11 Bionic
Центральный процессор
Архитектура | 2x 2. 49 ГГц – Vortex 4x 1.6 ГГц – Tempest | 2x 2.39 ГГц – Monsoon 4x 1.42 ГГц – Mistral |
Количество ядер | 6 | 6 |
Частота | 2490 МГц | 2390 МГц |
Набор инструкций | ARMv8.3-A | ARMv8-A |
Кэш L1 | 128 КБ | 64 КБ |
Кэш L2 | 8 МБ | 8 МБ |
Техпроцесс | 7 нм | 10 нм |
Количество транзисторов | 6.9 млрд. | 4.3 млрд. |
TDP | 6 Вт | 8 Вт |
Графический ускоритель
GPU | Apple A12 Bionic GPU | Apple GPU |
Частота GPU | 1125 МГц | — |
Вычислительных блоков | 32 | 3 |
Шейдерных блоков | 256 | — |
FLOPS | 560 Гфлопс | 325 Гфлопс |
Версия Vulcan | 1. 1 | 1.0 |
Версия OpenCL | 2.0 | 2.1 |
Версия DirectX | 12 | 12 |
Оперативная память
Тип памяти | LPDDR4X | LPDDR4 |
Частота памяти | 2133 МГц | 1866 МГц |
Шина | 1x 64 Бит | 2x 16 Бит |
Пропускная способность | До 34.1 Гбит/сек | До 14.9 Гбит/сек |
Объем | До 12 ГБ | До 3 ГБ |
Мультимедиа (ISP)
Нейронный процессор | Да | Neural Engine |
Тип накопителя | NVMe | NVMe |
Макс. разрешение дисплея | 2688 x 1242 | 2436 x 1125 |
Макс. разрешение фотокамеры | 2x 12МП | 2x 12МП |
Запись видео | 4K при 60FPS | 4K при 60FPS |
Воспроизведение видео | 4K при 60FPS | 4K при 60FPS |
Поддержка кодеков | H.264, H.265, Motion JPEG | H.264, H.265, Motion JPEG |
Аудио | AAC, AAC‑LC, Apple Lossless, HE‑AAC, Linear PCM, AAX и AAX+, HE‑AAC v2, MP3 | AAC, AIFF, CAF, MP3, MP4, WAV |
Связь и сети
Поддержка 4G | LTE Cat. 18 | LTE Cat. 12 |
Поддержка 5G | Нет | Нет |
Скорость скачивания | До 1000 Мбит/с | До 600 Мбит/с |
Скорость загрузки | До 150 Мбит/с | До 150 Мбит/с |
Wi-Fi | 5 | 5 |
Bluetooth | 5. 0 | 5.0 |
Навигация | GPS, GLONASS, Beidou, Galileo | GPS, GLONASS, Beidou, Galileo |
Общая информация
Дата анонса | Сентябрь 2018 года | Сентябрь 2017 года |
Класс | Флагман | Флагман |
Номер модели | APL1W81 | APL1W72 |
Опрос
Смартфон на каком из чипов вы предпочли бы?
A12 Bionic
737 (83.8%)
A11 Bionic
142 (16.2%)
Всего проголосовало: 879
Сравнения с конкурентами
1.
Qualcomm Snapdragon 8 Gen 1 vs Apple A12 Bionic
2.
Apple A15 Bionic vs Apple A12 Bionic
3.
Google Tensor vs Apple A12 Bionic
4.
Apple A15 Bionic vs Apple A11 Bionic
5.
Apple A13 Bionic vs Apple A11 Bionic
▶️ Сравнить другие SoC
Ремонт OPPO F11, F9 в Щёлково от 390 руб.
Дарья
Поменяли дисплей на айфоне, защитная пленка была в подарок. Я еще чехол заранее выбрала. Прихожу за телефоном, а он уже готовый в новеньком чехле. С-сервис)))
Юлия
Спасибо Pedant.ru и его сотрудникам. Профессионально, быстро, детали ставят новые!
Даниил
Благодарю данный сервис за быстрый ремонт планшета. Заменили кнопку включения, аппарат работает четко)))
Юлия
Мастер Владимир быстро и качественно решил мою проблему! Отличный сервисный центр, рекомендую!
Сергей
Сотрудник центра Малик очень быстро установил причину неиспоравности моего айфона и в течение полу-часа устранил ее (заменил аккумулятор). Большое спасибо! Рекомендую всем обращаться в этот сервисный центр.
Валентина
Искала что-то поближе и побыстрее. Впервые сталкиваюсь с тем, что по всем вопросам можно написать в ВК, очень удобно оказалось, меня проконсультировали подробно и я приняла решение остановиться на этом сервисе. Единственный минус что заказанный аккумулятор доставили немного позже оговоренного срока, но опять таки, даже звонить не пришлось, не то что зря ехать, все быстро узнала и спокойно ждала звонка. Поменяли тоже очень быстро, аккум работает как новый, очень рада что обратилась.
Семен
Пришел с неработающим портом зарядки. Починили за пять минут и даже денег не взяли! Большое спасибо! Следующий раз — только к вам!
Никита
Здравствуйте, приехал показать пульт от сигнализации автомобиля, они мне его сделали и не просто сделали, а сделали его БЕСПЛАТНО я в шоке. Всем советую, самый лучший ремонт чего-либо
Наталья
Хочу поделиться приятным опытом: очень оперативно и качественно заменили аккумулятор на iPhone 5s. Спасибо. Рекомендую:)))
Эльза
Здравствуйте!Являюсь постоянным клиентом педанта в Щелково и рекомендую всем обращаться в этот сервисный центр,именно к высококвалифицированному мастеру Игорю Сазонову,который знает свою работу,как никто другой,кроме того приятный в общении,вежливый,все объяснит,сходу скажет в чем проблема и решит её.Игорь, приношу свою благодарность за то,что вы решили мою проблему с телефоном,и теперь только к вам, и всем рекомендую с чистой совестью,потому что за столько времени ни разу не встречала такого добросовестного и квалифицированного мастера и просто человека с большой буквы!Спасибо вам Игорь !
Александр
Здравствуйте рекомендую этот сервисный центр всем кто хочет быстро и качественно отремонтировать свой гаджет в Щелково.
Александр
Выражаю благодарность специалисту Игорю за оперативную работу по ремонту Хонора 8Х. Проблема решена, слуховой динамик заменён. Спасибо огромное!
Мария
Очень благодарна за качественную и быструю помощь в ремонте телефона. Здоровья вам и удачи!!!
Артем
Отличная компания по ремонту сотовых телефонов! Ребята опытные, сразу все обрисовали и даже предложили подарок!!! Работу по ремонту телефона сделали быстро и качественно!! Рекомендую данную компанию!! Дальнейшего успешного процветания!
Людмила
Сдавала в ремонт 10.04.19. Redmi Note 4X — сделали быстро и качественно. Отдельного внимания заслуживает вежливое отношение к клиентам, разъяснения и советы. Большое спасибо мастеру!
Apple A11 Bionic vs Qualcomm Snapdragon 845: в чем разница?
44points
Apple A11 Bionic
73points
Qualcomm Snapdragon 845
Победитель сравнения
VS
60 Facts в сравнении
Apple Apple Bionic
Snapdragon 845
Apple Apple Apple BEELCRANICLER. 845?
- На 356 МГц выше тактовая частота графического процессора?
1066 МГц против 710 МГц
Почему Qualcomm Snapdragon 845 лучше Apple A11 Bionic?
- В 1,7 раза выше скорость процессора?
4 x 2,8 ГГц и 4 x 1,77 ГГц vs 2 x 2,53 ГГц и 4 x 1,42 ГГц - Еще 2 потока процессора?
8 vs 6 - Загрузка в 2 раза быстрее?
1200 Мбит/с по сравнению с 600 Мбит/с - Использует HMP?
- Максимальный объем памяти на 5 ГБ больше?
8 ГБ по сравнению с 3 ГБ
Какие сравнения самые популярные?
Apple A11 Bionic
vs
Qualcomm Snapdragon 720G
Qualcomm Snapdragon 845
vs
MediaTek Helio G90T
Apple A11 Bionic
vs
Apple A12 Bionic
Qualcomm Snapdragon 845
vs
MediaTek Dimensity 8100
Apple A11 Bionic
против
Qualcomm Snapdragon 860
Qualcomm Snapdragon 845
против
Qualcomm Snapdragon 732G
Apple A11 Bionic
VS
Apple A10 Fusion
QUALCOMM SNAPDRAGO 845
vs
MediaTek Dimensity 810
Apple A11 Bionic
vs
Qualcomm Snapdragon 855
Qualcomm Snapdragon 845
vs
0003
Qualcomm Snapdragon 778G 5G
Apple A11 Bionic
vs
Mediatek Helio G99
Qualcomm Snapdragon 845
vs
Huawei Kirin 980
Apple A11 Bionic
vs
Qualcomm Snapdragon 750G
Qualcomm Snapdragon 845
vs
Mediatek Helio G95
Apple A11 Bionic
vs
Qualcomm Snapdragon 732G
Qualcomm Snapdragon 845
vs
Samsung Exynos 9810
Qualcomm Snapdragon 845
vs
MediaTek Helio P70
Price comparison
User reviews
Overall Rating
Apple A11 Bionic
3 User reviews
Apple A11 Bionic
9. 3
3 Отзывы пользователей0003
Features
Gaming
9.3 /10
3 votes
9.5 /10
11 votes
Performance
9.3 /10
3 votes
9.5 /10
11 голосов
Производительность
Скорость процессора
2 x 2,53 ГГц и 4 x 1,42 ГГц
4 x 2,8 ГГц и 4 x 1,77 ГГц , учитывая все его ядра (процессоры). Он рассчитывается путем сложения тактовых частот каждого ядра или, в случае многоядерных процессоров, использующих разные микроархитектуры, каждой группы ядер.
Потоки ЦП
Чем больше потоков, тем выше производительность и лучше многозадачность.
Использует технологию big.LITTLE
✔Apple A11 Bionic
✔Qualcomm Snapdragon 845
Используя технологию big.LITTLE, чип может переключаться между двумя наборами процессорных ядер, чтобы максимизировать производительность и время автономной работы. Например, при игре более мощные ядра будут использоваться для повышения производительности, тогда как при проверке электронной почты будут использоваться менее мощные ядра для увеличения времени автономной работы.
Использует HMP
✖Apple A11 Bionic
✔Qualcomm Snapdragon 845
Гетерогенная многопроцессорная обработка (HMP) — это более продвинутая версия технологии big.LITTLE. В этой конфигурации процессор может использовать все ядра одновременно или только одно ядро для задач с низкой интенсивностью. Это может обеспечить высокую производительность или увеличить время автономной работы соответственно.
турбо тактовая частота
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
Неизвестно. Помогите нам, предложив значение. (Qualcomm Snapdragon 845)
Когда ЦП работает ниже своих ограничений, он может повысить тактовую частоту, чтобы повысить производительность.
Кэш второго уровня
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
Кэш-память L2 большего размера обеспечивает более высокую производительность процессора и всей системы.
Кэш L1
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
Кэш-память L1 большего размера обеспечивает более высокую производительность процессора и всей системы.
тактовый множитель
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
Неизвестно. Помогите нам, предложив значение. (Qualcomm Snapdragon 845)
Множитель тактовой частоты управляет скоростью процессора.
Кэш L3
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
Кэш-память L3 большего размера обеспечивает более высокую производительность процессора и всей системы.
Память
Скорость ОЗУ
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
1866 МГц
Может поддерживать более быструю память, что повысит производительность системы.
Версия памяти DDR
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
Память DDR (удвоенная скорость передачи данных) — наиболее распространенный тип оперативной памяти. Более новые версии памяти DDR поддерживают более высокие максимальные скорости и более энергоэффективны.
максимальный объем памяти
Максимальный поддерживаемый объем памяти (ОЗУ).
максимальная пропускная способность памяти
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
29,9 ГБ/с
Это максимальная скорость, с которой данные могут быть считаны из памяти или сохранены в ней.
каналов памяти
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
Больше каналов памяти увеличивает скорость передачи данных между памятью и процессором.
Версия eMMC
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
Более высокая версия eMMC позволяет использовать более быстрые интерфейсы памяти, что положительно влияет на производительность устройства. Например, при переносе файлов с компьютера на внутреннюю память через USB.
Поддерживает память ECC
✖Apple A11 Bionic
✖Qualcomm Snapdragon 845
Память с исправлением ошибок может обнаруживать и исправлять повреждение данных. Он используется, когда необходимо избежать повреждения, например, при научных вычислениях или при работе сервера.
Характеристики
Имеет встроенный LTE
✔Apple A11 Bionic
✔Qualcomm Snapdragon 845
Система на кристалле (SoC) имеет встроенный сотовый чип LTE. LTE способен загружать на более высоких скоростях, чем старая технология 3G.
скорость загрузки
600 Мбит/с
1200 Мбит/с
Скорость загрузки — это показатель пропускной способности интернет-соединения, представляющий собой максимальную скорость передачи данных, с которой устройство может получить доступ к онлайн-контенту.
скорость загрузки
150 МБит/с
150 МБит/с
Скорость загрузки — это измерение пропускной способности интернет-соединения, представляющее максимальную скорость передачи данных, с которой устройство может отправлять информацию на сервер или другое устройство.
Имеет TrustZone
✔Apple A11 Bionic
✔Qualcomm Snapdragon 845 (Qualcomm Kryo)
Интегрированная в процессор технология для защиты устройства от использования с такими функциями, как мобильные платежи и потоковое видео с использованием управления цифровыми правами (DRM) .
использует многопоточность
✖Apple A11 Bionic
✖Qualcomm Snapdragon 845
Технология многопоточности (например, Intel Hyperthreading или AMD Simultaneous Multithreading) обеспечивает повышенную производительность за счет разделения каждого физического ядра процессора на виртуальные ядра, также известные как виртуальные потоки. Таким образом, каждое ядро может одновременно запускать два потока инструкций.
Имеет бит NX
✔Apple A11 Bionic
✔Qualcomm Snapdragon 845 (Qualcomm Kryo)
Бит NX помогает защитить компьютер от вредоносных атак.
бита выполняются одновременно
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
128 (Qualcomm Kryo)
NEON обеспечивает ускорение обработки мультимедиа, например при прослушивании MP3.
Имеет AES
✔Apple A11 Bionic
✔Qualcomm Snapdragon 845 (Qualcomm Kryo)
AES используется для ускорения шифрования и дешифрования.
Версия VFP
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
4 (Qualcomm Kryo)
Векторные вычисления с плавающей запятой (VFP) используются процессором для повышения производительности в таких областях, как цифровая обработка изображений.
Тесты
Результат Geekbench 5 (одиночный)
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
Geekbench 5 — это кроссплатформенный тест, измеряющий производительность процессора в одноядерном режиме. (Источник: Primate Labs, 2022 г.)
Результат Geekbench 5 (мульти)
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
Geekbench 5 — это кроссплатформенный тест, измеряющий многоядерную производительность процессора. (Источник: Primate Labs, 2022 г.)
Результат PassMark
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
Неизвестно. Помогите нам, предложив значение. (Qualcomm Snapdragon 845)
Этот тест измеряет производительность ЦП с использованием нескольких потоков.
Результат PassMark (один)
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
Неизвестно. Помогите нам, предложив значение. (Qualcomm Snapdragon 845)
Этот тест измеряет производительность ЦП с использованием одного потока.
Результат PassMark (разгон)
Неизвестно. Помогите нам, предложив значение. (Apple A11 Bionic)
Неизвестно. Помогите нам, предложив значение. (Qualcomm Snapdragon 845)
Этот тест измеряет производительность процессора при разгоне.
Сравнение цен
Какие мобильные чипсеты лучше?
Metal 2 на A11 — Обзор — Tech Talks — Видео
Больше видео
Полная интеграция Metal 2 с процессором A11 Bionic позволяет вашим приложениям и играм реализовать совершенно новый уровень производительности и возможностей. Познакомьтесь с новыми мощными функциями API и возможностями Metal 2 на A11, управляемыми графическим процессором, включая блоки изображений, затенение плитки, улучшения групп порядка растра, контроль покрытия образца блока изображения и совместное использование групп потоков. Узнайте об архитектуре графического процессора A11, разработанного Apple, и узнайте, как он создает возможности для совершенствования методов рендеринга, вычислений и машинного обучения.
Ресурсы
Похожие видео
Технические переговоры
WWDC 2020
Скачать
Metal 2 представляет новый набор API и изменения языка затенения, чтобы использовать преимущества архитектуры и новых функций графического процессора A11. Давайте рассмотрим, что нового в Metal 2 на A11. Apple разработала Metal, чтобы обеспечить быстрые инновации в архитектуре графических процессоров. И, в свою очередь, архитектура графического процессора Apple повлияла на дизайн Metal. Эта глубокая и бесшовная интеграция аппаратного и программного обеспечения открывает захватывающие новые возможности для графики, вычислений, приложений машинного обучения и игр.
Всего через три года после представления Metal мы представили Metal 2, следующее поколение Metal, на WWDC 2017. Основанный на четком и продуманном дизайне, Metal 2 расширяется, чтобы включать в себя еще более передовые способы доступа к возможностям графического процессора, например рендеринг под управлением графического процессора, который позволяет графическому процессору распределять графические рабочие нагрузки на себя, дополнительно повышая эффективность и снижая стоимость вызовов отрисовки до 10 раз. В 2015 году Metal расширился до поддержки Mac и графических процессоров для настольных ПК. Теперь Metal 2 настраивает API для унифицированного предоставления ключевых функций, независимо от базовой архитектуры графического процессора. С появлением машинного обучения в самых разных областях Metal 2 предлагает более широкий и сложный набор функций, направленных на ускорение операций логического вывода для повышения производительности и эффективности. Metal 2 также предлагает новый набор инструментов оптимизации, которые значительно упрощают использование возможностей графических процессоров на платформах Apple. И теперь мы можем раскрыть больше возможностей Metal 2, о которых мы не объявили на WWDC. Metal 2 включает в себя набор новых мощных функций, раскрывающих уникальные возможности разработанного Apple графического процессора в нашем новейшем чипе серии A, A11.
Прежде чем мы углубимся в детали архитектуры и функций графического процессора A11, давайте рассмотрим архитектуру классического графического процессора и архитектуру отложенного рендеринга на основе тайлов. Это упрощенная схема классической архитектуры графического процессора. Графические процессоры — это машины с массовым параллелизмом. Стадии вершин и фрагментов, показанные на этой диаграмме, повторяются много раз и выполняются параллельно. Существует также множество оптимизаций, таких как иерархия кэша, FIFO, предварительный грубый тест глубины и т. д., которые не показаны на этой диаграмме. По сути, графические процессоры с классической архитектурой берут примитивы и генерируют глубину, цвет, буферы данных и текстуры. Одной из определяющих характеристик этой архитектуры является то, что выходные данные вершинной стадии поступают непосредственно на стадию фрагментов. Давайте посмотрим на архитектуру отложенного рендеринга на основе тайлов, также известную как TBDR. Все графические процессоры серии A основаны на архитектуре TBDR. TBDR вносит существенные изменения в классическую архитектуру графического процессора. Первое существенное отличие состоит в том, что стадия вершин не передается непосредственно на стадию фрагментов. Вместо этого, когда они выходят из вершинной стадии, примитивы объединяются в маленькие плитки, выровненные по экрану, и сохраняются в памяти.
Это изменение позволяет вершинному этапу работать асинхронно по отношению к фрагментному этапу. Параллельно с запуском этапа фрагмента прохода рендеринга аппаратное обеспечение выполняет этап вершины будущего прохода рендеринга. Асинхронный запуск этапа вершин обеспечивает значительное повышение производительности. Вершинный этап обычно интенсивно использует аппаратное обеспечение с фиксированными функциями, тогда как фрагментный этап интенсивно использует математику и пропускную способность. Их полное перекрытие позволяет нам одновременно использовать все аппаратные блоки GPU. Объединение примитивов в тайлы позволяет нам обрабатывать все примитивы в тайле одновременно. Давайте посмотрим, как мы можем воспользоваться этим. Мы размещаем буферы тайлового размера, полного разрешения, глубины, трафарета и кадра на чипе рядом с нашими шейдерными ядрами. Мы называем эту плитку памяти памятью. Тайловая память имеет три важные характеристики. Во-первых, пропускная способность между шейдерным ядром и тайловой памятью во много раз превышает пропускную способность между графическим процессором и внешней памятью и масштабируется пропорционально количеству шейдерных ядер.
Во-вторых, латентность доступа к тайловой памяти во много раз меньше, чем латентность доступа к внешней памяти. Наконец, тайловая память потребляет значительно меньше энергии, чем внешняя память. TBDR использует эту память с низкой задержкой, низким энергопотреблением и высокой пропускной способностью для двух основных оптимизаций. Во-первых, память о глубине тайла/трафарете позволяет аппаратному обеспечению генерировать полную информацию о глубине и буфере трафарета для непрозрачных объектов до того, как ядро затенения начнет их обрабатывать, что позволяет аппаратному обеспечению полностью отсеивать перекрытые фрагменты перед отправкой в ядро шейдера. Если буфер глубины не нужен для последующих проходов рендеринга, от полноразмерного буфера глубины можно полностью отказаться за счет использования целей рендеринга без памяти, что сэкономит большую часть пропускной способности памяти, хранилища и энергии. Во-вторых, тайловая память используется для хранения цветовых буферов на чипе. Операции смешивания выполняются быстро, поскольку им не требуется доступ к полноразмерному буферу кадров во внешней памяти. Память тайла записывается только один раз, после обработки всего тайла, что значительно экономит энергию, производительность и пропускную способность. Более высокая занятость достигается благодаря этой более быстрой памяти. Функция выборки кадрового буфера позволяет реализовать пользовательское смешивание и использовать несколько продвинутых методов. В сочетании с кадровыми буферами без памяти многие из этих методов также не требуют использования внешней памяти. В результате TBDR обеспечивает отличную производительность даже при ограниченной пропускной способности. TBDR потребляет гораздо меньше энергии, что важно для устройств с батарейным питанием.
Теперь переключимся на графический процессор A11. В A11 первое серьезное изменение, которое мы внесли в архитектуру графического процессора, — предоставить вам прямой контроль над данными, находящимися в тайловой памяти, из ваших функций фрагмента. Блоки изображений обеспечивают оптимизированный доступ к данным изображения, находящимся в тайловой памяти. Вы сможете размещать пиксели так, как это имеет смысл для вашего приложения, но при этом эффективно отображать их. Блок изображения — это двумерная структура данных в тайловой памяти. Вы можете указать его ширину, высоту, глубину и формат. Metal 2 добавляет форматы пикселей текстуры к языку затенения, чтобы дать вам полный контроль над расположением пикселей с помощью упакованных типов данных. Второе крупное архитектурное изменение дает вам доступ ко всем пикселям, хранящимся в тайловой памяти, одновременно.
Мозаичное затенение — это новый программируемый этап в графическом процессоре Apple A11, который обеспечивает встроенные вычислительные возможности в проходах рендеринга. Тайловое затенение обеспечивает совершенно новый уровень производительности и эффективности в Metal 2. Операции рендеринга и вычислений теперь могут совместно использовать данные благодаря более высокой пропускной способности, меньшей задержке и меньшей мощности плиточной памяти. Тайловое затенение тесно интегрировано с блоками изображения. Вы сможете анализировать содержимое блоков изображений, обобщать это содержимое, сохранять блоки изображений в середине сцены и даже изменять макеты блоков изображений. Вы также можете использовать память групп потоков точно так же, как это делает обычное вычислительное ядро. Для тайловых шейдеров память группы потоков является постоянной. Каждый последующий вызов тайлового шейдера может работать с памятью группы потоков, начиная со значений, оставшихся от предыдущего тайлового шейдера. Это верно и для памяти imageblock. Они сохраняются между вызовами тайловых и фрагментных шейдеров. Кроме того, мы представляем расширенную версию групп порядка растра, которая поддерживает затенение блоков изображений и плиток. И, наконец, мы расширяем язык шейдинга Metal, чтобы дать вам полный контроль над выборочным покрытием для мультисемплированных блоков изображений. Давайте посмотрим на набор методов рендеринга, которые могут использовать преимущества новой архитектуры и новых функций Metal 2.
Тайловые шейдеры, блоки изображений и растровые группы порядка — отличный способ объединить чередующиеся проходы, рендеринг и вычисления в один комбинированный проход. Таким образом можно ускорить отложенный рендеринг и мозаичный форвард-рендеринг. В качестве примера рассмотрим реализацию тайлового вперед. Вы можете сначала передать геометрию, чтобы создать информацию о глубине на кристалле, затем запустить шейдер плитки, чтобы создать информацию о минимальной и максимальной глубине для каждой плитки, запустить другой шейдер плитки, чтобы создать список отбракованных источников света в памяти группы потоков, а затем запустить шейдеры материалов. Все эти операции можно выполнить за один комбинированный проход, что повышает производительность за счет устранения больших объемов полосы пропускания, хранилища и мощности. Эти функции также позволяют эффективно реализовывать независимую от порядка прозрачность, многослойное альфа-смешивание и подповерхностное рассеяние. Контроль выборочного покрытия, тайловые шейдеры и блоки изображений обеспечивают гораздо более эффективные способы выполнения пользовательских разрешений MSAA, отображения тонов MSAA и агрегирования поверхностей. Чтобы показать, как можно ускорить некоторые из этих вариантов использования, мы выпускаем пример кода для отложенного рендеринга, мозаичного продвижения вперед, многослойного альфа-смешивания и агрегации поверхностей.
Metal 2 на A11 совершенствует архитектуру TBDR, добавляя блоки изображения, мозаичные шейдеры, контроль выборочного покрытия блока изображения и группы порядка растра. Кроме того, мы представили новые изменения языка шейдинга Metal, чтобы предоставить вам новые и эффективные механизмы для обмена данными между вашими вычислительными потоками и группами потоков. Давайте кратко рассмотрим эти и другие дополнительные функции и улучшения производительности на A11.
Начнем с блоков изображений. Блок изображения — это двумерная структура данных в тайловой памяти. Функции фрагмента могут получить доступ только к одному пикселю, соответствующему его местоположению, тогда как ядра могут получить доступ ко всему блоку изображения. Каждый пиксель может быть довольно сложным, состоящим из нескольких компонентов, и каждый компонент может рассматриваться как отдельная плоскость изображения. Блоки изображений также обеспечивают массовый доступ к аппаратному обеспечению преобразования формата графического процессора. Пиксели с плавающей запятой будут преобразованы в целевой формат текстуры при сохранении в память устройства. Тайловые шейдеры предоставляют возможности вычислений, встроенные в проходы рендеринга. Тайловые шейдеры могут получить доступ ко всему блоку изображения, и, как и обычные вычислительные ядра, они поддерживают память группы потоков. В отличие от памяти группы потоков вычислительного ядра, память группы потоков тайлового шейдера сохраняется на протяжении всего времени существования плитки, точно так же, как данные о цвете сохраняются при отрисовке. Таким образом, если раньше вы были ограничены обменом данными между отрисовками в пределах области видимости пикселя с помощью функции выборки кадрового буфера, то теперь вы можете обмениваться данными между диспетчеризацией тайлов и вызовами отрисовки фрагментов, используя более широкую область действия тайла. Давайте теперь посмотрим, как A11 улучшает MSAA по сравнению с предыдущими поколениями. Графические процессоры Apple серии A имеют очень эффективную реализацию MSAA. Когда фрагмент не является фрагментом края, аппаратное смешивание выполняется один раз для каждого фрагмента, а не один раз для каждого семпла. Кроме того, вы можете выполнять разрешение непосредственно из памяти плитки во вложение разрешения и избежать дополнительной пропускной способности памяти. Используя функцию целевого объекта рендеринга без памяти в Metal, вы также можете полностью отказаться от хранения в памяти целевого объекта рендеринга MSAA. С Metal 2 на A11 мы еще больше продвинулись в MSAA. В то время как наши текущие графические процессоры серии A уже отслеживают края в пикселях, графический процессор A11 расширяет это отслеживание до еще более точной детализации, отслеживая количество уникальных выборок в каждом пикселе. Это аппаратное изменение делает ваши приложения с несколькими семплами быстрее, не требуя каких-либо изменений в вашем приложении. С A11 Metal 2 также дает вам полный контроль над метаданными отслеживания с контролем покрытия образца блока изображения. Вы также можете использовать эту функцию в сочетании с блоками изображений групп потоков и тайловыми шейдерами. С помощью контроля покрытия выборки imageblock ваш конвейер плиток может изменять данные отслеживания покрытия выборки графическим процессором, что позволяет вам разрешать данные выборки в любое время в проходе рендеринга с помощью собственного пользовательского алгоритма разрешения. Группы порядка растра позволяют получить доступ к памяти из перекрывающихся функций фрагмента в порядке отправки и позволяют функциям фрагмента обмениваться данными. A11 расширяет функциональные возможности групп порядка растров. Во-первых, A11 предоставляет внутреннюю тайловую память графического процессора. Группы порядка растра делают память листов более полезной, предоставляя вам доступ к ней в предсказуемом порядке. Во-вторых, там, где группы растрового порядка на других графических процессорах ограничены только одним мьютексом на пиксель, A11 может работать более мелко, чем это, позволяя еще более легкое прикосновение и сводя к минимуму частоту ожидания доступа вашими потоками.
Теперь давайте посмотрим, как Metal 2 ускоряет обмен данными между потоками и группами потоков. Язык затенения Metal 2 расширяет атомарные функции с помощью атрибутов порядка и области памяти. Эти новые дополнения открывают новые способы гибкого и эффективного обмена данными между потоками. До Metal 2 для связи между группами потоков требовалось завершение выполнения ядра и выпуск нового ядра для использования выходных данных групп потоков первого ядра. В Metal 2 группы потоков могут напрямую взаимодействовать друг с другом. Кроме того, с добавлением этих новых функций потоки в группе потоков могут взаимодействовать без использования барьера, что приводит к повышению производительности.
Мы также добавили некоторые другие важные функции и возможности в Metal 2 на A11. На A11 математика f16 имеет в целом лучшую точность благодаря улучшениям округления и обработки максимального значения. В A11 добавлена поддержка массивов текстурных кубов и представлены функции чтения и записи текстур. С A11 массив охвата сэмплера приходит к графическим процессорам серии A. A11 добавляет функцию пост-глубинного охвата и обеспечивает более гибкий способ диспетчеризации вычислительных ядер. A11 также добавляет поддержку операций перестановки в четырех областях. Дополнительные сведения об этих функциях см. в документации по Metal 2. A11 значительно улучшает производительность графического процессора. Он имеет двукратное увеличение математической производительности, когда речь идет о задачах компьютерного зрения, обработки изображений и машинного обучения. Но это не единственная область улучшения производительности. Давайте рассмотрим улучшенную производительность и возможности графического процессора A11. Мы удвоили скорость математической и текстурной фильтрации F16 за такт по сравнению с графическим процессором A10. Обратите внимание: в A11 использование типов данных F16 в ваших шейдерах, когда это возможно, дает гораздо большую разницу в производительности. Мы удвоили максимальный размер группы потоков с 512 до 1 КБ на A11.