В последние годы развитие сегмента бытовой электроники характеризуется ярко выраженной сменой тенденций. Из-за избыточности, дальнейшее улучшение параметров компонентов часто не обеспечивает адекватного улучшения модели. Кроме того, их дальнейшее совершенствование зачастую обходится очень дорого. В список таких примеров входят 8K телевизоры (ограниченный контент 8K) или ультраяркие телевизионные панели (пиковая яркость Samsung Neo QLED QN90A 4K превышает 1,500 нит, что важно только для практически недоступного HDR-контента).
Схожая ситуация и в других сегментах. Например, анонсированный Google Pixel 6a за $ 450 будет использовать Google Tenzor, который сегодня уверенно входит в число лучших на рынке.
Но сегодня SoC даже бюджетных моделей обеспечивают избыточную производительность.
Конечно, лидеры отрасли отслеживают эти тенденции, корректируя свою стратегию. Возможно, разработка Google Tensor была обусловлена этим фактором.
Несколько лет назад Google Gboard сосредоточил свои усилия на повышении эффективности гетерогенных вычислений и рабочих нагрузок с помощью машинного обучения (ML). В прошлом, алгоритмы машинного обучения использовали только облачную обработку, которая имеет практически неограниченный объем для хранения огромных баз данных. К сожалению, у него есть несколько существенных недостатков, в том числе более медленное время отклика, проблемы с конфиденциальностью и ограниченная пропускная способность. Быстро развивающееся направление под названием ‘Федеративное обучение’ использует машинное обучение на устройствах и в облаке, и может позиционироваться как гибрид. Уникальная конфигурация Google Tensor (2+2+4 вместо традиционной 1+3+4) предназначена для расширения обучения на устройстве, с минимальной обоаботкой в облаке.
ML уже значительно расширил функциональность телефона. В этот список входят, например, Smart Reply, Recorder App, Live Caption, алгоритм HDRNet, Single Take, Adaptive Brightness (автоматическая регулировка яркости экрана) и т. д. Большинство из них практически моментально становятся популярными среди потребителей, доказывая свою востребованность. р>
Учитывая великолепные перспективы дальнейшего развития ML-приложений, Google Tensor SoC вполне обоснованно вызывает повышенный интерес.
Машинное обучение (ML)
В целом машинное обучение — это одно из направлений искусственного интеллекта (ИИ), основанное на использовании массивов данных для формирования алгоритмов управления. Анализируя решения множества однотипных задач, информационные системы самостоятельно выявляют закономерности и предлагают решения.
Возможно, краткая иллюстрация использования машинного обучения будет кому-то интересна. Например, в текстовых алгоритмах машинное обучение работает следующим образом.
Фрагмент текста может быть осмысленным или бессмысленным, например, «Майкл любит ловить рыбу, Джон предпочитает кататься на велосипеде, Смит с удовольствием читает книги, но все они страстные футбольные фанаты» или «kcxhIkGnvjdhPhfdRWjshfdldkjOPqS». ML-алгоритм должен обеспечить их отличие друг от друга. По аналогии с алгоритмами антивирусных программ, осмысленный текст можно назвать «чистым», а мусор — «вредоносным». Фактически разработчик должен формализовать разницу между ними.
ML решает эту проблему с помощью базы данных, содержащей частоту всех сочетаний букв в обычном тексте. В нашем примере:
— ит — 4 раза;
— ло — 2 раз и т.д.
В результате алгоритм запоминает, что, например, вероятность «ит» в ‘чистом’ тексте вдвое больше, чем «ло». Затем программа анализирует «правдоподобность» проверяемой строки или абзаца, перемножая количество всех буквенных комбинаций. Полученное после извлечения корня значение характеризует вероятность «чистого»/«вредоносного» текста. Его малое значение соответствует подозрительно большому количеству редких буквосочетаний, характерному для «вредоносного» текста. Среднее значение и критические отклонения вычисляются и сохраняются программой с помощью обучающих примеров.
Но, конечно же, текстовые алгоритмы — это очень малая часть возможностей машинного обучения.
Google Tensor SoC
Конечно, анонсированный Google Tensor второго поколения (кодовое название GS201) может стать одной из сенсаций этого года.
Tensor SoC (2021 г.) с Tensor Processing Unit (TPU) от Google в основном предназначен для улучшения обработки изображений с помощью машинного обучения.
Как известно, Google активно сотрудничает с Samsung в совместной разработке и производстве Tensor SoC. Может быть, поэтому его графический процессор, модем и даже некоторые архитектурные аспекты, например, часы и управление питанием, похожи на Exynos 2100.
Собственная SoC позволила компании отказаться от дополнительных Pixel Visual Core и чипа безопасности Titan M.
Возможно, новая SoC не поразила воображение с точки зрения прироста производительности, но компания честно предупреждала, что этот аспект второстепенен. Разработчики сосредоточили свои усилия на повышении производительности при решении таких задач, как языковой перевод субтитров в реальном времени, преобразование текста в речь без подключения к Интернету, обработка изображений и другие возможности на основе машинного обучения со встроенным TPU. В результате, он впервые обеспечил 4K@60fps для Google HDRNet алгоритма.
Фактически, TPU улучшил производительность машинного обучения без подключения к облаку. Это уменьшило задержку и потребление батареи.
Более того, ядро безопасности Titan M2 хранит и обрабатывает конфиденциальную информацию (биометрическая криптография и т. д.), дополнительно повышая безопасность.
В целом, флагманы Snapdragon и Exynos от Qualcomm и Samsung получили весьма грозного конкурента.
Тесты
Осенние утечки были не совсем точными. Но сегодня уже доступен более точный анализ.
Tensor vs Snapdragon 888 vs Exynos 2100 (все 5 нм, модем 4G LTE и оперативная память LPDDR5)
CPU
– 2x Arm Cortex-X1 (2,80 ГГц) + 2x A76 (2,25 ГГц) + 4x A55 (1,80 ГГц) vs
— 1x Arm Cortex-X1 (2,84 ГГц) + 3x A78 (2,4 ГГц) + 4x A55 (1,8 ГГц) vs
— 1x Arm Cortex-X1 (2,90 ГГц) + 3x A78 (2,8 ГГц) + 4x A55 (2,2 ГГц);
GPU
— Arm Mali-G78 MP20 vs Adreno 660 vs Arm Mali-G78 MP14;
ML
— Tensor Processing Unit vs Hexagon 780 DSP vs Triple NPU + DSP.
Два высокопроизводительных ядра Cortex-X1 за счет средних ядер — главное отличие Tenzor. Сегодня он использует уникальную конфигурацию 2+2+4 (большой, средний, маленький) вместо традиционной (1+3+4). По словам разработчиков, она лучше подходит для более ресурсоемких рабочих нагрузок и задач машинного обучения.
Использование Cortex-A76 вместо более производительных A77 и A78 может показаться спорным. Но, вероятно, на то есть веские причины.
Тесты
Tensor vs Snapdragon 888 vs Exynos 2100
— CPU — Geekbench 5 (одноядерный/многоядерный) – 1014/2679 vs 1100/3223 vs 1109/3620.
Для сравнения, max (Apple A15 Bionic) — 1722/4768, min (Exynos 990) — 914/2791;
— GPU (3DMark) – 6621 vs 5687 vs 5774.
Для сравнения, max (8 Gen 1 в Samsung Galaxy S22 Ultra) — 9841, min (Dimensity 1200 AI) — 4160;
— Speed Test G (CPU/Mixed/GPU) – 38/20/35 vs 33/18/24 vs 33/20/33.
Для сравнения, max — Snapdragon 888, min (Snapdragon 765G) — 57/30/54.
Формально Qualcomm и Samsung немного опережают Tensor, но с учетом явно избыточной производительности всех SoC, этот аспект неважен.
Графический процессор Tensor с 6 дополнительными ядрами показывает более высокую производительность по сравнению с Exynos 2100, но некоторые стресс-тесты сопровождаются температурным throttling.
Заключение
В определенной степени, Google Tensor ознаменовал новую эру в развитии телефонов. Помимо производительности, разработчики сосредоточили свои усилия на оптимизации SoC с учетом AI и ML. Эти инструменты должны способствовать дальнейшему расширению функциональных возможностей за счет повышения эффективности разнородных вычислений и рабочих нагрузок.
Сегодня даже компоненты бюджетного сегмента часто имеют избыточную производительность. Например, новый Google Pixel 6a стоимостью лишь $ 450 использует мощный Google Tenzor, который уверенно входит в число лучших на рынке.
В то же время список новых популярных приложений за последние несколько лет расширился за счет Smart Reply, Recorder App, Live Caption, алгоритма HDRNet, Single Take и т. д.
Предварительно, SoC Tensor следующего поколения с кодовым названием GS201 будет построен на 4-нм техпроцессе и будет использовать модем Samsung Exynos 5300 5G, который еще пока не анонсирован. Возможно, у него будут, например, Cortex-X2, Cortex-A710, Cortex-A510 и улучшенное аппаратное обеспечение Tensor AI вместо Cortex-X1, A76, A55. Но в любом случае он будет оптимизирован для машинного обучения.
В этом видео представляется Tensor SoC следующего поколения.