До чего дошел прогресс. Как искусственный интеллект меняет мобильный рынок

Каким образом "мобильный ум" облегчит жизнь пользователя

Искусственный интеллект – новый тренд в мобильном мире. Теперь при выборе смартфона покупатель обращает внимание не только на дизайн, а и задает себе вопрос – на что способен мой гаджет? Одним из первопроходцев интеграции искусственного интеллекта в процессоры стала компания Huawei. Не в последнюю очередь благодаря интеллектуальным новшествам китайская компания уже несколько лет подряд занимает третье место по количеству проданных смартфонов по всему миру. Кевин Чжоу, руководитель департамента Huawei Consumer BG в Украине, рассказал Фокусу о том, как ИИ ускоряет работу гаджетов, и какие тренды "мобильный ум" создаст в будущем.

Сколько времени Huawei потратил на разработку процессора Kirin 970 в моделях P20 и P20Pro? Насколько он мощнее, чем предшественники, и в чем его уникальность? Почему он является лучшим процессором для работы с ИИ?

До выпуска революционного процессора Kirin 970, первого в мире чипа для смартфона с отдельным процессором для обработки интеллектуальных задач, все подобные процессы выполнялись в облаке. Наш Kirin 970 имеет встроенный нейроморфный процессор (NPU), что позволяет обрабатывать данные и выполнять все задачи глубокого обучения намного быстрее, чем другие решения. Например, при выполнении одной и той же задачи, связанной с ИИ, гетерогенная вычислительная архитектура Huawei повышает энергоэффективность примерно в 50 раз, а производительность — в 25 в сравнении с традиционными чипсетами. Например, NPU может распознавать 2000 изображений в минуту. То есть этот специализированный блок быстрее, работает в режиме реального времени и энергоэффективен. На создание Kirin 970 Huawei потратил около года.

Как искусственный интеллект (ИИ) в мобильном устройстве облегчает жизнь обычного пользователя (за исключением работы камеры)?

Смартфон становится значительно "быстрее", моментально отвечая на действия пользователя. Он не зависает и не выключается. Это будет особенно заметно, если человек играет в современные мобильные игры.

Быстрая работа смартфона зависит от правильного управления ресурсами. Искусственный интеллект анализирует привычки и поведение пользователя и гарантирует, что устройство с течением времени останется таким же производительным, как и сразу после покупки. Умный смартфон отключает процессы, которые не используются в данный момент, а временные файлы автоматически регулярно удаляются из памяти. Все это также продлевает срок службы батареи.

Искусственный интеллект помогает распознавать сторонние помехи во время разговора, отделяя посторонний шум от голоса. Кроме того, он делает возможной работу голосовых помощников. Теперь пользователи могут "разбудить" свой смартфон, запустить какое-либо приложение или совершить поиск с помощью лишь голоса.

Я не могу не сказать о камерах. Когда в вашем телефоне самая лучшая камера, вы и пользуетесь ею чаще, а это означает огромное количество снимков. Тут возникает проблема — очень сложно найти нужную фотографию. Так вот, ИИ в Huawei P20 Pro автоматически сортирует изображения и присваивает им определенные категории и теги, не подключаясь к облаку.

Huawei P20 и P20 Pro автоматически распознают 19 различных сценариев съемки и настраивают параметры камеры для оптимизации изображения. В них даже есть два отдельных режима для съемки кошек и собак, причем ИИ способен идентифицировать 35 различных пород как собаку. Искусственный интеллект помогает выстроить композицию кадра, обеспечивает улучшенную стабилизацию видеосъемки, нивелируя вибрации и позволяя записывать ролики отличного качества. Хорошая стабилизация также позволяет экспонировать изображение в течение 4 секунд, удерживая телефон в руке без штатива. А это уже революция в ночной съемки.

Чего ожидать от интегрированного искусственного интеллекта в мобильных устройствах? Какие новые тенденции в отрасли появятся благодаря ИИ в ближайшие несколько лет?

В октябре 2017 года Huawei выпустила флагманскую модель Huawei Mate10, отличающуюся новыми возможностями фотографии, основанными на распознавании сценариев фотосъемки. Полагаю, что в ближайшем будущем появится больше подобных возможностей, и в этом году они будут широко представлены в основных моделях смартфонов главных игроков рынка.

Мобильные устройства уже не просто телефоны. Они фотокамеры, звуковые колонки, калькуляторы, переводчики... Конкуренция на рынке не ограничивается продуктами, она включает разработки, технологии, возможности, услуги, экосистемы.

Возьмем реализованную нами функцию идентификации продукта. Камера распознает объект, а спустя мгновения смартфон предоставляет релевантную информацию о продукте и рекомендует аналоги. На сегодняшний день рекомендуемые товары показываются через платформу Amazon.

Мы провели тест с увлажнителем воздуха. Первыми двумя рекомендованными вариантами были продукты того же бренда, цвета и размеров. Потом мы "отсканировали" серое женское пальто и тоже получили адекватные рекомендации.

Еще один пример использования искусственного интеллекта — приложение Microsoft Translator, оптимизированное Huawei при технической поддержке Microsoft. Оно имеет 4 основные функции: речевой перевод, перевод текста, перевод изображений и многопользовательская (многоязычная) конференция.

Сначала мы выбрали языковую пару (с китайского на английский) и сказали по-китайски: "Здравствуйте, добро пожаловать в мир искусственного интеллекта". В верхней части экрана мгновенно появился китайский текст, а затем экран сразу отобразил его на английском. Можно добавить и третий язык.

Потом я сфотографировал три абзаца англоязычной статьи, чтобы протестировать возможности перевода с изображения. Так как аппараты не понимают контекста, перевод части статьи является большой проблемой для машинного перевода. Китайский перевод появился поверх английского текста примерно через секунду. Конечно, другие языки тоже поддерживаются. Этот тест продемонстрировал две основные технологии ИИ: распознавание изображений и компьютерный перевод.

"Война" за искусственный интеллект только началась. Эта война — революция, основанная на технологиях. Победителем выйдет тот, кто преуспеет в программном обеспечении, оборудовании и экосистеме. В конце концов, мобильный — это то устройство, которое мы чаще всего используем в повседневной жизни, оно объединяет технологии, ресурсы и услуги. Производители со здоровой экосистемой и цепочкой поставок обладают большими конкурентными преимуществами.

Huawei предлагает не только основное аппаратное обеспечение, но и платформы, основанные на системах ИИ-приложений. Наше положение более выигрышно для того, чтобы завоевать данный сегмент.

Разработка ИИ в мобильных устройствах позволяет ему получить доступ ко всей информации, доступной пользователю. Как владелец смартфона может защитить свои данные от "восстания машин" или просто от сбоя в системе?

Не так давно Facebook стал причиной обеспокоенности миллионов людей из-за скандала по поводу утечки данных. В наше интеллектуальное время пользователи не могут устоять перед мировой тенденцией и загружают свой голос, изображения и видео в систему для распознавания. Но все же кажется странным передавать персональные данные облачному серверу, находящемуся за тысячи километров.

Это вторая причина, по которой смартфоны должны быть оснащены процессором обработки задач, связанных с искусственным интеллектом: обработка на устройстве намного более безопасна. Еще один способ — это синхронизация облака с устройством, то есть обучение аппаратной платформы на облаке и обслуживание пользователей через устройство. Но возможность обработки ИИ-задач на устройстве незаменима.

Для большинства пользователей ИИ в мобильных устройствах — это голосовой помощник. Когда работа этих помощников будет полноценной в Украине (с поддержкой украинского языка)?

В голосовом взаимодействии есть три основных фактора: аппаратное обеспечение, программное обеспечение и сервис. Первое в основном касается качества звука и того, насколько хорошо звук улавливается устройством. Аппаратное обеспечение не так сложно улучшить, в то время как над NLP программного обеспечения и персонализации все еще бьются лучшие умы отрасли.

Интеграция голосовых помощников в приложения — это битва между производителем устройства и разработчиком приложения: если владелец приложения допускает такую интеграцию, он соглашается разделить свой актив с производителем смартфона. Вот почему эта интеграция продвигается медленно. И хоть распознавание речи улучшилось, таким аспектам, как понимание сказанного, обучение и сторонняя интеграция, требуются еще 2-3 года, прежде чем мы сможем увидеть какой-то значительный прогресс.

Huawei завершает разработку собственного голосового помощника HiAssistant, в основе которого лежит технология NLU (Natural Language Understanding). Она позволяет на машинном уровне понимать, что именно хочет человек, говоря те или иные фразы. Иными словами, этот голосовой помощник способен распознавать не отдельно взятые слова, а целые фразы и предложения в зависимости от контекста. То есть пользователи смогут давать голосовые команды, не задумываясь над построением фраз.

Однако в будущем визуальное взаимодействие заменит голосовое. Существующие сегодня разблокировка устройства при помощи распознавания лица и мобильные игры с дополненной реальностью — это первые попытки визуального взаимодействия. Следующим этапом станут бесперебойная видеоконференц-связь и визуальный сенсор, одновременно воздействующий на человека посредством нескольких каналов восприятия. Эти технологии все еще находятся на ранней стадии из-за ограниченного времени автономной работы, пропускной способности сети и технологии светового поля.