Діджитал

Нові можливості: учені наділили ШІ фантазією й уявою

21 липня 2021 в 19:02

Фото: jonesday.com | Штучний інтелект

Використовуючи метод "розплутування", нейромережа може розділяти і рекомбінувати характеристики об'єктів. Це допоможе у створенні ліків, системи автопілота для машин та інших проектах.

Учені із США навчили систему штучного інтелекту "уявляти" обʼєкти, які вона раніше ніколи не бачила.

Детальніше про дослідження написав сайт Університету Південної Каліфорнії (USC).

Намагаючись уявити різні предмети або явища, людина викликає у своєму мозку ланцюжок активацій нейронів і уявляє якесь зображення, грунтуючись на вже наявному життєвому досвіді. Людині легко придумати обʼєкт з різними властивостями: розмірами, забарвленням, положенням тощо, навіть якщо раніше він ніколи не бачив такої комбінації. Але ось навіть просунута нейромережа не могла впоратися з таким завданням … до недавнього часу.

Команда з Каліфорнійського університету на чолі з професором компʼютерних наук Лоуреном Ітті вперше розробила ШІ-систему, яка продемонструвала здатність проявляти уяву, майже так само, як це роблять люди. Дослідники навчили нейромережу комбінувати різні характеристики для отримання нового зображення.

Одна з головних проблем полягала в тому, щоб змусити ШІ самостійно визначати ключові атрибути і переносити їх на різні обʼєкти, адже, як правило, нейромережі виділяють у зразках пікселі, а не окремі властивості. Для цього вчені використовували метод, який називають "розплутуванням". Він застосовується для створення діпфейків, коли обличчя людини і рухи її тіла переносяться на іншу, але зберігають вихідну анімацію — у результаті виходять нові відео і картинки. За цим же принципом автори завантажили в систему групу зразків з 1,56 млн зображень, а не по одному за раз, як це зазвичай роблять при створенні нейромереж.

Зображення, надані нейромережею

Нейромережа змінила фон

Нейромережа змінила положення об'єктів

"Візьмемо як приклад фільм "Трансформери". Зображення може містити щось схоже на автомобіль Мегатрон, у ролі основного обʼєкта, колір жовтого автомобіля Бамблбі в ролі додаткового обʼєкта і Таймс-сквер у Нью-Йорку як фон. У результаті ШІ видасть такий результат: по Таймс-сквер їде автомобіль-Мегатрон кольору Бамблбі. Цікаво, що система розпізнає всі ці обʼєкти, незважаючи на те, що побачила їх уперше", — пояснив один з провідних авторів проекту Юньхан Ге.

Американські розробники стверджують, що їхня нейромережа сумісна майже з будь-якими даними або знаннями і може розширити можливості додатків. Наприклад, розділити інформацію, повʼязану з національністю і статтю людей, або рекомбінувати властивості препаратів для створення нових ліків.

"Технологія глибокого навчання вже продемонструвала неперевершену продуктивність і перспективність у багатьох галузях, але часто вона лише поверхово імітувала те, що ми називаємо фантазією, — без глибокого аналізу окремих атрибутів, які роблять кожен обʼєкт унікальним", — зазначив професор Ітті. "Новий підхід, який ми назвали "розплутуванням" уперше по-справжньому розкрив потенціал ШІ-систем, наблизивши їх до людського розуміння світу".

Раніше вчені навчили ШІ передбачати розвиток агресивного раку грудей. Машинний алгоритм, розроблений у Данії, автоматично аналізує тканини пацієнтів, знаходить біомаркери і дає прогноз появи пухлин третього негативного підтипу. На основі цих даних медики зможуть призначати найбільш ефективне лікування.