"Великий" ШІ не допоможе США у війні з Китаєм: чому підхід Маска небезпечний для армії
Дослідники дійшли висновку, що "малий" ШІ в деяких випадках корисніший для військовослужбовців, ніж великі енергоємні моделі.
Сьогодні у сфері штучного інтелекту (ШІ) переважає принцип "що більше, то краще", однак нове дослідження показує, що такий підхід може підірвати розроблення ШІ-технологій, необхідних американським військовослужбовцям зараз і в майбутньому. Про це йдеться в матеріалі Defense One.
Звідки взялася ідея "більше — краще" в ШІ
Дослідники Гаель Вароко з Університету Париж-Сакле, Александра Саша Луччоні з Інституту ШІ Квебека та Мередіт Віттакер із Signal Foundation у своїй статті "Ажіотаж, стійкість і ціна парадигми "більше — краще" в ШІ" вивчили історію формування згаданого принципу у сфері ШІ. Вони виявили, що ця ідея була сформульована ще у 2012 у статті професора Університету Торонто Алекса Крижевська.
У своїй роботі Алекс Крижевськ стверджував, що великі обсяги даних і великомасштабні нейронні мережі дають набагато кращі результати для класифікації зображень, ніж більш дрібні. Цю ідею підтримали інші дослідники, і згодом цей підхід став панівним серед великих ШІ-компаній.
"Наслідком цього є як вибух інвестицій у великомасштабні моделі ШІ, так і супутній стрибок у розмірах помітних (високоцитованих) моделей. Генеративний ШІ, чи то для зображень, чи то для тексту, вивів це припущення на новий рівень, як у межах дисципліни дослідження ШІ, так і як компонент популярного наративу "більше — значить краще", що оточує ШІ", — ідеться в дослідженні.
Чи виправданий принцип "більше — краще"
У матеріалі йдеться про те, що продуктивність великих моделей ШІ не завжди виправдовує ресурси, які потрібні для їхнього функціонування. Крім того, концентрація зусиль у галузі ШІ у відносно невеликій кількості великих технологічних компаній несе в собі геополітичні ризики.
Незважаючи на те, що Міністерство оборони США приділяє увагу як великим моделям ШІ, так і менш масштабним проєктам, експерти побоюються, що майбутні дослідження в галузі "малого" ШІ можуть бути обмежені через дедалі більший вплив великих ШІ-компаній.
Як приклад наводиться висловлювання колишнього голови Google Еріка Шмідта, який заявив, що компанії та уряди повинні продовжувати займатися енергоємними великими моделями ШІ незалежно від вартості енергії, оскільки "ми все одно не досягнемо кліматичних цілей". Водночас екологічні витрати, зокрема споживання енергії, зростають значно швидше, ніж поліпшення продуктивності моделей ШІ.
Чому принцип "більше — краще" небезпечний для армії
Експерти зазначають, що дослідження в галузі ШІ за принципом "більше — значить краще" призводять до звуження і втрати різноманітності в цій сфері. Як зазначають у Defense One, це звуження може мати негативні наслідки для розроблення ШІ військовими. Річ у тім, що менші моделі ШІ можуть бути важливими в місцях, де комп'ютерних ресурсів мало, а зв'язок переривчастий, рідкісний або навіть відсутній.
"Надзвичайно часто буває так, що дрібніші, більш орієнтовані на завдання моделі працюють краще, ніж великі, широкопрофільні моделі, під час розв'язання конкретних завдань нижче за течією", — ідеться в окремій статті, опублікованій групою дослідників із Берклі.
Як приклад наводяться БпЛА, що працюють під дією РЕБ, і невеликі бази на передових позиціях, де енергії мало, а зв'язок слабкий. Оператори можуть зіткнутися з низкою ситуацій, коли їм може стати в пригоді модель ШІ, що працює на відносно невеликому масиві даних і не потребує для роботи масивної серверної ферми або великої кількості графічних процесорів. Це можуть бути додатки для аналізу зображень з БпЛА і супутників, а також технології для опрацювання економічних, погодних, демографічних та інших даних для планування більш ефективних і безпечних операцій у містах.
"Але, якщо галузь досліджень ШІ віддає пріоритет експертизі в галузі великого ШІ над малим, це може означати менше досліджень і менше експертів для навчання операторів тому, як добре створювати власні невеликі моделі ШІ", — зазначають у виданні.
Ще один потенційний наслідок пріоритетного розвитку "великого" ШІ — концентрація влади. Лише деякі компанії володіють ресурсами для створення і розгортання великих моделей. Як приклад згадується Ілон Маск, який є одним із найбагатших оборонних підрядників у світі. Ілон Маск також стає одним із ключових фінансових гравців у розробленні майбутнього ШІ.
"Концентрована приватна влада над ШІ створює невеликий і фінансово вмотивований сегмент осіб, які ухвалюють рішення в галузі ШІ. Ми повинні розглянути, як така концентрована влада з агентством над централізованим ШІ може формувати суспільство в більш авторитарних умовах", — зазначили дослідники.
У чому перевага "малих" ШІ
Як зазначають у Defense One, новий клас фахівців у галузі ШІ також поділяє думку, що концентрація на "великому" ШІ заглушає підходи, які могли б бути більш корисними для конкретних груп. Так, генеральний директор стартапу ШІ Useful Sensors Піт Ворден сказав виданню, що одержимість індустрії та академічних кіл більш масштабним ШІ упускає те, чого більшість людей насправді хочуть від ШІ.
"Академічні бенчмарки розходяться з вимогами реального світу. Наприклад, багато клієнтів просто хочуть мати можливість витягувати результати з наявної інформації (наприклад, посібників користувача), а не генерувати новий текст у відповідь на запитання, але дослідники не вважають це цікавим", — пояснив Піт Ворден.
Зі свого боку Дрю Бреуніг, екскерівник проєктів з науки про дані та стратегічних клієнтів у PlaceIQ, який зараз працює в Precisely, додав, що високі очікування багатьох людей щодо великих моделей ШІ навряд чи будуть виправдані.
Дрю Бреуніг ділить ШІ на три групи. Перша — "боги", яких він визначає, як "надрозумні штуки з ШІ" і "заміна людям, які роблять багато різних речей без нагляду". Нижче в ієрархії знаходяться "стажисти", яких він описує як "специфічні для предметної області додатки, що допомагають експертам з напруженою і виснажливою роботою, роблячи те, що міг би зробити стажист". Ці моделі перебувають під наглядом експертів.
Третю, найбільш локальну форму ШІ, Дрю Бреуніг назвав "шестерінки". Це моделі, налаштовані на виконання одного завдання, з дуже низькою стійкістю до помилок, що працюють без нагляду в додатках або конвеєрах. За словами експерта, це найпоширеніший вид ШІ, який використовують компанії — усі великі платформи переключилися на допомогу компаніям у завантаженні їхніх даних для налаштування моделей ШІ, які можуть добре виконувати якесь одне завдання.
"Крута річ у зосередженні на шестерінках полягає в тому, що ви можете зробити так багато з маленькими моделями! Крихітна модель, налаштована на щось одне, може перевершити гігантську загальну модель під час виконання того самого завдання", — підсумував експерт.
Нагадаємо, раніше американські сенатори Меггі Хассан і Маршу Блекберн заявили, що Китай домагається успіхів у квантовій інформаційній науці, перевершуючи в цьому напрямі розробки США за масштабом і охопленням.
Також повідомлялося, що остання модель штучного інтелекту OpenAI o1 демонструє відхід від людського мислення, займаючись пошуком правильних відповідей методом проб і помилок.