Дармова робоча сила: чому ви безкоштовно працюєте на ШІ вартістю мільярди доларів
Більшість безкоштовних чат-ботів зі штучним інтелектом (ШІ), таких як ChatGPT, Claude та Gemini, працюють на моделях, які покращуються за допомогою так званого навчання з підкріпленням від людського зворотного зв'язку (RLHF).
Будь-яка взаємодія зі ШІ, включно з питаннями, оцінками та реакціями на відповіді, використовується системою для навчання. Ваші вподобання фіксуються та обробляються, і зрештою модель налаштовується, щоб бути більш "корисною", повідомляє Notebookcheck.
"Якщо ви використовуєте безкоштовні інструменти штучного інтелекту, вітаємо, вас запросили до глобальної неоплачуваної робочої сили", — зазначають у виданні.
Ба більше, користувачі платних чат-ботів також не можуть бути впевненими, що не навчають ШІ. Наприклад, OpenAI використовує розмови як безкоштовних, так і платних користувачів для покращення своїх моделей, якщо ви не вимкнете "історію чатів". Те саме стосується Gemini та Claude.
Такі компанії, як Sama, Surge AI та Scale AI, надають схожі послуги, наймаючи людей для ранжування відповідей, позначення галюцинацій та класифікації підказок ШІ. Зазвичай це низькооплачувана робота, розповсюджена в країнах, що розвиваються.
"Реальні люди знову і знову натискають кнопку "ця відповідь краща". І саме цей цикл зворотного зв'язку живить ботів. Якщо ви надаєте такий самий тип відгуку за допомогою лайків, ви фактично виконуєте мініверсію їхньої роботи… безкоштовно", — наголосили автори статті.
Навчання ШІ: як це відбувається
Як пояснюють експерти, відгуки не навчають основну ШІ-модель безпосередньо. Вони впливають на моделі винагород, менші системи, які вказують основному ШІ, як поводитися. Тож, коли ви кажете: "Мені ця відповідь подобається більше", ви допомагаєте побудувати внутрішній компас, якого дотримується велика модель.
Окрім того, ШІ запам'ятовує тон розмови, наприклад, саркастичний, академічний чи жорстоко прямолінійний. Якщо постійно взаємодіяти з системою у певному стилі, вона почне відповідати в такому ж дусі.
Таким чином, ваші шаблони поведінки формують частину колективного досвіду навчання ШІ, особливо якщо чат-бот бачить, що іншим подобається певний стиль висловлювання. При цьому йому не потрібно отримувати дозвіл на копіювання ваших манер.
У виданні наголосили, що ринок навчальних даних сьогодні переживає бум. Прогнозується, що обсяг світового ринку навчальних даних зросте з 1,5 мільярда доларів у 2023 році до понад 4,6 мільярда доларів до 2030 року. Хоча ці цифри включають і синтетичні дані та куровані набори даних, цінність інформації, що поступає від реальних людей, зростає щодня.
"Це не означає, що ви повинні припинити використовувати штучний інтелект, але ви повинні знати, у що робите свій внесок. І, можливо, просто можливо, попросити трохи прозорості натомість. Зрештою, якщо вашої безкоштовної праці достатньо, щоб сформувати наступне покоління моделей штучного інтелекту вартістю мільярд доларів, найменше, що вони можуть зробити, це подякувати", — підсумували автори матеріалу.
Нагадаємо, нове дослідженням Університетського коледжу Лондона та Google DeepMind показало, що великі мовні моделі (LLM), такі як ChatGPT, іноді втрачають впевненість під час відповідей на запитання та відмовляються від правильних варіантів під впливом інших ШІ.