Дармовая рабочая сила: почему вы бесплатно работаете на ИИ стоимостью миллиарды долларов
Большинство бесплатных чат-ботов с искусственным интеллектом (ИИ), таких как ChatGPT, Claude и Gemini, работают на моделях, которые улучшаются с помощью так называемого обучения с подкреплением от человеческой обратной связи (RLHF).
Любое взаимодействие с ИИ, включая вопросы, оценки и реакции на ответы, используется системой для обучения. Ваши предпочтения фиксируются и обрабатываются, и в конце концов модель настраивается, чтобы быть более "полезной", сообщает Notebookcheck.
"Если вы используете бесплатные инструменты искусственного интеллекта, поздравляем, вас пригласили в глобальную неоплачиваемую рабочую силу", — отмечают в издании.
Более того, пользователи платных чат-ботов также не могут быть уверены, что не обучают ИИ. Например, OpenAI использует разговоры как бесплатных, так и платных пользователей для улучшения своих моделей, если вы не отключите "историю чатов". То же самое касается Gemini и Claude.
Такие компании, как Sama, Surge AI и Scale AI, предоставляют похожие услуги, нанимая людей для ранжирования ответов, обозначения галлюцинаций и классификации подсказок ИИ. Обычно это низкооплачиваемая работа, распространенная в развивающихся странах.
"Реальные люди снова и снова нажимают кнопку "этот ответ лучше". И именно этот цикл обратной связи питает ботов. Если вы предоставляете такой же тип отклика с помощью лайков, вы фактически выполняете мини-версию их работы... бесплатно", — отметили авторы статьи.
Обучение ИИ: как это происходит
Как объясняют эксперты, отзывы не обучают основную ИИ-модель напрямую. Они влияют на модели вознаграждений, меньшие системы, которые указывают основному ИИ, как себя вести. Поэтому, когда вы говорите: "Мне этот ответ нравится больше", вы помогаете построить внутренний компас, которого придерживается большая модель.
Кроме того, ИИ запоминает тон разговора, например, саркастический, академический или жестоко прямолинейный. Если постоянно взаимодействовать с системой в определенном стиле, она начнет отвечать в таком же духе.
Таким образом, ваши шаблоны поведения формируют часть коллективного опыта обучения ИИ, особенно если чат-бот видит, что другим нравится определенный стиль высказывания. При этом ему не нужно получать разрешение на копирование ваших манер.
ВажноВ издании отметили, что рынок учебных данных сегодня переживает бум. Прогнозируется, что объем мирового рынка учебных данных вырастет с 1,5 миллиарда долларов в 2023 году до более 4,6 миллиарда долларов к 2030 году. Хотя эти цифры включают и синтетические данные и курируемые наборы данных, ценность информации, поступающей от реальных людей, растет ежедневно.
"Это не означает, что вы должны прекратить использовать искусственный интеллект, но вы должны знать, во что вносите свой вклад. И, возможно, просто возможно, попросить немного прозрачности взамен. В конце концов, если вашего бесплатного труда достаточно, чтобы сформировать следующее поколение моделей искусственного интеллекта стоимостью миллиард долларов, меньшее, что они могут сделать, это поблагодарить", — подытожили авторы материала.
Напомним, новое исследованием Университетского колледжа Лондона и Google DeepMind показало, что большие языковые модели (LLM), такие как ChatGPT, иногда теряют уверенность во время ответов на вопросы и отказываются от правильных вариантов под влиянием других ИИ.