Мнения

Фальшивое прошлое от ИИ. Как нейросети могут превратить историю в фейк

Искусственный интеллект способен создавать не только фейковое настоящее, но и фейковое прошлое. Об этом предупреждает профессор политологии Джейкоб Шапиро в колонке для New York Times — и предлагает механизм защиты.

04 февраля 2024 в 10:00

1075

Related video

Нам не нужно представлять себе мир, в котором дипфейки могут настолько правдоподобно имитировать голоса политиков, что их можно использовать для разжигания скандалов, которые могут повлиять на выборы. Это уже здесь. К счастью, существует множество причин для оптимизма относительно способности общества выявлять фейковые СМИ и поддерживать общее понимание текущих событий.

Но хотя у нас есть основания полагать, что будущее может быть безопасным, мы обеспокоены тем, что прошлое таковым не является.

История может стать мощным инструментом для манипуляций и злоупотреблений. Тот же генеративный ИИ который может фальсифицировать текущие события, может также фальсифицировать и прошлые. Новый контент может быть защищен с помощью встроенных систем — но существует целый мир контента, который не имеет водяных знаков (что достигается путем добавления незаметной информации в цифровой файл, чтобы можно было отследить его происхождение). Как только водяные знаки при создании станут широко распространенными и люди привыкнуть не доверять контенту, на котором нет водяных знаков, тогда все, созданное до этого момента, будет гораздо легче подвергать сомнению.

И это создаст кладезь возможностей для проверки подлинности документов: от фотографий, ставящих исторических личностей в компрометирующие ситуации, до изменения отдельных текстов в исторических газетах и изменения имен в документах, подтверждающих право собственности. Хотя все эти методы использовались и раньше, противостоять им становится гораздо сложнее, когда стоимость создания почти идеальных подделок радикально снижена.

Есть много примеров того, как экономические и политические силы манипулировали историческими событиями в своих целях. Сталин вычистил из истории нелояльных товарищей, казнив их, а затем изменив фотографии, чтобы создать впечатление, будто их никогда не существовало. Словения, став независимой страной в 1992 году, удалила из реестра жителей более 18 000 человек — в основном представителей цыганского меньшинства и других этнических несловенцев. Согласно отчету Комиссара Совета Европы по правам человека за 2003 год, во многих случаях правительство уничтожало их физические данные, что приводило к потере ими домов, пенсий и доступа к другим услугам.

Важно

ИИ убьет фотографию. Как изменится искусство отражения мира с появлением нейросетей

Фальшивые документы являются ключевой частью многих попыток переписать историю. Печально известные "Протоколы сионских мудрецов", впервые опубликованные в российской газете в 1903 году, якобы представляли собой протоколы заседаний еврейского заговора с целью контроля над миром. Впервые дискредитированные в августе 1921 года как подделка, полученная из множества несвязанных источников, "Протоколы" занимали видное место в нацистской пропаганде и долгое время использовались для оправдания антисемитского насилия, включая цитату в статье 32 учредительного договора ХАМАСа от 1988 года.

В 1924 году "Письмо Зиновьева", якобы являвшееся секретным коммюнике главы Коммунистического Интернационала из Москвы главе Коммунистической партии Великобритании с целью мобилизовать поддержку для нормализации отношений с Советским Союзом, было опубликовано газетой Daily Mail за четыре дня до выборов. Возникший скандал мог стоить лейбористам поражения. Происхождение письма так и не было доказано, но его подлинность и в то время подвергалась сомнению, а официальное расследование 1990-х годов пришло к выводу, что оно, скорее всего, было делом рук "белых русских" — консервативной политической фракции, возглавляемой в то время русскими эмигрантами, выступавшими против лейбористского правительство.

Десятилетия спустя операция "Инфекция", советская дезинформационная кампания, использовала поддельные документы для распространения идеи о том, что Соединенные Штаты изобрели ВИЧ, вирус, вызывающий СПИД, в качестве биологического оружия. А в 2004 году CBS News отозвала спорную историю, поскольку не смогла подтвердить подлинность документов, которые позже были дискредитированы как подделки, что поставило под сомнение предыдущую службу президента Джорджа Буша в ВВС Национальной гвардии Техаса.

По мере того, как создавать историческую дезинформацию становится легче, а объем цифровых фейков стремительно растет, появится возможность перекроить историю или, по крайней мере, поставить под сомнение наше нынешнее понимание ее.

Перспективы политических деятелей эффективно изменить историю с помощью генеративного ИИ – не говоря уже о мошенниках, создающих фальшивые юридические документы и записи транзакций – пугает. К счастью, путь вперед был проложен теми же компаниями, которые создали риск.

Индексируя значительную долю мировых цифровых медиа для обучения своих моделей, ИИ-компании фактически создали системы и базы данных, которые вскоре будут содержать весь записанный в цифровом формате контент человечества или, по крайней мере, его значимую часть. Они могли бы уже сегодня начать работу по записи версий этих первичных документов с водяными знаками, включая газетные архивы и широкий спектр других источников, чтобы последующие подделки были мгновенно обнаружены.

Такая работа сопряжена с некоторыми препятствиями. Попытки цифровых библиотек Google отсканировать миллионы библиотечных книг мира и сделать их легкодоступными в Интернете столкнулись с ограничениями интеллектуальной собственности, в результате чего исторический архив оказался непригодным для достижения своей цели — сделать эти тексты доступными для поиска любому, у кого есть подключение к Интернету. Те же самые проблемы интеллектуальной собственности заставляют авторов и компании беспокоиться как по поводу обучающих данных, предоставляемых генеративному ИИ, так и по поводу последствия при его использовании для создания контента.

Важно

Революция от ChatGPT. Почему весь мир обсуждает нейросеть, очень далекую от совершенства

Учитывая эту сложную историю, включая неудачные инвестиции Google в проект цифровых библиотек, кто возьмется за столь масштабные усилия по созданию неизменяемых версий исторических данных? И у правительства, и у промышленности есть сильные стимулы для этого, и многие проблемы интеллектуальной собственности, связанные с предоставлением онлайн-архива с возможностью поиска, не применимы к созданию версий документов с водяными знаками и отметками времени, поскольку эти версии не обязательно должны быть общедоступными. Можно сравнить заявленный документ с записанным архивом, используя математическое преобразование документа, известное как хэш, тот же метод, который использует Глобальный интернет-форум по борьбе с терроризмом, чтобы помочь компаниям проверять известный террористический контент.

Помимо общественного блага и защиты граждан от опасностей, связанных с манипулированием историческими сведениями, создание проверенных записей старых документов может быть ценным для крупных ИИ-компаний. Исследования показывают, что, когда ИИ-модели обучаются на данных, сгенерированных искусственным интеллектом, их производительность быстро ухудшается. Таким образом, отделение того, что на самом деле является частью исторических данных, от вновь созданных "фактов" может иметь решающее значение.

Сохранение прошлого также будет означать сохранение данных обучения, связанных с ними инструментов и даже среды, в которой эти инструменты использовались. Винт Серф, пионер Интернета, назвал этот тип записей "цифровым пергаментом", и оно необходимо для защиты информационной среды.

Такой пергамент будет мощным инструментом. Это может помочь компаниям создавать более качественные модели, позволяя им понимать, какие данные следует включать, чтобы получить лучший контент. Это также поможет регулирующим органам проверять предвзятость и вредный контент.

Технологические гиганты уже предпринимают аналогичные усилия по записи нового контента, который создают их модели — отчасти потому, что им необходимо обучать свои модели на тексте, сгенерированном человеком, а данные, полученные после внедрения больших языковых моделей, могут быть испорчены сгенерированным контентом.

Пришло время распространить эти усилия и назад во времени, прежде чем наша политика будет серьезно искажена фейковой историей.

Автор выражает личное мнение, которое может не совпадать с позицией редакции. Ответственность за опубликованные данные в рубрике "Мнения" несет автор.

Источник.

Важно

ChatGPT взбунтовался. Почему нейросеть отказывается помогать людям