Фальшиве минуле від ШІ. Як нейромережі можуть перетворити історію на фейк
Штучний інтелект здатний створювати як фейкове сьогодення, так i фейкове минуле. Про це попереджає професор політології Джейкоб Шапіро у колонці для New York Times – і пропонує механізм захисту.
Нам не потрібно уявляти світ, у якому дипфейки можуть настільки правдоподібно імітувати голоси політиків, що їх можна використовувати для розпалювання скандалів, які можуть вплинути на вибори. Це вже тут. На щастя, існує безліч причин для оптимізму щодо спроможності суспільства виявляти фейкові ЗМІ та підтримувати загальне розуміння поточних подій.
Але хоча ми маємо підстави вважати, що майбутнє може бути безпечним, ми стурбовані тим, що минуле таким не є.
Історія може стати потужним інструментом для маніпуляцій та зловживань. Той же генеративний ШІ, який може фальсифікувати поточні події, може також фальсифікувати і минулі. Новий контент може бути захищений за допомогою вбудованих систем — але існує цілий світ контенту, який не має водяних знаків (що досягається шляхом додавання непомітної інформації до цифрового файлу, щоб можна було відстежити його походження). Як тільки водяні знаки при створенні стануть широко поширеними і люди звикнути не довіряти контенту, на якому немає водяних знаків, тоді все, створене до цього моменту, буде набагато легше ставити під сумнів.
І це створить скарбницю можливостей для перевірки справжності документів: від фотографій, що ставлять історичних особистостей у компрометуючі ситуації, до зміни окремих текстів в історичних газетах та зміни імен у документах, що підтверджують право власності. Хоча всі ці методи використовувалися і раніше, протистояти їм стає набагато складніше, коли вартість створення майже ідеальних підробок зменшена радикально.
Є багато прикладів того, як економічні та політичні сили маніпулювали історичними подіями у своїх цілях. Сталін вичистив з історії нелояльних товаришів, стративши їх, а потім змінивши фотографії, щоб створити враження, ніби їх ніколи не існувало. Словенія, ставши незалежною країною 1992 року, видалила з реєстру мешканців понад 18 000 осіб — переважно представників циганської меншини та інших етнічних несловенців. Згідно зі звітом Комісара Ради Європи з прав людини за 2003 рік, у багатьох випадках уряд знищував їхні фізичні дані, що призводило до втрати ними будинків, пенсій та доступу до інших послуг.
Фальшиві документи є ключовою частиною багатьох спроб переписати історію. Сумнозвісні "Протоколи сіонських мудреців", вперше опубліковані в російській газеті в 1903 році, нібито являли собою протоколи засідань єврейської змови з метою контролю над світом. Вперше дискредитовані у серпні 1921 року як підробка, отримана з безлічі незв'язаних джерел, "Протоколи" посідали чільне місце в нацистській пропаганді і тривалий час використовувалися для виправдання антисемітського насильства, включаючи цитату у статті 32 установчого договору ХАМАСу.
У 1924 році "Лист Зінов'єва", який нібито був секретним комюніке глави Комуністичного Інтернаціоналу з Москви голові Комуністичної партії Великобританії з метою мобілізувати підтримку для нормалізації відносин з Радянським Союзом, було опубліковано газетою Daily Mail за чотири дні до виборів. Скандал, що виник, міг коштувати лейбористам поразки. Походження листа так і не було доведено, але його справжність і в той час піддавалася сумніву, а офіційне розслідування 1990-х років прийшло до висновку, що він, швидше за все, був справою рук "білих росіян" — консервативної політичної фракції, очолюваної в той час час російськими емігрантами, що виступали проти лейбористського уряду.
Через десятиліття операція "Інфекція", радянська дезінформаційна кампанія, використовувала підроблені документи для поширення ідеї про те, що Сполучені Штати винайшли ВІЛ, вірус, що викликає СНІД, як біологічну зброю. А у 2004 році CBS News відкликала спірну історію, оскільки не змогла підтвердити справжність документів, які пізніше були дискредитовані як підробки, що поставило під сумнів попередню службу президента Джорджа Буша у ВПС Національної гвардії Техасу.
У міру того, як створювати історичну дезінформацію стає легше, а обсяг цифрових фейків стрімко зростає, з'явиться можливість перекроїти історію чи принаймні поставити під сумнів наше нинішнє розуміння її.
Перспективи політичних діячів ефективно змінити історію за допомогою генеративного ШІ – не кажучи вже про шахраїв, які створюють фальшиві юридичні документи та записи транзакцій – лякає. На щастя, шлях вперед проклали ті ж компанії, які створили ризик.
Індексуючи значну частку світових цифрових медіа для навчання своїх моделей, ШІ-компанії фактично створили системи та бази даних, які незабаром будуть містити весь записаний у цифровому форматі контент людства або принаймні його значну частину. Вони могли б вже сьогодні розпочати роботу із запису версій цих первинних документів з водяними знаками, включаючи газетні архіви та широкий спектр інших джерел, щоб подальші підробки були миттєво виявлені.
Така робота пов'язана із деякими перешкодами. Спроби цифрових бібліотек Google відсканувати мільйони бібліотечних книг світу і зробити їх доступними в Інтернеті зіткнулися з обмеженнями інтелектуальної власності, внаслідок чого історичний архів виявився непридатним для досягнення своєї мети — зробити ці тексти доступними для пошуку будь-кому, хто має підключення до Інтернету. Ті самі проблеми інтелектуальної власності змушують авторів і компанії турбуватися як щодо навчальних даних, що надаються генеративному ШІ, так і щодо наслідків при його використанні для створення контенту.
Враховуючи цю складну історію, включаючи невдалі інвестиції Google у проект цифрових бібліотек, хто візьметься за такі масштабні зусилля зі створення незмінних версій історичних даних? І уряд, і промисловість мають сильні стимули для цього, і багато проблем інтелектуальної власності, пов'язані з наданням онлайн-архіву з можливістю пошуку, не застосовуються до створення версій документів з водяними знаками та відмітками часу, оскільки ці версії не обов'язково повинні бути загальнодоступними. Можна порівняти заявлений документ із записаним архівом, використовуючи математичне перетворення документа, відоме як хеш, той самий метод, який використовує Глобальний інтернет-форум боротьби з тероризмом, щоб допомогти компаніям перевіряти відомий терористичний контент.
Крім суспільного блага та захисту громадян від небезпек, пов'язаних із маніпулюванням історичними відомостями, створення перевірених записів старих документів може бути цінним для великих ШІ-компаній. Дослідження показують, що коли ШІ-моделі навчаються на даних, згенерованих штучним інтелектом, їхня продуктивність швидко погіршується. Таким чином, відокремлення того, що насправді є частиною історичних даних, від новостворених "фактів" може мати вирішальне значення.
Збереження минулого також означатиме збереження даних навчання, пов'язаних з ними інструментів і навіть середовища, в якому ці інструменти використовувалися. Гвинт Серф, піонер Інтернету, назвав цей тип записів "цифровим пергаментом", і він необхідний захисту інформаційного середовища.
Такий пергамент буде потужним інструментом. Це може допомогти компаніям створювати якісніші моделі, дозволяючи їм розуміти, які дані слід включати, щоб отримати кращий контент. Це також допоможе регулюючим органам перевіряти упередженість та шкідливий контент.
Технологічні гіганти вже роблять аналогічні зусилля щодо запису нового контенту, який створюють їх моделі — частково тому, що їм необхідно навчати свої моделі на тексті, згенерованому людиною, а дані, отримані після впровадження великих мовних моделей, можуть бути зіпсовані згенерованим контентом.
Настав час розповсюдити ці зусилля і назад у часі, перш ніж наша політика буде серйозно перекручена фейковою історією.
Автор висловлює особисту думку, яка може не співпадати із позицією редакції. Відповідальність за опубліковані дані у рубриці "Думки" несе автор.