Лінгвістичне хакерство. Вчені розшифрували давню граматичну головоломку
Граматична загадка, об яку ламали зуби санскритологи з V ст. до н. е., розкрита. Ріші Раджпопат, доктор філософії, який навчався в Кембриджському університеті, зробив прорив, розшифрувавши правило, якому навчав "батько лінгвістики" Паніні.
Це відкриття дає змогу "вивести" будь-яке санскритське слово — побудувати мільйони граматично правильних слів, зокрема "мантра" та "гуру", — використовуючи шановану "мовну машину" Паніні, яку багато хто вважає одним із найбільших інтелектуальних досягнень у історії, повідомляють Phys.org.
У Фокус.Технології з'явився свій Telegram-канал. Підписуйтесь, щоб не пропускати найсвіжіші та найзахопливіші новини зі світу науки!
Провідні експерти з санскриту називають відкриття революційним, адже тепер граматиці Паніні можна "навчити" комп’ютери.
Система Паніні — 4 000 правил розписаних у "Aṣṭādhyāyī" (з санскриту перекладається як "Вісім правил" або "Восьмичастинний"), написаних близько 500 р. до н. е. — схожа за принципом роботи до машини: взявши базу слова та суфікс, їх можна перевести в граматично коректні слова та фрази через покроковий процес.
До сьогодні була проблема у використанні системи. Часто ставалося так, що два чи більше правила могли застосовуватися на одному й тому ж кроці, змушуючи вчених крутити мозком, яке з них вибрати.
Розв'язання так званих "конфліктів правил", що впливало на мільйони слів, серед яких деякі варіації слів "мантра" та "гуру", потребувало алгоритму. Паніні розробив метаправило, яке мало допомагати розв'язувати "конфлікти правил", проте останні 2500 років дослідники неправильно його трактували, що призвело граматично некоректних результатів.
Намагаючись виправити цю проблему, безліч вчених розробляли сотні своїх метаправил, проте Раджпопат довів, що вони не тільки неспроможні розв'язувати проблему, оскільки породжують безліч винятків, а й взагалі непотрібні. Вчений довів, що "мовна машина" Паніні є самодостатньою.
"Паніні мав екстраординарний розум й розробив машину, яка немає рівних. Він не планував, що ми будемо її доповнювати новими правилами. Чим більше ми возимося з нею, тим гірше розуміємо її суть" — сказав вчений.
Зазвичай науковці трактували метаправило в тому сенсі, що у випадку конфлікту правил рівної сили впливу, слід використовувати те правило, яке йде пізніше по списку.
Раджпопат заперечує це, аргументуючи тим, що Паніні мав на увазі, що між правилами, які застосовуються до лівої та правої частини слова відповідно, необхідно обирати те, яке застосовується до правої частини. Використовуючи таку інтерпретацію метаправила, вчений виявив, що машина Паніні генерує граматично коректні слова практично без винятків.
Візьмемо слова "мантра та "гуру" за приклад. У фразі "Devāḥ prasannāḥ mantraiḥ" ("Боги [devāḥ] задобрюються [prasannāḥ] мантрами [mantraiḥ]") ми стикаємося з "конфліктом правил" коли виводимо "mantraiḥ". Виведення слова починається з бази "mantra" та суфіксу "bhis". Одне правило має впливати на ліву частину ("mantra"), а друге на праву ("bhis"). Необхідно вибрати правило, яке впливає саме на праву частину і тоді отримаємо граматично коректну форму "mantraiḥ".
У фразі "Jñānaṁ dīyate guruṇā" ("Знання [Jñānaṁ] дане [dīyate] гуру [guruṇā]") ми знову стикаємося з "конфліктом правил": Одне правило впливає на "guru", а друге на "ā". Вибравши друге, ми отримуємо правильну форму "guruṇā".
Момент еврики
За шість місяців до того, як Раджпопат зробив своє відкриття, його керівник у Кембриджі Вінченцо Вергіані, професор санскриту, дав йому пророчу пораду: "Якщо роз'язання складне, ви, ймовірно, помиляєтеся".
Раджпопат сказав: "У Кембриджі у мене був момент еврики. Після 9 місяців спроб розв’язати цю проблему я майже був готовий кинути, адже нічого не досяг. Тож я закрив підручники на місяць і просто насолоджувався літом, плаванням, їздою на велосипеді, готуванням, молитвою та медитаціями. Потім, неохоче, я повернувся до роботи, і за кілька хвилин, коли я перегортав сторінки, ці шаблони почали виникати, і все почало мати сенс. Попереду було ще багато роботи, але я знайшов найбільшу частину головоломки".
"Протягом наступних кількох тижнів я був настільки схвильований, що не міг спати і годинами проводив у бібліотеці, в тому числі посеред ночі, щоб перевірити, що я знайшов, і розв'язати пов’язані з цим проблеми. Ця робота зайняла ще два з половиною роки".
Значимість відкриття
Професор Вінченцо Вергіані сказав: "Мій учень Ріші зламав це — він знайшов надзвичайно елегантне розв'язання проблеми, яка бентежила вчених століттями. Це відкриття зробить революцію у вивченні санскриту в той час, коли інтерес до мови зростає."
Санскрит є стародавньою індоєвропейською мовою з Південної Азії. Це священна мова індуїзму, а також засіб, за допомогою якого протягом століть передавали велику частину індійської науки, філософії, поезії та іншої світської літератури. Хоча сьогодні в Індії санскритом розмовляють лише 25 000 людей, він має дедалі більше політичне значення в Індії та вплинув на багато інших мов і культур у всьому світі.
Раджпопат сказав: "Деякі найдавніші мудрості Індії були викладені на санскриті, і ми досі не повністю розуміємо, чого досягли наші предки. Нас часто змушували вірити, що ми не важливі. Я сподіваюся, що це відкриття вселить у студентів в Індії впевненість, гордість і надію, що вони також зможуть досягти великих успіхів".
Основним наслідком відкриття Раджпопата є те, що тепер, коли ми маємо алгоритм, який запускає граматику Паніні, ми потенційно можемо навчити цієї граматики комп’ютери.
Раджпопат сказав: "Комп’ютерні науковці, які працюють над обробкою природної мови, відмовилися від підходів, заснованих на правилах, понад 50 років тому… Тож навчання комп’ютерів тому, як поєднувати наміри мовця з граматикою, заснованою на правилах Паніні, для створення людського мовлення було б важливою віхою в розвитку в історії взаємодії людини з машинами, а також в інтелектуальній історії Індії".
Раніше Фокус писав про те, що вчені знайшли витоки найзагадковішого народу Європи.