Лингвистическое хакерство. Ученые расшифровали древнюю грамматическую головоломку
Грамматическая загадка, об которою ломали зубы санскритологи из V в. до н. э., раскрыта. Риши Раджпопат, доктор философии, обучавшийся в Кембриджском университете, совершил прорыв, расшифровав правило, которому обучал "отец лингвистики" Панини.
Это открытие позволяет "вывести" любое санскритское слово — построить миллионы грамматически правильных слов, в частности "мантра" и "гуру", — используя уважаемую "языковую машину" Панини, которую многие считают одним из самых больших интеллектуальных достижений в истории, сообщают Phys.org.
У Фокус.Технологии появился свой Telegram-канал. Подписывайтесь, чтобы не пропускать самые свежие и увлекательные новости из мира науки!
Ведущие эксперты по санскриту называют открытие революционным, ведь теперь грамматике Панини можно "научить" компьютеры.
Система Панини — 4 000 правил расписанных в "Aṣṭādhyāyī" (с санскрита переводится как "Восемь правил" или "Восьмичастный"), написанных около 500 г. до н. е. — схожа по принципу работы с машиной: взяв базу слова и суффикс, их можно перевести в грамматически корректные слова и фразы через пошаговый процесс.
До сих пор была проблема в использовании системы. Часто случалось так, что два или более правила могли применяться на одном и том же шаге, заставляя ученых гадать, какое из них выбрать.
Разрешение так называемых "конфликтов правил", что влияло на миллионы слов, среди которых некоторые вариации слов "мантра" и "гуру", требовало алгоритма. Панини разработал метаправило, которое должно помогать решать "конфликты правил", однако последние 2500 лет исследователи неправильно его трактовали, что привело к грамматически некорректным результатам.
Пытаясь исправить эту проблему, множество ученых разрабатывали сотни своих метаправил, однако Раджпопат доказал, что они не только не могут решать проблему, поскольку порождают множество исключений, но вообще не нужны. Ученый доказал, что "языковая машина" Панини является самодостаточной.
"Панини обладал экстраординарным умом и разработал машину, которая нет имеет равных. Он не планировал, что мы будем ее дополнять новыми правилами. Чем больше мы возимся с ней, тем хуже понимаем ее суть" — сказал ученый.
Обычно ученые трактовали метаправило в том смысле, что в случае конфликта правил равной силы влияния следует использовать то правило, которое следует позже по списку.
Раджпопат отрицает это, аргументируя тем, что Панини подразумевал, что между правилами, применяемыми к левой и правой части слова соответственно, необходимо выбирать то, которое применяется к правой части. Используя такую интерпретацию метаправила, ученый обнаружил, что машина Панини генерирует грамматически корректные слова практически без исключений.
Возьмем слова "мантра" и "гуру" в пример. Во фразе "Devāḥ prasannāḥ mantraiḥ" ("Боги [devāḥ] задабриваются [prasannāḥ] мантрами [mantraiḥ]") мы сталкиваемся с "конфликтом правил" когда выводим "mantraiḥ". Вывод слова начинается из базы "mantra" и суффикса "bhis". Одно правило должно влиять на левую часть ("mantra"), а второе на правую ("bhis"). Необходимо выбрать правило, которое влияет именно на правую часть и тогда получим грамматически корректную форму "mantraiḥ".
Во фразе "Jñānaṁ dīyate guruṇā" ("Знание [Jñānaṁ] данное [dīyate] гуру [guruṇā]") мы снова сталкиваемся с "конфликтом правил": одно правило влияет на "guru", а второе на "ā". Выбрав второе, мы получаем правильную форму "guruṇā".
Момент эврики
За шесть месяцев до того, как Раджпопат совершил свое открытие, его руководитель в Кембридже Винченцо Вергиани, профессор санскрита, дал ему пророческий совет: "Если решение сложное, вы, вероятно, ошибаетесь".
Раджпопат сказал: "В Кембридже у меня был момент эврики. После 9 месяцев попыток решить эту проблему я почти был готов бросить, ведь ничего не достиг. Так что я закрыл учебники на месяц и просто наслаждался летом, плаванием, ездой на велосипеде, готовкой, молитвой и медитациями. Потом, неохотно, я вернулся к работе, и через несколько минут, когда я листал страницы, эти шаблоны начали возникать, и все начало иметь смысл. Впереди было еще много работы, но я нашел наибольшую часть головоломки".
"В течение следующих нескольких недель я был настолько взволнован, что не мог спать и часами проводил в библиотеке, в том числе посреди ночи, чтобы проверить, что я нашел, и решить связанные с этим проблемы. Эта работа заняла еще два с половиной года".
Значение открытия
Профессор Винченцо Вергиани сказал: "Мой ученик Риши сломал это — он нашел чрезвычайно элегантное решение проблемы, которая смущала ученых веками. Это открытие совершит революцию в изучении санскрита в то время, когда интерес к языку растет."
Санскрит является древним индоевропейским языком из Южной Азии. Это священный язык индуизма, а также средство, посредством которого на протяжении веков передавали большую часть индийской науки, философии, поэзии и другой светской литературы. Хотя сегодня в Индии санскритом говорят только 25 000 человек, он имеет все большее политическое значение в Индии и повлиял на многие другие языки и культуры во всем мире.
Раджпопат сказал: "Некоторые древнейшие мудрости Индии были изложены на санскрите, и мы до сих пор не полностью понимаем, чего достигли наши предки. Нас часто заставляли верить, что мы не важны. Я надеюсь, что это открытие вселит в студентов в Индии уверенность, гордость и надежду, что они также смогут добиться больших успехов".
Основным следствием открытия Раджпопата является то, что теперь, когда у нас есть алгоритм, запускающий грамматику Панини, мы потенциально можем научить этой грамматике компьютеры.
Раджпопат сказал: "Компьютерные ученые, работающие над обработкой природного языка, отказались от подходов, основанных на правилах, более 50 лет назад… Так что обучение компьютеров тому, как совмещать намерения говорящего с грамматикой, основанной на правилах Панини, для создания человеческая речь была бы важной вехой в развитии в истории взаимодействия человека с машинами, а также в интеллектуальной истории Индии".
Ранее Фокус писал, что ученые нашли истоки самого загадочного народа Европы.