Я. Розова Меня зовут Яна Розова, здравствуйте. На «Эхе продолжается цикл передач, посвященных развитию науки в городе. Сегодня мой гость Степан Кузнецов, научный сотрудник отдела математической логики, математического института имени Стеклова РАН.

С. Кузнецов Здравствуйте.

ДАВАЙТЕ ЗНАКОМИТЬСЯ.

Степан Кузнецов, 26 лет. Окончил механико-математический факультет МГУ имени Ломоносова, там же защитил кандидатскую диссертацию. Тема: «Категориальные грамматики, основанные на вариантах исчисления Ланбэка. Схема научных интересов, применение методов математической логики для исследования синтаксиса языков». Преподает на мехмате МГУ, участвует в работе семинара «Некоторые применения математических методов, языка знаний», на филологическом факультете МГУ.

Я. Розова Научные интересы ваши лежат в области математической теории формальных грамматик.

С. Кузнецов Это изучение все-таки ближе к естественным языкам, чем к языкам программирования. Можно назвать так условно-математическая лингвистика. Здесь есть кончено две вещи, с одной стороны есть сугубо лингвистические исследования, применяющие математический метод, с другой стороны есть чистая математика, которая как-то применяется к языкам знаний. Я занимаюсь вторым. Зачем это нужно? Традиционно считалось, что язык, это что-то такое, сугубо гуманитарное. Как вот изучают тексты филологи, начиная там с литературных скажем свойств, потом потихоньку переходят к языкам. Язык, как мы сейчас уже прекрасно понимаем, это такая система, вполне себе строгая, подчиняющаяся неким закономерностям. Но в силу того, что людей было много, то она приобрела некоторые (неразборчиво), почти как физические системы, или алгебраические, математические. Оказывается, что аналогии там довольно глубокие, и математические методы там могут сугубо применяться. То есть, ну первые, самые распространенные пожалуй – это (неразборчиво) методы. Ну, это вот те исследования Кнорозова скажем по изучению языков Америки. Когда он по сути их взламывал, как частотные методы взламывают шифры. Но оказывается, можно применять и (неразборчиво) алгебраическо-логические методы. Небольшой просто пример приведу из того, что мы исследуем. Вот то, что называется категориальной грамматикой. Оказывается, поведение слов в предложении и синтаксические роли можно описывать практически как школьную алгебру. Допустим, вот есть самое простое предложение: Петя поет. Там подлежащее и сказуемое. Можно сказать допустим, что предложение – это некий объект, ну, типа там С, как говорится (неразборчиво). А Петя – это Н. Тогда можно сказать, что поет – это вот объект типа С, делить (неразборчиво) на Н. И если мы приклеим вот этого самого Петю к этому слову, то получится Н умножить на Н под С. С делить на Н. Ну и сократив, получаем С. Как в алгебре это все получается. Естественно, эта система отличается от обычной алгебры, там натуральных и действительных чисел. Потому, что во-первых она коммутативная, не перестановочная. В большинстве языков вы не можете переставлять слова, чтобы получить тот же самый смысл. И возникает некая специфическая… Мы говорим это как алгебра, или логическое исчисление. То есть, способом, позволяющим рассуждать, переписывать, преобразовывать. Конечно то, что обычно царское такое приложение, которое все хотят – это конечно перевод. Автоматический перевод одного языка на другой, это какой-то там средний язык, или генерация текстов.

Я. Розова То есть, это была первая идея.

С. Кузнецов Да, первая идея скорее формализовать лингвистический опыт. Когда лингвисты берут допустим какой-то язык, начинают его исследовать, они это пишут грамматику. Ну, получают некий там большой Розенталь справочник, да. Вот мы хотим делать это более научно, и написать соответствующею речь. Впоследствии чтобы этой грамматикой как-то могли пользоваться автоматические системы. Перевод = это такая высшая задача на этом мути достижения. Есть сугубо статистический подход, тот же Google транслейт например, это вот основано просто на статистике. Вообще не знает никакой грамматики на самом деле. Обычно мы думает, что вот он переводит, он как-то знает, нет. Он просто учится. То есть, ему дает (неразборчиво), выдают текст на русском, (неразборчиво) греческом. Еще раз, еще раз, еще раз, и в конце концов он начинает… Существуют и методы, основанные на таких структурных подходах. Ну, вот я могу отметить пожалуй немецкую систему (неразборчиво). Там вот формально грамматика в ней записана. Можете сами посмотреть, как она переводится. По крайней мере я с зыков, которые совсем не известные, вот венгерский допустим, в общем-то может перевести и дать какой-то разумный ответ. Но есть и другие применения, то, что любят лингвисты. Например, есть такая штука уже давно, как языковой корпус. Это набор текстов, взятых из самых разных источников. Для русского языка есть такой (неразборчиво). Тексты бывают классические, бывает текст, взятый скажем из интернетовских форумов. Самое сложное (неразборчиво) устную речь. Кодировать, записывать. Но мы хотим не просто чтобы была куча текстов, мы хотим, чтобы тексты были в каком-то смысле размечены. Ну, разметка бывает разной. Можно размечать например части речи, можно размечать (неразборчиво) устная речь, (неразборчиво) ударение. Но в данном случае речь идет о том, чтобы размечать их синтаксически. Если у вас предложение, (неразборчиво) структуры. И для этого, поскольку естественно то что было раньше, пока не было корпусов, это было просто. Ну, как вот в школе учат, подчеркивают разными черточками соответствующие вещи, и получали какую-то разметку. Но сейчас, поскольку этот корпус огромен, он действительно огромен, включает в себя скажем всю русскую классику. То естественно, надо делать автоматически, или полуавтоматически, или по крайней мере в единообразном виде. То есть, даже посадить там кучу студентов, которые за какие-то деньги это делают, то (неразборчиво) делает единообразно. Для этого нужен некий формализм. Вот этот формализм, он называется формальная грамматика и формальный синтаксис. Почему я взял англоязычные термины? Во-первых, в науке действительно люди обычно используют английский язык практически везде. И Россия, кстати пожалуй одна из немногих стран, где внутренняя научная и печать, и устная речь все-таки поддерживается на национальном языке. (Неразборчиво) практически большая редкость. Французы еще так любят, но и то они под сильным давлением находятся. Здесь есть еще одна тонкость. Дело в том, что сейчас конечно для английского языка не в качестве языка (неразборчиво), языка на котором мы говорим, а в качестве языка – объекта, который мы исследуем, конечно, для английского языка все это более развито. Ну и в силу исторических причин потому, что западная наука развивалась быстро. И сейчас там языковедение считается такой вот областью… Чуть ли не разделом точных наук. Но у них такой вот (неразборчиво), у нас как бы (неразборчиво) математика, механика, с одной стороны физика. Может быть вычислительная математика, с другой стороны идет… Отдельно там еще есть (неразборчиво) как говорится, и IT. А отдельно есть история, филология, включая в себя язык о знании. Ну а кроме этого само исследование английского языка оказалось в чем-то проще. Ну, то есть языки восточной Европы устроены синтаксически… По крайней мере с нашей современной точки зрения в чем-то сложнее. Там есть проблема с порядком слов. Только мы уходим от английского, это начинается.

Я. Розова Правильно ли я понимаю, что все это делается для того, чтобы создать единую программу, которая позволит понимать все языки.

С. Кузнецов И да, и нет. Если (неразборчиво) программу как вычислительную машину, то скорее всего это так вот подходит, скорее всего не реалистично. Может быть и философские ограничения. Ну понятно, что есть методы (неразборчиво), но есть статистические. Человек, изучая язык, и теми и теми пользуется. Маленький ребенок (неразборчиво) в основном на статистике работает. Смотрит на то, что он видит, и накапливает некоторую базу примеров, потом (неразборчиво) понимать. Но тем не менее, что-то сделать можно. Но если программу понимать как программу научного исследования, в рамках которой можно дописывать языки, то в этом направлении мне кажется это вполне разумно.

Я. Розова У каждого ученого есть какая-то цель. Ваша какая?

С. Кузнецов Что касается моих собственных задач, то они сугубо математические. Дело в том, что я сейчас говорил больше о такой (неразборчиво), которая более естественно понятна людям, как она применяется. К тому же, с другой стороны как я уже сказал, возникают некие (неразборчиво) системы. Алгербаически-математические системы, которые уже начинают жить конечно самостоятельной жизнью. Они (неразборчиво) собственный интерес для математики, оказывается, что они похожи, и вообще просто совпадают (неразборчиво) которые возникают в алгебре, в теории категорий. Если допустим я бы оказался в среде, где люди там не любят языка знаний вообще, то я мог сказать, что вот есть некая алгебраическая система, вот она имеет такие то естественные свойства, и я исследую только математику.

Я. Розова Ну, вообще этому направлению не так много лет, с точки зрения (неразборчиво) науки. Кто впервые обратил на это внимание?

С. Кузнецов Кончено можно там какие-то древнегреческие параллели проводить, но вот я пожалуй назову из уже послевоенного времени – это Хомский, потому, что он… (Неразборчиво), вот эти формальные методы, порождающие романтики. Но были некоторые предшественники. Ну, вот я назову польского философа Казимира Айнукевича. Еще в довоенное время у него была такая книга, называется «Язык познаний», где вот он впервые пожалуй сформулировал понятие категориальной грамматики. Ну, а самая старая формальная грамматика, которую вот люди как считается придумали – это грамматика (неразборчиво), это древняя Индия. Дело в том, что санскрит как язык, на самом деле является языком эспиранте. Это не тот язык, на котором говорили, был древнеиндийский язык. И веды как раз написаны на древнеиндийском. А санскрит был придуман специально для того, чтобы его было проще запомнить. Индусы предвидели, что индийские языки будут эволюционировать. Со временем индусы перестанут понимать свои собственные священные тексты, поэтому придумали язык, которые легко запомнить. Придумали грамматику для него, чтобы сами будущие (неразборчиво) ее легко могли выучить, и грамматика была закодирована чуть ли не в стихах. То есть, в виде такого некоего короткого текста. И грамматика (неразборчиво) если её посмотреть, это одна страница. Так вот эта та самая формальная грамматика. Санскрит в переводе с него самого и значит очищенный язык. Но самое интересное, что они придумали эту грамматику, они ее сделали в таком компрессированном сжатом виде, и все это было сугубо русской культурой, это конечно поразительно. Там вообще никаких записей не было.

Я. Розова Вы занимаетесь этой наукой в математическом институте имени Стеклова. Насколько у нас это направление сейчас развито, и насколько интересуется научный мир этим направлением?

С. Кузнецов Вот здесь есть забавная такая ситуация. У нас вот этот вот контакт с лингвистическим… К сожалением мы его пытаемся улучшить, но он не очень сильно развит. И для русского языка это мало изучено, не пришло как бы время. То есть, лингвист интересуется, у нас есть семинар на филологическом факультете, некоторое применение математических методов языка знания, которое создано для того, чтобы обмениваться информацией. Со временем выросло поколение лингвистов, которые знают математику, это процесс, который идет. Но если говорить о современном состоянии, то есть лингвисты, которые изучают язык, немножечко используют там вот эти формальные методы, ну в разных смыслах. Больше используют статистику, которая проще и понятнее, и сразу приносит свои плоды. Есть сугубо математическая сторона, и здесь ну, скажем (неразборчиво) российское, славянское, половина Европы, в общем-то в теории можно сказать даже лидирует, (неразборчиво) скромность. Есть даже такая шутка, что вот скажем голландцы, которые занимаются практическими вещами в этой области… Не для голландского, а для английского тем не менее языка, они говорят, что их можно спросить, они будут доказывать сами теоремы об этих вещах. А иногда, зачем это нам нужно, ну если там нужна какая-нибудь теорема, сформулирует какой-нибудь русский или поляк, это дело докажет. Действительно у нас есть вот наша школа, которую (неразборчиво) возглавляет. У нас здесь человек, кроме (неразборчиво) еще есть трое, ну и студенты. Есть школа в (неразборчиво) университете, тоже довольно мощная.

Я. Розова Вы уже 5 лет преподаете в школе. Дети интересуются этим направлением науки?

С. Кузнецов Я преподаю в школе, я преподаю на кружках. На кружках мы традиционно даем лингвистические задачи, и это очень популярная вещь. Есть задачи например, что даны тексты на каких-то неизвестных языках, надо как-то их исследовать. Это чисто человек смотрит, и в задаче все есть. И школьники с большим удовольствием это решают. Что интересно, это иногда (неразборчиво) математические способности, иногда анти (неразборчиво). Бывают ситуации, когда школьник через наоборот входит как-то в математику. Задачи бывают самые разные. Например, там совершенно такая задача, которую я вычитал по-моему у Успенского. Короткая, я всем ее задаю. Придумайте слово, в котором две буквы ё, без дефисов. Есть там всякие слова, вроде ковер-самолет, которые легко придумать. А вот такое нормальное, совершенно русское слово. Могу даже подсказать, прилагательное. И причем оно не какое-то вот… Ну, есть такие, там Бирюлек например, там река в Якутии. Ну, это специально. Я вам могу рассказать решение задачи. Как к ней подходить. То есть, вот понятно, откуда две буквы ё? Вообще (неразборчиво) ударение. Значит что-то должно быть не чисто. Где может быть ну, два… Ну, хотя бы… Ну, вообще ударные слова тонкий вопрос, в английском точно они есть, а в русском… Значит надо, чтобы было два корня видимо. Ну, а дальше приходит довольно быстро ответ. Ну, ответ например (неразборчиво). Люди немножко смотрят на структуру языка и узнают что-то, что они совершенно (неразборчиво).

Я. Розова То есть получается, что мы на язык начинаем смотреть просто другими глазами.

С. Кузнецов Мы начинаем смотреть научными глазами. Так же как человек смотрит скажем на небо, может смотреть как просто человек, а может смотреть как астроном.

Я. Розова Как вы думаете, насколько это детям может помочь?

С. Кузнецов Вопрос конечно зачем помочь? Помочь стать лингвистами, очевидно сможет. Но это как Ломоносову говорили, что математику для того следует учить, что она там в порядок приводит ум. И вот эти вот такие игры логические, в духе (неразборчиво), языковые игры, это как мне кажется, очень полезная некая практика, разминка такая. Есть такие предметы, которые как география. Человек должен знать просто, а здесь скорее способы рассуждения. То есть, рассуждения, в чем-то похожие на математические. Математические считаются эталоном логики. Эталоном того, как мы мыслим. И вот это сама по себе мысль, что человеческая гуманитарная от слова гуманность человек. Можно исследовать точно так же строго, как мы изучаем (неразборчиво) природы физику, это мне кажется очень правильная мысль.

Я. Розова Это был Степан Кузнецов, научный сотрудник отдела математической логики, математического института имени Стеклова РАН.

Комментарии

0

Пожалуйста, авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий.
>
Не заполнено
Не заполнено

Не заполнено
Не заполнено минимум 6 символов
Не заполнено

На вашу почту придет письмо со ссылкой на страницу восстановления пароля

Войти через соцсети:

X Q / 0
Зарегистрируйтесь

Если нет своего аккаунта

Авторизируйтесь

Если у вас уже есть аккаунт

Самое обсуждаемое

Популярное за неделю

Сегодня в эфире