|
Все статьи
ФОРМАЛЬНАЯ ЛОГИКА
<<---
--->>
АЛГОРИТМЫ
ГРАММАТИКА
Естественный язык представляет собой некоторую знаковую
систему. Структурой
естественных языков занимается раздел науки лингвистики,
называемый грамматикой. Понятие “грамматика” определяется как
строй языка - как система морфологических категорий и форм,
синтаксических категорий и конструкций, способов
словопроизводства. Наряду со членением простого предложения
на группу подлежащего и группу сказуемого в лингвистике
рассматривается еще один тип его членения – на тему и рему (так
называемое актуальное членение). При этом считается, что тема
представляет известную часть речевого сообщения, а рема – новую
информацию о предмете или явлении, обозначенном темой. Чаще
всего тема выражается группой подлежащего, а рема – группой
сказуемого, но бывает и наоборот.
В
системах автоматической обработки текстовой информации
популярной является модель синтаксической структуры
предложения, получившая название дерево зависимостей.
В этой модели предложение представляется в виде дерева,
в узлах которого находятся слова, связанные друг с
другом отношениями подчинения (отношениями
непосредственной доминации). Сказуемое располагается в
корне дерева, а все остальные слова зависят от него либо
непосредственно, либо через посредство других слов.
Близкой к модели дерева зависимостей является модель
непосредственно составляющих. В основу этой модели
положено допущение, что всякая сложная единица языка или
текста складывается из двух более простых и не
пересекающихся единиц – ее непосредственно составляющих.
Последние, в свою очередь, могут дробиться на более
мелкие непосредственно составляющие и т. д., вплоть до
элементарных неделимых составляющих.
Идея последовательного членения предложений на
непосредственно составляющие положена в основу так
называемых порождающих и трансформационных грамматик
(generative
and transformational grammars).
Наиболее популярной из них является порождающая и
трансформационная грамматика американского ученого Н.
Хомского (Noam
Homsky),
предложенная им в середине 50-х годов прошлого
столетия. Порождающая грамматика позволяет не только
отличать грамматически правильно построенные предложения
какого-либо языка от “неграмматических”
последовательностей слов этого языка, но и получать
формализованные описания структуры всех грамматически
правильно построенных предложений языка, то есть
осуществлять их синтаксический анализ. Трансформационная
грамматика позволяет производить преобразования
(трансформации) синтаксической структуры предложений без
нарушения их смысла.
В грамматике Н.
Хомского для порождения предложений используется список
подстановок, в левой части которых стоят символы
структурных компонентов предложений, а в правой –
заменяющие их символы или сочетания символов таких
компонентов. В
случае сочинительной связи между предложениями они
воспринимаются как относительно независимые единицы
речи. В случае подчинительной связи - в составе
сложного предложения выделяют главное предложение и
“подчиненные” ему придаточные предложения (одно или
несколько). Придаточные предложения дополняют содержание
главного предложения. Их можно с некоторым основанием
считать развернутыми “второстепенными” членами простого
предложения (предложениями – дополнениями, предложениями
– обстоятельствами и др.).
Иногда несколько простых предложений с совпадающими
структурными компонентами (подлежащими, сказуемыми др.)
объединяются в одно сложное предложение с исключением
повторений одинаковых компонент. Это так называемые
эллиптические конструкции. Кроме предложений и
сверхфразовых единств в языке и речи имеются смысловые
единицы меньшей протяженности (морфемы, слова,
устойчивые фразеологические словосочетания).
|