КОМПЬЮТЕРНАЯ   ЛИНГВИСТИКА
 
 

 

 
 



 

 

                                                        Все статьи

КОНЦЕПТУАЛЬНЫЙ АНАЛИЗ ТЕКСТОВ <<--- 
---
>> ПОИСК ИНФОРМАЦИИ в БАЗАХ ДАННЫХ

ФРАЗЕОЛОГИЧЕСКИЙ МАШИННЫЙ ПЕРЕВОД ТЕКСТОВ

При создании систем  фразеологического машинного перевода текстов необходимо руководствоваться следующими принципами: 

1. Основными единицами языка и речи, которые прежде всего следует включать в машинный словарь, должны быть фразеологические единицы (словосочетания, фразы). Отдельные слова также могут включаться в словарь, но они должны использоваться только в тех случаях, когда не удается осуществить перевод, опираясь только на фразеологические единицы. 
2. Наряду  с  фразеологическими единицами, состоящими из непрерывных последовательностей слов, в системах машинного перевода следует использовать и так называемые "речевые модели" - фразеологические  единицы с "пустыми местами", которые могут заполняться различными  словами и словосочетаниями, порождая осмысленные отрезки речи. 
3. Реальные тексты, независимо от их принадлежности к той или иной тематической области, обычно бывают политематическими, если они имеют достаточно большой объем. И отличаются они друг от друга не столько словарным составом, сколько распределениями вероятностей появления в них различных слов из общенационального словарного фонда. Поэтому машинный словарь, предназначенный для перевода текстов даже только из одной тематической области, должен быть политематическим, а для перевода текстов из различных предметных областей - тем более. 
4. Для систем фразеологического перевода необходимы машинные словари большого объема. Такие словари должны создаваться прежде всего на основе автоматизированной обработки двуязычных текстов, являющихся переводами друг друга, и в процессе функционирования систем перевода. 
5. Наряду с  основным  политематическим словарем большого объема, в системах фразеологического машинного перевода целесообразно использовать также набор небольших по объему дополнительных тематических словарей. Дополнительные словари должны содержать только ту информацию, которая отсутствует в основном словаре (например, информацию о приоритетных переводных эквивалентах словосочетаний и слов для различных предметных областей, если эти эквиваленты не совпадают с приоритетными переводными эквивалентами основного словаря). 
6. Основным средством разрешения полисемии (многозначности) слов в системах фразеологического перевода является их использование в составе фразеологических словосочетаний. Дополнительным - аппарат дополнительных тематических словарей, где для каждого многозначного слова или словосочетания указывается его приоритетный переводной эквивалент, специфичный для рассматриваемой предметной области. 
7. Большую роль в системах фразеологического машинного перевода текстов могут играть разработанные авторами процедуры морфологического и синтаксического анализа и синтеза русских и английских текстов, построенные на основе принципа аналогии. Эти процедуры позволяют отказаться от хранения в словарях большого объема грамматической информации и порождать ее по мере необходимости автоматически, в процессе перевода. Они делают систему перевода открытой - способной обрабатывать тексты с "новой" лексикой. 
8. Наряду с переводом текстов в автоматическом режиме, в системах  фразеологического машинного перевода целесообразно предусмотреть и интерактивный режим их работы. В этом режиме пользователь  должен  иметь возможность вмешиваться в процесс перевода  и  настраивать  дополнительные машинные словари  на тематику переводимых текстов. 

Системы фразеологического машинного перевода должны быть ориентированы прежде всего на перевод деловых текстов в области науки, техники, политики и экономики. Перевод художественных текстов - более сложная задача. Но и здесь в будущем можно достичь определенного успеха, если найдутся энтузиасты типа Владимира Даля, которые с помощью современных технических средств возьмут на себя нелегкий труд по составлению мощных фразеологических словарей для этого класса текстов. Итак, будущее машинного перевода – это семантико-синтаксический преимущественно фразеологический перевод. Никакой другой разумной альтернативы здесь нет и быть не может.


Добавить свое объявление
Загрузка...