|
Все статьи
КОНЦЕПТУАЛЬНЫЙ АНАЛИЗ ТЕКСТОВ
<<---
--->>
ПОИСК ИНФОРМАЦИИ в БАЗАХ ДАННЫХ
ФРАЗЕОЛОГИЧЕСКИЙ МАШИННЫЙ ПЕРЕВОД ТЕКСТОВ
При
создании систем фразеологического машинного перевода
текстов необходимо
руководствоваться следующими принципами:
1.
Основными единицами языка и речи, которые прежде всего
следует включать в машинный словарь, должны быть
фразеологические единицы (словосочетания, фразы).
Отдельные слова также могут включаться в словарь, но они
должны использоваться только в тех случаях, когда не
удается осуществить перевод, опираясь только на
фразеологические единицы.
2.
Наряду с фразеологическими единицами, состоящими из
непрерывных последовательностей слов, в системах
машинного перевода следует использовать и так называемые
"речевые модели" - фразеологические единицы с "пустыми
местами", которые могут заполняться различными словами
и словосочетаниями, порождая осмысленные отрезки речи.
3.
Реальные тексты, независимо от их принадлежности к той
или иной тематической области, обычно бывают
политематическими, если они имеют достаточно большой
объем. И отличаются они друг от друга не столько
словарным составом, сколько распределениями вероятностей
появления в них различных слов из общенационального
словарного фонда. Поэтому машинный словарь,
предназначенный для перевода текстов даже только из
одной тематической области, должен быть
политематическим, а для перевода текстов из различных
предметных областей - тем более.
4.
Для систем фразеологического перевода необходимы
машинные словари большого объема. Такие словари должны
создаваться прежде всего на основе автоматизированной
обработки двуязычных текстов, являющихся переводами друг
друга, и в процессе функционирования систем перевода.
5.
Наряду с основным политематическим словарем большого
объема, в системах фразеологического машинного перевода
целесообразно использовать также набор небольших по
объему дополнительных тематических словарей.
Дополнительные словари должны содержать только ту
информацию, которая отсутствует в основном словаре
(например, информацию о приоритетных переводных
эквивалентах словосочетаний и слов для различных
предметных областей, если эти эквиваленты не совпадают с
приоритетными переводными эквивалентами основного
словаря).
6.
Основным средством разрешения полисемии (многозначности)
слов в системах фразеологического перевода является их
использование в составе фразеологических словосочетаний.
Дополнительным - аппарат дополнительных тематических
словарей, где для каждого многозначного слова или
словосочетания указывается его приоритетный переводной
эквивалент, специфичный для рассматриваемой предметной
области.
7.
Большую роль в системах фразеологического машинного
перевода текстов могут играть разработанные авторами
процедуры морфологического и синтаксического анализа и
синтеза русских и английских текстов, построенные на
основе принципа аналогии. Эти процедуры позволяют
отказаться от хранения в словарях большого объема
грамматической информации и порождать ее по мере
необходимости автоматически, в процессе перевода. Они
делают систему перевода открытой - способной
обрабатывать тексты с "новой" лексикой.
8.
Наряду с переводом текстов в автоматическом режиме, в
системах фразеологического машинного перевода
целесообразно предусмотреть и интерактивный режим их
работы. В этом режиме пользователь должен иметь
возможность вмешиваться в процесс перевода и
настраивать дополнительные машинные словари на
тематику переводимых текстов.
Системы фразеологического машинного перевода должны быть
ориентированы прежде всего на перевод деловых текстов в
области науки, техники, политики и экономики. Перевод
художественных текстов - более сложная задача. Но и
здесь в будущем можно достичь определенного успеха, если
найдутся энтузиасты типа Владимира Даля, которые с
помощью современных технических средств возьмут на себя
нелегкий труд по составлению мощных фразеологических
словарей для этого класса текстов.
Итак, будущее
машинного перевода – это семантико-синтаксический
преимущественно фразеологический перевод. Никакой другой
разумной альтернативы здесь нет и быть не может.
|