Статья опубликована в рамках: Научного журнала «Студенческий» № 20(148)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6, скачать журнал часть 7
ЗАМАНАУИ МАШИНАЛЫҚ АУДАРМА ЖҮЙЕЛЕРІНІҢ ТЕХНОЛОГИЯЛАРЫН ТАЛДАУ
АННОТАЦИЯ
Компьютерлік аударманы орындау күрделі, бірақ қызықты ғылыми міндет. Оның басты қиындығы – табиғи тілдердің рәсімдеуі нашар. Демек, машиналық аударма жүйелерінің көмегімен алынған мәтіннің сапасы, мазмұны мен формасы төмен. Мақалада аналитикалық машиналық аударма, статистикалық машиналық аударма, нейрондық машиналық аударма сияқты машиналық аударма технологиялары қарастырылады. Қазіргі уақытта оқыту үшін аз деректерді қажет ететін статистикалық жүйелер де, тар салаларда тұрақты және дәл нәтижелер беретін аналитикалық жүйелер де өзектілігін сақтайды.
Кілт сөздер: автоматты аударма, аналитикалық машиналық аударма, статистикалық машиналық аударма, нейрондық аударма.
Мәтіндердің автоматты аудармасы алғашқы электрондық есептеуіш машиналар пайда болғаннан бері алғаш рет талқыланды. Машиналық аударманың потенциалды қолданылуы әр түрлі. Мысалы, машиналық аударма пайдасы – күнделікті деңгейде, әртүрлі тілдік топтардың адамдарына тиісті тілдік дағдыларсыз сөйлесуді жеңілдетеді. Мәліметтерді аудару қажет болған кезде машиналық аударма бизнес саласында да маңызды [1].
Қазіргі уақытта машиналық аударманың үш технологиясы бар: аналитикалық машиналық аударма, статистикалық машиналық аударма және нейрондық аударма.
Аналитикалық машиналық аударма – бұл тарихи тұрғыдан алғашқы машиналық аударма технологиясы. Осы әдіс лингвист жазған бастапқы тілден аударма тіліне аудару ережелерінің жиынтығын және екі тілдік сөздіктерді – екі тілдің лексикалық элементтерінің жиынтығын пайдалануды көздейді [1].
Статистикалық машиналық аударма – бұл мәтіндік корпусына негізделген әдістің кіші бөлігі. CMА дайын ережелермен емес, рационалистік (аналитикалық) тәсілмен емес, эмпирикалық тәсілмен, яғни параллель екі тілді мәтіндер корпусына негізделген ережелермен жұмыс жасауды қалыптастырады [1].
Сурет 1. Нейрондық машиналық аударма. Статистикалық машиналық аударма + нейрондық желі арқылы қайта құру. Статистикалық машиналық аударма – бұл нейрондық желі [2].
Нейрондық аударма – статистикалық аудармаға өте ұқсас, өйткені ол параллель деректерді талдауды қолданады және осы талдау негізінде белгілі бір тәуелділіктер мен заңдылықтарды қалыптастырады. Алайда, бұл әдіс мүлдем басқа принциптерге негізделген. Нейрондық аудармашының негізінде статистикалық машиналық аудармашыларға қарағанда едәуір күрделі ықтималдық модельдерін құруға мүмкіндік беретін матрицалық есептеулерге негізделген екі бағытты қайталанатын нейрондық желілер механизмі жатыр [1].
MА жүйелері мәтінді автоматты түрде аударуды жүзеге асырады. Бұл жағдайда аударма бірліктері сөздер немесе сөз тіркестері болып табылады, ал соңғысы әзірлемелер аударылған сөздің морфологиясын ескеруге мүмкіндік береді. Дамыған MА жүйелері аударманы әзірлеуші және/немесе қолданушы түзеткен аударма алгоритмі бойынша жүзеге асырады [3].
Машиналық аударманы жүзеге асыру үшін компьютерге аударма алгоритмін іске асыратын арнайы бағдарлама енгізіледі, ол аударманың берілген бағытында (бір нақты тілден екінші тілге) L1 - L2 тілдерінің осы жұбында аударма сәйкестігін табу үшін мәтін бойынша бірмәнді және қатаң анықталған іс-әрекеттердің реттілігін білдіреді [3].
Машиналық аударма жүйесі эквивалентті, нұсқалық және трансформациялық аударма сәйкестіліктерін беруді қамтамасыз ету үшін қажетті грамматикалық ақпаратпен (морфологиялық, синтаксистік және семантикалық) жабдықталған екі тілді сөздіктерді, сондай-ақ мәтінді автоматты түрде өңдеуге қабылданған ресми грамматикалықтардың кез-келгенін жүзеге асыратын грамматикалық талдаудың алгоритмдік құралдарын қамтиды. Қазіргі уақытта машиналық аударманың сапасы көп нәрсені қалайды және мұндай жүйелердің болуы ғылыми зерттеулердің тақырыбы ретінде қабылданған дұрыс. Көп жағдайда, жоба бойынша жұмыс істеген кезде MА жүйелерін пайдалану ақталмайды, өйткені:
– MА жүйелері шығатын мәтіннің қолайлы сапасын бермейді. Жоғары сапаға жүйені алдын-ала орнату арқылы қол жеткізуге болады (PROMT XT сериясының өнімдері пайдаланушыға көптеген мүмкіндіктер ұсынады), бұл аз көлемді аударылған мәтіндермен және/немесе кейіннен редакциялау арқылы мүлдем қолайсыз, егер аудармашы соқыр әдісті басып шығаруды қолданса, бұл жұмыс істеуді баяулайды.
– MА жүйелері терминологияның біртектілігінің сақталуына кепілдік бермейді, әсіресе аудармашылар тобы үлкен жобамен жұмыс жасағанда. Керісінше, олар қолданушы сөздіктеріне мұқият қараған жағдайда кепілдік бере алады және бұл әрдайым сенуге тұрарлық емес [3].
Алайда, кейбір жағдайларда MА жүйелерін пайдалану уақыт шығындарын азайтуға көмектеседі. Егер мәтін жеткілікті көлемді болса және монотонды терминологияны қамтыса, бұл оған MА жүйесін салыстырмалы түрде тез орнатуға мүмкіндік береді. Содан кейін мәтінді редакциялау көп уақытты қажет етпейді. Бірақ та, бұл жағдайда аударма мәтіннің стиліне ерекше назар аудару керек. Машиналық аударма формальды, ол жалпы аудармаға тән, түпнұсқа тілінің синтаксистік құрылымын есептеу ықтималдығы жоғары, сондықтан редакциялау кезінде өткізіп жіберуге болады.
Әдебиеттер тізімі:
- Колганов Д.С., Данилов Е.А. Обзор аналитической, статистической и нейронной технологий машинного перевода // Международный студенческий научный вестник. – 2018. – № 3-2.; URL: http://eduherald.ru/ru/article/view?id=18262.
- [электронды ресурс] – URL: http://datareview.info/article/neyronnyiy-mashinnyiy-perevod-s-primeneniem-gpu-vvodnyiy-kurs-chast-1/.
- [электронды ресурс] – URL: https://study-english.info/article065.php.
Оставить комментарий