УДК 37.016:811
УО «Брестский государственный университет имени А.С. Пушкина», г. Брест
Научный руководитель – М.П. Концевой, старший преподаватель, кафедры прикладной математики и информатики БрГУ имени А.С. Пушкина
Современные технологии изучения иностранного языка все чаще опираются на использование языковых корпусов. По мнению В.А. Плунгяна, ведущего российского лингвиста в сфере корпусной лингвистики, современное освоение языка должно опираться на корпус «Теперь для овладения языком человеку нужны не две, а три вещи: словарь, грамматика и корпус текстов данного языка. Потому что и словарь, и грамматика, в общем-то, бесполезны вне этого живого пространства, где язык, собственно, и функционирует. Более того, и словари и грамматики теперь нужны не традиционные, а нового поколения, то есть не просто словари и грамматики, а словари такого-то корпуса и грамматики такого-то корпуса» [Плунгян, 2009].
В 2003 году была создана обширная информационно-справочная система, основанная на собрании русских текстов в электронной форме – Национальный корпус русского языка (далее НКРЯ). На сегодняшний день данный корпус обладает объемом более 600 млн. слов, что представляет собой неограниченную исследовательскую и обучающую базу, которая может быть использована в равной степени специалистами, занимающимися вопросами русского языка, включая русский язык как иностранный, и всеми желающими изучить данный язык в качестве родного и иностранного [НКРЯ, 2003].
Благодаря электронному формату предоставления информации, использование языковых корпусов обладает явным преимуществом по сравнению с традиционным форматом поиска необходимой информации в специализированных справочниках и учебниках и привлекает внимание современного поколения. Характерным для использования корпусов также является смещение акцентов на дискурс, на квантитативный компонент языка и учет синхронной и диахронической вариативности языка [Прилепская, 2010].
В последнее время в России разрабатывается идея параллельных электронных корпусов текстов различных жанров. Параллельный корпус (Parallel Corpora) – это электронный аналог параллельных переводных текстов, как правило состоящий из множества блоков «текст–оригинал и один/несколько его переводов». Электронные тексты в корпусе могут представлять собой целое оригинальное словесное произведение или какую-либо его часть. Применение таких корпусов представляет особый интерес в задачах обучения иностранному языку, позволяя подобрать возможные эквиваленты изучаемой лексики, проследить ее значения и функции в тех или иных контекстах [Соснина, 2006].
Корпуса, прежде всего, содержат практический материал, который может быть применен студентами при поиске примеров из реальной коммуникативной среды изучаемого языка. Часто материал, предоставленный типовыми учебниками, разнится с тем, как на самом деле говорят носители языка. В таких моментах языковой корпус является источником, отражающим реальные контексты словоупотребления, тем самым повышая эффективность освоения языка и акцентируя внимание обучающихся на более часто используемые обороты речи и важные аспекты языка.
Для носителя русского языка, изучающего польский язык, доступны два параллельных (польско-русско-польских) корпуса.
- http://www.ruscorpora.ru/search-para-pl.html
- http://pol-ros.polon.uw.edu.pl/index.php?id=&lang=ru
В корпусе предоставлен оригинальный текст на польском языке и соответствующий ему перевод на русском, и наоборот. Параллельные части текста расположены в одинаковом порядке в обеих частях корпуса: оригинальном тексте и переводном. Благодаря такому предоставлению текста можно делать выводы о частотности различных грамматических конструкций, а также рассматривать синонимичную лексику в контексте. Так, В.Г. Сибирцева приводит примеры употребления глаголов «молвить» и «сказать», которые могут переводиться на польский язык одинаково. Однако, в соответствии с количеством выданных примеров с употреблением этих двух глаголов, видно, что глагол «молвить» является малоупотребительным, устаревшим. Кроме того, используя функцию поиска в корпусе можно подбирать примеры для дальнейшего создания упражнений для работы с языком [Сибирцева, 2013].
Рассмотрим возможности определения выбора необходимой лексической единицы, на примере анализа контекстов употребления русского слова «бояться» (таблица 1). Многочисленные русско-польские словари, среди которых, к примеру, Большой русско-польский словарь Мировича А. в двух томах, предлагают следующие варианты перевода в очередности их употребления – bać się, lękać się obawiać się. На основе двух результатов двух корпусов, представить данные в виде таблицы, которая указывает на то, что помимо трёх вышеперечисленных общеупотребительных вариантов, параллельные польско-русско-польские корпуса предлагают ещё четыре эквивалента – strachać się, uląc się, przerażać się, uląkać się. Таким образом, использование параллельных корпусов расширяет границы познания словоупотребления и облегчают поиск смыслоразличения.
Таблица 1
bać się | Widział, że odesłałem cię pod eskortą, założył, że już nie musi się ciebie bać. [Andrzej Sapkowski. Lux Perpetua (1) (2006)] | Он видел, что я отослал тебя под эскортом, считает, что ему уже не надо тебя бояться. [Анджей Сапковский. Свет вечный (1) (В. Фляк, 2009)] |
obawiać się | Brak reakcji ze strony oceanu też pozostawił mnie obojętnym do tego stopnia, że po dwu czy trzech dniach mało że przestałem na nią liczyć czy obawiać się jej, całkowicie o niej i o doświadczeniu zapomniałem. [Stanisław Lem. Solaris (1961)] | Отсутствие реакций со стороны океана также оставляло меня равнодушным до такой степени, что через два или три дня я почти перестал на них рассчитывать или бояться их и полностью забыл и об океане, и об эксперименте. [Станислав Лем. Солярис (Дм. Брускин, 1973)] |
lękać się | Ja mam dopiero dwadzieścia. –Ja miałbym się lękać? –Reynevan z poważną miną włączył się do gry. [Andrzej Sapkowski. Lux Perpetua (2) (2006)]
– Nie lękam – odrzekł Reyhevan, nieco zbyt szybko i nieco zbyt szczerze. –Przestałem się lękać. –Oho. –Ksiądz nie przegapił tonu, spojrzał na niego bystro. [Andrzej Sapkowski. Lux Perpetua (2) (2006)] |
Мне всего лишь двадцать. – Я должен бояться? – Рейневан с серьезной миной включился в игру. [Анджей Сапковский. Свет вечный (2) (В. Фляк, 2009)]
– Не боюсь, – ответил Рейневан, слишком быстро и слишком откровенно. – Я перестал бояться. – Ого, – его тон не прошел мимо внимания священника, он быстро посмотрел на Рейневана. [Анджей Сапковский. Свет вечный (2) (В. Фляк, 2009)] |
strachać się | – Saladyn nie pozwoli ruszyć niewiast –zapewnia Sybilla swe dworki. – Nie macie czego się strachać… Ostatecznie i w haremie można żyć…Saracenowie podobno są bardzo namiętni… [Zofia Kossak. Król trędowaty (1937)] | – Саладин не позволит обидеть женщин, – утешает Сибилла придворных дам. – Так что бояться нам нечего. Впрочем, и в гареме жить можно, сарацины, говорят, мужчины пылкие… [Зофья Коссак. Король-крестоносец (Н. Смирнова, С. Скорвид, 1995)] |
uląc się | Czegóż, kogo mógłby się uląc po tym, co już widział? [Stefan Żeromski. Popioły (1) (1902)] | Чего и кого ему бояться после того, что он уже видел? [Стефан Жеромский. Пепел (1) (Е. Н. Троповский, Е. М. Егорова, 1967)] |
przerażać się | – Nie jestem przecież babą, abym snami miał się przerażać, –zaczął – ale miałem jeden taki, że każdemu by od niego włosy dębem na głowie stanęły. [Eliza Orzeszkowa. Nad Niemnem (1886-1887)] | – Я не баба, чтобы бояться снов, но однажды от одного сна у меня волосы на голове стали дыбом. [Элиза Ожешко. Над Неманом (Вукол Лавров, 1896)] |
uląkać się | Cóż myślisz? Pewnie! Wzroku bym się nie uląkł niczyjego! wołał Borzywój. Ale srogo patrzy jakoś, aż mrozem ścina, wtrącił Ziema. Ciarki po mnie poszły, gdy mijając go, oczy spotkałem. [Józef Ignacy Kraszewski. Boleszczyce (1877)] | –- А как же! Всеконечно!.. Вот еще!.. Бояться чьего-то взгляда! – возмутился Буривой. – Строгий взгляд! Мороз по коже продирает, – вставил Земя. – Мурашки побежали, когда я, проезжая, встретился с его глазами! [Юзеф Игнацы Крашевский. Болеславцы (1915)] |
Одной из сложностей освоения иностранного языка помимо различия лексики и контекста ее употребления является несоответствие грамматических категорий. Несмотря на близость русского и польского языков, при их изучении выявляются несоответствия в управлении слов. На данный момент не существует составленного оформленного сборника или словаря управления польских слов и именно параллельные польско-русские корпуса могут стать решением снятия трудностей, возникающих при переводе. Так, к примеру, существуют два управления слова «chęć» – chęć czegoś и chęć do czegoś. В обоих случаях русским эквивалентом будет «желание сделать что-либо». Но конструкция без предлога обозначает преходящее, ситуативное желание, а конструкция с предлогом – желание как постоянную характеристику личности, что может быть выявлено только при рассмотрении слова неотрывно от контекста (таблица 2).
Таблица 2
chęć czegoś | Patrząc w jej spokojne oczy, poczułem okropną chęć gwałtownego zaciśnięcia palców. [Stanisław Lem. Solaris (1961)] | Глядя в ее спокойные глаза, я почувствовал острое желание быстро стиснуть пальцы. [Станислав Лем. Солярис (Дм. Брускин, 1973)] |
chęć do czegoś | Bogata domieszka krwi syryjskiej, a niejednokrotnie arabskiej, przydała im zmysłowości; stara, dobra krew rycerska dała odwagę i szczerość. Przykład Greczynek pobudził chęć do nauki. [Zofia Kossak. Król trędowaty (1937)] | Богатая примесь сирийской, а то и арабской крови разбудила в них чувственность, старая добрая рыцарская кровь питала прямодушие и отвагу, а пример гречанок вызывал у них тягу к образованию. |
Незамысловатый интерфейс и удобная навигация, предоставленные на сайтах корпусов, просты в освоении и не требуют дополнительных инструкций, тем самым позволяя сократить время нахождения искомых слов и делая возможным осуществление поиска слов в различных сферах употребления лексики от повседневной до профессиональной лексики. Польско-русско-польский параллельный корпус использует выведение информации, разделяя страницу на два столбца, что делает восприятие текста более легким, в то время как НКРЯ размещает информацию построчно, указывая название языка сбоку. Удобством пользования НКРЯ является функция выбора грамматических, семантических и дополнительных признаков при осуществлении лексико-грамматического поиска. Также НКРЯ предлагает отдельный поиск точных форм. В польско-русско-польском корпусе вынесен отдельно морфологический поиск, в котором возможно выбрать часть речи искомого слова и его грамматические категории. Облегчает работу с НКРЯ выделение другим цветом искомого слово. Еще одной особенностью НКРЯ является предоставление результатов поиска не только посредством выведения результатов на страницу браузера, как это сделано и в польско-русско-польском корпусе, но и возможность скачивания нескольких первых результатов выдачи в формате Excel, OpenOffice Calc, XML. Существенным отличием поискового аппарата НКРЯ от польско-русско-польского является возможность задания подкорпуса, который включает в себя так называемую метаразметку текстов, входящих в него. Исследователь, пользующийся корпусом, может выбрать такие параметры текста, как автор текста, год написания, жанр, стиль текста. Количество результатов, выданных на поиск слова, у НКРЯ значительно выше, чем у польско-русско-польского корпуса.
Из вышеперечисленного можно сделать вывод, что оба инструмента могут быть полезны при работе с текстами русского и польского языков. При этом каждый из них имеет свои ограничения и требует доработки. Польско-русско-польскому корпусу явно необходимо сконцентрировать внимание на технической и функциональной стороне. К тому же, работу с данным корпусом затрудняет отсутствие выделения искомого слова в найденных текстах. Можно сказать, что на данный момент НКРЯ является более развитым параллельным корпусом, работающим с польским и русским языками, чем польско-русско-польский корпус.
Список использованных источников
- Почему современная лингвистика должна быть лингвистикой корпусов. [Электронный ресурс] Режим доступа: http://polit.ru/article/2009/10/23/corpus/ – Дата доступа:03.2018.
- Национальный корпус русского языка. [Электронный ресурс] Режим доступа: http://www.ruscorpora.ru (дата обращения: 03.2018).
- Использование Национального корпуса русского языка в преподавании иностранных языков. [Электронный ресурс] Режим доступа: http://www.gramota.net/materials/1/2010/11-1/39.html – Дата доступа: 03.2018.
- Параллельные корпуса. [Электронный ресурс] Режим доступа: http://ling.ulstu.ru/articles/corpus_education_translation/ – Дата доступа: 03.2018.
- Технология использования параллельного подкорпуса Национального корпуса русского языка и коллекций текстов в обучении иностранным языкам. [Электронный ресурс] Режим доступа: http://bazhum.muzhp.pl/media///Rocznik_Instytutu_Polsko_Rosyjskiego-r2013-t-n2-s98-110.pdf – Дата доступа: 03.2018.