О І Ванівська - Корпусні та лексикографічні технології опису мовної системи термінознавство - страница 11

Страницы:
1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96 

Запозичених термінів-іменників середнього роду, які б належали до другої та четвертої відміни, у терміноло­гії економіки АПК не виявлено.

Запозичені терміни, що належать до іменникової відміни з нульовим омонімічним закінченням, "не маю­чи зовнішніх, флексійних ознак родової належності, зазнають семантико-граматичного поділу на групи, кожна з яких характеризується однією, зрідка двома ознаками роду" [1, с. 64]. Родову належність "невідмінюваних" термінів - назв осіб іншомовного походження семантично зумовлює позамовний чинник - стать особи, напр. рантьє - фр. rentier, пор.:... середовище народження нового прошарку в суспільстві сільськогорантьє [5, с. 7]. Терміни нульової відміни, що позначають сукупність осіб, мають граматичне значення середнього роду, напр.: Аграрнелобі спробувало накласти руку на 10 % державного бюджету в розмірі 4,6 млрд. грн. [5, с. 7]. На мор­фологічну категорію роду цих термінів-іменників у реченні вказують флексії залежних прикметників та дієслів у формі минулого часу.

Граматичний рід похідних іменників - назв неістот можна визначити за допомогою афіксів, оскільки, на дум­ку О. К. Безпояско, "за кожною такою (похідною) лексемою закріплений суфікс, який сигналізує про родову віднесеність" [1, с. 64]. Останнім часом це набуло особливого поширення, на що вказує І. Р. Вихованець: "У су­часній українській літературній мові новоутворювані іменники здебільшого мають словотворчі форманти як по­казники морфологічного роду" [2, с. 91]. Це явище не може не стосуватися агроекономічних термінів-іменників, утворених поєднанням іншомовних коренівта інтернаціональних або питомих українських формантів.

Найпродуктивнішим вирізнювачем віддієслівних іменників середнього роду виступає суфікс -нн-, напр.: суб­сидування. фермерування, бонітування, дисконтування, парцелювання, авансування та ін. Ці терміни середнього роду в українській мові називають абстрактні дії, процеси та стани. Середній рід деяких термінів - назв видів діяльності особи, пов'язаний зі словотвірним типом із суфіксом -ств-, що додається до іншомовної основи, напр.: фермерство < фермер- + -ств-(-о); трейдерство < трейдер-+ -ств-(-о).

На належність до іменників жіночого роду вказують деякі суфікси, зокрема: -ість у відприкметникових імен-никах-термінах на позначення якостей, властивостей, станів, напр.: сезонність, офшорність, рентабельність, продуктивність,-ацій-, -ізацій-/-изацій-, -фікацій- у термінах - назвах дій, процесів, станів, утворених в україн­ській мові на базі запозичених коренів або оформлених за допомогою цих суфіксів запозичених цілих іменників, напр.: консервація, контрактація, екологізація, офшоризація, парцелізація.

Для всіх мов, з яких поповнювалася українська термінологія економіки АПК, спільною є категорія числа, що має схожу логічну основу та історію розвитку в більшості мов. Оскільки "граматична категорія числа відтво­рює кількісні співвідношення предметів і явищ навколишньої дійсності і належить до категорій із семантичною домінантою" [1, с. 72], то воформленні множини запозичених термінів-іменниківзасобами української мовної системи майже не простежуємо відхилень від норми та трансформацій у парадигмі числа запозичень на ґрунті нашої мови. Українська мова запозичує терміни-іменники переважно у формі однини, а множину утворює за сво­їми законами. Від термінів, що в ній мають граматичні значення чоловічого та жіночого роду, форми множини утворюються за допомогою закінчень -и, -і, -ї, напр.: парцела - парцели; ферма - ферми; рента - ренти; пре­ференція - преференції;продукція - продукції; плантація - плантації та ін. Формальне вираження категорії числа безпосередньо залежить і від категорії роду: іменники залежно від родової належності та властивих їм закінчень належать до однієї з чотирьох відмін і відповідно у множині набувають різних закінчень.

Агроекономічні терміни-іменники на позначення конкретних понять як у мові-джерелі, так і в українській мові, мають співвідносні форми однини та множини, напр.: фр. parcelle (парцела) - parcelles (парцели); лат. dividendum (дивіденд) - dividenda (дивіденди), англ. lot (лот) - lots (лоти), нім. Aktionar (акціонер) - Aktionare (акціонери). Частина іменників у німецькій мові не змінює своєї форми, зокрема закінчення, в однині й множи­ні, але має різні артиклі. Потрапляючи ж до української мови, вони набувають різних закінчень, властивих для однини і множини, напр.: нім. Borse (біржа) - Borsen (біржі). Усі ці приклади вказують як на великі адаптивні можливості української мови, так і на те, що в морфологічній категорії числа іменників усіх зазначених мов ви­разно простежується її семантичне спрямування: відображати кількісні співвідношення предметів у позамовній дійсності. Також можемо констатувати відсутність будь-якого впливу норм мов-донорів на граматичну систему української мови.

На явище "переосмислення числа" запозиченого іменника звертав увагу у своїх працях С. В. Гриньов [3, с. 120-121]. Г. А. Сергєєва зафіксувала "випадки запозичення з англійської мови іменників у значенні одиничнос­ті, але зі збереженням формальних показників множини - закінчення множини ^",напр.: ф'ючерс, грос-термс, "пені стокс" [6, с. 99-100]. Термін "ф'ючерс"увійшов і до термінології економіки АПК, пор.: Форвардний контр­акт - це по суті крок до ф'ючерсу. [7, с. 2]. Як бачимо,формально-граматичний показник множини в цього слова втратив граматичне значення, притаманне йому в англійській мові, а сам термін, підпорядковуючись граматичній будові української мови, набув типового для неї закінчення множини: ф'ючерс - ф'ючерси. Можемо спосте­рігати зміну числа на українському мовному ґрунті, оскільки термін "ф'ючерс" в мові-джерелі не має форми однини. Змінив число та втратив закінчення множини -s під час запозичення в українську мову й англійський термін "бедленд", який у мові-донорі має лише форму множини "badlands", утворену внаслідок злиття слів "bad"

-   "поганий" та "lands" - "землі". Число іменників в українській мові є категорією лексико-граматичною, і хоч формально слово "бедленд" вживається у формі однини, проте позначає одиничне і множинні поняття, пор.: "не­придатна для оброблення земельна ділянка" і "неродючі землі".

В українській мові "назви предметів і явищ, що не підлягають кількісному визначенню, граматично вираже­ного протиставлення за числом не виражають" [8, с. 210]. Вони становлять класи слів singularia tantum та pluralia tantum. Тому в українській термінології економіки АПК з-поміж запозичених термінів-іменників, крім тих, що мають співвідносні форми однини та множини, трапляються іменники з неповною парадигмою категорії числа.

Семантика деяких запозичень є самодостатнім показником множинності, хоч має формальні ознаки однини, тому більшість таких іменників в українській мові має лише форму однини. Серед проаналізованих термінів-за-позичень до іменників однинної форми (singularia tantum) належать слова-англіцизми, які позначають абстрактні поняття, зокрема "бізнес", "агромаркетинг", "лаг", та термін-латинізм "емфітевзис", який є гіпонімом до пито­мого терміна "землекористування", що вживається тільки в однині, то ж за логічною подібністю й запозичений термін на українському ґрунті не розвинув форму множини. Форму singularia tantum мають похідні терміни, утворені від іншомовних основ за допомогою суфіксів.

Запозичених термінів-іменників, що належать до класифікаційної групи pluralia tantum (вживаних тільки в множині), у термінології економіки АПК незначна кількість. Усі вони перейшли із загальноекономічної терміно­логії до галузевої, є давніми запозиченнями української мови і позначають грошові суми, кількісно не окреслені, напр.: фінанси, кошти, гроші.

"Невідмінювані субстантиви на позначення предметів з органічно притаманними їм кількісними характерис­тиками, - на думку В. М. Фурси, - утворюють підгрупу іменників, у яких наявні граматично омонімічні форми однини і множини в одній лексемі" [9, с. 10]. Значення числа "невідмінюваних" конкретних термінів-іменників, у яких одиничність і множинність в українській мові не виражена морфологічними засобами, а встановлювана синтаксично, що ж до мови-джерела, то вони мали однину і множину, виражену морфологічно, пор.: аграрне лобі

-   аграрні лобі < англ. lobby - lobbies, сільський рантьє - сільські рантьє < франц. rentier - rentiers.

Отже, запозичені терміни економіки АПК цілком підпорядковані граматичній системі сучасної української літературної мови та набули властивих їй граматичних форм.

Література:

1. Безпояско О. К., Городенська К. Г., Русанівський В. М. Граматика української мови. Морфологія. - К. : Наук. думка, 1993. - 336 с.

2. Вихованець І. Р., Городенська К. Г. Теоретична морфологія української мови. - К. : Унів. вид-во "Пульсари", 2004. - 400 с.

3. Гринёв С. В. Терминологические заимствования (Краткий обзор современного состояния вопроса) // Лотте Д. С. Вопросы заимствования и упорядочения иноязычных терминов и терминоэлементов. - М. : Наука, 1982. -С. 108-135.

4. Панько Т. І. Від терміна до системи: Становлення марксистсько-ленінської політекономічної термінології у східнослов'янських мовах. - Львів: Вища школа, 1979. - 146 с.

5. Пропозиція. - 2000. - № 1-12.

6. Сергєєва Г. А. Англомовні запозичення в українській правничій термінології: Дис.. канд. філол. наук. 10. 02. 01/ Харків. нац. ун-т. ім. В. Н. Каразіна. - Харків, 2002. - 250 с.

7. Сільський час. - 2000.

8. Сучасна українська літературна мова: Підручник / М. Я. Плющ, С. П. Бевзенко, Н. Я. Грипас та ін. / За ред. М. Я. Плющ - К. : Вища школа, 2000. - 430 с.

Фурса В. М. Семантико-граматичне та словотвірне освоєння невідмінюваних імен: Автореф. дис.... канд. фі­лол. наук: 10. 02. 01 / Ін-т укр. мови НАН України. - К., 2004. - 20 с.УДК 81'33=134. 2

Кундис Л. Т.,

Львівський національний університет імені Івана Франка

НАЦІОНАЛЬНІ КОРПУСИ ІСПАНСЬКОЇ МОВИ

У статті подано опис двох національних корпусів текстів іспанської мови (El banco de datos del espanol і El Corpus del Espanol), розглянуто їх основні властивості, з'ясовано переваги та недоліки, а також проаналізовано дослідні можливості кожного з них.

Ключові слова: корпусна лінгвістика, корпус текстів, національний корпус, іспанська мова.

В статье представлено описание двух национальных корпусов текстов испанского языка (El banco de datos del espanol и El Corpus del Espanol), рассмотрены их главные свойства, определены преимущества и недостатки, а также проанализированы исследовательские возможности каждого из них.

Ключевые слова: корпусная лингвистика, корпус текстов, национальный корпус, испанский язык.

The article deals with the description of two national text corpora of Spanish language (El banco de datos del espanol and El Corpus del Espanol). Were examined their main features, determined advantages and disadvantages and was carried out the analysis of research possibilities of each one of them.

Key words: corpus linguistics, text corpus, national corpus, Spanish language.

Корпусна лінгвістика, що виникла як наука близько півстоліття тому, останнім часом набуває все більшого поширення. Про стрімкий розвиток цієї галузі прикладної лінгвістики свідчить постійне збільшення кількості мо­вознавців, які здійснюють різноманітні дослідження всіх рівнів мовної системи на матеріалі одного чи декількох корпусів тексів (КТ), число яких теж постійно зростає.

На сьогодні більшість мов вже представлена електронними ресурсами такого типу. Іспанська мова, як одна з найбільш поширених мов у світі, не є винятком: світ побачила значна кількість різноманітних текстових корпу­сів, які дають у руки лінгвісту безцінний матеріал для опису та вивчення мови в усіх її проявах. Найвідомішими та найбільш використовуваними з усіх корпусів іспанської мови є Банк даних іспанської мови (El Banco de datos del espanol) та Корпус іспанської мови (El Corpus del Espanol).

Банк даних іспанської мови (El Banco de datos del espanol) [10] - текстовий корпус, створений наприкінці 1990-х років лінгвістами Королівської академії іспанської мови. За стратегією побудови та призначення цей КТ є дослідницьким, тобто матеріал до даного типу корпусу був відібраний таким чином, щоб він міг адекватно репрезентувати мовну систему в її реалізації. За способом подання мовного матеріалу Банк даних іспанської мови є динамічним, тобто не є попередньо встановленим і незмінним набором текстів, а передбачає поповнення їх множини через певні проміжки часу. За хронологічним параметром розглянутий корпус є синхронно-діахрон-ним, тобто містить тексти, що репрезентують сучасну мову та її історичний розвиток. За предметною галуззю він є загальномовним (репрезентує національну мовну систему та її реалізацію), а за кількістю представлених мов - одномовним (конститутивною для нього є лише одна мова, а саме - іспанська). За типом охоплення тексту -повнотекстовий, тобто до його складу увійшли тексти повністю, без жодних скорочень. За розміром Банк даних іспанської мови належить до великих, або мегакорпусів, оскільки його обсяг становить понад 410 мільйонів сло­вовживань. Щодо типу реалізації мовної системи описуваний КТ належить до ресурсів мішаного типу: він подає тексти як писемного, так і усного мовлення.

Що стосується анотації корпусу, то його текстам було присвоєно маркування, визначене міжнародним стан­дартом SGML (Standard Generalized Markup Language). Та на сьогодні рівень його анотації (за визначенням авторів корпусу [10], мінімальний: він містить лише зовнішнє та структурне маркування) значно програє іншим, пізнішим проектам. Крім того, Банк даних іспанської мови належить до нелематизованих КТ, що, як зазначають дослідники [8, с. 152], робить неможливою велику кількість лінгвістичних досліджень на морфологічному і синтаксичному рівнях. До того ж, оскільки іспанська мова є багатою на морфологічні форми, відсутність лематизації суттєво ускладнює роботу з даними корпусу і в десятки разів збільшує час, затрачений на пошук потрібної інформації.

Структурно Банк даних іспанської мови організований як генеральний корпус з двома субодиницями: діа-хронним (CORDE) та синхронним (CREA) підкорпусами, що є взаємодоповнюваними ресурсами. Їх інтегратив-ність полягає у можливості переходу текстів з синхронної частини у діахронну, що здійснюватиметься тоді, коли дані перестануть входити до предметної галузі першої з них [10].

Діахронний корпус іспанської мови (El Corpus Diacronico del Espanol, CORDE) [7] - це корпус текстів "усіх часів та з усіх країн, де коли-небудь говорили іспанською, від зародження мови до 1975 року" [10]. Основними перевагами цього КТ є досить значний обсяг репрезентованих текстів (понад 250 млн. слововживань, що роблять його найбільшим на сьогодні іспаномовним ресурсом такого типу) усіх періодів розвитку іспанської мови, а та­кож можливість використання корпусу широким загалом. Саме ці особливості Діахронного корпусу іспанської мови посприяли популярності застосування його даних в історичних дослідженнях цієї романської мови.

Матеріалами для CORDE стали лише письмові тексти різноманітних жанрів (від лірики, драми і літературної прози до науково-технічних, історичних, релігійних текстів, а також періодики). Автори цього корпусу ставили собі за мету зібрати все "географічне, історичне і жанрове різноманіття іспанської мови задля досягнення таким зібранням достатньої репрезентативності" [10].

Хронологічно тексти описуваного КТ поділені на три великі періоди:

Середні віки (підгрупи: тексти періоду до 1250 р. ; тексти 1250 - 1492 рр.), що становлять 21 % всього корпусу;

 

© Кундис Л. Т., 2012Золотий вік (підгрупи: тексти 1493 - 1598 рр. ; тексти 1599 - 1713 рр.), який складає 28 % текстів;

- сучасна іспанська мова (підгрупи: тексти 1714 - 1812 рр. ; тексти 1813 - 1898 рр. ; тексти 1899 - 1936 рр. ; тексти 1937 - 1974 рр.), що охоплює 51 % даних усього корпусу.

Територіальний розподіл текстів Діахронного корпусу іспанської мови має такий вигляд: 74 % текстів похо­дять з Іспанії, 25 % - з країн Латинської Америки і 1 % - іспанська мова сефарді та ін.

За формою та жанром серед текстів, представлених у CORDE, можна виокремити дві великі групи: художню (складається з поезії та прози у відсотковому співвідношенні 15 % до 85 % відповідно) та нехудожню літературу (сюди увійшли тексти наукові, дидактичні, суспільні, релігійні, історично-документальні, юридичні, рекламні, публіцистичні і т. д.).

Попри певні недоліки (як вже було зазначено, тексти Банку даних іспанської мови мають лише зовнішнє та структурне маркування, а також відсутня лематизація словоформ), Діахронний корпус іспанської мови залиша­ється обов'язковим джерелом діахронно орієнтованих студій, стаючи все частіше в нагоді не лише дослідникам-іспаністам, але й тим, хто лише опановує іспанську мову.

Корпус сучасної іспанської мови (El Corpus de Referenda del Espanol Actual, CREA) [5] - корпус текстів, який охоплює широке коло письмових і усних текстів, створених у всіх іспаномовних країнах в період з 1975 р. по 2004 р. Як зазначають автори корпусу, він був розроблений таким чином, щоб "надавати вичерпну інформацію про мову у певний визначений період її історії та, відповідно, бути достатньо об'ємним, аби відображати всі най­важливіші особливості цієї мови" [10].

Виконання поставленого завдання передбачає, насамперед, розв'язання двох питань: обсягу корпусу та його збалансованості. Що стосується об'єму описуваного КТ, він становить більше 160 млн. слововживань. Такий значний розмір ресурсу (зважаючи також на те, що він охоплює лише 30 років у розвитку мови) свідчить про справді широке коло відображеного матеріалу, який дозволить проводити найрізноманітніші дослідження сучас­ної іспанської мови.

Репрезентативності і збалансованості як першочергових вимог до КТ творці CREA досягли шляхом вклю­чення в його склад матеріалів, відібраних за часовим, географічним і тематичним чинниками з урахуванням по­ходження текстів щодо форми побутування мови.

Часові рамки Корпусу сучасної іспанської мови спершу були обмежені 1975 - 1999 роками. Та у 2008 р. він був доповнений матеріалами наступних п'яти років (2000 - 2004 рр.), тож на сьогодні весь корпус поділений на шість періодів по п'ять років кожен: 1975 - 1979 рр. ; 1980 - 1984 рр. ; 1985 - 1989 рр. ; 1990 - 1994 рр. ; 1995 -1999 рр. ; 2000 - 2004 рр.

Що стосується територіального чинника, тут варто зважати на той факт, що іспанська мова є державною не лише для Королівства Іспанія, але й ще для 21 країни світу. Таким чином, розподіл текстів у CREA (як в частині усних, так і писемних текстів) щодо країни їх походження має такий вигляд: 50 % усіх матеріалів становлять тексти, що бути створені в Іспанії, і 50 % припадає на тексти з решти країн.

Оскільки CREA є корпусом мішаного типу, тобто в ньому представлені тексти як усного, так і писемного мовлення, важливим фактором досягнення репрезентативності є співвідношення між цими двома підгрупами. Даний корпус складається з 90 % писемних та 10 % усних текстів (подібне співвідношення є досить типовим для національних корпусів мов, зокрема для класичного на сьогодні Британського національного корпусу).

Писемна частина CREA (CREA Escrito), у свою чергу, поділяється на книги (49 %), пресу (49 %) та інші види текстів, а саме буклети, рекламні проспекти, електронні листи, блоги та ін. (2 %). Усна частина корпусу (CREA Oral) складається з записів радіо- та телепередач (сюди увійшли записи новин, репортажів, інтерв'ю, дебатів, спортивних трансляцій та оглядів і т. п.), що становлять основу CREA Oral, та записів іншого типу (телефонні розмови, повідомлення на автовідповідачах, неофіційні діалоги тощо).

Страницы:
1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96 


Похожие статьи

О І Ванівська - Корпусні та лексикографічні технології опису мовної системи термінознавство