О І Ванівська - Корпусні та лексикографічні технології опису мовної системи термінознавство - страница 4

Страницы:
1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96 

9) ТГ 9 - назви на позначення часових параметрів ігрового часу: period, playing time, overtime, shot clock, hang time, garbage time, interval, time-out.

10) ТГ 10 - ігрові команди, опис суддівських жестів під час гри: pushing or charging without the ball; stop clock
for violation; excessive swinging of elbows, holding, ball returned to backcourt, beckoning-in, cancel score.

Отже, англомовна термінологія баскетболу є складною системно-семантичною парадигмою, основним спо­собом найменування у якій є метафоричне найменування явищ і понять: переосмислюється, метафоризується, спеціалізується загальновживана лексика, яка потім термінологізується. Основними рисами баскетбольної тер­мінології є її структурна (деривативна) похідність, компактність форми, динамічність, точність, високий ступінь інформативності, експресивність і метафоричність. Тематична класифікація номінацій баскетболу (виділено 10 тематичних груп) свідчить про чітку системну організацію спортивної лексики та розгалуженість підсистеми баскетбольної термінології.

1.Перспективи подальших досліджень вбачаємо у комплексному вивченні англомовної баскетбольної терміно­логії, у проведенні компаративних лінгвістичних досліджень англійської, української та російської термінолек-сики та в укладанні термінологічного словника.Англо-русский баскетбольный словарь : English-Russian Basketball Dictionary [Електронний ресурс]. - Режим доступу : http://slovotolk.com/society/sport/basket.html.

2.Бардіна Л. Актуальні аспекти сучасного адекватного перекладу спортивних термінів ігрових видів спорту / Л. Бардіна, Н. Назаренко // Актуальні проблеми фізичної культури і спорту. - 2005. - № 8-9. - С. 80-83.

3.Боровська О. Словотвірні характеристики термінів гандболу в англійській мові / О. Боровська, О. Матвіяс, Н. Юрко // Вісник Національного університету "Львівська політехніка". Серія : Проблеми української термінології. -Л., 2010. - № 675. - С. 175-177.

4.Офіційні правила баскетболу : Затверджені Центральним Бюро ФІБА : [український текст ...] [Електронний ресурс]. - Сан-Хуан, Пуерто-Ріко, 2010. - 81 с. - Режим доступу : http://ukrbasket.net/frontend/webcontent/images/ photo Galle^s/2011/07_2011/05/fiba_official_rules_2010_ukr.pdf.

5.Попов Р. В. Русская спортивная терминология (на материале баскетбольной терминосистемы) : автореф. дис. на соискание ученой степени канд. филол. наук : спец. 10. 02. 01 - русский язык / Р. В. Попов: - Северодвинск, 2003. - 24 с.

6.FIBA Europe Basketball Glossary [Електронний ресурс]. - Режим доступу : http://www.fibaeurope.com/cid_UD-XflK3IQgl4t8JKzEA00.html.

Official Basketball Rules: Approved by FIBA Central Board [Електронний ресурс]. - San Juan, Puerto Rico, 2010. - 81 p. - Режим доступу : http://www.fiba.com/downloads/Rules/2010/OfficialBasketballRules2010.pdf.УДК 81-13:811. 111+81374

Дубравська Д. М.,

Львівська комерційна академія

ВНЕСОК КОРПУСНОЇ ЛІНГВІСТИКИ У СУЧАСНУ ЛЕКСИКОГРАФІЮ

"Працюючи з корпусом ми відчували потік творчої енергії, яка надихала нас своєю придатністю до застосування, витон­ченістю та гнучкістю. "

Джон Сінклер1

У статті розглянуто поняття корпусу та роль репрезентативного корпусу в кволітативному та квантита­тивному аналізі лінгвістичних феноменів; розкрито актуальність корпусної лінгвістики та подано результати лінгвістичного дослідження частотності конвертованих іменників в дієслово та композитів із лексемою key (на матеріалах Британського національного корпусу (BNC).

Ключові слова: корпус, корпусна лінгвістика, корпусні дані, композити, конверсиви, лексикографія.

В статье рассмотрено понятие корпуса и роль репрезентативного корпуса в кволитативном и квантита­тивном анализе лингвистических феноменов; раскрыто актуальность корпусной лингвистики и представлены результаты лингвистического исследования частотности конвертированных имён существительных в глагол и композитов с лексемой key (на материалах Британского национального корпуса (BNC).

Ключові слова: корпус, корпусная лингвистика, корпусные данные, композиты, конверсивы, лексикография.

The article emmines the notion of the corpus as the new methodology for linguists. The role of a representative corpus in qualitative and quantitative analysis of linguistic phenomena is discussed. The importance of the corpus linguistics is revealed. The importance of copora to language study is aligned to the importance of empirical data. Empirical data enable the linguist to make objective statements, rather than those which are subjective, or based upon the individual's own internalised cognitive perception of language. The results of the linguistic research of the parent nouns denoting instrument which are converted into verbs and the list offrequency of the composits with lexeme key are given (based on the British National Corpus (BNC).

Key words: corpus, corpus linguistics, corpus data, cjmposits, conversion, lexicography.

Корпусна лінгвістика впродовж останніх десятиріч сформувалась в самостійний науковий напрямок, досяг­нення якого ознаменували новий етап в розвитку наукової думки. На сьогодні корпусна лінгвістика вважається відносно новим підходом, що має справу з емпіричним дослідженням "реального життя" мови, яке здійснюється за допомогою комп'ютера та електронних корпусів. Корпусна лінгвістика - займається створенням, обробкою та використанням корпусів. Праці провідних представників комп'ютерної та корпусної лінгвістики висвітлюють кардинальні проблеми організації корпусів текстів та застосування результатів їх аналізу в лінгвістичних дослі­дженнях [1; 6; 9; 12;13].

На основі корпусів текстів граматичні моделі досліджували С. Ханстон та В. Френсіс [7; 8], фразеологію Дж. Сінклер, M. Стабс, M. Холідей, В. Тойберт [5;12; 14; 15; 16], лексичні 'кластери' та їхні функції в різних жанрах Д. Байбер, Р. Реппен, Р. Сімпсон, Дж. Свейлс [2; 11], та семантичну просодію Д. Сінклер, Д. Байбер [2; 12]тощо.

Ця галузь лінгвістики зараз є дуже актуальною, хоча ще 15-20 років тому була захопленням невеликої кількос­ті людей. Термін корпусна лінгвістика виник на початку 1980-х [9, с. 105] і вживається для опису збірки мовних моделей чи цілих текстів: ними можуть слугувати слова, речення, розмови, журнальні та газетні тексти, чи цілі тексти книг. Теоретично корпус здатний представляти потенційно необмежену систематизовану вибірку текстів.

У науковому лінгвістичному словнику з'явилися дуже близькі поняття: "електронні бібліотеки", "масив тек­стів", "колекція текстів", "електронний архів", "повна текстова база даних" тощо. Серед них можна виділити лінгвістичні корпуси, або мовні корпуси. Варто зауважити, що праця з електронними корпусами давно вже стала одним з основних методів лінгвістичних досліджень.

Аналіз наукових джерел свідчить про те, що лексикографи використовували емпіричні дані ще задовго до появи дисципліни корпусної лінгвістики. Однак, цей процес був тривалий і громіздкий, дані досліджень не були репрезентативними (ґрунтувалися на даних спостереження).

Першим сучасним корпусом текстів був Браунівський корпус текстів на машинних носіях (Brown corpus 1960 - for American English). Його автори У. Френсіс та Г. Кучера спроектували його як набір прозаїчних друкованих тек­стів американського варіанту англійської мови (1 млн. слів). Його автори під словом "корпус" розуміли "сукупність текстів, яка вважається репрезентативною для даної мови, діалекту ... призначена для лінгвістичного аналізу" [4].

Браунівський корпус швидко перетворився в популярний об'єкт дослідження та навіть в певний стандарт для створення інших аналогічних корпусів. Аналогами Браунівського корпусу були LOBC (Ланкастер-Осло/Берген) (1978 рік - 1 млн. слів), London-Lund Corpus (LLC - 1987 рік, 1 млн. слів), Frown Corpus (Freiburg-Brown Corpus of American English) (1992 рік, 1 млн. слів).

У 1990-і роки створений British National Corpus (BNC, 100 млн. слів). В той же час був створений The Bank of English, Birmingham (600 млн. слів). На початку XXI ст. були створені такі корпуси, як American National Corpus (100 млн. слів) та Gigaword corpora (англійський, арабський, китайський - 1 млрд. слів) тощо.

1 John Sinclair, Introduction to How to Use Corpora in Language Teaching, Amsterdam: Benjamins, 2004, p. 1 © Дубравська Д. М., 2012


Британський національний стандартизований корпус текстів вважається як таким, що репрезентує сучасну бри­танську англійську мову в цілому, а тому відноситься до загальних корпусів. Містить різні жанри, насичений, збалан­сований (містить в собі писемне і усне мовлення). Писемні тексти підібрані за трьома критеріями: змістовим(галузь), часовим (період появи) та носієм інформації (типи публікації текстів - книги, газети, журнали тощо).

Хоча існує багато визначень корпусу [4; 12; 13; 17] - однак, існують спільні погляди на те, що корпус - це комп'ютеризовані автентичні тексти, підібрані і упорядковані згідно з експліцитними критеріями, визначеними користувачами, вони є репрезентативними зразками певної мови чи мовних варіантів.

Отже, корпусом може називатися репрезентативна вибірка текстів в електронній формі, доступ до якої забез­печується ретельно розробленими дослідницькими комп'ютерними програмами пошуку та аналізу.

Організація корпусу може бути різна - в залежності від прагматичних цілей його творця чи користувача. Хоча створений корпус може використовуватися і для цілей, які не були передбачені автором. Тексти, складові елементи корпусу, можуть бути цілісними оригінальними словесними творами чи їх частинами.

Корпуси діляться на одномовні та багатомовні, паралельні та порівняльні (перекладацькі корпуси), загальні і спеціалізовані, діахронні та синхронні.

Можна навіть стверджувати, що корпуси здійснили революцію в лексикографії. Послідовно застосовуючи принцип комп'ютерної обробки реального мовного матеріалу, що використовується у відповідних сферах кому­нікації, був сформований принципово новий тип словників [12]. Усі сучасні словники англійської мови створю­ються на базі корпусів, серед них Oxford, Collins, Longman, Cambridge, Macmillan тощо.

Лінгвістика зазнала значних змін за останні десятиріччя завдяки наявності електронних корпусів, які полег­шили аналіз мови як феномену. Для лексикології проведення досліджень з використанням електронних корпусів стало загальноприйнятим стандартом. На цьому фоні перспективними є лексикографічні дослідження, з опорою на дані корпусного аналізу.

На думку багатьох вчених при підборі корпусу для дослідження варто зважати на характерні риси корпусу: кількість (велика вибірка), якість (автентичність), репрезентативність (корпус повинен містити різноманітні зраз­ки з широкого ряду текстів) збалансованість (повинен з максимальною об'єктивністю представляти існування певного феномену в мовній практиці носіїв даної мови), простота формату, можливість верифікації даних тощо.

Отже, лексикографічні дослідження, проведені на основі корпусів будуть достовірними, якщо корпус текстів достатньо великий і варіативний - таким корпусом є британський національний корпус (BNC), на основі якого ґрунтуються наші дослідження.


Комп'ютерний аналіз великої кількості текстів дає нам можливість осягнути те, що невидимо неозброєним оком. Програма конкордансів швидко складе список частотності в алфавітному порядку, тому легше здійснити квантитативний та квалітативний аналіз різних лінгвістичних феноменів:

Корпусні дані - систематизовані і чіткі. З появою корпусів текстів з'явилася можливість використовувати кор­пусні дані для верифікації та перевірки результатів досліджень отриманих традиційним шляхом. Комп'ютерна лінгвістика змінила спосіб в який лексикографи можуть вивчати мову як феномен, використовуючи готові дані різних періодів. Корпуси містять дані для дескриптивних та теоретичних досліджень і дають можливість вносити радикальні зміни в лінгвістичну теорію на основі очевидних фактів.Емпіричні дані корпусів дають можливість лінгвістам робити об'єктивні висновки, ґрунтуючись на великій кількості зібраного матеріалу, а не на індивідуальних суб'єктивному сприйманню мови. Матеріали, зібрані в корпусах, це здебільшого зразки мови, яка використовується у реальному житті (зібрано регіональні та соціальні акценти), вони охоплюють різні періоди, жанри тощо.

Д. Літч розглядає корпусну лінгвістику як 'новий філософський підхід' [9, с. 106]. Багато інших вчених і ми в тому ж числі вважаємо її методологією, яка дає нам змогу здійснити всебічний аналіз феномену, який ми вивча­ємо. Перш за все це стосується частотності, тексти корпусу - дистрибутивна (або квантитативна / статистична) інформація: наявність лінгвістичних елементів, наприклад, чи засвідчені в корпусі конверсиви, композити, де­ривати, фразеологізми і як часто вони вживаються в текстах корпусу; ця інформація представлена у так званому реєстрі частотності в конкордансах у відповідному контексті. Великий розмір корпусу BNC, репрезентативність, наскрізний комплексний аналіз - уможливив нам дослідити таке явище словотворення, як композити.

Так серед 100 мільйонів слів композит weak tea зустрічається 16 разів, що підтверджує стійкий зв'язок між компонентами композита. Іншим композитам з лексемою weak (link. (32), form (30), position (30), spot (24), smile (23) etc.) притаманна навіть вища частотність, що вказує на статистичну значущість феномену.


Композити - ефективний шлях створення і вираження нових значень. Часто можна вивести значення компо­зита з його складових. Однак, існує доволі велика кількість композитів, зміст яких зовсім не можна взнати з пере­кладу його складових. При перекладі таких композитів ми орієнтуємося на оточення даного композита в реченні. Для прикладу розглянемо композити із лексемою key:

Отже, виникає необхідність глибокого аналізу композитів в розрізі морфології, семантики та граматики.

Хоча місце корпусів в лінгвістиці є контраверсійним, нині як ніколи виникає широкий інтерес щодо їх вико­ристання у лінгвістичних дослідженнях. Це зумовлено тим, що лінгвісти більш зацікавлені у практичному вико­ристанні мови, ані ж у мові як абстрактній системі. Безсумнівно, що такий глибокий інтерес появився внаслідок появи і розвитку корпусних методик, які дозволяють швидко і точно аналізувати такі корпуси різні виміри.

Корпусна лінгвістика не лише запропонувала нові методи для лексикографії, але й розширила межі її до­слідження. Ініціатором в цьому був Джон Сінклер, який уклав словник англійської мови (COBUILD 1987), що цілком базувався на корпусі.

Корпусна лінгвістика розширила наші лінгвістичні знання завдяки вдалому поєднанню трьох різних підходів: ідентифікація мовних фактів за допомогою категоріального аналізу (процедурний підхід); кореляція фактів за допомогою статистичних методів (математичний підхід); і інтерпретація результатів (когнітивний підхід). Якщо перших два підходи автоматизовані, останній потребує людського інтелекту, оскільки інтерпретація даних по­требує людської свідомості. Звичайно інтерпретація даних - це завдання людини, а не корпусу текстів. "... кор­пуси безсумнівно цінні джерела для лінгвістичного аналізу ..." [17, с. 144].

Корпусна лінгвістика враховує, що мова - соціальний феномен. Більшість текстів корпусів - комунікативна діяльність в процесі взаємодії членів певної мовної спільноти. Корпус віртуально поєднує в собі комунікативнудіяльність будь-якої відібраної мовної спільноти (у нашому випадку англомовної). Однак, ми не знаємо як саме мовець чи слухач розуміє слова, речення і тексти, які він промовляє чи чує, нам відомо лише те, що є в тексті корпусу тобто в контексті). Саме в контексті визначається конкретне значення слова. Корпусна лінгвістика дає нам змогу не лише виявити зв'язки між елементами тексту та контекстом, а також сегментами тексту.

Корпусна лінгвістика - доповнення до традиційної лінгвістики, але, на відміну від традиційної, корпусна лінг­вістика використовує корпуси не лише для вивчення окремих абстрагованих прикладів, але й для систематичного дослідження феномена в контексті, оскільки вона більш зацікавлена в семантичному зв'язку між елементами тексту і контексту, що можна виявити за допомогою квантитативного аналізу дискурсу чи корпусу.

Дослідження словникового запасу найчастіше зустрічається в корпусній лінгвістиці. Корпуси дають змогу отримати дані по лексемі в цілому (пошук за лемою) та по конкретній словоформі, виявити типові/нетипові вжи­вання та характерні сполучення слів. Ці дані можуть бути різними: контексти, частоти (абсолютні та відносні), частоти за колокаціями, статистика по жанрах/стилях/авторах, тощо. Саме корпусна лінгвістика дає змогу спра­витися з таким динамічним аспектом мови як словотворення. Корпус дає можливість продемонструвати різні способи вживання лексики в певному контексті.

Джон Ферс наголошував на важливості аналізу оточення, в якому перебуває слово [3]. Саме тому класифіка­ція слів лінгвістами здійснюється не лише за їхнім значенням, але й на основі співіснування з іншими словами.

Корпус, як правило, забезпечує нас емпіричним матеріалом для підтвердження гіпотези; інформацією про частотність вживання слів, фраз чи конструкцій, які можна використати з метою квонтитативних досліджень; та метаінформацією (екстралінгвістичною інформацією) - про такі фактори як вік, рід мовця чи автора, жанр тексту, часові та просторові параметри походження тексту тощо. Така екстралінгвістична інформація дає змогу порівняти різні типи текстів чи різні групи мовців.

Для проведення ефективного корпусного аналізу необхідна чітка методика та інструментарій, оскільки аналіз корпусів текстів включає в себе більше, ніж простий підрахунок лінгвістичних характеристик. Необхідно пере­конатися, що вибраний вами корпус містить потрібну кількість текстів відповідної довжини для аналізу, саме тоді результати будуть валідними, а висновки матимуть надійне підґрунтя.

Сучасна лексикографія аналізує і використовує методи та можливості корпусної лінгвістики, яка в свою чергу освоює методи та можливості лексикографії. Оскільки це відносно новий підхід до вивчення лінгвістичних явищ, корпус та його інструментарій постійно оновлюється і зазнає якісних змін.

Література:

1.Atkins S., Clear J. and Ostler N. 'Corpus design criteria'. / S. Atkins, J. Clear, N. Ostler. // Literary and LingComputing 7/1, 2005. - P. 1-16.

Biber D., Conrad S., Reppen R. Corpus linguistics: investigating language structure and use. / Douglas Biber, Susan Conrad, Randi Reppen. Cambridge University Press, 1998. - 300 p.

2.Firth, J. R. A synopsis of linguistic theory. Studies in linguistic analysis. / J. R. Firth, Oxford : Oxford University Press, 1957. - P. 179.

3.Frequency analysis of English usage: lexicon and grammar / by Henry Kucera and W. Nelson Francis. - Boston : Houghton Mifflin, 1982. - pp. 3-15.

4.Halliday, M. A. K. Lexis as a linguistic level. // In C. E. Bazell, J. C. Catford, M. A. K. Halliday & R. H. Robins (Eds.), In Memory of J. R. Firth. London : Longman, 1966. - pp. 148-162.

5.Hunston S. Corpora in applied linguistics. / Susan Hunston. Cambridge : Cambridge University Press, 2002. - 241p.

Страницы:
1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96 


Похожие статьи

О І Ванівська - Корпусні та лексикографічні технології опису мовної системи термінознавство