А П Загнітко - Лінгвістичні студії - страница 54

Страницы:
1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68 

Структурна розмітка КТ граматичної службовості наразі включає дані тільки про межі тексту, це тег <doc> - </doc>, і межі речень у ньому тег <s> - </s>. Спеціальний тег <g/> позначає розділові знаки, перед якими не ставиться пробіл - це всі, крім тире. У перспективі маємо намір додати автоматично виставлені позначки абзаців, параграфів, розділів, частин тощо. Лінгвістична розмітка - завжди найскладніша і найважливіша частина корпусу. Оскільки було обрано за основний корпусний менеджер відкритий проект NoSketch Engine (http://nlp.fi.muni.cz/trac/noske), розроблений в університеті Масарика (Брно, Чехія) [Rychly, Pavel, Srnrz, Pavel 2004], то форма представлення розмітки у вигляді тегів була єдино можливою. Структура стандартного тегу є такою: на першій позиції в тегу позначка граматичного класу слова, далі позначки підкласів, усі позначки одно символьні латиницею або цифрами, за кожним підкласом закріплена позиція, яка не змінюється для різних класів (детально описати принципи тегування маємо намір у наступних публікаціях).

Наприклад, для слова конференцією тег має вигляд - Izzooin1m (сх. 1).

Схема 1. Розшифрування тегу для словоформи «конференцією»

іменник

I

Z

жіночий рід

Z

O

орудний відмінок

O

I

Неістота

N

м'яка група

M

загальна назва

однина

іменни­ковий тип відміню­вання

перша відміна

1

У КТ граматичної службовості закладено такий поділ слів на граматичні класи із позначенням їх за ключовими літерами українських термінів (табл. 2):

_Таблиця 2. Класи слів у КТ граматичної службовості

Клас

Тег

1)

(І)менник

I

2)

(Д)ієслово

D

3)

При(к)метник

K

4)

При(с)лівник

S

5)

(Ч)ислівник

C

6)

(З)айменник

Z

7)

Час(т)ка

T

8)

С(п)олучник

P

9)

При(й)менник

J

10)

(В)игук

W

11)

(А)бревіатура

A

12)

(Р)ешта

R

Нарешті, на завершення першої із серії публікацій наведемо розгорнуту систему тегів для частини мови, яка є одним із безпосередніх об'єктів вивчення - частки (табл. 3).

_Таблиця 3. Система тегів для класу частки

Позиція в коді

Атрибут

Значення

Тег

0

Час(т)ка

 

T

1

Походження

п(е)рвинна

e

 

 

в(т)оринна

t

2

Тип (для вторинних)

(в)ідсполучникова

v

 

 

в(і)ддієслівний

i

 

 

відз(а)йменниковий

a

 

 

від(п)рислівниковий

p

3

Будова

(п)роста

p

 

 

с(к)ладна

k

 

 

ск(л)адена

l

4

Статус

власне час(т)ка

t

 

 

частка-(в)исловлення

v

 

 

(а)налог частки

a

5

Дистинктивний тип

(а)пелятивна

a

 

 

(о)цінна

o

 

 

(е)моційна

e

 

 

(т)екстоструктурувальна

t

6

Функційний тип

Вказівна

f

 

 

категорійно-комунікативні:

l

 

 

питальна

 

 

 

Спонукальна

m

 

 

заперечна

q

 

 

Стверджувальна

1

 

 

дискурсивні: підсилювальна

2

 

 

роз'яснювальна

3

 

 

Обмежувальна

4

 

 

Зіставна

5

 

 

Відокремлювальна

6

 

 

Видільна

7

 

 

Порівняльна

8

 

 

Вірогідна

9

Отже, розробка КТ граматичної службовості, як, зрештою, і будь-якого корпусу текстів є складним багатокроковим процесом. На сьогодні завершено створення україномовного інтерфейсу для корпусного менеджера NoSketchEngine Manatee/Bonito, розроблено систему тегів для металінгвістичної та власне лінгвістичної морфологічної розмітки, що буде описано у наступних публікаціях серії. Найважчим завданням попереду є визначення кількісних і якісних параметрів критерію репрезентативності для текстів корпусу, механізмів автоматичного розмічування.

Література

Баранов 2003: Баранов, А.Н. Введение в прикладную лингвистику [Текст] / А. Н. Баранов. - М. : Едиториал УРСС, 2003. - 360 с. - ISBN 5-354-00313-X

Бук 2007: Бук, С. Корпус текстів Івана Франка : спроба визначення основних параметрів [Текст] // Прикладна лінгвістика та лінгвістичні технології : MegaLing-2006 : Зб. наук. пр. / НАН України. Укр. мовн.-інформ. фонд, Таврійськ. нац. ун-т ім. В. І. Вернадського ; за ред. В. А. Широкова. - К. : Довіра, 2007. - С. 72­82.

Демська-Кульчицька 2005: Демська-Кульчицька, О. Основи національного корпусу української мови [Текст] / О. Демська-Кульчицька. - К. : Інститут української мови національної академії наук України, 2005. -219 с.

Захаров 2005: Захаров, В.П. Корпусная лингвистика : Учебно-метод. пособие. - СПб., 2005. - 48 с. Зубов 2004: Зубов, А.В. информационные технологии в лингвистике : Учеб. пособие для студ. лингв. фак-тов высш. учеб. заведений [Текст] / А. В. Зубов, И. И. Зубова. - М. : Издательский центр «Академия»,

2004. - 208 с.

Карпіловська 2006: Карпіловська, Є.А. Вступ до прикладної лінгвістики : комп'ютерна лінгвістика. Підручник [Текст] / Є. А. Карпіловська. - Донецьк : ТОВ «Юго-Восток, Лтд», 2006. - 188 с. - ISBN 966-374­078-7.

Корпусна лінгвістика 2005: Корпусна лінгвістика : Моногр. [Текст] / В. А. Широков, О. В. Бугаков, Т. О. Грязнухіна, О. М. Костишин, М. Ю. Кригін ; НАН України, Укр. мов.-інформ. фонд. - К. : Довіра, 2005. -

472 с.

Загнітко, Каратаєва 2012: Загнітко, А.П., Каратаєва Г.О. Словник часток : матеріали і статті [Текст] / Анатолій Загнітко, Анна Каратаєва ; Донец. нац. ун-т. - Донецьк : ДонНУ, 2012. - 381 с.

Загнітко, Ситар, Данилюк, Щукіна 2007: Загнітко, А.П., Ситар, Г.В., Данилюк, І.Г., Щукіна, І.А. Словник українських прийменників. Сучасна українська мова [Текст]. - Донецьк : ТОВ ВКФ «БАО», 2007. - 416 с.

Загнітко, Ситар, Данилюк 2012: Загнітко, А.П., Ситар, Г.В., Данилюк, І.Г., Структура і модель бази даних «Українські частки та їхні еквіваленти» [Текст] // Комп'ютерна лінгвістика : сучасне та майбутнє. Матеріали Міжнародної науково-практичної конференції. - К. : КНЛУ, 2012. - С. 21 -22.

Загнитко, Ситарь, Данилюк 2011: Загнитко, А.А., Ситарь, А.В., Данилюк, И.Г. Особенности структурирования базы данных служебности <-> вспомогательности : на материале украинских частиц [Текст] // Проблемы компьютерной лингвистики : Сборник научных трудов под ред. А. А. Кретова. - Вып. 5. - Воронеж,

2011. - С. 56-67.

Українська мова 2004: Українська мова : Енциклопедія / Редкол. : Русанівський, В. М. (співголова), Тараненко, О. О. (співголова), Зяближ М. П. та ін. - 2-ге вид., випр. і доп. - К. : Вид-во «Укр. енцикл.» ім. М. П. Бажана, 2004. - 824 с. - ISBN 966-7492-19-2.

Biber, Conrad, Reppen 1998: Biber, D., Conrad, S., Reppen R. Corpus Linguistics, Investigating Language Structure and Use [Текст]. - Cambridge : Cambridge UP, 1998. - ISBN 0-521-49957-7

Facchinetti 2007: Facchinetti, R. (ed.) Corpus Linguistics 25 Years on. [Текст]. - New York / Amsterdam : Rodopi, 2007. - ISBN 978-90-420-2195-2

Rychly, Pavel, Smrz, Pavel 2004: Rychly, Pavel, Smrz, Pavel. Manatee, Bonito and Word Sketches for Czech. In Proceedings of the Second International Conference on Corpus Linguisitcs [Текст]. - Saint-Petersburg : Saint-Petersburg State University Press, 2004. - Pp. 124-132. - ISBN 5-288-03531-8.

Wallis, Nelson 2001: Wallis, S., Nelson, G. Knowledge discovery in grammatically analysed corpora [Текст] // Data Mining and Knowledge Discovery, 5. - 2001. - Pp. 307-340.

Wynne: Wynne, M. (editor). Developing Linguistic Corpora : a Guide to Good Practice [Електронний ресурс]. - Oxford : Oxbow Books, 2005. - Access mode : URL http://ahds.ac.uk/linguistic-corpora. - Title from the screen. - ISSN 1463 5194.

В статье рассмотрены основные теоретические и практические подходы к созданию новейшего корпуса текстов украинского языка, предназначенного, кроме общих лингвистических целей, для изучения функционально-коммуникативной природы служебных частей речи - предлога, частицы и союза. Описаны требования к корпусу, поставленные в рамках проекта задания, технические и программные аспекты реализации корпуса текстов, система тегов для служебных частей речи.

Ключевые слова: корпус текстов, корпусный менеджер, разметка, тег, служебные части речи.

The article discusses the basic theoretical and practical approaches to the design of new corpora for the Ukrainian, which is designed among other general linguistic purposes for studying functional and communicative nature of the syntactic parts of speech (POS) - preposition, conjunction and particle. We describe the requirements for building, objectives set in the project, technical and program aspects of the corpora, tag system for syntactic POS.

Keywords: corpora, corpora manager, tagging, tag, syntactic POS.

Надійшла до редакції 7 серпня 2012 року.

РОЗДІЛ ХІ. УКРАЇНСЬКІ ДІАЛЕКТИ СЬОГОДНІ: СТАН ТА ПЕРСПЕКТИВИ ДОСЛІДЖЕННЯ

Надія Загнітко

УДК 801.311

ПРО ДЕЯКІ НАЗВИ ЇЖІ ТВАРИННОГО ПОХОДЖЕННЯ В СХІДНОСТЕПОВИХ ГОВІРКАХ

ДОНЕЧЧИНИ

Стаття продовжує цикл публікацій автора про особливості назв їжі в говірках Донеччини. У ній здійснено структурно-семантичний аналіз частини назв їжі тваринного походження. Докладно розглянуто структурно-семантичні особливості мікропарадигм назв м'яса, жирів та приготовлених з них страв, уживаних у східностепових говірках, а також ареальну поведінку зазначеного сегмента лексики харчування.

Ключові слова: діалектна лексика, лексема, сема, семантична структура слова, східностепові говірки.

Лексико-семантична система діалектної мови як складний і багатогранний об'єкт дослідження відображена в роботах багатьох лінгвістів. Наблизитись до об'єктивного та всебічного опису лексичної диференціації певного діалектного континууму або його частини можна насамперед шляхом максимально повного вивчення лексики, здійснюваного поетапно за окремими сегментами системи [Гриценко 1990: 14]. Тому важливу роль в аналізі структури діалектів, визначенні діалектного членування мови загалом відіграє вивчення діалектної лексики за окремими тематичними групами лексики (ТГЛ) та лексико-семантичними групами (ЛСГ) з урахуванням усіх багатовимірних зв'язків та відношень, у яких перебуває лексема з іншими елементами системи.

Метою статті є системний аналіз складу й семантичної структури частини назв їжі тваринного походження у східностепових говірках Донеччини.

Заявлена мета зумовлює необхідність розв'язання таких завдань:

1. виявити склад, структурну організацію й семантику лексико-семантичної групи назв їжі тваринного походження в східностепових говірках Донеччини;

2. здійснити   структурно-семантичний   аналіз   деяких   назв   їжі   тваринного   походження в східностепових говірках Донеччини;

3. з'ясувати закономірності формування й змін досліджуваної лексики та її семантики в говірках пізньої формації.

Помітне місце серед тематичних груп лексики посідають назви народного побуту, що охоплюють назви меблів та інших хатніх речей, назви посуду й кухонного начиння, назви одягу, взуття, прикрас, головних уборів, назви їжі, напоїв тощо.

На українському діалектному матеріалі лексика, пов'язана з харчуванням неодноразово була предметом спеціальних досліджень, серед яких чільне місце посідають роботи Є.Д. Турчин на матеріалі східнополіських українських говорів [Турчин 1990], З.Т. Ганудель на матеріалі українських говорів Східної Словаччини [Ганудель 1975], Е.Д. Ґоци на матеріалі українських карпатських говорів [Ґоца 2001: 194-197].

Проте назви їжі, напоїв новостворених українських говорів загалом та східностепових говірок зокрема на сьогодні залишаються маловивченими. Тому актуальність дослідження зумовлена необхідністю докладного вивчення складу, семантики й географії ТГЛ харчування говірок Донеччини. Ця стаття присвячена аналізу назв їжі тваринного походження.

У структурній організації назв їжі тваринного походження домінантною є диференційна ознака (ДО) "продукт, з якого приготовлено страву". Відповідно всі назви м'ясних страв можна поділити на три лексико-семантичні мікрогрупи: назви їжі з м'яса, назви їжі з жиру та сала, назви їжі зі свинячої крові. Здавна м'ясо й м'ясні страви повсякденно споживали тільки заможні люди. Обмеження споживання м'ясних продуктів обумовлювалося тяжким матеріальним становищем більшості селянських господарств, а тому використовували все - навіть кров забитої худоби. Так, Л.Ф. Артюх зазначає: "З забитої свині майже не лишалося відходів" [Артюх 1982: 33-34].

Лексико-семантична мікрогрупа назв їжі з крові репрезентована в східностепових говірках маніфестантами двох сем: "ковбаса з крові" та "смаженя з крові". Сема "ковбаса з крові" в досліджуваних говірках реалізована майже однотипно: лексемою кровйанка з варіантами кров'анка, кроавйанка, кроав'анка та описовою номінативною конструкцією кровйана ковбаса.

Порівняймо: кровйанку рдбл'ат' с крдв'і / добавл'айут' йайёчка / кашу // (29) кровйанку робили з'і свин'ачих кишдк / кров туди залиевали с пшондм // (10) робили домашн'у кровйану ковбасу / йак порос'а р'іже"мо / то об'азат'ел'но готдвимо// (81). Зрідка назви кровйанка, кровйана ковбаса входять до словника обстежуваних говірок, однак належать до пасивної його частини, що пов'язано з екстралінгвістичними чинниками. Порівняймо: ми кровйану ковбасу неи йімд / бо ми православн'і / і йак вам сказат' / йіжште все / кр'ім крдв'і / бо в н'ій йес'т' душа і л'удини / і тварини // (67).

Сема "смаженя з крові" маніфестована в досліджуваних говірках однотипно-описовою двокомпонентною номінативною конструкцією жарена кров. Порівняймо: і кровйанку робили / і прдсто кров

© Загнітко Н., 2013жариели / на салов'і або на жиеру / в основндму на жиеру / виелиевали кров на сковор 'їдку / циебул'ки туда трдшки /і пе"реим'ішували /жариелос' /і шли тод'ї /вонд вкусне таке // (13).

Іншу лексико-семантичну мікрогрупу в межах ЛСГ назв м'яса, жирів та приготовлених з них страв утворюють назви їжі з м'яса. Усі вони диференціюються за ДО "спосіб приготування".

Серед таких назв у досліджуваних говірках виділяються репрезентанти сем "проварені страви з м'яса", "запечені страви з м'яса" або "смажені страви з м'яса". Усі страви з м'яса в досліджуваних говірках мають загальну назву: мйасо - у більшості східностепових говірок, м'асо - 64, 10, 31, 16, 63, 65, 58, 37, 17, 74, 79; мн'асо - 29, 24, 69, 62, 15, 42, 23, 41, 54, 52, 5, 46, 57. Паралельно вживаються й номени атрибутивного походження: мйасне, м'асне, мн'асне.

До основних назв варених страв з м'яса в донецьких говірках відносимо лексеми на позначення провареної поребрини; домашніх ковбас, начинених м'ясом; начиненого м'ясом і приготовленого як страва шлунка тварини; холодцю.

Передня частина туші з ребрами, поребрина, у досліджуваних говірках має назву: пореибрина - 18, 56, 22, 49, 4, 30, 64; пор'ібрина - 5, 51, 14, 13, 79, 61, 48; реибрина - 9, 80, 71, 72, 20, 63, 1, 50, 2, 13, 55, 81; пор'їбр'а -60, 37, 8, 35, 52; ребра - 70, 63, 33, 50, 59, 73, 5, 46, 47, 57, 43, 41, 38, 76, 39, 45, 3, 15, 27, 69, 34, 77, 21, 12, 68, 32; р 'дбра - 7, 16; реберц 'а - 39, 26, 29; р 'дбришка - 58, 65, 23, 41, 29, 40, 74; поребершч 'інка - 66; груднинка -31; ребринка - 24, 54; ребри - 35; р 'дбрушки - 53; п 'ідреберйа - 10. Така фонетична й словотвірна варіативність відображає особливості східностепових говірок, що сформувалися під впливом різнодіалектних контактів та сусідніх російських говірок. У деяких обстежуваних говірках спостерігаємо вживання лексичних різногенетичних дублетів, якими часто є лексеми російської та української мов [Омельченко 1982: 101].

Порівняймо: р'дбришка // реибрина - 65, р'дбришка // ребра - 41, 3.

До назв варених страв з м'яса відносимо й назви холодцю - драглистої страви, яку одержують при охолодженні м'ясного відвару з подрібненими шматочками м'яса. У східностепових говірках до таких назв

належать: холодец' - 11, 33, 63, 65, 25, 28, 7, 50, 59, 73, 1, 10, 34, 22, 49, 27, 31, 5, 52, 57, 35, 8, 47, 4, 20, 17, 60,

54, 38, 72, 43, 71, 80, 76, 39, 9, 48, 69, 2, 24, 3, 15, 23, 42, 30, 41, 45, 14, 62, 13, 12, 77, 74, 68, 36, 21, 53, 56, 81, 75;

холддне - 37, 58, 33, 47, 72, 52, 51, 30, 41, 76, 31, 26, 13, 7, 50, 59, 1, 12, 77, 6, 75, 44, 19, 61, 67, 18, 56, 53;

хоалддне - 20, 64; хоалоадец' - 35, 64, 16; студ'ін' - 47, 66, 29, 79, 78, 6, 55; студеин' - 71, 60, 24, 48, 33, 22, 32, 75, 59, 73; студеинец' - 60, 33. Спорадично в донецьких говірках уживаються лексеми захолод - 8 та зимне - 53.

Наведені вище матеріали свідчать, що найбільш уживаними в досліджуваних говірках є назви холодец' (хоалоадец' ) та холддне (хоалддне). Такі номени відомі й іншим українським говорам.

Порівняймо: поліськ. холодец' "холодний борщ, приготовлений з сироватки, зелені й риби" [Лисенко 1972: 225], полт. холодец' "їжа, виготовлена з захолодженого густого м'ясного навару" [Ващенко 1960: 99-100], зах.-поліськ. холодниц'а "холодець" [Аркушин 2000, ІІ: 231]. Функціонування лексем студ'ін' (студен'), захолод, студеинец' , очевидно, свідчить про залишки впливу поліських та південно-західних українських говірок, що є материнськими для деяких східностепових. Порівняймо: поліськ. студ'ен' "холодець" [Лисенко 1972: 206]; поліськ. захолдд "холодець (з м'яса)" [Лисенко 1972: 81]; бойк. студ'ін', студенина "холодець" [Онишкевич 1984, ІІ: 262]; бук. студенец, студинец, студ'інец "холодець" [СБГ 2005: 530]. Слід зазначити, що в сучасних східностепових говірках назва студ'ін' (студен' ) нерідко є маркованою щодо часу використання. Порівняймо: соврем'ен:ий холодец' / це тод'їшн'ій студ'ін' // (62) тод'ї / ран'ше / назиевали студеин' / каже / вже наварила студ'н'у // (71).

До назв варених страв з м'яса відносимо й репрезентанти семи "домашня ковбаса з м'яса". В усіх досліджуваних говірках ця сема реалізована описовою номінативною конструкцією домашн'а ковбаса (домашн'а ковбаска).

Порівняймо: Ал'дша м'ій вобшч'е кровйану ковбасу неи йїс'т' / йа йому домашн'у готдвл'у // (81) йак зар 'їжут' кабана / це знач 'іт' сало на другий ден' посолили / і ковбаси домашн'ї робили з мн'аса // (62).

До аналізованої лексичної мікрогрупи належать і назви начиненого м'ясом і приготовленого як страва шлунка тварини: кен'д'ух (кен'д'ушдк) - 69, 2, 48, 9, 24, 29, 52, 27, 23, 3, 15, 45, 41, 38, 71, 72, 76, 43, 80, 54, 14, 8, 57, 47, 33, 25, 1, 28, 7, 50, 22, 49, 4, 77, 13, 31, 32, 12, 61, 67, 56, 75, 6, 19, 44, 37, 70, 10, 34, 63; сал'т'ісдн - 20, 68, 55, 40, 66, 59, 18, 11, 33; кдвбик - 65, 14, 16, 78, 45. Порівняймо: а тод'ї начин'али жеилуоч'ек із порос 'атки / назиевавс'а кеин'д'ушдк / отд булд нар 'їжут' туди мн'аса / шкурки із сала / начин'ат' / зашийут' / тод 'ї провар 'ат' / а тод'ї / йак неи булд духовки / у пеич 'ї приеп 'ікали / в'їз 'мут' тод'ї п 'ід той / приедавл'ат' п 'ід такий прес / гн'їтиек п 'ідлджут' / і в 'ін такий плоский рдбиец ':а // (62). Усі вище зазначені назви функціонують і в інших українських говорах.

Страницы:
1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68 


Похожие статьи

А П Загнітко - Лінгвістичні студії