Н Л Кузьмінська, Р М Семенишин - Статистичний аналіз деякої учбової літератури харчової промисловості - страница 1

Страницы:
1 

СТАТИСТИЧНИЙ АНАЛІЗ ДЕЯКОЇ УЧБОВОЇ ЛІТЕРАТУРИ ХАРЧОВОЇ ПРОМИСЛОВОСТІ

Н.Л. Кузьмінська, Р.М. Семенишин Національний університет харчових технологій У статті описані результати статистичного дослідження деяких текстів галузі харчова промисловість. Дослідження проводилось по частотним словникам, складеним за допомогою програми TextAnalyzer, яка була створена спільно з Міжнародним науково-навчальним центром інформаційних технологій та систем НАН України та МОН України.

 

Вступ.

Генеральна Асамблея Організації Об'єднаних націй проголосила 2008 рік Міжнародним роком мов. В [1] наголошувалось, що позиція ЮНЕСКО полягає у тому, що в багатомовному світі не можуть домінувати всього декілька глобальних мов, а повинні використовуватися і менш розповсюджені мови. Технологічно питання забезпечення мовного різноманіття в кіберпросторі на даний час розв'язане. Багатомовний матеріал Інтернету являє собою безцінний навчальний ресурс, який потрібно уміло використовувати. Вивчаючи багатомовні ресурси, користувачі не тільки поглиблюють знання іноземних мов, але і краще розуміють особливості рідної мови.

Хотілось би відзначити, що досить багато саме різногалузевої учбової літератури потрапляє в кіберпростір, і вона подана не відредагованою. І, в такому випадку, говорити про поглиблення знання або розуміння мови недоцільно. На жаль, з кожним роком ця проблема стає все актуальнішою для української мови. Об'єм учбової літератури збільшується, а якість його подання знижується. Тому проблема аналізу текстової інформації є досить актуальною.

Також підкреслимо, що автори відносяться до тієї категорії людей, які вірять, що мова і мовлення підкоряються статистичним законам. Наявність у мові кількісних характеристик визнається в явному чи неявному виді всіма мовознавцями [2].

Статистичне дослідження великого обсягу матеріалу має своєю метою встановлення деяких характеристик мови і мовлення. Статистичні методи не тільки додають більшої ваги і авторитетності, доказовості мовознавчим висновкам, вони здатні розкрити такі закономірності будови мови та мовлення, які без нихрозкрити неможливо, перевірити або і відкинути такі загальноприйняті твердження, існування яких можливе лише внаслідок недостатнього проникнення в глибину структури мови. У плані прикладному статистичні методи мають велике значення для відбору учбового матеріалу [2].

Автори  статті  вирішили  долучитися  до  приведених вище проблем та провести статистичне дослідження деякої учбової літератури у галузі «харчова промисловість». Статистичний аналіз текстів галузі «харчова промисловість».

Для аналізу були взяті підручники одного функціонального стилю (предмет «Товарознавство м'яса») на російській [3] та українській [4] мовах. Для складання частотних словників використали програму TextAnalyzer, яка була створена спільно з Міжнародним науково-навчальним центром інформаційних технологій та систем НАН України та МОН України та пройшла апробацію в вищезгаданому центрі. Більш докладно програма описана у [1].


Статистичні характеристики текстів, які вибрані для дослідження наведемо у таблиці 1.

На основі даних, отриманих програмою TextAnalyzer, були створені дискретні статистичні розподіли вибірок: (Xj,nxl), (xi,mxi) i=1,..,21 (х,- - довжина слова, nxi (mxl) - його абсолютна частота у частотному словнику (тексті)) для тексту [3] на російській мові (таблиця 2) та (yj,n„), (yj,m„) j=1,..,23 (y - довжина слова, щ- (m„- ) -його абсолютна частота у частотному словнику (тексті)) для тексту


Таблиця 3

y

nyi

w

 

w

1

33

0,003200776

5350

0,105616425

2

103

0,009990301

3229

0,063744941

3

168

0,016294859

3249

0,064139769

4

373

0,036178468

2610

0,051525022

5

709

0,068768186

4586

0,090534005

6

1001

0,097090204

4902

0,096772283

7

1313

0,127352085

6328

0,124923502

 


Використовуючи данні про дискретні статистичні розподіли (таблиці 2, 3) побудуємо полігони частот для вибірок, отриманих по тексту та по частотному словнику (рис.1, 2):

- - - -текст [2] ------------------------ текст [3]



Рисунок 1


 

 

 


н о н о « 0

 

1   2   3   4   5   6   7   8   9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

довжина слова

 

текст [2]


- текст [3]

 


На основі отриманих числових характеристик можна сказати, що середні довжини слів, дисперсії та середні квадратичні відхилення у російському та українському текстах близькі за своїми значеннями. Обидва розподіли мають додатну асиметрію (невелику), тобто

кількість варіант xj > x (yj > y ) переважає кількість варіант xi < x

(yt < y). Оскільки Ex = 0,29236 > 0 та Ey = 0,41503 > 0, то вершини

таких  законів  розподілів   будуть   гострими,  тобто   це будуть гостровершинні розподіли. На основі приведених даних (таблиця 4), можна зробити висновок, що отримані розподіли (вибірки по частотним словникам) близькі до нормального закону розподілу. Висновки.

Найуживанішим словом, якщо не рахувати прийменники, є, як в українській, так і у російській мовах, слово «м'ясо» («мясо»).

Раніше отримані результати досліджень [1], проведених над великою кількістю різнотематичної літератури, показали, що середня довжина слова в українському тексті менша за середню довжину слова в російському. Але наше дослідження цього не виявило, можливо, це пов'язано з вживанням великої кількості складних слів, які в літературній мові частіше замінюються двома або трьома словами. Такими «важкими» для сприйняття є слова, наприклад, вологоутворюючого, смакоаромоутворюючого і т.і. Це, звичайно, може бути специфіка саме цієї галузі, тому робити якісь висновки зарано, потрібно провести ще ряд додаткових досліджень з підручниками інших авторів. Список літератури.

1.  Н.А.Власенко, Н.Л.Кузьминская, А.А.Максименко. ЮНЕСКО
о многоязычии и
один из путей его эффективного использования.

2.         Перебийніс В.І. Статистичні методи для лінгвістів: Навчальний посібник/ Вінниця: «Нова книга», 2001 - 168 с.

3.           Товароведение пищевых продуктов. Учебник для технол.фак.торг.вузов. Тылкин В.Б., Кононенко И.Е., Дмитриева А.Б. - 2-е издание, переработанное и дополненное - М.: Экономика, 1980. - 432 с.

4.  І.В. Сирохман, Т.М. Раситюк. Товарознавство м'яса і м'ясних
товарів. Підручник. - К.: Центр навчальної літератури, 2004. - 384
с.

Страницы:
1 


Похожие статьи

Н Л Кузьмінська, Р М Семенишин - Статистичний аналіз деякої учбової літератури харчової промисловості