ПРИК ЛАДНА ЛІНГВІ СТИК А.
ЛІ НГВОДИ ДАК ТИ К А
УДК 811.161.2’33:82’09
БОЇ: 10.18523/1стр2522-9281.2019.5.158-169
Ілля Данилюк
https://orcid.org/0000-0001-8681-9321
Анатолій Загнітко
https://orcid.org/0000-0001-7398-6091
Ганна Ситар
https://orcid.org/0000-0001-8806-8322
КОРПУС ТЕКСТІВ ЮРІЯ ШЕВЕЛЬОВА:
СТРУКТУРА, ФУНКЦІЇ, НАВІГАЦІЯ
Статтю присвячено проблемі створення корпусу текстів Юрія Шевельова. Визначено основні структурні компоненти корпусу текстів, виділено
функції, схарактеризовано особливості його наповнення, пояснено екстра
лінгвістичне й лінгвістичне розмічення.
Ключові слова: конкорданс, корпус текстів, лінгвоперсона, лінгвоперсонологія, розмітка корпусу, частотний аналіз, Юрій Шевельов.
Вступ
Лінгвоперсонологія Грунтована на філософському розумінні персо
налізму (Б. П. Боун, Р. Г. Лотце, Дж. X. Хауісон, У. Джеймс, Дж. Ройс,
М. У. Калкінс, У. Е. Гокінґ, Г. У. Опорт, Е. Муньє, Т. О. Бофорд та ін.),
одним із виявів якого постає теза про духовне оновлення особистості,
тяглість її самовдосконалення У сучасній лінгвістиці актуалізовані
1 Дослідження виконано в межах фундаментального наукового проекту «Об'єктивна і суб'єк
тивна мовносоціумна граматика: комунікативно-когнітивний та прагматико-лінгвокомп'ютерний виміри» (011811003137).
© Ілля Данилюк, Анат олій Загнітко, Ганна Ситар, 2019
188Ы 2522-9281. Мова: класичне - модерне - постмодерне. 2019. Випуск 5
159
питання мовного портрета особистості, встановлення структурних і функційних компонентів останнього. Заявлені та низка інших питань поста
ють істотними для сучасної прикладної лінгвістики, почасти для пси
холінгвістики, лінгвопсихіатрії, нейролінгвістичного програмування, су
гестивної лінгвістики та ін. У лінгвоперсонології як науці про мовну
особистість - одноосібну (монолінгвоперсона) чи колективну (полінгвоперсону) - лінгвоперсону досліджують у функційно-комунікативних,
вербально-семантичних, лінгвопсихологічних, мовленнєвоповедінкових,
дискурсивно-ситуативних, мотиваційно-сугестивних та інших вимірах.
Актуальними є питання формування мовленнєвих потреб персони, ви
значення їх тяглості, діагностування видозміни мовних і мовленнєвих
потреб у життєвому просторі лінгвоперсони з внутрішнім диференцію
ванням статусу та функційного навантаження мовних і мовленнєвих пе
реходів, кодування й перекодування, формування множин лінгвоіндивідуалізацій, умотивованих територіальними, соціальними, віковими, ес
тетичними, етичними, емоційно-ситуативними та іншими чинниками.
Особливо важливим постає дослідження знаних лінгвоперсон, до яких
належить Юрій Шевельов - видатний лінгвіст, історик літератури, кри
тик. У його мовленнєво-дискурсивних практиках співвіднесені різні
мовні стихії, нерівнорядні дискурсивні практики, активізовані територі
альні, соціальні, вікові, естетичні, емотивні та інші мотиватори індивіду
альних видозмін. Мотивованим є наукове завдання встановлення лінгвокорпусної структурованості дискурсивних практик Юрія Шевельова. За
явлене корелює з практичним завданням - уведенням в активний обіг не
лише науково-творчої спадщини видатного науковця, а й використання
напрацьованих Юрієм Шевельовим мовних моделей і конструкцій, лінгвоіндивідуалізацій у сучасній мовно-кодифікованій практиці.
Теоретичне підґрунтя. Уперше поняття лінгвоперсони на початку
XX ст. використав М. Трубецькой із опертям на ідеї персоналізму
(Е. Муньє та ін.). У другій половині XX ст. у зв'язку з активізацією студі
ювань мовної особистості, питань активної, асоціативної граматики
(Караулов, 1987) поняття лінгвоперсони набуло іншого виміру й статусу.
Активізацію лінгвоперсонологійних студіювань спостережувано в кінці
XX - на початку XXI ст., коли істотними постали теоретичні й практичні
напрацювання комунікативних стратегій і тактик, дискурсології, лінгвіс
тики тексту, спроби дослідження мовленнєвоповедінкових стереотипів,
160
188Ы 2522-9281. Мова: класичне - модерне - постмодерне. 2019. Випуск 5
розширення студій із прикладної лінгвістики, окреслення теоретичних
засад об'єктивної граматики та ін. Не менш значущими були спроби
мовного портретування особистості, створення авторських корпусів
текстів.
Мовну особистість Юрія Шевельова розглядав Р. Трифонов, з'ясо
вуючи лінгвокультурні складники індивідуального мовлення науковця
на матеріалі есе та листів, а М. Мозер розкриває основні етапи динаміки
творчої особистості Ю. Шевельова на дорозі відрадянщини (Трифонов,
2009; Трифонов, 2015; Мозер, 2014). Не менш актуальними є студіюван
ня А. Даниленка, М. Коцюбинської, Л. Масенко, Л. Тарновецької та ін.
У мережі інтернет сьогодні розміщено більшість праць Ю. Шевельова,
що загалом не вирішує питання цілісного бачення його творчої лінгвоперсони, що можливе за умови цілісної корпусації його спадщини, напрацювання лінгвокомп'ютерних технологій вільної навігації в межах
гіпертексту. Тому метою студіювання є експериментально-дослідницька
модель текстової корпусації лінгвоперсони Юрія Шевельова з визначен
ням основних компонентів корпусу, закономірностей вільної лінгвотекстової навігації.
Методологійне підґрунтя дослідження
Цілісна корпусація лінгвоперсони Юрія Шевельова, а також розгляд
особливостей мовного портрета науковця потребує застосування відпо
відних методів, з-поміж яких значущими постають метод дискурсивного
аналізу з використанням методики корпусного контент-аналізу для вста
новлення усіх можливих фіксацій досліджуваного слова з фіксацією
його граматичних змін, вузьких і розширених контекстів, а також - для
вияву невипадкових сполук слів - колокацій, зіставлення останніх із ре
гулярними та квантитативно домінувальними. Використання корпусного
контент-аналізу може слугувати опертям створення скетча слова з внутрішньокорпусним диференціюванням узуальних та оказіонально-ав
торських (індивідуалізованих) сполук слів, визначення їх навантажен
ня в межах комунікативних регістрів, вияву комунікативних інтенцій.
Індивідуально-авторські експериментальні науково-дослідні
корпуси: функційне навантаження в дослідженні лінгвоперсони
Викінчене мовне портретування можливе за умови охоплення усієї
сукупності породжених особистістю текстів із діагностуванням терито
188Ы 2522-9281. Мова: класичне - модерне - постмодерне. 2019. Випуск 5
ібі
ріальних, соціальних, генераційних та інших мотивацій змін у дис
курсивних практиках. Сукупність наголошених питань постає однією
із площин сучасної лінгвоперсонології, окремі напрями якої активно сту
дійовані на кафедрі загального та прикладного мовознавства і слов'ян
ської філології Донецького національного університету імені Василя
Стуса (А. Загнітко, І. Данилюк, Ж. Краснобаєва-Чорна, Г. Ситар та ін.).
Опрацювання рівнів, категорій та аспектів лінгвоперсонології уможли
вить створення об'єктивної та суб'єктивної мовносоціумної граматики,
в центрі якої перебуває моно- і/або полілінгвоперсона в неозначеній
кількості її і/або їхніх дискурсивних практик. Діагностування видозмін
у 1) структурі мовної особистості, 2) рівнях її реалізації (вербальносемантичного, лінгвокогнітивного, мотиваційного (за Ю. Карауловим),
функційного (В. Конецька), ситуативно-психологічного), 3) співвідно
шенні компонентів (формування уміння комунікувати, потреби у спіл
куванні й належної компетентності, формування мовної свідомості
та мовної і/чи мовленнєвої поведінки) з опертям на врахування: а) орга
нічної потреби спілкування рідною мовою; б) комунікативної необ
хідності спілкуватися чужою мовою; в) дискурсивно-мотивованої
практики (педагогічна, лікарська та ін.) спілкування нерідною мовою,
можливе за умови створення цілісного корпусу текстів мовної осо
бистості.
Індивідуально-авторські експериментальні науково-дослідні корпу
си дають змогу встановити рівні й аспекти лінгвоперсони з опертям на
її персонотексти. Через призму сумарної величини текстового корпусу
можна визначити певні тематично-ключові елементи розкриття тяглості
розвитку лінгвоперсони, формування лакун, мотивованих територіаль
ними, соціальними та іншими чинниками, а також відповідним мовним
ландшафтом функціювання лінгвоперсони, реконструювання її творчого
потенціалу та механізмів його реалізації. Прикметно, що реконструйова
ними можуть поставати результати навчання, розпросторення й самореалізація лінгвоперсони та ін. Текстовий корпус уможливлює простеження
закономірностей мовносоціальної зумовленості лінгвоперсони та стату
су лінгвоіндивідуалізацій як індивідуального самовияву: потяг, бажання,
схильність, світогляд, переконання. Лінгвоперсона виявляє себе через
стосунки з іншими, де відносини з іншими індивідами - це переживання
й усвідомлення, переконання ж окреслюють спрямування особистості,
162
ISSN 2522-9281. Мова: класичне - модерне - постмодерне. 2019. Випуск 5
її мовні цінності. Згодом постають значущими знання, уміння, навички
та звички користуватися мовою, диференціювати її в різних корпоратив
них групах, уміти використовувати різні мовні коди залежно від ситуацій,
що підтверджує мовножиттєвий простір Юрія Шевельова в різні періо
ди його життя - в дитинстві, студентські роки, харківський період, роки
мюнхенської еміграції, викладання в Лундському університеті, а зго
дом - у Гарвардському й Колумбійському університетах.
Послідовне використання корпусного контент-аналізу забезпечує ви
значення емоційного тла дискурсивних практик, вияву в них відчуттів
і почуттів, рівнів пам'яті та ін. У цілісності авторський експеримен
тальний науково-дослідницький корпус текстів забезпечує з'ясування
властивостей темпераменту лінгвоперсони, простеження зміни її мовленнєвоповедінкових реалізацій, встановлення типологійних власти
востей лінгвоперсони. Загалом дискурс лінгвоперсони - її життєвий
простір із різними функційно навантаженими сукупностями самореалізацій у мову та в мові.
Індивідуально-авторський експериментальний науково-дослідний
корпус лінгвоперсони Ю рія Шевельова: структура, технології
Юрій Шевельов - видатна особистість, яка реалізована в численних
текстах, різних дискурсивних практиках, нерівнорядних лінгволандшафтних просторах.
Для дослідження особливостей мовлення Юрія Шевельова було ви
рішено укласти дослідницький корпус текстів. Цей корпус текстів спро
ектували й реалізували викладачі кафедри загального та прикладного
мовознавства і слов'янської філології Донецького національного універ
ситету імені Василя Стуса А. Загнітко, І. Данилюк і Г. Сигар. У межах
проходження навчальної практики в підготовці текстів для корпусу ак
тивну участь взяли студенти 2 курсу спеціальності «Прикладна лінг
вістика».
Корпус текстів Юрія Шевельова створений за допомогою вільного
корпусного менеджера NoSketch Engine (https://www.sketchengine.eu/),
розробленого в університеті Масарика (Брно, Чехія) (Rychly & Smrz, 2004).
Цей корпус разом з іншими доступний на сервері кафедри загального
та прикладного мовознавства і слов'янської філології ДонНУ імені Ва
силя Стуса за адресою corpora.donnu.edu.ua.
ISSN 2522-9281. Мова: класичне - модерне - постмодерне. 2019. Випуск 5
163
За задумом авторів, корпус містить усі видані на сьогодні тексти Юрія
Шевельова, зокрема:
Шевельов Юрій. З історії незакінченої війни (упорядники Оксана
Забужко, Лариса Масенко). Київ: Видавничий дім «Києво-Могилянська
академія», 2009. 471 с. ISBN 978-966-518-519-2; Шевельов Юрій. З істо
рії незакінченої війни (упорядники Оксана Забужко, Лариса Масенко).
Київ: Видавничий дім «Києво-Могилянська академія», 2009. 471 с.
ISBN 978-966-518-519-2; Шерех Юрій. Поза книжками і з книжок. Київ:
Вид-во «Час», 1998. 456 с. ISBN 966-95238-3-4; Шерех Юрій. Друга
черга. «Бібліотека Прологу і Сучасности Ч. 130», 1978. 393 с.; Шерех
Юрій. Не для дітей. Нью-Йорк: Вид-во «ПРОЛОГ», 1964. 416 с.; Шеве
льов Юрій. Вибрані праці: у 2 кн. Книга II. Літературознавство. Київ:
Видавничий дім «Києво-Могилянська академія», 2009. 1151 с. ISBN 978966-518-496-6; Шевельов Юрій. Вибрані праці: у 2 кн. Книга І. Мовознав
ство. Київ: Видавничий дім «Києво-Могилянська академія», 2009. 583 с.
ISBN 978-966-518-494-2; Шерех Юрій. Третя сторожа. Балтимор-Торонто:
Смолоскип, 1991. 454 с.; Шевельов Юрій. «Я, мені, мене... (і довкруги)».
Спогади. У двох томах. Видавництво часопису «Березіль», Видавни
цтво М. П. Коць. Харків - Нью-Йорк, 2001; Забужко О., Шевельов Ю.
Вибране листування на тлі доби: 1992-2002: з додатками, творами, ко
ментарями, причинками до біографій та іншими документами. Київ: Ви
сока Полиця, ВД Факт, 2011.
Українськомовна частина корпусу на сьогодні охоплює 104 докумен
ти українською мовою, містить 1 346 424 токени.
У створеному корпусі використано екстралінгвістичну й лінгвістичну
розмітку. Екстралінгвістична розмітка корпусу об'єднує:
а) метатекстові дані. До них належать:
• поле area (сфера) з можливими значеннями літературознавство,
мовознавство, загальні праці;
• author (автор) - у цьому корпусі тільки Юрій Шевельов, створе
но для можливості об'єднання з іншими корпусами;
• genre (жанр): есе, стаття, монографія, інтерв'ю, передмова, ви
ступ, доповідь, спогади, стаття, виступ, стаття, доповідь, лист,
вступне слово;
• пате (назва твору)',
• source (джерело)',
• style (стиль): публіцистичний, науковий та епістолярний;
164
ISSN 2522-9281. Мова: класичне - модерне - постмодерне. 2019. Випуск 5
• type (тип): мовою оригіналу, переклад з англійської, переклад з ні
мецької, переклад з французької;
• year (рік)',
б) структурну розмітку. Корпус містить дані:
• про межі тексту в тегах <doc> - </doc>;
• про межі абзацу в тегах <р> - </р>;
• межі речень у тегах <s> - </s>;
• спеціальний тег <g/> позначає розділові знаки, які не відокрем
люються пробілом від попереднього токена.
Лінгвістична розмітка аналізованого корпусу текстів Юрія Шевельова сьогодні є результатом автоматичного морфологічного аналізу й лематизації, здійснених за допомогою авторських інструментів. Структура
стандартного тегу до кожного токена є такою: на першій позиції стоїть
позначка граматичного класу слова, далі - позначки підкласів, усі по
значки - односимвольні латиницею або цифрами, за кожним підкласом
закріплена позиція, яка не змінюється для різних класів.
Наприклад, для слова конференцією тег має вигляд - Izzooinlm (рис. 1).
ім е н
ник
ж ін о ч и й
р ід
І
Z
Z
загальн а
назва
орудний
в ід м ін о к
0
не
іс т о т а
0
і
п
ім е н н и к о
в и й т и п в ід
м ін ю в а н н я
однина
м ’я к а
гр у п а
і
m
перш а
в ід м ін а
Рис. 1. Розшифрування тегу для словоформи «конференцією»
Таблиця 1
Таблиця 2
Класи слів у корпусі
текстів Ю рія Ш евельова
П означки грамем
роду в корпусі текстів
Ю рія Ш евельова
іменник
дієслово
дієприкметник
дієприслівник
прикметник
займенник
прислівник
прийменник
сполучник
числівник
частка
вигук
абревіатура
решта
і.*
D.*
Dk.*
Ds.*
К.*
Z.*
S.*
J.*
p*
C*
T*
w.*
A.*
R.*
Д о к л а д н о с и с т е м у позн а ч о к д л я т е г ів викладено в д о сл ід ж ен н і (За„ _
гш тко & Д анилю к, 2013).
4. p.
..c .*
Ж. p.
..z.*
Зо кр ем а, к л а с и ф ік а ц ію
гр ам ати ч н и х кл асів п о
c. p.
..s.*
д ан о в т а б л . 1. К а т е г о
р ію р о д у о п и с а н о п о
зн ач к ам и в т е га х у табл. 2.
К іл ь к іс н і п а р а м е т р и с т в о р ен о г о к о р п у су
є так и м и : у 104 д о к у м е н т а х зіб р а н о 1 346 424
т о к е н ів , з я к и х 1 0 3 7 9 4 9 - ц е с л о в а у 66 039
188Ы 2522-9281. Мова: класичне - модерне - постмодерне. 2019. Випуск 5
165
реченнях. Загальний лексикон охоплює 138 187 різних словоформ та роз
ділових знаків, описаних 157 оригінальними тегами, і 32 172 лем.
У корпусному менеджері доступні типові функції, як-от побудова кон
кордансу на підставі простого пошуку, пошуку в лемах, пошуку фрази,
словоформи, символу або певного шаблону, побудованого за допомогою
регулярного виразу.
Корпус:
Корпус текстів Юрія Шевельоза (Шереха)_______у
Простий запит:
11 Побудувати конкорданс [
Типи запигів Контекст Типи текстів О
Тил запиту ф простий О лема
Побудувати конкорданс
фраза 0 слово О символ О СОІ
Очистити ,
Рис. 2. Інтерфейс для вибору типу запиту в корпусі
Запит може спиратися на додатковий пошук у контексті з фільтруван
ням потрібних лем чи словоформ на відстані до 15 токенів управо чи
вліво від головного слова.
Корпус: | Корпус текстів Юрія Шевельова (Шереха)
Простий запит:
Ц
1| Побудувати конкорданс |
Типи запитів Контекст Типи тек стів
О
Контекст
Фільтр лем
Окіл:
Леми: |
Фільтр частин мови
ліворуч
Т 111 т | токенів.
11все
Окіл:
т | з цього.
Частина мови (ЧМ):
ліворуч
▼||
м
Оу.-р......
Пж.р.
.................
□ іменник
▼
□ дієслово
| Побудувати конкорданс]| Очистити |
Рис. 3. Інтерфейс для вибору контексту запиту в корпусі
* І з цього.
166
188Ы 2522-9281. Мова: класичне - модерне - постмодерне. 2019. Випуск 5
Нарешті, пошук можна обмежити різними типами текстів, передбаче
ними екстралінгвістичною розміткою.
У побудованому конкордансі можливі різні типи сортування та філь
трування даних, частотний аналіз морфологічних позначок чи словоформ
для леми тощо.
Іншою типовою функцією корпусного менеджера є частотний аналіз
із можливістю вибору мінімальної чи максимальної частоти, частиномов
них фільтрів, ІЧ-грамів.
Параметри словника частот О
Рис. 4. Інтерфейс для побудови
частотного словника в корпусі
Інструмент частотного аналізу дає змогу, крім того, вибрати всі леми
та всі словоформи.
188Ы 2522-9281. Мова: класичне - модерне - постмодерне. 2019. Випуск 5
167
Рис. 5. Фрагмент словника частот словоформ із корпусу Юрія Шевельова
Висновки
Отже, створений корпус Юрія Шевельова є дослідницьким, повнотекстовим і динамічним, має екстралінгвістичну та лінгвістичну розмітку.
З-поміж важливих функцій варто виокремити: а) побудову конкордансу
на підставі простого пошуку, пошуку в лемах, пошуку фрази, словофор
ми, символу або певного шаблону, створеного за допомогою регулярного
виразу; б) частотний аналіз для словоформ, лем та тегів.
Нині колектив авторів працює над усуненням помилок автоматичного
морфологічного аналізу й наповненням англійськомовної частини корпу
су. Перспективою дослідження є створення вичерпного корпусу текстів
Юрія Шевельова, що охоплюватиме документи українською та англій
ською мовою та стане надійним підґрунтям для вивчення особливостей
мовлення видатного вченого.
С писок ви кори ст ан ої літ ерат ури
Загнітко, А. П., Данилюк, І. Г. (2013). Корпус текстів граматичної службовості. В Прикладна
лінгвістка та лінгвістичні технології: MegaLing-2012 (с. 102-112). Київ: УМІФ.
Караулов, Юрий. (1987). Русский язык и языковая личность. Москва: УРСС.
168
ISSN 2522-9281. Мова: класичне - модерне - постмодерне. 2019. Випуск 5
Мозер, Міхаель. (2014). Юрій Шевельов на дорозі відрадянщення. Взято з http://www.historians.
in.ua/index.php/eri/ukrayiriska-mova/1066-mikhael-mozer-yurii-shevelov-na-dorozi-vidradianshchennia.
Трифонов, Р. А. (2009). Метамовні фрагменти спогадів Юрія Шевельова - репрезентанти
індивідуальної картини світу лінгвіста. Вісник Харківського національного університету
ім. В. Н. Каразіна, 843 (55), 19-26.
Трифонов, Роман. (2015). Лінгвокультурні складники індивідуального мовлення Юрія Шевельо
ва (на матеріалі есе та листів). Взято з http://www.historians.in.ua/index.php/en/ukrayinskamova/1697-roman-tryfonov-linhvokulturni-skladnyky-indyvidualnoho-movlennya-yuriyashevelova-na-materiali-ese-ta-lystiv.
Rychly, Pavel, & Smrz, Pavel. (2004). Manatee, Bonito and Word Sketches for Czech. In Proceedings
o f the Second International Conference on Corpus Linguisitcs (pp. 124-132). Saint-Petersburg:
Saint-Petersburg State University Press.
References
Karaulov, Yuryi. (1987). Russkyi yazyk i yazykovaia lychnost [Russian language and language per
sonality]. Moskva: URSS [in Russian].
Mozer, Mikhael. (2014). Yurii Shevelov na dorozi vidradianshchennia [George Shevelov on the Sovietaway-road]. Retvieved from http://wvw.historians.in.ua/index.php/en/ukrayinska-mova/1066-mikhaelmozer-yurii-shevelov-na-dorozi-vidradianshchennia [in Ukrainian].
Rychly, Pavel, & Smrz, Pavel. (2004). Manatee, Bonito and Word Sketches for Czech. In Proceedings
o f the Second International Conference on Corpus Linguisitcs (pp. 124-132). Saint-Petersburg:
Saint-Petersburg State University Press.
Tryfonov, R. A. (2009). Metamovni frahmenty spohadiv Yuriia Shevelova - reprezentanty indyvidualnoi kartyny svitu linhvista [Metamorphic Fragments of George Y. Shevelov’s Memoirs Representatives of the Linguist’s Individual Picture of the World]. Visnyk Kharkivskoho natsionalnoho universytetu im. V. N. Karazina [Bulletin o f Kharkiv National University named by
V. N. Karazin], 843 (55), 19-26 [in Ukrainian].
Tryfonov, Roman. (2015). Linhvokulturni skladnyky indyvidualnoho movlennia Yuriia Shevelova (na
materiali ese ta lystiv) [The linguistic and cultural components o f George Y. Shevelov’s individual
speech (based on essays and letters)]. Retvieved from http://wvw.historians.in.ua/index.php/en/
ukrayinska-mova/1697-roman-tryfonov-linhvokulturni-skladnyky-indyvidualnoho-movlennyayuriya-shevelova-na-materiali-ese-ta-lystiv [in Ukrainian].
Zahnitko, A. P, & Danyliuk, I. H. (2013). Korpus tekstiv hramatychnoi sluzhbovosti [Text corpus for
grammatical auxiliary]. In Prykladna linhvistka ta linhvistychni tekhnolohii [Applied linguistics
and linguistic technologies]: MegaLing-2012 (pp. 102-112). Kyiv: UMIF [in Ukrainian].
Abstract
Iliya Danyliuk, Anatoliy Zahnitko, Hanna Sytar
GEORGE Y. SHEVELOV’S TEXT CORPUS:
STRUCTURE, FUNCTIONS, NAVIGATION
Background. In modem linguistics, the questions of the linguistic portrait
of the person, the establishment of its structural and functional components
are actualized. The study of eminent linguistic persons is very important, and
ISSN 2522-9281. Мова: класичне - модерне - постмодерне. 2019. Випуск 5
169
George Y. Shevelov is one of them - as an eminent linguist, historian of litera
ture, and critic. The scientific task to establish the linguistic corpus structure of
George Y. Shevelov’s discursive practices is highly motivated.
Purpose. The purpose of die article is to establish and implement an exper
imental and research model of text corpus of George Shevelov’s linguistic per
son with the determination of the main corpus components, patterns of free
linguistic text navigation.
Methods. The method of discursive analysis, body content analysis are
used.
Results. Text corpus contains all the Ukrainian-language published texts by
George Y. Shevelov, it was created on the free NoSketch Engine corpus manag
er and is available on the server of the Department of General and Applied
Linguistics and Slavic Philology in Vasyl’ Stus Donetsk National University at
corpora.donnu.edu.ua.
The quantitative parameters of the created corpus are as follows: 104 docu
ments contain 1 346 424 tokens, and 1 037 949 are words in 66 039 sentences.
The total lexicon includes 138 187 different word forms and punctuation marks,
157 original tags, and 32 172 lemmas.
Conclusions and Prospects. The created corpus of George Y. Shevelov is
research type, full-text and dynamic, has extralinguistic and linguistic mark
ings. Among the important features: a) building a concordance based on simple
search, search in lemmas, search for a phrase, wordfonn, symbol or a certain
pattern created using die regular expression; b) frequency analysis for word
forms, lemmas, and tags.
The prospect of the research is the creation of a comprehensive George Y. She
velov' s Texts Corpus, which will cover documents in Ukrainian and English
and will be a reliable basis for studying the features of the outstanding scientist’s
speech.
Keywords: concordance, text corpus, linguistic person, linguistic persona
lity, corpus marking, frequency analysis, George Y. Shevelov.
Матеріал надійшов 26.07.2019