ЛІНГВІСТИЧНІ ТА ЕКСТРАЛІНГВІСТИЧНІ ОСОБЛИВОСТІ ЕЛЕКТРОННИХ СЛОВНИКІВ СУЧАСНОЇ УКРАЇНСЬКОЇ МОВИ

УДК 801.311

Н. М. Сінкевич, О. О. Плющай

 

ЛІНГВІСТИЧНІ ТА ЕКСТРАЛІНГВІСТИЧНІ ОСОБЛИВОСТІ ЕЛЕКТРОННИХ СЛОВНИКІВ

СУЧАСНОЇ УКРАЇНСЬКОЇ МОВИ

 

Проаналізовано лінгвістичні та екстралінгвістичні особливості електронних словників сучасної української мови.

Ключові слова: словник, лексикографія, екстралінгвістичні особливості.

 

Проанализированы лингвистические и экстралингвистические особенности электронных словарей современного украинского языка.

Ключевые слова: словарь, лексикография, экстралингвистические особенности.

 

Analyzed linguistic and extra-linguistic features of electronic dictionaries of modern Ukrainian language.

Keywords: dictionary, lexicography, extra-linguistic features.

 

У сучасному світі інформаційних технологій одним з найважли­віших завдань постає забезпечення зручності й швидкості доступу до інформації. Це можуть забезпечити електронні доку­менти. До них уналежнюємо й словники. Будь-який словник надзвичайно важливий у багатьох сферах людської діяльності, зокрема для вивчення мов, у викладацькій, перекладацькій, науковій діяльності тощо.

Систему «Словники України» укладено на основі сучасних академічних словників української мови за допомогою словозмінної класифікації та комп’ютерних програм, розроблених фахівцями Українського мовно-інформаційного фонду. Автори її — В. Широков, І. Шевченко, О. Рабулець, О. Костишин, М. Пещак.

Аналіз сучасних українських електронних словників подано в працях В. Широкова [2-8], де йдеться про феноменологію лексикографічних систем, розроблено їх теорію.

Мета статті – визначити особливості електронних тлумачних словників української мови.

Електронні тлумачні словники нерідко містять елементи інших словників, які в паперовій версії словника не можуть уходити до їх складу (наприклад, озвучування вимови або переклад іноземними мовами); з іншого боку, способи тлумачення слів в електрон­ній версії словника можуть поставати невід’ємним складником інших лексикографічних праць (словників синонімів, термінологічних тощо).

Паперові й електронні варіанти тлумачних класичних словників загалом збігаються за змістом, але частково не збігаються за формою. Спостережено такі формальні відмінності, як відсутність чіткої фрагмен­­тації тексту словника, формальна контамінація розділів, різне групу­вання матеріалу, спрощення системи ремарок тощо.

Електронний словник має значно більші можливості для використання в дефініції різноманітних видів ілюстрацій (малюнків, схем, анімації, звукового супроводу) порівняно з паперо­вим, коли словникову дефініцію перетворено на креолізований текст. Під цим терміном розуміють текст, фактуру котрого складають дві негомогенні частини: вербальна (мовна та мовленнєва) та невербальна (що належить до інших знакових систем порівняно з природною мовою). Ці частини креолізованого тексту, складного семіотично, різноспрямовані за своїми функціями. Постає питання оптимізації дизайну тлумачення, і тут очевидними стають переваги електронного словника, що має різноманітні можливості розташування елементів слів, серед іншого й ілюстрації, кольору, шрифту тощо.

Українські електронні словники розміщено на різних носіях, а саме:

1) електронну систему «Словники України» подано на дисках. На сьогодні видано вже четверту версію, утім, працю над словниками не припиняють.

Зокрема, заплановано завершити видання в серії «Словники України» багато­­томних лексикографічних праць національного рівня – тлумач­ного Словника української мови в 20 томах та Етимологічного словника української мови в 7 томах, а також

– здійснювати щорічний випуск масовими накладами в серії «Словники України» нових видань нормативного правописного українського словника для забезпечення державних органів, навчаль­них закладів та бібліотек;

– забезпечити щорічний випуск масовими накладами нових версій універсального українського електронного словника – Інтегрованої лексикографічної системи «Словники України»;

– забезпечити щорічний випуск базових українських електрон­них та паперових словників для потреб української діаспори та уніфікації нормативного варіанта української мови на під­ставі академічного правопису та академічних орфографічних словників;

– розробити багатомовну термінографічну базу даних, укласти термінологічні словники з усіх галузей науки, техніки, народного господарства та суспільної практики та забезпечити їх видання;

– розробити сучасну мережеву технологію укладання й ведення лексикографічних систем та продуктів на основі загальнодоступного Українського національного лінгвістичного корпусу й забезпечити її активне застосування, насамперед, лінгвістичними підрозділами універ­ситетів, що входять до системи Міністерства освіти і науки України (система «Всеукраїнський лінгвістичний діалог»);

– створити універсальну систему загальнослов’янської лексико­графії (ЛЕКСИКА-СЛАВІКА) та ініціювати виконання між­народ­­ного проекту з її формування, де Україна могла б виступити координатором;

– розробити лінгвістичну технологію укладання багатомовних словників, орієнтованих насамперед на застосування в інтелектуальних системах опрацювання природної мови;

– розробити та створити систему електронних словникових ресурсів і забезпечити доступ до неї українських користувачів через мережу Інтернет;

– розробити та впровадити в державних органах України програмне забезпечення для природномовного індексування та пошуку в комп’ю­терних системах (засоби природномовного інтерфейсу);

– створити універсальну загальнодоступну бібліотеку словників та електронних лексикографічних систем;

– розробити проект Закону України про обладнання всіх комп’ютерів, які виробляють та продають в Україні, універсальним нормативним українським електронним словником – Інтегрованою лексикографічною системою «Словники України». Реалізація Програ­ми уможливить вихід українського словникарства на рівень передових лексикографій світу.

На нашу думку, довершеність лексикографічного твору потребує враховування всіх параметрів слова, і зокрема його стилістичної характеристики, з огляду на це проблема стилістичних ремарок стає актуальнішою;

2) частину словників розміщено в мережі Інтернет під гаслом «Спочатку було слово». У мережі розміщено такі лексикографічні праці:

Словник сленгу хіпі;

Словник російської цивілізації;

Словник церковних термінів;

Шкільний етимологічний словник;

Словник іноземних слів;

Словник прикладної інтернетики;

Словник астрологічних термінів;

Словник злодійського жаргону;

Словник йоги;

Словник компютерної лексики;

Архітектурний словник;

Найновіший філософський словник;

Довідник з фразеології;

Педагогічна енциклопедія;

Енциклопедія юриста;

Психологічний тлумачний словник;

Словник синонімів;

Історичний словник;

Словник з політології;

Тлумачний словник фінансових термінів [http://www.slovnik.com.ua/].

Іншою цікавою електронною побудовою постає Універсальний словник-енциклопедія (УСЕ), головним редактором якої є Миро­слав Попович. До цього словника вміщено близько 25000 статей, 3200 ілюстрацій, фото, карт, схем, таблиць, найновіших фактів, що ви­світлюють історію та сучасність науки й техніки, культури й спорту, географії й медицини, персоналії та реалії, Україну й світ. Підготовлено словник у межах міжнародного проекту EUROPEDIA, автор проекту – шведський енциклопедист, засновник і президент Шведської академії вербовізуальної інформації Свен Лідман.

У виданні спстережено певні лексикографічні інновації: наприклад, у статтях про іншомовні власні назви та імена застосовано новітні тенденції транслітерації таких назв українською мовою й відтворення «на слух», а не «літера до літери» (наприклад, Райн, а не Рейн; Бош замість Босх; Айседора Данкен замість Дункан, Австерліц, а не Аустерліц тощо). Набагато ширше, ніж у чинному правописі, уживано літеру ґ.

Зручною лексикографічною побудовою постає СЛОВНИК.net – наразі найповніший універсальний тлумачний словник української мови в мережі, який містить понад 220 000 словникових статей і понад 20 000 фразеологізмів. У ньому широко представлено активну лексику української літературної мови, найуживаніші слова, пов’язані із релігійними та філософськими поняттями, економічні, історичні, лінгвістичні, літературні, медичні, музичні, технічні, юридичні та інші терміни, номенклатурні й складноскорочені слова, лексику історичного фонду, найуживаніші архаїзми, найбільш поши­рені лексичні й етнографічні діалектизми, неологізми, зокрема й іншомовні запозичення, що постали в українській мові впродовж останніх років. До СЛОВНИКа.net постійно додають нові слова, доповнюють наявні тлумачення. Для наповнення СЛОВНИКа.net використо­вува­лися як авторські напрацювання, так і різні джерела (наукові тексти, матеріали ЗМІ, інші словники тощо).

Позитивним у праці з електронними словниками в Інтер­неті вважаємо змогу вибрати визначення потрібного слова із низки запропонованих словників. За невідповідності тлума­чення користувач надзвичайно швидко може знайти інше визна­чення й продовжити далі працю­вати.

Електронні (комп’ютерні) словники поділяють на ті, у яких користувач нічого не може змінити, тобто незалежні від діяльності користувача, та інтерактивні. Поняття «інтерактивний словник» нове і мало розроблене в лінгвістиці. Це електронна (комп’ютерна) лінгвістична побудова, до якої будь-який користувач може внести зміни і до­повнення.

Сьогодні інтерактивні словники постають у різних формах: від коротких глосаріїв до гетерогенних мультилінгвістичних колекцій словників та електронних енциклопедій. Інтерактивні словники укладають, застосовуючи особливі методи, названі контекстно-за­лежними, Словники містять комплексні структуровані об’єкти знань, різноманітні системи класифікації та впорядкування. Сучасні інформа­ційні та комунікаційні технології, комп’ютерні системи й сервіси уможливлюють нові якості інтерактивних словників: незалеж­ність словникових об’єктів від просторових та часових обмежень; використання гіпермедіальних об’єктів; розподільні середовища для зберігання, розповсюдження та надання кінцевим користувачам словникових об’єктів; динамічність словнико­­вих об’єктів та розподіл зв’язків (лінків) та відношень між цими об’єктами.

На думку В. Широкова, інтерактивні словники можна широко застосовувати в різноманітній навчальній діяльності. Словники сприяють формуванню ментальних структур знань користувачів, повно та ком­пактно подають, зокрема візуалізують, концептуальну структуру знань предметної галузі, дискретно інкорпорують нові колекції понять і знань для досягнення професійних та інших персональних цілей [6]. Інтерактивні словники відмінні багатьма аспектами та пара­метрами: якістю, призначенням, комплектацією, технологічним середо­ви­щем функціонування, рівнем структурування інтерфейсів уводу та виводу, типами та перевагами кінцевих користувачів, входами доступу ілюстративного середовища тощо.

Інтерактивні словники постають унаслідок колективних зусиль висококваліфікованих фахівців з лексикографії та термінології, перекладачів, експертів із предметних галузей, технологів, дизайнерів, програмістів, видавців та ін.  Діяльність творців словників суворо регламентовано. Зазвичай її поділено на такі етапи:

— розроблення лінгвістичної (і педагогічної в майбутньому) концепції словника;

— розроблення проекту словника (плану-конспекту або формалізо­ваного проекту);

— розроблення словникових структур та інформаційне комплекту­вання словника;

— створення однієї чи кількох словникових програм;

— випуск словникової продукції та її супровід.

Корпус інтерактивних словників, представлених у мережі Інтернет, достатньо широкий і постійно поповнюється. Ці словники різноманітні як за обсягом (від усеохопної Вікіпедії) до «Джинсового словника», що містить усього кілька слів. Низка словників постає як електронна версія вже наявних видань, інші укладають автори.

Рівень доступу до цих наукових творів також різний. На більшості сайтів їх розміщено у вільному доступі, на деяких потрібно зареєструватися, незначна кількість сайтів — платна.

Перевагами інтерактивного словника вважаємо:

–       ефективну та зручну пошукову систему;

–       змогу для користувача додавати коментарі або нові слова до персонального словника;

—       систему авторизації доступу до інформації, яку контролює адміністратор словника;

–       захист бази даних словника від несанкціонованого викорис­тання (копіювання, зміни або видалення інформації).

Важливим напрямом електронної лексикографії постає науково-технічна лексикографія, теоретичною базою для якої стала порів­няно молода лінгвістична галузь – термінознавство. Термінологіч­ні словники в мережі найчисленніші; багато із них вузькоспеціалізовані. Ці словники досить близькі до тлумачних, відмінні від них лише критеріями добирання матеріалу.

Проблеми, що постають для традиційних та інтерактивних словників, спільні й пов’язані із добором термінів та розкриттям їхнього змісту. З огляду на це до комп’ютерної версії термінологічного словника висувають такі вимоги:

  • вхід, до якого приписано словникову статтю, потрібно фор­мулю­­вати однозначно;
  • словниковому входу можуть відповідати кілька синонімічних термінологічних виразів;
  • до словника додають статті-посилання;
  • значення багатозначних термінів описують як посилання до однозначних словникових входів.

Складником сучасної електронної лексикографії постає Вікіпедія та Вікісловник як її тлумачний елемент.

Вікісловник (англ. Wiktionary) – одна із найновіших особливих лексикографічних побудов, словник, який вільно поповнюється, заснований на вікі-двигуні [1].

У словнику вміщено граматичні описи, тлумачення та пере­клади слів. Крім того, статті можуть містити інформацію про семан­тичні зв’язки слів. Отже, Вікісловник – спроба поєднати в одному продукті граматичний, тлумачний, етимологічний та багато­мовні словники, а також тезаурус. Наведемо приклад типової статті з Вікі­­словника:

Абак (грец. αβαξ, лат. abacus дошка)

  1. Вид рахівниці у стародавній Греції та Римі, а також (до XIX ст.) у Західній Європі. У країнах Далекого Сходу був роз­повсюдже­ний китайський варіант абаку суан-пан.
  2. архіт. Верхня частина капітелі колони у вигляді чотири­кутної плити.

Для аналізу та опису специфіки цього словника потрібно звернутися до оболонки, у якій він існує. Вікіслов­ник є частиною однієї із найпомітніших лексикографічних побудов інтерактивного зразка – багатомовної енциклопедії «Вікіпедія».

Вікіпедія (англ. Wikipedia) — багатомовна та загально­доступ­на, вільнопоширювана енциклопедія, яку видають в Інтернеті. Вона постає багатьма мовами світу завдяки колективній праці добро­вільних авторів, які використовують технологію вікі. Від моменту зародження на початку 2001 року і дотепер Вікіпедія неухильно збільшується і набуває популярності в користувачів мережі Інтернет.

Перші вікі-сайти з’явилися в 1995 році, на підставі цієї технології було створено кілька не просто масштабних, а й унікальних проектів. Назва цієї енциклопедії – слово-телескоп, перша частина якого – комп’ютерний термін, а друга – частина слова «енциклопедія» — Wiki, або WikiWiki, – сторінки у WWW, котрі користувач має змогу не лише прочитати, а й відредагувати. Звідси й назва «Вікіпедія» – енциклопедія, інформацію у якій можна виправити. Творець вікі-вікі-веб назву Wiki-Wiki запозичив з гавайської мови, де  слово означає автобус-човник в аеропорту. Подвоєння гавай­ською означає ‘дуже швидко’. WikiWikiWeb – це технологія розроблення web-сторінок безпосередньо з браузера.

Варіанти Вікіпедії існують усіма поширеними мовами світу. На сьогодні Вікіпедія налічує 253 мовні розділи. Вікі покликана виконати просте та природне завдання – уможливити для кожного від­відувача розроблення контенту не лише як комента­торові, а як повно­правному авторові та редакторові – нарівні з адміністрацією та штат­ними співробітниками проекту. Для здійснення цього потрібно, по‑перше, щоб користувач мав технічну змогу змінювати сторінки сайту, по-друге, процес не повинен потребувати спеціальних знань та навичок.

Для зниження порогу входження було вигадано «вікі-розмітку» – максимально простий засіб структурування тексту для сприймання його людиною. Про основні правила вікі-розмітки, достатні для редагування і створення нових матеріалів, можна дізнатися за лічені хвилини. Посилання «ведуть» або на наявні, або на ще не створені сторінки. Наприклад, якщо виділений як посилання термін ще не описано в ен­цикло­педії, то, перейшовши на це посилання, користувач отримає повідом­лення, що поки така сторінка відсутня – йому буде запропо­но­вано створити її. (Постійне запрошення до співпраці – також елемент вікі-філософії). Якщо сторінки перейменовують, посилання також збері­гаються, надаючи словнику особливого механізму підтримки та цілісності.

Думка про створення лексикографічного твору, зміст якого спроможний корегувати кожен з його користувачів, видавалася спершу нереальною, утім, виявилася вкрай ефективною: Вікіпедія стрімко стала найбільшою енциклопедією у світі. Першим за кіль­кістю статей уважають розділ англійською мовою (на початок жовтня 2007 року він містив більше 1,4 млн статей, а 17 серпня 2009 року англійська Вікіпедія перетнула рубіж у три мільйони статей), другим – німецький, одинадцять розділів якого містять більше ста тисяч статей.

У Вікіпедії спостережено кілька принципів побудови словника, відсутні в більшості з інших або не настільки значущі для них. По‑перше, це «копілефт» (ще одне новоутворення, яке постало саме для цього лексикографічного джерела). Назва виникла на проти­вагу концепту «копірайт», ідеєю якого є обмеження прав користувачів, копілефт же – найзагальніший спосіб зробити програмне забезпечення вільним і га­рантувати дотримання цієї умови також для всіх змінених та поширених версій такого програмного забезпечення.

Іншою найважливішою особливістю цього словника постає пріоритетне застосування системи категорій. Для ознайомлення з уміщеною до Вікіпедії інформацією на певну тему застосовують категорії – класифікаційну систему Вікіпедії. Для полегшення пошуку кожну статтю Вікіпедії уналежнено до однієї або кількох категорій. На першій сторінці розділу Вікіпедії будь-якою мовою подано систему рубрикації його сторінок. Це подання постає як «дерево» рубрик Вікіпедії – категорій, які автоматично відкриваються. Натискаючи позначку «+» ліворуч від назви рубрики, відкриваємо перелік підрозділів цієї рубрики, кожну з яких можна відкрити аналогічно. Назва будь-якої рубрики постає як гіперпосилання, перейшовши за яким, маємо змогу побачити перелік сторінок, уміщених до цієї рубрики. Наявний також автоматично формований перелік кате­горій (зокрема, ще й не створених, але вже позначених на сторінках).

Словникові ресурси, у яких уміст інтелектуального ресурсу є ос­новною цінністю, зазвичай потребує величезних трудо­витрат на роз­роблення та супровід. Вирішення проблеми багатора­зо­вого й багато­профільного використання інформаційних ресурсів і про­грамних засобів у мінливих економічних, технологічних і соціаль­них умовах набуває величезного значення, тому стандартиза­ція українських словникових ресурсів і сприяння широкому використанню de facto словникових стандартів – актуальне завдання загально­державного масштабу.

Український мовно-інформаційний фонд НАН України, провідна організація в царині розроблення електронних версій нового покоління академічних словників загального призначення (орфографіч­ного, орфоепічного, словника синонімів, антонімів і, нарешті, багато­томного академічного Словника української мови), та інші укладачі електронних лексикографічних праць створили значну кількість нових словників, які потребують свого лінгвістичного дослідження.

 

БІБЛІОГРАФІЧНІ ПОСИЛАННЯ

  1. Вікісловник [Електронний ресурс]. – Режим доступу : http://www.uk.wiktionary.org/
  2. Технологічні основи сучасної тлумачної лексикографії / Ши­ро­ковВ. А., Рабулець О. Г., Шевченко І. В. та ін. // Мовознавство. – 2002. – № 6. – С. 49–86.
  3. Широков В. А. Всеукраїнський лінгвістичний діалог у контексті теорії лексикографічних систем / В. А. Широков // Мовознавство. – 2003. – № 6. – С. 3–7.
  4. Широков В. А. Iнформацiйна теорiя лексикографiчних систем / В. А. Широков. – К. : Довiра, 1998. – 331 с.
  5. Широков В. А. Інформаційно-енергетичні трансформації та ін­­формаційне суспільство / В. А. Широков // Наука, інновація, ін­формація : українсько-польський науково-практичний журнал. – К., 1996. – С. 48–66.
  6. Широков В. А. Прикладна лінгвістика та лінгвістичні техно­логії: MegaLing-2006 : зб. наук. праць / за ред. В. А. Широкова. — К. : Довіра, 2007. — 345 с.
  7. Широков В.А. Структура и информационная модель толкового Словаря украинского язика [Електронний ресурс] / В. А. Широков, М. П. Воронько, А. М. Костышин // Проблеми створення машинних фондiв мов : труды научной конференции (Київ, 1991. – Режим доступу : http://www.nbuv.gov.ua/
  8. Широков В.А. Структурна модель реєстрової частини Словника української мови / В. А. Широков, М. М. Пещак // Національна архівна інформаційна система «Архівна та рукописна Україніка і комп’ютеризація архівної справи» : зб. наук. праць. – 1996. – Вип. 1 : Інформатизація архівної справи в Україні: сучасний стан та перс­пективи. – С. 154–174.

 

Надійшла до редколегії 31.05.2016

 

 
 
Редакційна колегія не завжди поділяє позицію авторів. За точність викладеного матеріалу відповідальність покладена на авторів.
Усі права застережені. Використання матеріалів – з дозволу редакційної ради

© Дніпропетровський національний університет імені Олеся Гончара, 2012-2015