Укрдержархів передав 10 терабайтів даних для навчання ШІ Сяйво

опубліковано 13 квітня 2026 року о 10:20

Людина у VR-окулярах взаємодіє з цифровими потоками даних, що символізує процес навчання штучного інтелекту

Уявіть масив інформації, що дорівнює 70 тисячам книжок. Саме стільки — 10 терабайтів унікальних історичних матеріалів, державних документів та наукових текстів — Державна архівна служба України вперше передає для тренування національної мовної моделі Сяйво.

Більшість глобальних АІ-помічників генерують відповіді англійською і перекладають ці тексти українською, часто втрачаючи контекст. Щоб Сяйво стало надійним джерелом інформації для людей і бізнесу, Мінцифри тренує його на українських даних. Для цього модель вивчатиме історичні джерела, рукописи, закони, судові рішення, медіаматеріали та словники.

Частина великого проєкту

Створення великої мовної моделі — важливий крок до побудови ШІ-суверенітету. Зараз Мінцифри збирає якісні дані для моделі. Свої матеріали надають вже понад 50 партнерів, серед яких медіа, університети, бібліотеки тощо. Щойно модель запрацює, буде оприлюднено повний перелік інституцій та людей, які допомогли створити національний український ШІ.

«Для тренування національної мовної моделі ми збираємо дані, щоб мовна модель була натренована на унікальному масиві інформації. Це державні документи, наукові статті, медіаматеріали, словники, історичні матеріали, закони, судові рішення тощо,» — Олександр Борняков, т. в. о. Міністра цифрової трансформації України.

Залучення таких даних пришвидшує створення якісної української моделі, яка розумітиме нашу історію та контекст.

"Це унікальний випадок, коли Укрдержархів вперше надає свої дані для розвитку цифрових сервісів в Україні. Ми маємо великий масив даних різних історичних епох, друкованих та рукописних, українською та іншими мовами. До кінця 2026 року кількість цифрових копій держархівів збільшаться із 150 млн до понад 200 млн — це один із найвищих у світі темпів оцифрування архівної спадщини,"  — Анатолій Хромов, голова Укрдержархіву.

Хочете, щоб ваші дані також стали основою національної LLM? Заповнюйте форму за посиланням. Якщо маєте запитання, звертайтеся на пошту ai@thedigital.gov.ua —команда Мінцифри вийде на зв‘язок і надасть усі деталі.

За матеріалами Мінцифри

Outdated Browser
Для комфортної роботи в Мережі потрібен сучасний браузер. Тут можна знайти останні версії.
Outdated Browser
Цей сайт призначений для комп'ютерів, але
ви можете вільно користуватися ним.
67.15%
людей використовує
цей браузер
Google Chrome
Доступно для
  • Windows
  • Mac OS
  • Linux
9.6%
людей використовує
цей браузер
Mozilla Firefox
Доступно для
  • Windows
  • Mac OS
  • Linux
4.5%
людей використовує
цей браузер
Microsoft Edge
Доступно для
  • Windows
  • Mac OS
3.15%
людей використовує
цей браузер
Доступно для
  • Windows
  • Mac OS
  • Linux