В Україні презентували велику мовну модель під назвою Lapa LLM, яка стала результатом співпраці вчених із кількох провідних закладів: Український католицький університет (УКУ), Київський політехнічний інститут (КПІ), Львівська політехніка та Гірничо‑металургійна академія в Кракові. Згідно з пресрелізом, базою для моделі стала архітектура Gemma‑3‑12B від Google.
Назва моделі — Lapa LLM — обрана на честь Валентин Лапа, який раніше був співавтором методів групового обліку аргументів — одного з теоретичних підґрунть сучасного глибинного навчання. За словами розробників, під час створення моделі було замінено близько 80 000 токенів із початкових 250 000, щоб краще адаптувати архітектуру під українську мову.
Представники УКУ повідомляють, що за швидкістю та якістю роботи з українською мовою Lapa LLM перевершує оригінальну Gemma, а також більшість закритих моделей того ж класу. Така перевага, як стверджують, досягнута за рахунок локалізації, оптимізації токенайзера та адаптації до української морфології і синтаксису.
Ця новина має значення не лише для наукової спільноти, але й для розвитку українського IT-ринку, оскільки моделі подібного класу — ключовий інструмент для задач обробки природної мови, перекладу, створення текстів, чатботів, автоматизованого аналізу даних та інших застосувань.
У найближчому майбутньому очікується відкрите тестування Lapa LLM, а також інтеграція моделі у проєкти, що стосуються української мови, культури, освіти та бізнесу.

