В Україні представили Lapa LLM — нову велику мовну модель для української мови

В Україні презентували велику мовну модель під назвою Lapa LLM, яка стала результатом співпраці вчених із кількох провідних закладів: Український католицький університет (УКУ), Київський політехнічний інститут (КПІ), Львівська політехніка та Гірничо‑металургійна академія в Кракові. Згідно з пресрелізом, базою для моделі стала архітектура Gemma‑3‑12B від Google.

Назва моделі — Lapa LLM — обрана на честь Валентин Лапа, який раніше був співавтором методів групового обліку аргументів — одного з теоретичних підґрунть сучасного глибинного навчання. За словами розробників, під час створення моделі було замінено близько 80 000 токенів із початкових 250 000, щоб краще адаптувати архітектуру під українську мову.

Представники УКУ повідомляють, що за швидкістю та якістю роботи з українською мовою Lapa LLM перевершує оригінальну Gemma, а також більшість закритих моделей того ж класу. Така перевага, як стверджують, досягнута за рахунок локалізації, оптимізації токенайзера та адаптації до української морфології і синтаксису.

Ця новина має значення не лише для наукової спільноти, але й для розвитку українського IT-ринку, оскільки моделі подібного класу — ключовий інструмент для задач обробки природної мови, перекладу, створення текстів, чатботів, автоматизованого аналізу даних та інших застосувань.

У найближчому майбутньому очікується відкрите тестування Lapa LLM, а також інтеграція моделі у проєкти, що стосуються української мови, культури, освіти та бізнесу.

spot_imgspot_imgspot_imgspot_img

Популярне

Поділитися дописом:

Більше подібного
ТУТ

Чому шия старіє швидше і як цього уникнути

Шия однією з перших видає вік — тонка й...

Голова Держкомісії із запасів корисних копалин Паюк подвоїв статки за три роки війни і отримує виплати з Брюсселя

Голова Державної комісії України з питань запасів корисних копалин...

В НАБУ знову виявили готівку в пломбах ФРС США, але НБУ не може відстежити її шлях в Україну

Заступник голови Національного банку України Дмитро Олійник заявив, що...

Експрокурор Фільчаков і бізнесмен Костенко фігурують у скандалі з приватизацією держпідприємства за 35 млн

У 2021 році бізнесмен Ярослав Костенко придбав державне підприємство...

«Танці на кістках»: камбек «Танців з зірками» викликав хвилю суперечок

Відомий продюсер і телеведучий Юрій Горбунов, який нещодавно показав...

НАБУ розслідує корупцію в оборонних закупівлях, але Держфінмоніторинг блокує доступ до даних

Директор НАБУ Семен Кривонос повідомив, що Бюро активно розслідує...

Міністр енергетики Галущенко ночував у заарештованому маєтку Захарченка перед обшуком НАБУ

Міністр енергетики Герман Галущенко, за даними нардепа Ярослава Железняка,...

Одеського медика викрили на схемі з фальшивими довідками для відстрочки від призову

В Одесі 65-річному лікарю однієї з приватних клінік повідомлено...