В Украине презентовали большую языковую модель под названием Lapa LLM, которая стала результатом сотрудничества ученых из нескольких ведущих заведений: Украинский католический университет (УКУ), Киевский политехнический институт (КПИ), Львовская политехника и Горно-металлургическая академия в Кракове . Согласно прессрелизу, базой для модели стала архитектура Gemma-3-12B от Google .
Название модели – Lapa LLM – выбрано в честь Валентин Лапа , который ранее был соавтором методов группового учета аргументов – одного из теоретических оснований современного глубинного обучения. По словам разработчиков, при создании модели было заменено около 80 000 токенов из начальных 250 000, чтобы лучше адаптировать архитектуру под украинский язык.
Представители УКУ сообщают, что по скорости и качеству работы с украинским языком Lapa LLM превосходит оригинальную Gemma, а также большинство закрытых моделей того же класса. Такое преимущество, как утверждают, достигнуто за счет локализации, оптимизации токенайзера и адаптации к украинской морфологии и синтаксису.
Эта новость имеет значение не только для научного сообщества, но и развития украинского IT-рынка, поскольку модели подобного класса — ключевой инструмент для задач обработки естественного языка, перевода, создания текстов, чатов, автоматизированного анализа данных и других применений.
В ближайшем будущем ожидается открытое тестирование Lapa LLM, а также интеграция модели в проекты, относящиеся к украинскому языку, культуре, образованию и бизнесу.

