In der Ukraine wurde ein großes Sprachmodell namens Lapa LLM vorgestellt, das aus der Zusammenarbeit von Wissenschaftlern mehrerer führender Institutionen hervorgegangen ist: der Ukrainischen Katholischen Universität (UCU), dem Polytechnischen Institut Kiew (KPI), dem Polytechnischen Institut Lwiw und der Akademie für Bergbau und Metallurgie in Krakau . Laut Pressemitteilung basiert das Modell auf der Gemma-3-12B von Google .
Der Modellname – Lapa LLM – wurde zu Ehren von Valentyn Lapa , der zuvor Mitautor von Methoden zur Gruppenargumentrechnung war – einer der theoretischen Grundlagen des modernen Deep Learning. Laut den Entwicklern wurden bei der Erstellung des Modells etwa 80.000 der ursprünglich 250.000 Token ersetzt, um die Architektur besser an die ukrainische Sprache anzupassen.
Vertreter der UCU berichten, dass Lapa LLM hinsichtlich Geschwindigkeit und Qualität der Arbeit mit der ukrainischen Sprache das ursprüngliche Gemma sowie die meisten geschlossenen Modelle derselben Klasse übertrifft. Dieser Vorteil, so behaupten sie, wurde durch Lokalisierung, Tokenizer-Optimierung und Anpassung an die ukrainische Morphologie und Syntax erreicht.
Diese Neuigkeit ist nicht nur für die wissenschaftliche Gemeinschaft wichtig, sondern auch für die Entwicklung des ukrainischen IT-Marktes, da Modelle dieser Klasse ein wichtiges Werkzeug für die Verarbeitung natürlicher Sprache, Übersetzung, Texterstellung, Chatbots, automatisierte Datenanalyse und andere Anwendungen sind.
In naher Zukunft wird mit offenen Tests des Lapa LLM sowie mit der Integration des Modells in Projekte im Zusammenhang mit der ukrainischen Sprache, Kultur, Bildung und Wirtschaft gerechnet.

