In der Ukraine wurde ein umfangreiches Sprachmodell namens Lapa LLM vorgestellt, das in Zusammenarbeit von Wissenschaftlern mehrerer führender Institutionen entstanden ist: der Ukrainischen Katholischen Universität (UCU), des Polytechnischen Instituts Kiew (KPI), der Technischen Universität Lwiw und der Akademie für Bergbau und Hüttenwesen in Krakau . Laut Pressemitteilung basiert das Modell auf Googles Gemma-3-12B - .
Der Modellname – Lapa LLM – wurde zu Ehren von Valentyn Lapa , der zuvor Methoden der Gruppenargumentationsrechnung mitentwickelt hatte – eine der theoretischen Grundlagen des modernen Deep Learning. Laut den Entwicklern wurden bei der Erstellung des Modells etwa 80.000 der ursprünglich 250.000 Token ersetzt, um die Architektur besser an die ukrainische Sprache anzupassen.
Vertreter der UCU berichten, dass Lapa LLM hinsichtlich Geschwindigkeit und Qualität der Arbeit mit der ukrainischen Sprache das ursprüngliche Gemma sowie die meisten geschlossenen Modelle derselben Klasse übertrifft. Dieser Vorteil sei durch Lokalisierung, Tokenisierungsoptimierung und Anpassung an die ukrainische Morphologie und Syntax erreicht worden.
Diese Nachricht ist nicht nur für die wissenschaftliche Gemeinschaft wichtig, sondern auch für die Entwicklung des ukrainischen IT-Marktes, da Modelle dieser Klasse ein wichtiges Werkzeug für die Verarbeitung natürlicher Sprache, Übersetzung, Texterstellung, Chatbots, automatisierte Datenanalyse und andere Anwendungen darstellen.
In naher Zukunft wird mit offenen Tests von Lapa LLM gerechnet, ebenso wie mit der Integration des Modells in Projekte im Zusammenhang mit der ukrainischen Sprache, Kultur, Bildung und Wirtschaft.

