En Ukraine, un modèle linguistique de grande envergure, baptisé Lapa LLM, a été présenté. Il est le fruit d'une collaboration entre des scientifiques de plusieurs institutions de premier plan : l'Université catholique d'Ukraine (UCU), l'Institut polytechnique de Kiev (KPI), l'École polytechnique de Lviv et l'Académie des mines et de la métallurgie de Cracovie . Selon le communiqué de presse, ce modèle repose sur Gemma-3-12B de Google .
Le nom du modèle – Lapa LLM – a été choisi en l'honneur de Valentyn Lapa , co-auteur de Méthodes de Comptabilisation des Arguments de Groupe – l'un des fondements théoriques de l'apprentissage profond moderne. Selon les développeurs, lors de la création du modèle, environ 80 000 jetons ont été remplacés des 250 000 jetons initiaux afin de mieux adapter l'architecture à la langue ukrainienne.
Les représentants de l'UCU indiquent qu'en termes de rapidité et de qualité de travail avec la langue ukrainienne, Lapa LLM surpasse le Gemma original, ainsi que la plupart des modèles fermés de la même catégorie. Cet avantage, affirment-ils, a été obtenu grâce à la localisation, à l'optimisation du tokenizer et à l'adaptation à la morphologie et à la syntaxe ukrainiennes.
Cette nouvelle est importante non seulement pour la communauté scientifique, mais aussi pour le développement du marché informatique ukrainien, car les modèles de cette classe sont un outil clé pour le traitement du langage naturel, la traduction, la création de texte, les chatbots, l'analyse automatisée des données et d'autres applications.
Dans un avenir proche, des tests ouverts du Lapa LLM sont prévus, ainsi que l'intégration du modèle dans des projets liés à la langue, à la culture, à l'éducation et aux affaires ukrainiennes.

