Елімізде ақылды жүйелер мен жасанды интеллект институты (ISSAI NU), ғылыми институттар мен жоғары оқу орындарын тарта отырып, KazLLM ұлттық тіл моделіне қажетті қазақ тілінің корпусын қамтамасыз ету жұмысын жасады.
Қазақ тілін заманауи технологияларға кіріктіру үшін KazLLM ұлттық тіл моделі жасалды
Фото: istockphoto.com
1,333
оқылды

Мемлекет басшысының тапсырмасы аясында қазақ тіліндегі жасанды интеллектіні дамытуға бағытталған KazLLM ауқымды тіл моделі әзірленді. Бұл туралы Aikyn.kz хабарлайды Ғылым және жоғары білім министрлігіне сілтеме жасап.

Аталған тапсырманы жүзеге асыру аясында Қазақстан Республикасы Ғылым және жоғары білім министрлігі Nazarbayev University жанындағы Ақылды жүйелер мен жасанды интеллект институты (ISSAI NU), ғылыми институттар мен жоғары оқу орындарын тарта отырып, KazLLM ұлттық тіл моделіне қажетті қазақ тілінің корпусын қамтамасыз ету жұмысын жүргізді.

Аталған шара қазақ тіліндегі мәтіндік ақпаратты өңдеу, аудару, талдау және қазақ тілін заманауи технологияларға кіріктіруге қажетті тиімді шешімдер жасауға бағытталған. Жаһандану және елдің мәдени бірегейлігін сақтау жағдайында жобаның маңыздылығы тіпті артып отыр.

KazLLM-ге қажетті қазақ тіліндегі корпусты әзірлеуге атсалысқан еліміздің 26 жетекші институттарының, жоғары оқу орындарының 140-тан аса ғалымы мен қызметкері экономика, қаржыландыру, математика, тарих, биология, химия, медицина, технология және тағы да басқа 115 сала бойынша үлкен көлемдегі деректерді дайындаумен айналысты. Мәселен, әл-Фараби атындағы Қазақ ұлттық университеті философия, этика, PR, астрономия, астрофизика, ақпараттық технология салалары бойынша деректерді дайындаумен, Математика және математикалық модельдеу институты математика саласы бойынша, Ш.Уәлиханов атындағы Тарих және этнология институты тарих саласы бойынша, медициналық университеттер медицина саласы бойынша деректерді дайындаумен айналысты. Ғылым және жоғары білім мекемелерімен бұл ынтымақтастық модельдің сапалы әрі тиімді әзірленуін қамтамасыз ететін қазақ тіліндегі бірегей контенттің құрылуына ықпал етті.

Бүгінгі күні KazLLM-нің ашық бастапқы коды бар нұсқасы https://huggingface.co/issai платформасында қолжетімді.

Цифрлық инфрақұрылымның маңызды бөлігі болып саналатын  аталған модель коммерциялық емес ғылыми және академиялық мақсаттарда, сондай-ақ чат-боттар, виртуалды көмекшілер, Google Translate-ке ұқсас автоматты аударма әзірлеуде қолданылатын болады.

Сараптама, зерттеу мақала, күнделікті өзекті ақпаратты «Айқынның» TELEGRAM арнасынан табасыз.