Қазаққа «Алиса» арман ба?
Қазаққа «Алиса» арман ба?
Жасанды интеллект тұр­мыcымызға дендеп енді. Оның басты құралдарының бірі – дауыспен басқару. Ал осы тұрғыда қазақша сөй­леуді машиналық тану процесін әзірлеу – аса маңызды жұмыстың бірі. Елімізде осындай бірнеше жоба қолға алын­ды. Солардың ішін­­­де дайын жүйеге ай­­­налған жобаның авто­ры­мен сөйлесіп, осы мо­дельдің қыр-сырымен таныстық. Адам жеңіл түсінетін сөзді машинаның ұғуы қиын Жалпы, ауызбен айтылған сөздің цифрлы нұсқасын мәтінге айналдыру немесе найрожелінің оқуы ісінде қазақ тілі кешеуілдеп келеді. Басқа тілдерде мұндай бағыттағы қолданба, бағдарлама немесе кешенді жүйелер көп әрі еркін қолданысқа енгізілген. Осы кемшілікті жою әрі қазақ тілінің интернет және цифрлық саладағы нейрожелі негізіне айналу жолында еңбек етіп жүрген Ақпараттық және есептеу технологиялары институты бас директоры­ның орынбасары Өркен Мамырбаев қазақ тілінде сөйлеуді тану технологиясына қа­тысты бірнеше дайын жоба әзірлеп шықты. Басында зерттеу үшін басталған ғылыми жұмыс соңында қолданбалы жағынан нә­тижеге айналған.
«Бастапқысы қазақ тілінде сөйлеуді тану технологиясын әзірледік. Ең алдымен 2 мың сағатқа жуық ауызекі сөйлеу дерек­тор қорын жинадық. Тілдік модельді ней­рон­дық желі арқылы дамытамыз. Осы тұста тоқтала кететін нәрсе, тұрмысымызға жасанды интеллект тікелей еніп кетті. Көп салада қолданылады. Тіпті, МРТ, УДЗ-ге тексерілсе, ол сырқатты нақты көрсетеді. Соның негізінде жасанды интеллект, нейрожелі тұр. Біз де нейрондық желінің ең жаңа түрін құрдық. Архитектурасын, моделін әзірледік. Ол трансферлі үйрену деп аталады. Алдымен осындай зерттеу жасап, жаңа модель жөніндегі үлкен мақа­ламызды инфофакторы бар шетелдік жур­налға жарияладық», – дейді PhD доктор, қауымдастырылған профессор Өркен Мамырбаев.
Оның айтуынша, сөйлеуді тану процесі мен синтез процесі қатар жүреді. Синтез – ол дайын мәтінді дауыстау. Қазір мұндай қосымша өте көп. Ол толық жүзеге асып үлгерген. Ал сөйлеген сөзді тану процесі мен оның сапасы әлі жетілдірілу үстінде.
«Айтылған сөзді тану процесін 80 па­йызға дейін жеткіздік. Жоғарыда айтылған екі процестің шешімін тапсақ, біз Siri, Алиса деген жүйелерге ұқсас өнімді өзіміз жасап аламыз» деп сеніммен айтты ғалым.
Жас ғалымдарға қолдау қажет Қазір қазақ тілін тану процесіне қатысты жүйе жетілдіру үстінде. Өйткені деректер қоры неғұрлым мол болса, жасанды интеллект оны автоматты түрде оқып, өзі қатесін түзетіп, ары қарай үйрене береді. Алайда қолданбалы модельді жетілдіруге көп қаражат керек. Оның бір бөлігі дарынды, жас ғалымдардың жала­қысына жұмсалмақ.
«Біздің шағын ұжымда істейтін жас ғалымдардың жалақысы өте аз. Сондықтан жас ғалымдар шетелдік компанияларға кетіп қалады. Екі ғалымымыз Microsoft компаниясына жұмысқа орналасып кетті. Тағы бір әріптесіміз Уашингтон универ­си­тетіне оқуға кетті. Осы мәселе бізге қиын­дық тудырады», – дейді Өркен Мамырбаев. Қазақстан – Британ техникалық уни­вер­ситеті Ақпараттық технология мекте­бінің қауымдастырылған профессоры Александр Пак қазақ тілін қолдауға бағыт­талған ауқымды жұмысты қолдау қажет­тігін алға тартады. «Осы жұмыстың басты қиыншылығының бірі – ол қазақ тілінің ресурстық мүмкіншілігі аз тілдердің қатарына жататынында. Яғни, көптеген дайын IT өнімдерді әзірлеп шығуға қажет инвестиция құралдары жетіспейді», – дейді ол.
Александр Пак еліміздегі ғылыммен айналысатын компаниялардағы IT мамандарға жасалған жағдай шетелдік компаниялар ұсынатын жағдайдан екі есе төмен екеніне тоқталды.
«Қазір адамды бір жерде қалдырып, жұмыс берушіге ұнайтын жағдайда еңбек етуге мәжбүрлеу мүмкін емес. Менің жетекшілігіммен ғылыми жұмыс қорғаған шәкірттерімнің ішінде 15 адам шетелге жұмысқа кетіп қалды. Ол жақта тұрмыс жоғары, азаматтық қоғам, адам құқығын сақтауға қатысты көптеген артықшылық бар», – дейді ол.
Жоба жасаушылар қаржыландыруды мемлекеттік немесе жекеменшік компа­ния­лар арасынан іздейді. Алайда қомақты ақшаны көбіне шетелдегі инвесторлар ғана ұсынып жатады. Олармен жұмыс істегенде танымал жобалар арқылы нарыққа шығу мүмкіндігі ашылады.
«Біздің жобаға шетелдік компаниялар қызығушылық танытып отыр. Олар «модельді барынша дамытып, жетілдіріп берсеңдер, өзіміз жасап шыққан құрылғы­ларға қосамыз», – дейді. Қазір ресейлік IT speech, SpeechPro секілді компаниялар «бізге осы модельді әзірлеп берсеңіздер» деп ұсыныс беруде. Негізі, ресейлік компа­ниялар біздің нарыққа осы жобалармен келгісі келеді», – дейді жоба авторы.
Оның айтуынша, ұжым оны қазақстан­дық компаниялармен бірлесіп дайын өнімге айналдыруды көздейді. Тек бір ғана аяқталған жоба танымал нидерландтық Philips компаниясына беріліп, соның өнімдеріне біріктірілген бағдарламаға айналған.
«Моделіміз олардың диктофон, микро­фондарындағы бағдарламада жұмыс істеп жатыр. Олардың қоятын талабы – қазақша сөйлеуді жетілдіріп отыру. Бағдарламаны сатқаннан түскен пайданың 10 пайызын аламыз. Осындай салада жұмыс істеп жатқандықтан, жобамызды серверге қоюға тура келді. Моделімізді жаңартқан сайын оны Philips-ке ұсынамыз», – дейді Өркен Мамырбаев.
Қазір бұл технологияны қолдану саласына қарай жетілдіру жүзеге асырылып жатыр. Айталық, терминдер қолданылу ерекшелігіне байланысты экономика, өндіріс, математика тағы басқа салаларда терминологиялық сөздерді қазақ тілін машинатану процесіне қосу қолға алынған. Ең алдымен оған экономикалық деректерді қосып ұлғайту жүргізілген. Сан түрлі саланың терми­нологиялық сөздерімен байытылған жүйе көлемі артқан соң тану процесінің сапасы да жоғарылай бастаған. Александр Пак, қазақша сөйлейтін адамның орыс сөздерін араластырып сөйлеуін де ескеру керек деп санайды. Оның пікірінше, бұл ерекшелік дауысты мәтінге айналдыру моделінің жұмысын күрделендіре түседі.
«Бізге «қазақ тіліне орыс тілін аралас­тырып сөйлеуді тани аласыңдар ма, осыған зерттеу жүргізе аласыңдар ма» деген сұра­ныс түсті. Жобамыз қазақша және орысша жеке істеп тұрғандықтан, араластыра сөй­леуді жақсы ажырата алады. Қазір ауызекі сөйлегенде көп адам орыс тілін аралас­тырып сөйлейді. Біз соның моделін жасап, оны жетілдіру үстіндеміз», – дейді Өркен Мамырбаев.
Айта кетерлігі, елімізде IT маман Ди­нара Әлімова жетекшілік еткен топ та осындай технология әзірлеген. Scriptur аталған жобада қазақша және оған орысша араластырып сөйлеуді таниды. Тілдік ерекшелік ескеріледі Өркен Мамырбаев қазақ тілінің агглютивті тілдер тобына жататынын, әрі туыстас түркі тілдеріне көп сөздері ұқсас екенін айтып өтті. Осыны ескере отырып қырғыз, өзбек, әзербайжан, түрік тілдерін­дегі ортақ сөздерді тануды жеңілдетуге болады. Ғалым осы процесті зерттеп, нәтижесін мақала етіп ғылыми басылымға жариялаған. Бұл Language education тілді инден­тификация­лауға қатысты.
«Тілді тануды күшейту үшін жобаны осы тұрғысынан жетіл­діргенбіз. Адам қай тілде сөйлеп жатыр соны анықтайды. Сосын адам қай тақырыпта сөйлеп жатыр оны да білеміз. Осының бәрін машиналық тану жіктеп алады. Тағы бір артықшылығы – алгоритм көп дауыстан таң­дап, оны жеке жіктеп, иден­тификация жасайды. Содан кейін адамның жас мөлшері қай шамада екенін де дәл табады», – дейді ғалым.
Осы тұста еске сала кетсек, Назарбаев университетінің ақылды жүйелер мен жасанды интеллект институтының (NU ISSAI) ғалымдары он түркі тілін – қазақ, әзербайжан, башқұрт, өзбек, қырғыз, сақа, татар, түрік, ұйғыр және чуваш тілдерін танитын жаңа модель әзірлеген. Бұл мо­дель де түркі тілдерінің ұқсастығын пай­даланады. Айтылған сөзді анық түсінудегі тағы бір мәселе – адамның қай өңірден екенін анықтау. Өйкені елімізде әр өңірдің сөйлеуінде айырмашылық бар.
«Ауызекі сөйлеудегі бір мәселе – диалекті, регионализм. Сөзді мәтінге айналдырғанда оны қатесіз, дұрыс жазу қажет. Зерттеу барысында әртүрлі аймақ­тағы сөйлеу ерекшелік­тері, атаулардың балама немесе айырмаларына қатысты мәліметтерді жинастырдық. Солтүстік, батыс, шығыс аймақтардағы сөйлеу мә­не­рі, Қытайдан, Тәжікстаннан, яғни шетел­ден келген қазақтардың сөздерді айтуын­дағы ерекшеліктерді де осыған қостық», – дейді Өркен Мамырбаев.
Оның айтуынша, сөздік қорды тану деңгейі 80 пайызға жеткенде отандық Алиса, Siri секілді дауыстық көмекшілерді жасауға мүмкіндік туады екен. Жоба жетекшісінің айтуынша, жина­лыс­тардың хаттамасын автоматты түрде әзірлеуге мүмкіндік туады. Үкімет аппараты осындай ұсыныс жасаған. Алайда жабық түрде өтетін жиындардың дыбыс сигналын жазып алу үшін бағдар­лама сол жердегі серверде орналасуы тиіс. Қазір ғалымдар осының шешімін ойлас­тырып жатыр. Сонымен қатар телевизияда берілетін видеоның субтитрін автоматты түрде әзірлеуге болады. Тіпті, электронды үкімет өкілдері аппараттардан анықтаманы алуды жеңілдетуді, оны дауыспен сұратып алуы технологиясын әзірлеп беруді сұраған. Өркен Мамырбаев­тың айтуынша, дайын жүйенің бірін Талдықорғандағы екі мектеп тестіден өткі­зіп, сатып алып қолданысқа енгізген. Ол білім ошағында өткізілетін олимпиадаға пайдаланылады. Өркеннің айтуынша, көпшілікке осы жобалардың жарнамасы үшін Telegram-да айтылған сөзді мәтінге айналдыратын чат-бот іске қосылған. Онда дауысты жазып қойсаңыз, бот дауыстық сигналды дайын мәтінге айналдырып ұсынады. Сөз соңында айтарымыз, осы мақаланы әзірлеу барысында біз тақырып етіп көтерген жүйені түрлі бағытта, үш балама түрін отандық ғалымдар ұжымы зерттеп, әзірлеп жүргенін білдік. Яғни, өндірістен шыққан дайын өніміміз болмаса да, ақпараттық технология алаңында әлемдік алпауыттардың өнімінен кем түспейтін жаңа жоба, ғалымдардың зерттеу-тәжірибелік еңбектері бар екеніне көзіміз жетті. Ендеше оларды қолдау ниеті мен ісін алға сүйрейтін қаржы жағы ғана тапшылық етпесе болды.

Жәнібек АМАНГЕЛДІ