Жасанды интеллект тұрмыcымызға дендеп енді. Оның басты құралдарының бірі – дауыспен басқару. Ал осы тұрғыда қазақша сөйлеуді машиналық тану процесін әзірлеу – аса маңызды жұмыстың бірі. Елімізде осындай бірнеше жоба қолға алынды. Солардың ішінде дайын жүйеге айналған жобаның авторымен сөйлесіп, осы модельдің қыр-сырымен таныстық. Адам жеңіл түсінетін сөзді машинаның ұғуы қиын Жалпы, ауызбен айтылған сөздің цифрлы нұсқасын мәтінге айналдыру немесе найрожелінің оқуы ісінде қазақ тілі кешеуілдеп келеді. Басқа тілдерде мұндай бағыттағы қолданба, бағдарлама немесе кешенді жүйелер көп әрі еркін қолданысқа енгізілген. Осы кемшілікті жою әрі қазақ тілінің интернет және цифрлық саладағы нейрожелі негізіне айналу жолында еңбек етіп жүрген Ақпараттық және есептеу технологиялары институты бас директорының орынбасары Өркен Мамырбаев қазақ тілінде сөйлеуді тану технологиясына қатысты бірнеше дайын жоба әзірлеп шықты. Басында зерттеу үшін басталған ғылыми жұмыс соңында қолданбалы жағынан нәтижеге айналған.
«Бастапқысы қазақ тілінде сөйлеуді тану технологиясын әзірледік. Ең алдымен 2 мың сағатқа жуық ауызекі сөйлеу деректор қорын жинадық. Тілдік модельді нейрондық желі арқылы дамытамыз. Осы тұста тоқтала кететін нәрсе, тұрмысымызға жасанды интеллект тікелей еніп кетті. Көп салада қолданылады. Тіпті, МРТ, УДЗ-ге тексерілсе, ол сырқатты нақты көрсетеді. Соның негізінде жасанды интеллект, нейрожелі тұр. Біз де нейрондық желінің ең жаңа түрін құрдық. Архитектурасын, моделін әзірледік. Ол трансферлі үйрену деп аталады. Алдымен осындай зерттеу жасап, жаңа модель жөніндегі үлкен мақаламызды инфофакторы бар шетелдік журналға жарияладық», – дейді PhD доктор, қауымдастырылған профессор Өркен Мамырбаев.Оның айтуынша, сөйлеуді тану процесі мен синтез процесі қатар жүреді. Синтез – ол дайын мәтінді дауыстау. Қазір мұндай қосымша өте көп. Ол толық жүзеге асып үлгерген. Ал сөйлеген сөзді тану процесі мен оның сапасы әлі жетілдірілу үстінде.
«Айтылған сөзді тану процесін 80 пайызға дейін жеткіздік. Жоғарыда айтылған екі процестің шешімін тапсақ, біз Siri, Алиса деген жүйелерге ұқсас өнімді өзіміз жасап аламыз» деп сеніммен айтты ғалым.Жас ғалымдарға қолдау қажет Қазір қазақ тілін тану процесіне қатысты жүйе жетілдіру үстінде. Өйткені деректер қоры неғұрлым мол болса, жасанды интеллект оны автоматты түрде оқып, өзі қатесін түзетіп, ары қарай үйрене береді. Алайда қолданбалы модельді жетілдіруге көп қаражат керек. Оның бір бөлігі дарынды, жас ғалымдардың жалақысына жұмсалмақ.
«Біздің шағын ұжымда істейтін жас ғалымдардың жалақысы өте аз. Сондықтан жас ғалымдар шетелдік компанияларға кетіп қалады. Екі ғалымымыз Microsoft компаниясына жұмысқа орналасып кетті. Тағы бір әріптесіміз Уашингтон университетіне оқуға кетті. Осы мәселе бізге қиындық тудырады», – дейді Өркен Мамырбаев. Қазақстан – Британ техникалық университеті Ақпараттық технология мектебінің қауымдастырылған профессоры Александр Пак қазақ тілін қолдауға бағытталған ауқымды жұмысты қолдау қажеттігін алға тартады. «Осы жұмыстың басты қиыншылығының бірі – ол қазақ тілінің ресурстық мүмкіншілігі аз тілдердің қатарына жататынында. Яғни, көптеген дайын IT өнімдерді әзірлеп шығуға қажет инвестиция құралдары жетіспейді», – дейді ол.Александр Пак еліміздегі ғылыммен айналысатын компаниялардағы IT мамандарға жасалған жағдай шетелдік компаниялар ұсынатын жағдайдан екі есе төмен екеніне тоқталды.
«Қазір адамды бір жерде қалдырып, жұмыс берушіге ұнайтын жағдайда еңбек етуге мәжбүрлеу мүмкін емес. Менің жетекшілігіммен ғылыми жұмыс қорғаған шәкірттерімнің ішінде 15 адам шетелге жұмысқа кетіп қалды. Ол жақта тұрмыс жоғары, азаматтық қоғам, адам құқығын сақтауға қатысты көптеген артықшылық бар», – дейді ол.Жоба жасаушылар қаржыландыруды мемлекеттік немесе жекеменшік компаниялар арасынан іздейді. Алайда қомақты ақшаны көбіне шетелдегі инвесторлар ғана ұсынып жатады. Олармен жұмыс істегенде танымал жобалар арқылы нарыққа шығу мүмкіндігі ашылады.
«Біздің жобаға шетелдік компаниялар қызығушылық танытып отыр. Олар «модельді барынша дамытып, жетілдіріп берсеңдер, өзіміз жасап шыққан құрылғыларға қосамыз», – дейді. Қазір ресейлік IT speech, SpeechPro секілді компаниялар «бізге осы модельді әзірлеп берсеңіздер» деп ұсыныс беруде. Негізі, ресейлік компаниялар біздің нарыққа осы жобалармен келгісі келеді», – дейді жоба авторы.Оның айтуынша, ұжым оны қазақстандық компаниялармен бірлесіп дайын өнімге айналдыруды көздейді. Тек бір ғана аяқталған жоба танымал нидерландтық Philips компаниясына беріліп, соның өнімдеріне біріктірілген бағдарламаға айналған.
«Моделіміз олардың диктофон, микрофондарындағы бағдарламада жұмыс істеп жатыр. Олардың қоятын талабы – қазақша сөйлеуді жетілдіріп отыру. Бағдарламаны сатқаннан түскен пайданың 10 пайызын аламыз. Осындай салада жұмыс істеп жатқандықтан, жобамызды серверге қоюға тура келді. Моделімізді жаңартқан сайын оны Philips-ке ұсынамыз», – дейді Өркен Мамырбаев.Қазір бұл технологияны қолдану саласына қарай жетілдіру жүзеге асырылып жатыр. Айталық, терминдер қолданылу ерекшелігіне байланысты экономика, өндіріс, математика тағы басқа салаларда терминологиялық сөздерді қазақ тілін машинатану процесіне қосу қолға алынған. Ең алдымен оған экономикалық деректерді қосып ұлғайту жүргізілген. Сан түрлі саланың терминологиялық сөздерімен байытылған жүйе көлемі артқан соң тану процесінің сапасы да жоғарылай бастаған. Александр Пак, қазақша сөйлейтін адамның орыс сөздерін араластырып сөйлеуін де ескеру керек деп санайды. Оның пікірінше, бұл ерекшелік дауысты мәтінге айналдыру моделінің жұмысын күрделендіре түседі.
«Бізге «қазақ тіліне орыс тілін араластырып сөйлеуді тани аласыңдар ма, осыған зерттеу жүргізе аласыңдар ма» деген сұраныс түсті. Жобамыз қазақша және орысша жеке істеп тұрғандықтан, араластыра сөйлеуді жақсы ажырата алады. Қазір ауызекі сөйлегенде көп адам орыс тілін араластырып сөйлейді. Біз соның моделін жасап, оны жетілдіру үстіндеміз», – дейді Өркен Мамырбаев.Айта кетерлігі, елімізде IT маман Динара Әлімова жетекшілік еткен топ та осындай технология әзірлеген. Scriptur аталған жобада қазақша және оған орысша араластырып сөйлеуді таниды. Тілдік ерекшелік ескеріледі Өркен Мамырбаев қазақ тілінің агглютивті тілдер тобына жататынын, әрі туыстас түркі тілдеріне көп сөздері ұқсас екенін айтып өтті. Осыны ескере отырып қырғыз, өзбек, әзербайжан, түрік тілдеріндегі ортақ сөздерді тануды жеңілдетуге болады. Ғалым осы процесті зерттеп, нәтижесін мақала етіп ғылыми басылымға жариялаған. Бұл Language education тілді индентификациялауға қатысты.
«Тілді тануды күшейту үшін жобаны осы тұрғысынан жетілдіргенбіз. Адам қай тілде сөйлеп жатыр соны анықтайды. Сосын адам қай тақырыпта сөйлеп жатыр оны да білеміз. Осының бәрін машиналық тану жіктеп алады. Тағы бір артықшылығы – алгоритм көп дауыстан таңдап, оны жеке жіктеп, идентификация жасайды. Содан кейін адамның жас мөлшері қай шамада екенін де дәл табады», – дейді ғалым.Осы тұста еске сала кетсек, Назарбаев университетінің ақылды жүйелер мен жасанды интеллект институтының (NU ISSAI) ғалымдары он түркі тілін – қазақ, әзербайжан, башқұрт, өзбек, қырғыз, сақа, татар, түрік, ұйғыр және чуваш тілдерін танитын жаңа модель әзірлеген. Бұл модель де түркі тілдерінің ұқсастығын пайдаланады. Айтылған сөзді анық түсінудегі тағы бір мәселе – адамның қай өңірден екенін анықтау. Өйкені елімізде әр өңірдің сөйлеуінде айырмашылық бар.
«Ауызекі сөйлеудегі бір мәселе – диалекті, регионализм. Сөзді мәтінге айналдырғанда оны қатесіз, дұрыс жазу қажет. Зерттеу барысында әртүрлі аймақтағы сөйлеу ерекшеліктері, атаулардың балама немесе айырмаларына қатысты мәліметтерді жинастырдық. Солтүстік, батыс, шығыс аймақтардағы сөйлеу мәнері, Қытайдан, Тәжікстаннан, яғни шетелден келген қазақтардың сөздерді айтуындағы ерекшеліктерді де осыған қостық», – дейді Өркен Мамырбаев.Оның айтуынша, сөздік қорды тану деңгейі 80 пайызға жеткенде отандық Алиса, Siri секілді дауыстық көмекшілерді жасауға мүмкіндік туады екен. Жоба жетекшісінің айтуынша, жиналыстардың хаттамасын автоматты түрде әзірлеуге мүмкіндік туады. Үкімет аппараты осындай ұсыныс жасаған. Алайда жабық түрде өтетін жиындардың дыбыс сигналын жазып алу үшін бағдарлама сол жердегі серверде орналасуы тиіс. Қазір ғалымдар осының шешімін ойластырып жатыр. Сонымен қатар телевизияда берілетін видеоның субтитрін автоматты түрде әзірлеуге болады. Тіпті, электронды үкімет өкілдері аппараттардан анықтаманы алуды жеңілдетуді, оны дауыспен сұратып алуы технологиясын әзірлеп беруді сұраған. Өркен Мамырбаевтың айтуынша, дайын жүйенің бірін Талдықорғандағы екі мектеп тестіден өткізіп, сатып алып қолданысқа енгізген. Ол білім ошағында өткізілетін олимпиадаға пайдаланылады. Өркеннің айтуынша, көпшілікке осы жобалардың жарнамасы үшін Telegram-да айтылған сөзді мәтінге айналдыратын чат-бот іске қосылған. Онда дауысты жазып қойсаңыз, бот дауыстық сигналды дайын мәтінге айналдырып ұсынады. Сөз соңында айтарымыз, осы мақаланы әзірлеу барысында біз тақырып етіп көтерген жүйені түрлі бағытта, үш балама түрін отандық ғалымдар ұжымы зерттеп, әзірлеп жүргенін білдік. Яғни, өндірістен шыққан дайын өніміміз болмаса да, ақпараттық технология алаңында әлемдік алпауыттардың өнімінен кем түспейтін жаңа жоба, ғалымдардың зерттеу-тәжірибелік еңбектері бар екеніне көзіміз жетті. Ендеше оларды қолдау ниеті мен ісін алға сүйрейтін қаржы жағы ғана тапшылық етпесе болды.
Жәнібек АМАНГЕЛДІ