Бүгінде көптің аузынан түспейтін жасанды интеллект технологиясы ғылымның қай саласында болмасын қолданысқа еніп, әлемдік нарықты жаулап келеді.
Қара сөздерді жасанды интеллект дыбыстады
402
оқылды

Соның ішінде ЖИ қуатын пайдалануға көшкен салалардың бірі – әдебиет. Иә, енді қазақ әдебиетінің жауһар туындылары оқырманға жаңаша форматта ұсынылады. Соның бір көрінісі – ЖИ көмегімен әзірленген Абайдың қара сөздерінің аудиокітабы.

Ақпараттық және есептеуіш технологиялар институтының ғалымдары қазіргі кезеңде ЖИ бойынша бірқатар маңызды ғылыми жұмыс жүргізіп отыр. Ғалымдар жүзеге асырған жоба­лардың тақырыбы да, бағыты да сан алуан. Мәселен, олар үлкен кө­лемдегі деректерді өңдеуге ар­налған жаңа әмбебап кластерлеу алгоритмдерін әзірлеген. Бұл деректерді мағыналық топтарға бөлуге мүмкіндік береді, сондай-ақ қаржы, медицина және марке­тинг саласында деректерді талдау, шешім қабылдау процесін жеңіл­детеді. Ғылыми қызметкер Әлім­жан Төлеу қазақ әдебиетіндегі шығармаларды дыбыстауда ЖИ құралдарын пайдаланудың тиімді тұсы көп екенін жеткізді. 

– ЖИ көмегімен әзірленген аудиокітаптардың дәстүрлі аудио­жазбалардан ерекшелігі,  ең алды­мен, ЖИ арқылы аудиокітап жыл­дам әзірленеді. Бұл үшін дикторлар студияда мәтін дыбыстап, апталап, айлап уақыт жұмсамайды. Кітап бірер сағатта, тіпті бірнеше минут ішінде дыбысталып үлгереді. Дыбысталу барысында қатені түзету, жаңалықтарды енгізу де жылдам. Біз ЖИ арқылы түрлі эмоцияны, оқу жылдамдығы мен дауыс мәнерін өзгерте аламыз. Сон­дықтан ЖИ кітапты аз шығын­мен дыбыстауға мүмкіндік береді. Жаңа технология кітаптарды ғана емес, онымен қоса мақала, жаңа­лық сынды кез келген қажетті мә­­тін­дерді дыбыстауға ыңғайлы, – деді ол.

Аудиокітапты әзірлеу бары­сында бірнеше ЖИ технологиясы қолданылған. Осы ретте Әлімжан Төлеу бізге процестің негізгі кезең­дері туралы айтып берді. Оның сөзінше, процестің алғашқы сатысы дауыс мәліметтерін жинау­дан басталады (Corpus Collection). Екіншіден, мәтіннен дыбысқа айналдыру жүйесін құру (Text-to-Speech, TTS), үшіншіден, модельді оқыту (Training Process) және ең соңғы кезең дыбысты өңдеу және тазартудан (Post-processing) тұ­рады. 

– Ең алдымен, қазақ тіліндегі жоғары сапалы дауыс мәліметтері жи­налды. Бұл үшін кәсіби диктор­лардың кең көлемді мәтіндер оқыған аудиосын жинадық. Бұл модельдің әртүрлі сөйлеу мәнерін меңгеруіне мүмкіндік берді. Ал мәтіннен сөйлеуге айналдыру жүйесін құру процесі (Text-to-Speech, TTS) екі сатыдан тұрады: спектрограммалық болжау (Spectrogram Prediction) және дыбыстық сигнал жасау (Vocoder Training). Мәтінді дыбысқа айналдырудың алғашқы қадамы – мәтіннен спек­трограмма (дыбыстың визуалды көрінісі) жасау. Бұл үшін терең нейрондық желі модельдері құрылды. Олар сөйлем құрылы­мындағы интонация, екпін, және паузаларды дәл болжауға көмек­тесті. Модель дұрыс айтылымды қамтамасыз ету үшін сөздердің фонетикалық транскрипциясын пайдаланды. Спектрограммадан нақты дыбыс шығару үшін vocoder модельдері жасалды. Вокодерлер спектрограммадағы мәліметтерді пайдаланып, ды­быстың шынайы тембрін, тыныс алу сәттерін және интонациялық ауытқуларды қалпына келтірді, – деді маман.

Үшінші сатыда модель үлкен көлемдегі мәліметтер негізінде бірнеше кезеңнен тұратын оқыту процесінен өтеді. Модель сөйлеу жылдамдығы, кідірістер және сөздердің өзара байланысын үйреніп, сөйлеудің табиғилығын арттырады (Training Process). Әрі қарай дыбыстың таза шығуын қамтамасыз ету үшін фондық шуды азайту, тыныс белгілерін дұрыс қою және дыбыстық сапаны арттыру құралдары қолданылады (Post-processing).  Әлімжан Төлеу ана тіліміздегі шығармаларды оқырманға ЖИ арқылы жаңаша форматта жеткізу қазақ әде­биетінің цифрлық дамуы­на ықпал ететінін атап өтті.  

– Шығармаларды ЖИ арқылы жаңаша форматта жеткізу қазақ әдебиетінің қолжетімділігін арт­тырады. Одан өзге, қоғамда көру қабілеті нашар адамдар үшін кітап­ты аудио арқылы тыңдауға мүмкіндік береді. Жас буынға ұлттық әдебиетті заманауи фор­матта жеткізу – қызығушылықты жоғарылатады. ЖИ тек дыбыстау­мен шектелмейді. Бұл тұста автоматты аударма технологиясын қоссақ болады. Осының арқасында қазақ классикалық шығармалары шетел тілдеріне жылдам аудары­лып, әлемдік оқырманның наза­рына жетеді. Ал тану технология­ларын қолдану арқылы ескі және сирек кездесетін шығармаларды цифрландыру, қолжазбаларды тану және қалпына келтіру про­цесін жеңілдете аламыз, – деді ол.

Институт ғалымдарының аудиокітаптан өзге жаңа техно­логияларға негізделген бірнеше жобасы бар. Олардың қатарында медиа контентті талдауға арналған құралға қолданылатын тематика­лық модельдеудің жаңа алго­ритмдері, үлкен тілдік модельде RAG жүйелеріне пайдаланылатын көп құжаттағы мәтіндерді жи­нақтаудың жаңа алгоритмдері бар. 

Әлімжан Төлеу институтта ЖИ бағытында халықаралық деңгей­дегі технологиялар мен әдістермен теңесетін ғылыми жұмыс әзір­ленетінін айтты. Оның ойынша, әлемді дүр сілкіндірген ChatGPT, Deepseek сияқты үлкен тілдік модельді құруға өз ғалым­дары­мыздың да қабілеті жеткілікті.

– Келешекте ЖИ ғылымға зор ықпал етеді. Ол дәстүрлі әдістерді өзгертумен қатар, зерттеулерді жылдам әрі тиімді жүргізуге мүм­кіндік береді. Үлкен көлемдегі мәліметтерді өңдеу – жасанды интеллектің басты артықшылығы. Деректер көлемі күн сайын артып келе жатқандықтан, оларды қолмен талдау күрделі. ЖИ бұл мәселені шешіп, сенімді нәти­желер береді. Мысалы, жаңа мате­риалдарды табу процесін жедел­детеді. Екіншіден, білім беруді жекелендіру мүмкіндігі артты. ЖИ студенттердің білім деңгейін баға­лап, жеке оқу бағдар­ламаларын ұсына алады. Сондай-ақ ол ғы­лым­ның жаһан­дануына үлес қо­сып, ғалымдарға деректерді бөлі­суге және әлем елдерімен ортақ зерттеу жүргізуге көмек­теседі, – деді Ә. Төлеу.

Сондай-ақ маман жасанды интеллектің нарыққа толыққанды енуі үшін бірнеше маңызды фак­торды ескеру қажеттігін айтты. 

– Біріншіден, инфрақұры­лымды дамыту – жоғары өнімді есептеу жүйелері мен мәліметтерді сақтау орталықтарын құру аса маңызды. Екіншіден, кадр даярлау – ЖИ саласында білікті маман­дарды даярлау арқылы технология­ны тиімді қолдануға жол ашылады. Үшіншіден, заңнамалық реттеу мен этика – ЖИ қолдануда дерек­тердің қауіпсіздігін қамтамасыз ету және этикалық мәселелерді шешу халықтың сенімін арт­тырады. Төртіншіден, жергілікті контент әзірлеу – Қазақстанның тілі мен мәдениетіне бейімделген ЖИ жүйелері халыққа ыңғайлы әрі қолжетімді болады, – деді институттың ғылыми қызметкері Ә. Төлеу.

Маман жоғарыда аталған ба­ғыттарда жүйелі жұмыс жүргізілсе, ЖИ технологиялары елімізде кеңінен қолданылып, экономика мен қоғамның түрлі саласында тиімділікті арттыруға айтарлықтай үлес қосатынын, сондай-ақ жаңа технологияларды енгізуде адам құқықтары мен ұлттық мүдделерді ескеру қажет екенін жеткізді.

Алтынай БАУЫРЖАНҚЫЗЫ,

Алматы қаласы