Соның ішінде ЖИ қуатын пайдалануға көшкен салалардың бірі – әдебиет. Иә, енді қазақ әдебиетінің жауһар туындылары оқырманға жаңаша форматта ұсынылады. Соның бір көрінісі – ЖИ көмегімен әзірленген Абайдың қара сөздерінің аудиокітабы.
Ақпараттық және есептеуіш технологиялар институтының ғалымдары қазіргі кезеңде ЖИ бойынша бірқатар маңызды ғылыми жұмыс жүргізіп отыр. Ғалымдар жүзеге асырған жобалардың тақырыбы да, бағыты да сан алуан. Мәселен, олар үлкен көлемдегі деректерді өңдеуге арналған жаңа әмбебап кластерлеу алгоритмдерін әзірлеген. Бұл деректерді мағыналық топтарға бөлуге мүмкіндік береді, сондай-ақ қаржы, медицина және маркетинг саласында деректерді талдау, шешім қабылдау процесін жеңілдетеді. Ғылыми қызметкер Әлімжан Төлеу қазақ әдебиетіндегі шығармаларды дыбыстауда ЖИ құралдарын пайдаланудың тиімді тұсы көп екенін жеткізді.
– ЖИ көмегімен әзірленген аудиокітаптардың дәстүрлі аудиожазбалардан ерекшелігі, ең алдымен, ЖИ арқылы аудиокітап жылдам әзірленеді. Бұл үшін дикторлар студияда мәтін дыбыстап, апталап, айлап уақыт жұмсамайды. Кітап бірер сағатта, тіпті бірнеше минут ішінде дыбысталып үлгереді. Дыбысталу барысында қатені түзету, жаңалықтарды енгізу де жылдам. Біз ЖИ арқылы түрлі эмоцияны, оқу жылдамдығы мен дауыс мәнерін өзгерте аламыз. Сондықтан ЖИ кітапты аз шығынмен дыбыстауға мүмкіндік береді. Жаңа технология кітаптарды ғана емес, онымен қоса мақала, жаңалық сынды кез келген қажетті мәтіндерді дыбыстауға ыңғайлы, – деді ол.
Аудиокітапты әзірлеу барысында бірнеше ЖИ технологиясы қолданылған. Осы ретте Әлімжан Төлеу бізге процестің негізгі кезеңдері туралы айтып берді. Оның сөзінше, процестің алғашқы сатысы дауыс мәліметтерін жинаудан басталады (Corpus Collection). Екіншіден, мәтіннен дыбысқа айналдыру жүйесін құру (Text-to-Speech, TTS), үшіншіден, модельді оқыту (Training Process) және ең соңғы кезең дыбысты өңдеу және тазартудан (Post-processing) тұрады.
– Ең алдымен, қазақ тіліндегі жоғары сапалы дауыс мәліметтері жиналды. Бұл үшін кәсіби дикторлардың кең көлемді мәтіндер оқыған аудиосын жинадық. Бұл модельдің әртүрлі сөйлеу мәнерін меңгеруіне мүмкіндік берді. Ал мәтіннен сөйлеуге айналдыру жүйесін құру процесі (Text-to-Speech, TTS) екі сатыдан тұрады: спектрограммалық болжау (Spectrogram Prediction) және дыбыстық сигнал жасау (Vocoder Training). Мәтінді дыбысқа айналдырудың алғашқы қадамы – мәтіннен спектрограмма (дыбыстың визуалды көрінісі) жасау. Бұл үшін терең нейрондық желі модельдері құрылды. Олар сөйлем құрылымындағы интонация, екпін, және паузаларды дәл болжауға көмектесті. Модель дұрыс айтылымды қамтамасыз ету үшін сөздердің фонетикалық транскрипциясын пайдаланды. Спектрограммадан нақты дыбыс шығару үшін vocoder модельдері жасалды. Вокодерлер спектрограммадағы мәліметтерді пайдаланып, дыбыстың шынайы тембрін, тыныс алу сәттерін және интонациялық ауытқуларды қалпына келтірді, – деді маман.
Үшінші сатыда модель үлкен көлемдегі мәліметтер негізінде бірнеше кезеңнен тұратын оқыту процесінен өтеді. Модель сөйлеу жылдамдығы, кідірістер және сөздердің өзара байланысын үйреніп, сөйлеудің табиғилығын арттырады (Training Process). Әрі қарай дыбыстың таза шығуын қамтамасыз ету үшін фондық шуды азайту, тыныс белгілерін дұрыс қою және дыбыстық сапаны арттыру құралдары қолданылады (Post-processing). Әлімжан Төлеу ана тіліміздегі шығармаларды оқырманға ЖИ арқылы жаңаша форматта жеткізу қазақ әдебиетінің цифрлық дамуына ықпал ететінін атап өтті.
– Шығармаларды ЖИ арқылы жаңаша форматта жеткізу қазақ әдебиетінің қолжетімділігін арттырады. Одан өзге, қоғамда көру қабілеті нашар адамдар үшін кітапты аудио арқылы тыңдауға мүмкіндік береді. Жас буынға ұлттық әдебиетті заманауи форматта жеткізу – қызығушылықты жоғарылатады. ЖИ тек дыбыстаумен шектелмейді. Бұл тұста автоматты аударма технологиясын қоссақ болады. Осының арқасында қазақ классикалық шығармалары шетел тілдеріне жылдам аударылып, әлемдік оқырманның назарына жетеді. Ал тану технологияларын қолдану арқылы ескі және сирек кездесетін шығармаларды цифрландыру, қолжазбаларды тану және қалпына келтіру процесін жеңілдете аламыз, – деді ол.
Институт ғалымдарының аудиокітаптан өзге жаңа технологияларға негізделген бірнеше жобасы бар. Олардың қатарында медиа контентті талдауға арналған құралға қолданылатын тематикалық модельдеудің жаңа алгоритмдері, үлкен тілдік модельде RAG жүйелеріне пайдаланылатын көп құжаттағы мәтіндерді жинақтаудың жаңа алгоритмдері бар.
Әлімжан Төлеу институтта ЖИ бағытында халықаралық деңгейдегі технологиялар мен әдістермен теңесетін ғылыми жұмыс әзірленетінін айтты. Оның ойынша, әлемді дүр сілкіндірген ChatGPT, Deepseek сияқты үлкен тілдік модельді құруға өз ғалымдарымыздың да қабілеті жеткілікті.
– Келешекте ЖИ ғылымға зор ықпал етеді. Ол дәстүрлі әдістерді өзгертумен қатар, зерттеулерді жылдам әрі тиімді жүргізуге мүмкіндік береді. Үлкен көлемдегі мәліметтерді өңдеу – жасанды интеллектің басты артықшылығы. Деректер көлемі күн сайын артып келе жатқандықтан, оларды қолмен талдау күрделі. ЖИ бұл мәселені шешіп, сенімді нәтижелер береді. Мысалы, жаңа материалдарды табу процесін жеделдетеді. Екіншіден, білім беруді жекелендіру мүмкіндігі артты. ЖИ студенттердің білім деңгейін бағалап, жеке оқу бағдарламаларын ұсына алады. Сондай-ақ ол ғылымның жаһандануына үлес қосып, ғалымдарға деректерді бөлісуге және әлем елдерімен ортақ зерттеу жүргізуге көмектеседі, – деді Ә. Төлеу.
Сондай-ақ маман жасанды интеллектің нарыққа толыққанды енуі үшін бірнеше маңызды факторды ескеру қажеттігін айтты.
– Біріншіден, инфрақұрылымды дамыту – жоғары өнімді есептеу жүйелері мен мәліметтерді сақтау орталықтарын құру аса маңызды. Екіншіден, кадр даярлау – ЖИ саласында білікті мамандарды даярлау арқылы технологияны тиімді қолдануға жол ашылады. Үшіншіден, заңнамалық реттеу мен этика – ЖИ қолдануда деректердің қауіпсіздігін қамтамасыз ету және этикалық мәселелерді шешу халықтың сенімін арттырады. Төртіншіден, жергілікті контент әзірлеу – Қазақстанның тілі мен мәдениетіне бейімделген ЖИ жүйелері халыққа ыңғайлы әрі қолжетімді болады, – деді институттың ғылыми қызметкері Ә. Төлеу.
Маман жоғарыда аталған бағыттарда жүйелі жұмыс жүргізілсе, ЖИ технологиялары елімізде кеңінен қолданылып, экономика мен қоғамның түрлі саласында тиімділікті арттыруға айтарлықтай үлес қосатынын, сондай-ақ жаңа технологияларды енгізуде адам құқықтары мен ұлттық мүдделерді ескеру қажет екенін жеткізді.
Алтынай БАУЫРЖАНҚЫЗЫ,
Алматы қаласы