Алтынбек Шәріпбай: Қазақ тілі жасанды интеллекттің тіліне айналуға тиіс

Алтынбек Әмірұлы жасанды интеллект саласында интеллектуалды жүйелер және компьютерлік лингвистика проблемаларымен 30 жылдан астам айналысып келеді

«Қазақстан жасанды интеллект академиясы» қоғамдық бірлестігінің президенті, Л.Гумилев атындағы Еуразия ұлттық университетінің жасанды интеллект кафедрасының профессоры, техника ғылымдарының докторы Алтынбек Шәріпбаймен жасанды интеллект, ақпараттық технологияға қатысты қазіргі өзекті мәселелер және осы саладағы отандық өнімдер жөнінде пікір алмастық. Алтынбек Әмірұлы жасанды интеллект саласында интеллектуалды жүйелер және компьютерлік лингвистика проблемаларымен 30 жылдан астам айналысып келеді. Осы бағытта 5 ғылым докторы, 8 ғылым кандидаты мен 10 phd докторын даярлап, ақпараттық технология мен ақпараттық қауіпсіздік саласында көптеген шәкірт тәрбиелеп шықты.

– Алтынбек Әмірұлы, он шақты жыл бұ­рын қиял жемісі ғана саналатын жасанды интеллект қазір біртіндеп тұрмысымызға еніп ке­леді. Алайда соңғы кезде осы даму үде­рі­сінің жемісін көріп отырғанымызбен, оның бе­талысына қауіптене қарайтынымыз жасы­рын емес. Ғалым ретінде осы мәселені қалай көресіз?

– Жасанды интеллект қазір адамның ин­теллектуалды тіршілігінің барлық сала­сын­да қолдануға болатыны анық. Оның ал­дағы уақытта қолданылатын саласы тек кө­бейе береді. Қазір жалпы адамзат алдын­да «жасанды интеллектті біз жүгендеп, жұм­сай аламыз ба, әлде ол бізді билеп кете ме?» деген сұрақ тұр. Біз оны тізгіндей ал­масақ, жойылып кетуіміз әбден мүмкін. Ға­лым ретінде ондай қауіптің бар екенін жоқ­қа шығармаймын. Ғылыми тұрғыдан «ин­теллект» деген субъектінің қоршаған ор­тадан білімді қабылдау, түсіну, өңдеу, өзін-өзі оқыту, ережелер шығару және бас­қару қабілетін айтады. Егер субъект адам болса, онда табиғи интеллект, ал егер ол техникалық құрылғы болса, онда жасанды интеллект болады. Жалпы, білім деп белгілі бір пәндік аймақтағы (мысалы, бастауыш, орта және жоғарғы білім пәндеріндегі) не­месе қоғамның кез келген тіршілігіндегі немесе қоршаған ортадағы нысандар, үдерістер мен құбылыстардың қасиеттері мен өзара қатынастарының құрылымдық және мағыналық сипаты. Сипаттау үшін син­таксистік және семантикалық (мағы­налық) ережелері анықталған жасанды не­месе табиғи (ағылшын, қазақ және бас­қа) тіл қолданылады. Қазір белгілі бір пән­дік салада (мысалы, білім беру, денсаулық, са­лық, қаржылық нарық және басқа) жа­сан­ды интеллектті даярлау үшін білімдерді бей­нелеудің формалды моделдері мен тілдері қолданылып, білімдер базасы құ­ры­лады. Ол үшін таңдалған саладағы білікті ма­­мандардың білімдерінен жасанды интел­лект даярлайтын білім инженері жинап, білімдер базасымен қатар шығарым ере­желерін құрады. Бұл бір уақытта аяқталатын жұмыс емес, ол тұрақты (не кеміп, не өсіп) өзгеріп отырады, себебі деректер статис­ти­калық (өзгермейтін) нысан, ал білім ди­на­микалық (өзгермелі) нысан.

Жасанды интеллект дегеніміз – ақ­параттық жүйе, алайда білімді қо­рыта отырып жұмыс істейді. Ол кез кел­ген адамның зерделі қызметін ауыстыруға қа­бі­летті. Сонымен қатар қазір адамның қо­лымен жасалатын интернет заттар – чип­тер, сенсорлар бар. Олар кез келген қон­дыр­ғы мен құрылғыда орнатылып, интер­нет арқылы бір-бірімен байланыса алады. Егер жасанды интеллект осылардың басын қо­са алса, онда олар ақпарат алмаса оты­рып өзара қоғамды құрады. Бұл деңгейге жеткенде жасанды интеллект бізге қауіп төн­діруі мүмкін. Біздің қолданыстағы қа­зіргі қару жасанды интеллектінің жемісіне ай­налатын қарумен бәсекелесе алмайды. Қауіп күтетін нәрселер өте көп. Өйткені мен осы бағыттағы ғылыми мақалаларды көп оқимын. Соларды бағамдап отырсаң, олар айналысқа түсіп, қолданыла бастаған ке­зінде қандай дүниелер пайда болатынын ой­лаудың өзі қиын.

Айта кетсек, жасанды интеллект мо­дель­дері мен әдістері арқылы даярланған кез кезген интеллектуалды жүйемен табиғи тілде диалог жасап қатынасуға болады. Біз­дің елде мұндай тіл қазақ тілі. Мен өзімнің шә­кірттеріммен бірігіп жасанды интеллект және компьютерлік лингвистика саласында қазақ тілінің математикалық теориясын жасадым. Бұл салада менің білімім де, тә­жірибем де жеткілікті. Сондықтан жасанды интеллект саласында болжам және мәсе­ленің шешімі жөнінде пікір айта аламын. Қа­зіргі жағдайдағы бір қауіпке келсек, ол жа­санды интеллектінің салдарынан көп ел­дің тілдері жойылып кетуі мүмкіндігі бар. Жа­санды интеллектіні кім алдымен жа­са­ды, кім өз тілін оған енгізді, тек сол тілдер сақталып қалады. Сондықтан егер қазақ ті­лі осы жүйеге іліксе және сондағы диа­лог­тің бір құралы болса, онда ол мәңгілік жойылмайды. Бұл бағыттағы атқарылар жұмыс мемлекеттің жаһандық, стратегия­лық проблемасына айналды деп түсінемін. Сол үшін еңбек етіп, бар күш-жігерімді жұм­сап жатырмын. Менің соңғы жазған оқу­лығым және басқа да IT шешімдерім жа­санды интеллекті бағытында болып отыр.

– Бұған дейін ақпараттық технологиялар саласында көптеген автоматтандырылған жүйе жасағаныңызды білеміз. Ал білім және ғы­лым саласында электронды оқулықтар, қа­шықтан оқыту жөнінде жобаларды әзір­ле­діңіз. Алайда қазір ақылды оқулықтарды жа­саудың технологиясы туралы өзекті мә­селе көтеріп жүрсіз? Осы оқулық та жасанды ин­теллекті технологиясымен әзірленуі тиіс екен. Осы жобаға кеңірек тоқтала кетсеңіз?

– Бұрын нейрондық желі қолданылмай тұрған кезде бүкіл ақпараттық технология ма­­тематиканың динамикалық прог­рам­ма­лау моделдері мен әдістері арқылы жасалып кел­ді. Алайда жасанды интеллект шыққан соң ол толығымен өзгеріп кетті. «Білім беру мен білімді бағалаудың интеллектуалдық тех­нологиясы» атты қазақ тілін түсінетін жа­санды интеллекті бар көпфункционалды тех­нологияны әзірледім. Осы бойынша зерт­теу жүргізіп, бірқатар ақылды білім беру жүйелерін әзірлеуге болады. Олар қа­зақша көпдеңгейлі интеллектуалды оқу­лық, ауызша және жазбаша қарым-қатынас фун­кциясы бар терминологиялық сөздік, өзі үйрете алатын интеллектуалды цифрлық білім ресурсы, смарт аудио және мәтіндік кон­вертор жүйесі.

Жасанды интеллектті игеру үшін біз алдымен осындай ақылды оқу­лық әзірлеуді қолға алдық. Кез келген пән­нің онтологиялық (құрылымдық және ма­ғыналық) моделі мен тезаурасы бойынша смарт оқулықты автоматты тудыратын тех­нология даярланады. Дайын ақылды оқу­лық онлайн режимде оқушыға жеке оқыту траекториясын анықтап, мәтіндік, аудио және видео оқу материалдарын ұсынып, сұ­рақ қойып, оның жауабын пайыздық дең­геймен бағалай алады. Ақылды оқулық сұ­раққа берілген жауапты қабылдап, жауап­тың мағынасын түсінеді, берілген жауап бойынша білім деңгейін бірден ба­ға­лайды. Егер ауызша жауап берілсе, дауыс­ты танып, оны түсіне алады. Жазбаша жа­уап берілсе, оны дұрыс жауаппен салыс­ты­рып шығады. Яғни, тестке ұқсамайды. Бі­лім бағалаудың бұл түрінде классикалық логика қолданылып, ол жалған не ақиқат деп екі ғана жауап таңдайды. Ал ақылды оқу­лықта бұлдыр логика қолданылады. Ол 0-ден 100 пайызға дейінгі аралықта білі­мің­ді бағалайды. Берілген жауаптың дұрыс жауапқа қаншалықты семантикалық жуықтығын есептеп береді.

Осы тех­но­ло­гия тес­­­тілеу жүйесін ал­мас­ты­рып, білім саласына пай­далы өзгеріс әкеледі деп үміт­теніп отырмын. Бұл технология қа­зақ тілінің басқа тілдерге қарағанда ма­тематикалық сипаттауға, формалдауға, модельдеуге оңай келетінін дә­лелдеді, яғни бо­ла­шақта қазақ тілін халықаралық тіл­дер­мен бір қатарға шығарады.

Айта кетсек, қазір ауылдар азай­ды, он­да­ғы мектептер оқушы саны жет­пегендіктен жабылды. Мектебі жоқ ауылда өскен бала­лар интернатта жатып оқи­ды, білім сапасы төмендеп кетті. Өзінің атын жаза алмайтын ба­лалар бар. Соларды оқы­туды, білімін жақ­сартуды ақылды оқу­лық шеше алады. Ол интернет қолжетімді жер­дің бәрінде қол­дануға ыңғайлы. Смарт оқулықтың үй­рететін немесе сұрайтын та­қырыбын қа­тар­дағы мұғалімнен өте жақсы бі­леді. Өйт­­кені оны әзірлеуде саланың үз­дік ға­лым­дары мен мұғалімдерінің бі­лім­дері жи­нақталады және тәжірибелері бас­шы­­лыққа алынады. Қазір «кейбір мектеп­тер­дің білімі жақсы» деп жатады, бұл жеке мұ­ға­­лім­нің еңбегі, жетістігі. Сондай маман­дар­дың ең мықтыларының білімдері мен тә­­жі­­ри­­белері мен ұсынған жобада еске­рі­леді.

Интернет арқылы кез келген жерде, кез келген уақытта оқытуға мүм­кін­­дік береді. Электронды оқулықтан айыр­­машылығы бар. Онда статистикалық мәлімет беріледі. Ақылды оқулық жасанды ин­теллекттің технологиясымен жасалады, онда бәрі динамикаға негізделеді. Бір шәкіртім осы тақырыптан диссертация жазды. Тағы біреуі диссертация қорғауға әзірленіп жатыр.

Осы ұсынысымды Түркі кеңесі ая­сын­да Ташкентте, Бішкекте, Ыс­тан­бұлда жарияладым. Ақылды оқулықты осы түркітілдес төрт елде қолданысқа ен­гізу жайын көтердім. Бұл – өте ауқымды жұ­­мыс, сондықтан мемлекет қаржылан­дыруы­­мен ғана ілгерілетуге болар еді. Ақыл­ды оқулықты енгізу – білім беру са­ла­сындағы жемқорлыққа жол беретін тұ­с­тарды жояды. Өйткені біліміңді тексер­ген­де, биометрикалық мәліметтермен сау­са­ғыңның таңбасы, көзіңнің қарашығы ар­қы­лы оқушыны тани алады.

Мұны бастапқыда қазақ тілінде жа­сауды ойластырып жатырмыз. Со­­нымен бірге бұған дейінгі түркі тілдері бойынша жасаған жобалар мен еңбек­тері­міздегі білімді пайдаланып, түркітілдес ел­­­дерге де осыны жасап беру қиын емес. Тек білім дерекқоры болса жеткілікті. Ға­лым­дар біздің ұсынысты қолдап отыр.

– Мұндай оқулықтар басқа елдерде бар ма?

– Басқа елдерде осындай жобалар жа­са­лып жатыр. Бірақ дайын күйінде айна­лым­ға енгізілген нұсқа жоқ. Атышулы Chat­GPT те осының бір түрі. Онда сұраққа ғана жауап береді. Мектептің оқулықтарын осындай смарт жүйемен әзірлеп шығуды 4-5 жылдан бері ұсынып келемін. Өйткені жа­санды интеллект жобаларын қазақ тілін­де жасамасақ, артта қалып қоямыз. Сосын осы бағыттағы технология көп бол­ғандықтан, бәрінің соңынан жүгіре бермеу керек. Оның бәрін бір жолда дамыта алмай­мыз. Тағы бір айта кетер жайт, сурет тану жүйе­сі басқа елде шығып қойған. Оған ней­рожелі қолда­ны­лады. Саусақ таңбасын тану да толық зерт­теліп бітті, жетік жоба да көп...

– Сіз 1976-1991 жылдары КСРО-ның стра­­­тегиялық ғылыми орталықтарында жұ­мыс істедіңіз. Сол кездегі ақпараттық техно­ло­гия саласының қазір қолдануға ыңғайлы ұтым­ды тұстары, жақсы тәжірибелері көп пе?

– ҚазҰУ-ды бітірген соң 1975 жылы Мәс­­кеудегі Мәскеу мемлекеттік уни­вер­си­тетіне қолданбалы математиканы оқу үшін бардым. Онда Электронды есептеу маши­насын математикалық жабдықтау деген ка­федра ашылды, соның алғашқы түлегі біз едік. Бастапқыда мені «Ықтималдық тео­рия­сы» бойынша тағылымдаманы өтуге жі­берді. Алайда басқа тақырыптағы се­ми­нарларды тыңдап, жүйелі бағдарламалауға қы­зығып, екінші жылы министрліктен сұранып жүріп сонда ауыстым.

«Ғарыштық жүйелерді имитациялау тілі­нің трансляторы» атты ғылыми жобаға қатыстым. Жуков қаласындағы Ұшу-сы­нау институтында ғарышкерлер тексері­ле­тін. Оларды сынау үшін айналатын кунст­ка­мераға отырғызады, денесіне түрлі сен­сор орнатып қояды. Ғимараттағы үлкен зал­да кемінде 256 адам отырады. Өйткені қа­бырғадағы үлкен экранда орнатылған 256 ұяшықта шамдар жанып-сөніп тұрады. Әр адам өзіне бекітілген шамның жанып-өшкенін бақылайды. Содан сигналдар құрып, ғарышкердің қысымы, жүрек со­ғысы т.б. анықтайды. Соны автоматтандыру керек болды. Олар аппараттық тіл жасап шық­ты. Соны машина түсінетін, маши­на­дан аударатын транслятор жасау керек бол­ды. Осы жобаға үшінші адам болып қа­тыс­тым. Сонда күндіз-түні жүріп өндіріс­ке қол­данатын бағдарламаны жасауды үй­рен­дім.

Кейін сонда жүріп ғарыштың екінші тақырыбы бойынша жоба жаса­дым. Жоғарыда айтылған трансляторды Refal деген тілмен жаздық. Ол КСРО-да жа­салған. Жапондар сол кезде Prolog деген тіл­ді аппаратты түрде жүзеге асырды. Ал АҚШ Lisp деген тілді әзірледі, ал Кеңес Ода­­­ғында осындай тіл ретінде Refal тілі қа­­­былданып, оның аппаратты жүзеге асыруы басталды. Мен ол кезде Refal ті­лін­де жазылған бағдарламаның дұрыстығын тек­серу бағытында кандидаттық дис­сер­та­ция қорғаған болатынмын. Сол жылдары «Буран» ғарыш аппаратын ұшыруды басқару үшін қажетті аппараттық бағдар­ла­маны Ғарышты зерттеу институты мен М.Келдыш атындағы Қолданбалы ма­те­ма­тика институтының мамандары даяр­ла­ды, ал оның кейбір бөліктері Refal тілінде жа­зылды. Алайда бұл бағдарламаның дұрыс-бұ­рыстығын анықтайтын тест әлі шықпаған еді. Мен бес маманның бірі болып осы бағ­дарламаның дұрыстығын теорема бойын­ша тексеретін жабық жобаға кірдім. Кейін осы және тағы басқа мәселе бойын­ша докторлық диссертация қор­ға­дым. Диссертациямның жетекші ұйымы М.Келдыш атындағы Қолданбалы мате­ма­тика институты болды.

Жалпы, осы тұста айта кетер жайт, ондағы жұмыстың жүйелі ұйым­дас­тырылуына қатты қызығамын. Мысалы М.Ломоносов атындағы ММУ-да кибер­не­тика және есептеу математикасы факуль­те­тін алсақ. Факультет деканы мен кафедра мең­герушілері түске дейін университетте, түстен кейін ғылыми-зерт­теу институт­та­рын­­да жұмыс істейді. Өздері зерттеу инс­ти­туттарында істеген соң шәкірттерінің дип­­лом жұмысы, диссертацияларын өзде­рі­­нің саласына қатысты етіп береді. Оның ішін­де ғарышқа, қорғаныс өнеркәсібіне қа­тысты жа­бық тақырыптар да бар. Қазір біз­де де осындай жүйені қалыптастырып, өн­­діріс, білім беру, ғылымды бірлесіп жүр­гізуді ор­нықтыру қажет. Ашықтық, ғы­лым­ды объек­тивті бағалау арқылы жемқорлыққа жол беретін элементтерді алып тастау ке­рек.

М.Ломоносов атындағы ММУ-де біздің та­қырып бойынша семинарлар жиі өт­кі­зі­летін. Ғылыми еңбектерді оқығаннан анау дә­рістерді тыңдау біршама оңтайлы бо­ла­тын. Тыңдап отырып лектордан керек тұ­сын анықтап сұрап аласың. Осындай се­минарлар ұйымдастыру қолға алынса деген ойым бар. Оны тұрақты жүргізу үшін қаржы керек. Өйткені дәріс оқитын ғалымға ақы тө­леу қажет. Оны ұйымдастырушы тағы бар, талқылайтын тақырып бекіту керек, оған қатысатын адамдарды шақыру де­ген­дей тұстары бар. Ұйымдастырушы жұм­сал­ған қаржының есебін тапсырады. Бізде осын­дай есеп алу біршама қиындатылған. Жал­пы, адамға сену керек. Ғалымдарға сену керек, сонда ғана жетістікті ғылым пай­да болады. Ғалым бүгін күнкөріс үшін мы­на жобада, келесі жылы тағы бір жобада жүрсе, онда нәтижелі зерттеу шықпайды. Ғылымды жас бала секілді бар жағдайын жасап, баптап қойсаң ғана нәтиже күтуге бо­лады. Қазір елімізде ғалымдардың жағ­дайы керемет деп айта алмаймын. Барлығы грант қаржысын алып, ақшасы төленетін жобалардың қатарында емес. Сондықтан күнкөріс қамы үшін бірнеше оқу орнында жұ­мыс істеп жүр. 10-15 жыл бұрын бірнеше рет Қытайға барып дәріс оқыдым. Олар біз­дің баяндамамызды мұқият тыңдап, ке­рек тұстарын түртіп алып отыратын. Солар қазір бізден асып кетті. Өйткені онда бүкіл жүйе дұрыс жолға қойылды.

Сосын ғылыми жобаларды қаржы­лан­дыру тұрақты болуға тиіс. Қа­зіргі гранттық қолдау осы жүйелілікті бере ал­майды. Ғалымдар бір-екі жыл бір жобада істейді, сосын келесі жылдары басқа жо­ба­ны зерттейтін команда құрамында жүреді.

ММ ережелерінің мате­ма­ти­ка­лық моделдері жасалды. Қазақша жа­зыл­ғанды сөйлету және қазақша сөйлегенді жазу технологиялары дүниеге келді. Қазақ ті­ліндегі мәтінді морфологиялық, синтак­сис­тік және семантикалық талдау техноло­гиялары, қазақ тіліндегі білімдерді бейнелеу мен өңдеу және қазақ тілінің жазылған әр- түрлі заңдарына қайшы келетін мазмұндары бар мәтіндерді реңдік (эмоциялық) талдау технологияларын жасадық. Осы техно­логияларды кейін қазақ тілінде әртүрлі интеллектуалдық сұрақ-жауап жүйелерін, мә­тіндерді сентименттік талдау мен авто­матты рефераттау жүйелерін және кез кел­ген пән бойынша электронды оқыту мен білімді бағалау жүйелерін және ақпаратты қорғауды жүзеге асыру мен ақпараттық қауіпсіздіктің тәуекелдерін бағалауда қол­данып келеміз.

– Сіздің жетекшілігіңізбен түркі тілдеріне арналған ортақ тезаурусты әзірлеу жобасы жүзеге асырылды. Түркі тілдерін компью­терлік өңдеу жөнінде TurkLang жобасының құ­ра­мында жүрсіз. Түркі тілдерінің ақпараттық технологиясын бірлесе отырып дамытудың ұтымды тұстары жөнінде айта кетсеңіз.

– Біздің елімізде әлемге танылған ал­па­­уыт кәсіпорын да, заманауи робот жүйе­сін жа­сайтын өндіріс те жоқ. Өзіміз жасап шыққан автоматтандырылған кә­сіп­орындар да жоқ. Сондықтан бізге қол­же­тімді экспорттайтын сала – ол білім беру саласы. Біз айтқан және соған келетін озық бастамаларды дайын жобаға айналдырсақ, суы­рылып алға шығамыз. Он шақты басты түр­кі тілі бар. Алдымен жобаны қазақ тілін­де жасасақ, сосын түркі тілдерінің кез кел­генінен ауыстыра салу қиын емес. Өйткені тех­нологиялық моделі бір, сөйлем жасау, сөз­дің орналасуында айтарлықтай өзге­ше­лік жоқ. Тек сөздерін ауыстыра саласың. Осы әдіспен кез келген моделді істетуге бо­­­лады.

Сонымен қатар түркі тілді ұлттардың осы бағыттағы нәтижелі жақсы жо­балары баршылық. Солардың тәжіри­бесін де ортақ іске пайдалануға болады.

– Әңгімеңізге рақмет! Ісіңіз ілгері бас­сын!

Сұхбаттасқан

Жәнібек Амангелді