Жасанды интеллектінің жұлдызын жаққан

Жасанды интеллектінің бүгінде өзектілігі артып, қоғамның әртүрлі саласы мен адам өмірін трансформацияға ұшыратып жатыр. Алғашқы алыптардың бірі болып OpenAI компаниясы өзінің ChatGPT қызметін жаһанға паш еткенімен, технологиялар додасына ендігі уақытта біраз ел белсенді түрде қосылуда. Солардың бірі Қытай бүгінде Made in China 2025 стратегиялық бастамасының негізгі бағыты ретінде жасанды интеллектінің «жолын ашуға» ұмтылып келеді.

Жасанды интеллектіні дамыту бағыттарының ішінде сөзді тану және синтездеу технологиялары ай­рықша мәнге ие. Бұл салада қы­тайлық iFlytek компаниясы же­текші орында. Шанхай Ынты­мақ­тастық Ұйымына мүше мем­ле­кеттердің бір топ журналис­те­ріне арналған медиа-тур ба­ры­­­­сында біз осы брендтің кеңсесіне қонаққа ба­рып, өнімдерімен егжей-тег­жей­лі таныстық.

Дауыстық мәзірден басталған даңқ

Бұл компанияны 1999 жылы Хэфэйдегі беделді оқу орны са­на­латын Қытай ғылым және тех­ника уни­верситетінің 26 жастағы ас­пи­ранты Лю Цинфэ құрған. Он­дағы мақ­саты – батыстың әйгілі бренд­тері­мен бәсекелес болумен қоса, қы­тайлықтарға мақтаныш сезімін сый­лайтын өнімді өмірге әкелу бо­лыпты. Оның: «Дауыс – мәде­ниет­тің негізі әрі ұлттың сим­во­лы» деп айтқаны бар. Лю кор­пора­тив­тік клиенттерге колл-орталықтарды автома­тиза­ция­лап, оператор адам­дарды дауыстық мәзірмен алмас­тыруға («төлем жасау үшін «тө­лем» деп айтыңыз») көмектесетін биз­нес құруды көкседі. Жаңа­ғы­дай дауыстық мәзірді ең алғаш Huawei компаниясының өнім­де­рі­не орнатқаннан кейін iFlytek-тің атағы аспандап шыға келді. 

iFlytek 2010 жылы өзінің ірі тұ­тынушылық өнімі – iFlytek Input қосымшасын шығарады. Ес­теріңізде болса, дәл сол жылы Apple өз айфондарына Siri-ді ор­нат­қан еді. Бірақ Siri сұрақтарға жауап бере алатын жеке цифрлық кө­мекшінің рөлін атқарса, iFlytek Input-тің қызметі әлдеқайда ау­қым­дырақ болып шықты. Ол адам­­­­дарға кез келген жерде өз те­лефондарына мәтінді сөйлеп ен­гізуге мүмкіндік берді: элект­рон­ды поштада да, уеб-іздеу қыз­ме­тінде де немесе Қытайдағы су­пер­қосымша саналатын We­Chat-та да мәтінді саусақпен термей, ауыз­ша айтасың. 

«Машиналық оқытуға негіз­дел­ген кез келген технология тә­різ­ді бастапқыда мұның жұмы­сын­да да ақау көп болатын. Алай­да не­ғұрлым көбірек деректер ен­гі­зіл­ген сайын, жүйе де соғұрлым жақ­сырақ жұмыс істей бастады. 2012 жылы компания Yudian атты вир­туалды көмекші шығарып, ж­а­санды интеллектіні жаңа жол­мен – нақты уақыт режимінде ау­дарма жасауға үйретеді. Көп ұза­май, ол қытайша 23 диалек­ті­дегі және 4 шет тіліндегі әңгіме­лер­ді аударуды меңгереді», – дейді ком­панияның инновациялық бас­тамалар бөлімі маманы Ху Чжин. 

Өзі «тыңдаушы», өзі «ділмәр»

Бүгінде iFlytek шапшаң түрде стенограммалар әзірлеп беретін план­шеттер мен цифрлық рекор­дер құрылғыларын да шығарады. Біз­дің, яғни журналистердің әрі таң­ғалып, әрі қызығып тама­ша­ла­ған құралдардың бірі де осы бол­ды. Сағаттап сұхбаттарды дик­то­фоннан түсірген кез келген тіл­ші ол істің машақатын жақсы бі­леді. Қолымыздағы iFlytek ре­кор­дерлерінің әлеуетін естігенде, еріксіз аузымызды аштық. Был­тыр өткен 14-ші Қытай парламен­ті­нің жиынында бұл кіп-кішкен­тай құрылғы 15,5 миллион сөзді 96% дәлдікпен жазып шыққан екен.

Жасанды интеллектінің сөзді синтездеу қабілеті дамығаны сон­ша, ол қазіргі жаңалықтар тарату қыз­метінде де кеңінен қол­да­ны­лады. Танымал жүргізушілердің кей­піне «енген» Синьхуа және CCTV телеарналарындағы цифр­лық дикторларға жергілікті ха­лық­тың әбден көзі үйренген. 

Тағы бір кереметі, iFlytek құ­рыл­­ғылары мәтінді ауызша да, жаз­баша да жеткізуде еш жаңыл­май­­ды. Мәселен, көзіңіз шаршап, қан­дай да бір мәтінді оқуға құ­март­пай тұрсаңыз, «ақылды» құ­рал оны әп-сәтте дауыстап оқып береді. Я болмаса, керісінше, әл­де­кімнің аузынан шыққан сөзді ай­на-қатесін мәтінге айналдыруға да шебер. Сөздегі дауыс ырғағы, эмо­ция және диалектілердің бә­рін жазбай таниды.

Айтпақшы, бұл жасанды ин­тел­лект алдағы шақта аударма­шы­ларды да жұмыссыз қалдыратын түрі бар. Аударма жасауға «маман­дан­ған» iFlytek құрылғысы 83 тілді бі­леді. 2022 жылы Бейжіңде өткен Қыс­қы Олимпиада және Пара­лим­пиада ойындарында тарихта ал­ғаш рет синхронды аударма ин­тернетсіз осы жасанды интел­лек­т көмегімен жүзеге асыпты. 

GPT-мен бәсеке мықты

Жасанды интеллект тек тап­сыр­маларды орындай алады деп ой­ласаңыз қателесесіз. Компания қызметкерлерінің айтуынша, ол «ойланып, қорытынды жасауға да қабілетті». 

«Былтыр 19 маусымда Аллен зерт­теу институты ұйымдастырған мә­тінді түсіну және логикалық ой­лауды бағалауға арналған ког­нитивті модель бойынша чем­пио­натта біздің iFlytek компаниясы­ның D-Reasoner моделі жеңімпаз атан­ды. Бұл байқауда жасанды ин­теллектіге әртүрлі матема­ти­ка­лық тұжырымды, теореманы және мә­селені шешудің әдістерін қам­ти­тын күрделі ойлау тізбектерін құру керек болған. Бұған, әлбетте, бірден қол жеткізе қойғанымыз жоқ. Бәрі кезең-кезеңімен болды. Мысалы, 2008 жылы сөзді түсініп, синтездеуді үйренсе, 2012 жылы сөзді сараптауды, 2015 жылы есті­ге­н және оқыған сөзді тануды мең­герді. 2017 жылы интеллек­туал­ды медициналық қызметкер рөлін атқара бастады, 2018 жылы екінші деңгейдегі аудармашы деңгейіне жетті, ал 2022 жылдан бері дұрыс пайым жасау қабілетіне ие. Біздің мақсатымыз – түптің түбінде адамша ойлайтын робот жасап шығару», – дейді компа­ния­ның вице-президенті Ху Генинг.

Бүгінде компанияның бір өні­мі саналатын SparkDesk чат-боты дүниежүзіне әйгілі GPT-4 Turbo қызметімен шамалас, тіпті кейбір тұстарда басып озады. Мысалы, тілді түсіну бойынша GPT-4 Turbo деңгейі 83,54%-ды құраса, SparkDesk 84,84% көрсеткішке ие бол­ған. Сұраққа жауап беру бойынша GPT-4 Turbo мен SparkDesk сәй­ке­сінше 78,23% және 77,56% дең­гей­де болса, математикалық қабі­лет бірін­шісінде 73,54%, екін­­шісінде 75,63% деңгейінде болған. Жақын бо­лашақта қытайлық ЖИ амери­ка­лық «әріптесін» басып озып кет­се, таңғалуға болмайды.

Ху Генинг айтқан «адамша ой­лайтын роботтың» өмірге келуі қаншалықты ақиқатқа айналарын қай­дам, бірақ ертеңгі күні робот­тың алдында ұятқа қалып қалмас үшін біздің де біраз дағды үйренуі­міз керегін осы сапарда түсініп қайт­тық.

Ботагөз МАРАТҚЫЗЫ,

Астана-Хэфэй-Астана