Жасанды интеллектіні дамыту бағыттарының ішінде сөзді тану және синтездеу технологиялары айрықша мәнге ие. Бұл салада қытайлық iFlytek компаниясы жетекші орында. Шанхай Ынтымақтастық Ұйымына мүше мемлекеттердің бір топ журналистеріне арналған медиа-тур барысында біз осы брендтің кеңсесіне қонаққа барып, өнімдерімен егжей-тегжейлі таныстық.
Дауыстық мәзірден басталған даңқ
Бұл компанияны 1999 жылы Хэфэйдегі беделді оқу орны саналатын Қытай ғылым және техника университетінің 26 жастағы аспиранты Лю Цинфэ құрған. Ондағы мақсаты – батыстың әйгілі брендтерімен бәсекелес болумен қоса, қытайлықтарға мақтаныш сезімін сыйлайтын өнімді өмірге әкелу болыпты. Оның: «Дауыс – мәдениеттің негізі әрі ұлттың символы» деп айтқаны бар. Лю корпоративтік клиенттерге колл-орталықтарды автоматизациялап, оператор адамдарды дауыстық мәзірмен алмастыруға («төлем жасау үшін «төлем» деп айтыңыз») көмектесетін бизнес құруды көкседі. Жаңағыдай дауыстық мәзірді ең алғаш Huawei компаниясының өнімдеріне орнатқаннан кейін iFlytek-тің атағы аспандап шыға келді.
iFlytek 2010 жылы өзінің ірі тұтынушылық өнімі – iFlytek Input қосымшасын шығарады. Естеріңізде болса, дәл сол жылы Apple өз айфондарына Siri-ді орнатқан еді. Бірақ Siri сұрақтарға жауап бере алатын жеке цифрлық көмекшінің рөлін атқарса, iFlytek Input-тің қызметі әлдеқайда ауқымдырақ болып шықты. Ол адамдарға кез келген жерде өз телефондарына мәтінді сөйлеп енгізуге мүмкіндік берді: электронды поштада да, уеб-іздеу қызметінде де немесе Қытайдағы суперқосымша саналатын WeChat-та да мәтінді саусақпен термей, ауызша айтасың.
«Машиналық оқытуға негізделген кез келген технология тәрізді бастапқыда мұның жұмысында да ақау көп болатын. Алайда неғұрлым көбірек деректер енгізілген сайын, жүйе де соғұрлым жақсырақ жұмыс істей бастады. 2012 жылы компания Yudian атты виртуалды көмекші шығарып, жасанды интеллектіні жаңа жолмен – нақты уақыт режимінде аударма жасауға үйретеді. Көп ұзамай, ол қытайша 23 диалектідегі және 4 шет тіліндегі әңгімелерді аударуды меңгереді», – дейді компанияның инновациялық бастамалар бөлімі маманы Ху Чжин.
Өзі «тыңдаушы», өзі «ділмәр»
Бүгінде iFlytek шапшаң түрде стенограммалар әзірлеп беретін планшеттер мен цифрлық рекордер құрылғыларын да шығарады. Біздің, яғни журналистердің әрі таңғалып, әрі қызығып тамашалаған құралдардың бірі де осы болды. Сағаттап сұхбаттарды диктофоннан түсірген кез келген тілші ол істің машақатын жақсы біледі. Қолымыздағы iFlytek рекордерлерінің әлеуетін естігенде, еріксіз аузымызды аштық. Былтыр өткен 14-ші Қытай парламентінің жиынында бұл кіп-кішкентай құрылғы 15,5 миллион сөзді 96% дәлдікпен жазып шыққан екен.
Жасанды интеллектінің сөзді синтездеу қабілеті дамығаны сонша, ол қазіргі жаңалықтар тарату қызметінде де кеңінен қолданылады. Танымал жүргізушілердің кейпіне «енген» Синьхуа және CCTV телеарналарындағы цифрлық дикторларға жергілікті халықтың әбден көзі үйренген.
Тағы бір кереметі, iFlytek құрылғылары мәтінді ауызша да, жазбаша да жеткізуде еш жаңылмайды. Мәселен, көзіңіз шаршап, қандай да бір мәтінді оқуға құмартпай тұрсаңыз, «ақылды» құрал оны әп-сәтте дауыстап оқып береді. Я болмаса, керісінше, әлдекімнің аузынан шыққан сөзді айна-қатесін мәтінге айналдыруға да шебер. Сөздегі дауыс ырғағы, эмоция және диалектілердің бәрін жазбай таниды.
Айтпақшы, бұл жасанды интеллект алдағы шақта аудармашыларды да жұмыссыз қалдыратын түрі бар. Аударма жасауға «маманданған» iFlytek құрылғысы 83 тілді біледі. 2022 жылы Бейжіңде өткен Қысқы Олимпиада және Паралимпиада ойындарында тарихта алғаш рет синхронды аударма интернетсіз осы жасанды интеллект көмегімен жүзеге асыпты.
GPT-мен бәсеке мықты
Жасанды интеллект тек тапсырмаларды орындай алады деп ойласаңыз қателесесіз. Компания қызметкерлерінің айтуынша, ол «ойланып, қорытынды жасауға да қабілетті».
«Былтыр 19 маусымда Аллен зерттеу институты ұйымдастырған мәтінді түсіну және логикалық ойлауды бағалауға арналған когнитивті модель бойынша чемпионатта біздің iFlytek компаниясының D-Reasoner моделі жеңімпаз атанды. Бұл байқауда жасанды интеллектіге әртүрлі математикалық тұжырымды, теореманы және мәселені шешудің әдістерін қамтитын күрделі ойлау тізбектерін құру керек болған. Бұған, әлбетте, бірден қол жеткізе қойғанымыз жоқ. Бәрі кезең-кезеңімен болды. Мысалы, 2008 жылы сөзді түсініп, синтездеуді үйренсе, 2012 жылы сөзді сараптауды, 2015 жылы естіген және оқыған сөзді тануды меңгерді. 2017 жылы интеллектуалды медициналық қызметкер рөлін атқара бастады, 2018 жылы екінші деңгейдегі аудармашы деңгейіне жетті, ал 2022 жылдан бері дұрыс пайым жасау қабілетіне ие. Біздің мақсатымыз – түптің түбінде адамша ойлайтын робот жасап шығару», – дейді компанияның вице-президенті Ху Генинг.
Бүгінде компанияның бір өнімі саналатын SparkDesk чат-боты дүниежүзіне әйгілі GPT-4 Turbo қызметімен шамалас, тіпті кейбір тұстарда басып озады. Мысалы, тілді түсіну бойынша GPT-4 Turbo деңгейі 83,54%-ды құраса, SparkDesk 84,84% көрсеткішке ие болған. Сұраққа жауап беру бойынша GPT-4 Turbo мен SparkDesk сәйкесінше 78,23% және 77,56% деңгейде болса, математикалық қабілет біріншісінде 73,54%, екіншісінде 75,63% деңгейінде болған. Жақын болашақта қытайлық ЖИ америкалық «әріптесін» басып озып кетсе, таңғалуға болмайды.
Ху Генинг айтқан «адамша ойлайтын роботтың» өмірге келуі қаншалықты ақиқатқа айналарын қайдам, бірақ ертеңгі күні роботтың алдында ұятқа қалып қалмас үшін біздің де біраз дағды үйренуіміз керегін осы сапарда түсініп қайттық.
Ботагөз МАРАТҚЫЗЫ,
Астана-Хэфэй-Астана