Синтетикалық деректер жасанды интеллектің дамуына ықпал етеді. Ал ЖИ үшін цифрлық мұнай не үшін керек?
Роботқа цифрлық мұнай не үшін керек?
Синтетикалық деректердің мұнайға ұқсайтын қасиеті бар. Фото purepathtech.com сайтынан алынды
412
оқылды

Aikyn.kz синтетикалық деректердің жаңа заманның мұнайы, жасанды интеллект жұмысын жеделдететін құпия отын екенін Quartz сайтында жарияланған хабарламаға сүйеніп түсіндіреді.

Деректердің мұнай сияқты синтетикалық аналогы бар, оларды қолданған сайын ЖИ жүйелері ақылдырақ болады. Фото appen.com сайтынан алынды

Gretel-дің негізін қалаушы Джон Майерс жасанды интеллект (ЖИ) жүйелерін дамыту үшін «синтетикалық деректер» – цифрлық мұнай – керек екенін айтады.

Деректердің жаңа заманның «мұнайы» екенін алғаш рет 2006 жылы  математик Клайв Хамби айтқан болатын. Шикізат ретінде мұнай арзан болғанымен, ол тазартылып бензинге, дизельге айналса құны бірнеше есе өсетінін білеміз. Дәл осылайша, біз қолданып жүрген деректердің де «мұнайға ұқсайтынын, оларды қолданбас бұрын тазалап, өңдеу керектігін» математик ескерткен еді. Сонда деректердің құны да, маңызы да өседі.

Джон Майерстің айтуынша, мұнай сияқты деректердің де жасанды интеллектің болашағын қамтамасыз ететін синтетикалық аналогы бар.

«Менің ойымша, синтетикалық деректер негізінен ЖИ жүйелерін, атап айтқанда, оларға енгізілетін мәліметтерді дамытуға ықпал ететін негізгі отын болады», – дейді.

Gretel ЖИ және машиналық оқыту үлгілерін жақсарту үшін кәсіпорындарға синтетикалық деректер ұсынады. Бұндай деректерді қолданған сайын ЖИ жүйелері ақылдырақ және тиімдірек болады, басқа жүйелер мен оқыту үлгілерін әзірлеуді оңтайландырады.

Синтетикалық деректер көліктің синтетикалық майына ұқсайды, олар сапалы әрі қолдануға ыңғайлы. Фото Getty Images сайтынан алынды. Авторлығы: Khanchit Khirisutchalual

«Мен синтетикалық деректерге синтетикалық май сияқты қараймын. Көлік жүргізушілердің барлығы синтетикалық майды пайдаланады. Олар синтетикалық май табиғи майдың бір түрі екенін біледі. Бірақ синтетикалық май қозғалтқыштың бірқалыпты жұмыс істеуін қамтамасыз етеді, сапасы жоғары», – дейді Джон Майерс.

Синтетикалық деректер де дәл осылай жұмыс істейді. Синтетикалық деректерді жасаудың екі жолы бар. Біріншісі – бар деректерді жинап, оны қауіпсіз ету. Көлемін азайту, тасымалдауға ыңғайлы ету және ондағы құпия мәліметтерді алып тастау.

Екінші жолы – оларды «нөлден бастап» жаңадан жасау. Жаңа өнімдер шығарып, проблемаларды шешу үшін өмірде жоқ мәліметтерді жинастыру, жаңадан жасау.

Gartner консалтингтік компаниясы 2024 жылға қарай жасанды интеллект пен аналитика үшін пайдаланылатын деректердің 60%-ы синтетикалық жолмен жасалады деп есептейді. BCC Research мәліметтері бойынша синтетикалық деректерді өндіру нарығы 2022 жылы 381,3 миллион АҚШ доллары болса, 2028 жылға қарай 2,1 миллиард долларға дейін өседі.

Құпия ақпаратты қамтыған, жеке деректерді өңдейтін банктер мен медициналық мекемелерде синтетикалық деректерді қолданған тиімді. Фото news.mit.edu сайтынан алынды

Құпиялылықты сақтау синтетикалық деректердің ең маңызды сипаты саналады. Әсіресе көптеген құпия ақпаратты қамтыған, жеке деректерді өңдейтін қаржылық қызметтер мен денсаулық сақтау сияқты секторларда. Сонымен бірге, синтетикалық деректер нақты деректер жетіспейтін бос орындарды толтыруға және ескірген немесе сапасыз жасалған органикалық деректердің орнын толықтыруға көмектеседі. Бірақ өңделмеген нақты деректердің орнына синтетикалық деректерді қолдану тиімсіз болып саналады. Оның орнына синтетикалық деректерді нақты деректер мен жазбаларға қосымша ретінде пайдаланған тиімді екен.

Біздің ойымызша, жаңа қолданбалар жасағанда немесе табиғи (органикалық, нақты) деректерді жұмыста пайдаланғанда, олардың орнына осы мәліметтердің синтетикалық нұсқасын қолдану жеке деректерді құпия сақтау үшін, адамдардың қауіпсіздігі үшін қажет екенін көреміз.

Масштабтауға болатын ірі өндірісте бастапқы органикалық деректердің орнына олардың синтетикалық нұсқасын пайдалану қауіпсіздік мәселесін де, авторлық құқық проблемасын шешуге де оңтайлы болар еді.

Компьютерлік модельдеу арқылы жасалған деректер де синтетикалық деректер деп саналады. Фото radix-communications.com сайтынан алынды

Қысқаша анықтама

Синтетикалық деректер – бұл нақты өмірден алынбаған, жасанды түрде жасалған деректер. Әдетте алгоритмдер арқылы жасалған синтетикалық деректер математикалық үлгілерді сынау және машиналық оқыту үлгілерін үйрету үшін пайдаланылады. Компьютерлік модельдеу арқылы жасалған деректерді де синтетикалық деректер деп санауға болады.

Сараптама, зерттеу мақала, күнделікті өзекті ақпаратты «Айқынның» TELEGRAM арнасынан табасыз.