Aikyn.kz кеше Financial Times жариялаған DeepMind роботтарының мүмкіндіктері мен ерекшеліктерін бағалайды.
Google DeepMind робототехникаға арналған ЖИ модельдерін таныстырды. Компания жаңа технологиялық шешім әмбебап машиналарды күнделікті өмірде пайдалы көмекшіге айналдыру жолындағы маңызды қадам екенін атап өткен.
Жаңа робототехникалық модельдер Gemini Robotics және Gemini Robotics-ER деп аталады. Олар үлкен тілдік модельдердің (LLM) логикалық ойлау қабілеттерін пайдаланып, нақты өмірдегі күрделі тапсырмаларды орындауға жақсы бейімделе алады.
Google DeepMind мәліметінше, жаңа модельдермен оқытылған робот оригами-түлкіні қағаздан бүктеп жасай алады, дауыс арқылы берілген нұсқаулықтарға сүйене отырып, үстелдің үстіне тағамдар қояды, құлаққап сымдарын жинайды, миниатюралық баскетбол добын себетке дәл тастай алады.
Компания осы технологияны қолданып, Apptronik стартапымен бірлесіп, адам тәрізді роботтарды жасау бойынша жұмыс істеп жатыр. Бұл салада Tesla, OpenAI сияқты ірі технологиялық компаниялар мен стартаптар робототехниканы автономды басқаруға қабілетті ЖИ «миын» жасау үшін өзара бәсекеге түскен. Жарыс сәтті аяқталса өнеркәсіптен бастап денсаулық сақтау саласына дейін көптеген салалар жылдам өзгертуі мүмкін.
Nvidia компаниясының бас директоры Дженсен Хуан роботтарды кең ауқымда енгізу үшін генеративті ЖИ қолдану бірнеше триллион долларлық мүмкіндік екенін мәлімдеді. Осылайша әлемдегі ең үлкен технологиялық индустрияға жол ашылмақ.
Gemini Robotics алдыңғы үздік модельдерге қарағанда екі есе «ақылды». Фото blog.google блогынан алынды
Gemini Robotics қалай жұмыс істейді?
Соңғы онжылдықтарда робототехниканы жетілдіру өте баяу жүрді, себебі ғалымдар әр роботтың қозғалысын қолмен бағдарламалауға мәжбүр болды. Бірақ жасанды интеллектің жаңа әдістері машиналардың қоршаған ортаға жақсы бейімделуіне және жаңа дағдыларды жылдамырақ меңгеруіне мүмкіндік берді.
«Gemini Robotics біздің алдыңғы үздік модельдерімізге қарағанда екі есе әмбебап. Роботтарды жалпы мақсатта пайдалану жолында үлкен серпіліс жасалды», – деді Google DeepMind компаниясының бағдарламалық жасақтама инженері Канишка Рао.
Google Gemini Robotics моделін жасау үшін Gemini 2.0 тілдік моделін пайдаланған. Роботтарды басқаруға арнайы оқытқаннан кейін машиналардың өнімділігі артып, үш негізгі қабілетті игере бастаған: жаңа жағдайларға бейімделу, сөздік нұсқаулар мен қоршаған орта өзгерістеріне жылдам жауап беру, заттарды икемді ұстап, басқару қабілеті.
Бұндай мүмкіндіктер роботтарды дамытуға үлкен серпіліс береді. Себебі роботтар зертханаларда жақсы жұмыс істесе де, шынайы өмірдегі жағдайларға бейімделуі қиын.
Google DeepMind үлкен тілдік модельдердің интернет деректерінде оқытылған кең әлемдік түсінігін пайдаланды. Мысалы, робот кофені екі саусақпен ұстау керектігін интернеттегі материалдар негізінде өздігінен білген.
Tesla, OpenAI сияқты ірі технологиялық компаниялар робототехниканы автономды басқаруға қабілетті ЖИ «миын» жасау үшін жарысуда. Фото manlybattery.com сайтынан алынды
Калифорния университетінің (Беркли) робототехника профессоры Кен Голдберг зерттеуге қатыспағанымен, бұл жобаны «жасанды интеллект пен робототехникадағы өте қызықты жаңалық» деп бағалады.
«Бұл технология Google-дың үлкен көлемдегі деректер мен есептеу қуатын өңдеудегі мықты жақтарына негізделген. Ол робототехниканың болашағына үлкен ықпал етуі мүмкін», – дейді Голдберг.
Ол сондай-ақ жаңа робототехника модельдерінің ең инновациялық ерекшеліктерінің бірі – олардың үздіксіз бұлтта жұмыс істеуі екенін атап өтті.
«Бұл кең ауқымды әрі әсерлі зерттеу, оның нәтижелері өте сенімді: кеңістіктік ойлаудан бастап, икемді манипуляцияға дейін. Бұл қуатты [көру-тілдік] базалық модельдер манипуляция өнімділігін айтарлықтай жақсарта алатынының сенімді дәлелі», – дейді Массачусетс технологиялық институтының профессоры және Toyota зерттеу институтының робототехника бойынша вице-президенті Расс Тедрейк.
Gemini – маңызды қадам болғанымен, әмбебап роботтар кеңінен қолдануға дайын болуы үшін әлі де көп жұмыс атқару қажеттігін Кен Голдберг де мақұлдайды.
Сараптама, зерттеу мақала, күнделікті өзекті ақпаратты «Айқынның» TELEGRAM арнасынан табасыз.