
«Идеальный робот»: на что способны умные машины и при чем тут виноделие
с помощью нейросети
Как сделать из робота полезного и безопасного партнера человека в реальной жизни? Вопрос непростой, ведь пока даже самые продвинутые версии автономных машин нуждаются в контроле, а роботы-гуманоиды только приближаются к уровню моторики ребенка. «Повзрослеть» им помогли бы передовые сенсорные системы и нейросети, но первые еще очень дороги, а для вторых нет масштабных датасетов, отражающих физическое взаимодействие человека с окружающим миром.
В Центре робототехники Сбера эти вызовы рассматривают как точки роста для нишевых технологических решений. Созданный в его стенах робот-сомелье уже три года обслуживает гостей в люксовой гостинице на черноморском курорте, а система автоматизированной логистики Sber Shuttle проходит обкатку на складах российских компаний. О том, как устроены эти проекты, и что, помимо дефицита больших данных, мешает наступлению эры универсальных роботов, — в интервью «Истовому инженеру» рассказал исполнительный директор Центра робототехники Сбера и руководитель направления манипуляции и LLM Алексей Постников.
- как кобот подбирает вино
- какие мифы связаны с ИИ и роботами-гуманоидами
- чем занят искусственный интеллект на виноградниках
- какое качество сегодня важнейшее для инженера-управленца
У нас конкретная цель — создавать роботизированные системы, которые могут приносить реальную пользу уже сегодня. Мы занимаемся разными проектами, но практически все они прикладные. Исследовательские направления тоже есть, но и они сосредоточены на конкретных практических задачах. Прежде всего — на преодолении существующих инженерных ограничений, особенно в части взаимодействия с физической средой.
Команда в Центре робототехники накопила большой опыт работы с различными устройствами: от промышленных манипуляторов до мобильных платформ и летающих аппаратов. И хотя экосистема «Сбера» остается ключевым заказчиком наших разработок, мы многое делаем и для стороннего бизнеса. Это принципиальная установка — не превращаться во внутреннюю лабораторию, а быть инженерным хабом с открытым контуром. Не обо всех разработках я могу говорить публично, но некоторые наши решения уже реализованы и успешно применяются.
В том числе. Еще можно назвать робота-дезинфектора, робота-художника или, скажем, роботизированный участок пересчета. Все они из разных сфер: от услуг до автоматизации бизнес-процессов. Разные платформы, разная механика, но их объединяет одна общая черта — прикладной характер. При этом мы не изобретаем заново велосипед.
Основная задача — сделать так, чтобы робот не просто удивлял, но и приносил конкретную пользу.

Робот-сомелье, например, уже три года обслуживает гостей ялтинского курорта «Мрия». Это проект на стыке гастрономии, высоких технологий и дизайна. Мы делали его совместно с Владимиром Пирожковым — лучшим дизайнером, с которым я когда-либо работал. Вместе мы хотели создать роботизированную систему, которая физически взаимодействует с клиентом и соответствует требованиям профессии сомелье — от подачи бокала до точной дозировки напитка.

Это высокотехнологичная барная стойка с перемещающейся вдоль нее роборукой и интеллектуальной системой выбора вина. Посетитель садится за стойку, задает параметры: настроение, вкусы, еда. Робот это анализирует и предлагает вариант. Мы работали с сомелье, которые помогли нам формализовать методику винного подбора. На ее основе мы затем построили собственную рекомендательную платформу.
Для наших задач подошла коллаборативная рука от корейской компании Doosna Robotics. Но ее приобретение — это только фундамент. Нам потребовалось разработать специализированные захватные устройства, чтобы робот мог элементарно взять бокал, бутылку, открыть ее, не разбив при этом и не пролив.
Эти кажущиеся человеку тривиальными манипуляции для современного робота все еще сложные операции. Чтобы робот выполнял их четко и безопасно в близком присутствии человека, следует учесть множество факторов.

Можно было бы использовать в данном случае компьютерное зрение, но мы пошли более надежным путем. В столешницу встроены цифровые весы, подключенные к общей системе управления. Робот ставит бокал на весы и получает в реальном времени данные об объеме вина в бокале. Вместе с этим работает предсказательная модель, которая учитывает, с какой скоростью происходит налив. Это зависит и от положения бутылки, и от ее наполненности, и от скорости движения манипулятора. А его движения инерционны, что важно учитывать.
Это хороший вопрос, потому что он затрагивает более широкую тему мифов о современной робототехнике и иллюзий, что ИИ-решения теперь оправданы всегда и везде. Но реалии таковы, что в повседневной жизни человек редко сталкивается с роботами. А те, что уже работают в реальной среде, в большинстве случаев — относительно простые автоматы, не обладающие полноценным восприятием среды. Они ничего не знают о мире вокруг и никак на него не реагируют.
Да, нейросети научились отличать кошек от собак, но когда дело доходит до взаимодействия с реальностью, возникает бесконечное число пограничных случаев, с которыми ИИ пока не справляется. Свет упал под другим углом — в бокале отблеск. И система начинает ошибаться. Это либо перелив, либо недолив. Для достижения надежности ИИ-решений, соответствующей нашим ожиданиям от высоких технологий, в этой сфере еще многое предстоит сделать.
Это большая тема. Илон Маск и другие звезды из мира высоких технологий обещают нам уже в ближайший год универсальных домашних роботов. Я оптимист в робототехнике, но реалист в оценке сроков, и уверен: в течение года не появится робот, который сможет полноценно заменить человека. Прогресс идет, но проблем еще очень много.

Все крупные компании сейчас делают ставку на мобильность. Наличие у робота колес или ног, возможность манипуляции, автономная навигация — в отличие от универсальных гуманоидов, все это уже применимо и масштабируемо. Если на базе этого появится работающий универсальный продукт, то он, действительно, изменит мир. Но пока автономные роботы справляются лишь с ограниченным кругом задач.
Много нерешенных задач. И хорошая сенсорика не менее важна, чем алгоритмы. У человека тактильная кожа: мы чувствуем место, силу, направление, температуру контакта. Такого покрытия у роботов нет. Нужен материал-сенсор, покрывающий всю кисть или вообще единый сенсорный материал. Человек — идеальный биологический робот, и разработчики стараются его копировать. Но сенсорика и силомоментное чувствование остаются слабым звеном.
Следующий важный барьер — отсутствие больших данных о поведении в физическом мире. Другой — качество манипуляций. Существуют исследования, в которых развитие роботов-гуманоидов сопоставляется с формированием моторики у детей. По разным оценкам, современные системы находятся примерно на уровне ребенка одного-двух лет. Это не метафора, а вполне объективное приближение по функциональным возможностям. До условного «совершеннолетия» таким системам еще очень далеко.
С этим сейчас нет проблем. Есть энергоэффективные вычислители от Nvidia, которые, скорее всего, стоят в тех же Optimus от Tesla.
Sber AI — отдельная структура, которая в первую очередь занимается цифровым искусственным интеллектом. Мы работаем с коллегами по ряду проектов, но наш фокус — реализация решений в робототехнике. Если упростить: Sber AI отвечает за алгоритмы, а мы — за «воплощенный» интеллект, который управляет физическим роботом. У нас есть синергия: мы используем разработки коллег, адаптируем их под задачи робототехники, а в ряде случаев создаем собственные модули.
Также у нас плотное сотрудничество с AIRI — исследовательским институтом, занимающимся фундаментальной наукой в области ИИ. Мы и с ними разрабатываем решения, которые затем применяем в реальных роботах.
Примерно так. Но мы и сами проводим исследования в области ИИ, если видим зазор, которым никто из партнеров не занимается. В таких случаях разрабатываем собственные решения.
К примеру, робот-художник. Это скорее имиджевая история, но она показывает, как связка генеративных моделей и робототехники работает в реальности. Человек вводит текстовый запрос, робот отправляет его в Kandinsky — модель Sber AI для генерации изображений. Затем картинка обрабатывается и превращается в алгоритмы, векторы, понятные роботу. Он производит ее маркером на доске или кистью на холсте.
Для такой задачи антропоморфность не нужна. Необходим манипулятор с захватом. Но ключевое здесь то, что он переводит изображение из пикселей в движения. Мы разработали несколько способов такой трансформации, чтобы робот мог физически воспроизвести результат Kandinsky.
Это один из ключевых примеров нашей работы, потому что он связан с логистикой, переживающей сейчас интенсивную роботизацию по всему миру. Многие в этом плане равняются на Amazon, и у нас задача была похожая — создать российское решение для автоматизации перемещений на складах. Специфика в том, что в наши дни логистические центры многоуровневые и могут охватывать территорию в тысячи квадратных метров. Мы разработали колесных роботов, которые способны функционировать в таких условиях. Система уже на этапе пилотного тестирования.
Все, кроме электродвигателей, разработано внутри Центра — от компоновки, механики и электроники до логики управления и планирования маршрутов. И верхнеуровневая система управления флотом роботов — тоже наша разработка. Ее логика похожа на Amazon, но их решений мы не применяем, делаем сами с нуля.
Этим проектом мы занимаемся совместно со Sber AI, так как для него как раз нужна система компьютерного зрения. Ровер перемещается между рядами, анализирует состояние растений, выявляет болезни или проблемы роста. Это отдельное направление применения наших технологий в сельском хозяйстве.

Я окончил МГТУ им. Баумана, где изучал системы управления и «железо» — классическое инженерное образование с упором на практику. Затем поступил в магистратуру в «Сколтех», уже с фокусом на современные технологии и искусственный интеллект. Там же защитил PhD в области компьютерных наук и робототехники. Почти сразу после окончания магистратуры пришел в Центр робототехники, где работаю уже около восьми лет. Начинал как инженер-исследователь, развивал технические навыки, накапливал опыт и понимание задач. Со временем уровень доверия со стороны руководства рос, и мне доверили руководство сначала одной, а затем и несколькими командами.
Умение работать в команде, доносить до других свои мысли, слушать и слышать — все это критично. Также важно чувствовать себя комфортно в коллективе. В остальном нельзя выделить одну «магическую» компетенцию. Человек всегда представляет собой совокупность разных навыков, и чем шире они развиты, тем лучше. Все зависит от целей: хочешь идти вглубь технической экспертизы — развивай одни качества, стремишься к управлению — другие. Главное — понимать, чего хочешь на самом деле, и ставить реалистичные цели.
Важнейшее качества для инженера-управленца — умение интегрировать технологии в жизнь. Быстро оценивать, что из нового имеет практическую ценность, и применять это.
Сейчас технологии развиваются стремительно, и выигрывает тот, кто умеет быстро адаптироваться и извлекать пользу из новых инструментов. Возможно, через десять лет роботы действительно будут делать все за нас, но способность к быстрой адаптации и в этом случае пригодится.
Прогнозы в робототехнике — дело неблагодарное. Но все упирается в доступность данных. Языковые модели обучаются на терабайтах текстов — такого объема достаточно, чтобы достигать существенных результатов. А вот с данными о физическом взаимодействии с миром все гораздо сложнее.
Даже при наличии хороших алгоритмов это становится серьезным ограничением: попросту не хватает материала, на котором их можно было бы полноценно обучить.
Универсальность и адаптивность человека вне конкуренции еще надолго. Мы уже научились получать пользу от роботов, и с каждым годом их вклад становится более заметным. Но до уровня взрослого человека — особенно в тонкой сенсорике и сложной моторике — путь еще весьма далек. Это не повод сбавлять темп, но и не стоит обольщаться.