
Робофутбол, ИИ и немного ядерной физики: как в России создаются центры разработок гуманоидной техники
с помощью нейросети
В Лаборатории волновых процессов и систем управления МФТИ кипит работа. Раньше здесь занимались ядерной физикой, теперь создают гуманоидных роботов, обучают их точным движениям и командной игре. Во главе направления — предприниматель и конструктор Азер Бабаев. Выпускник МФТИ, он построил успешный бизнес по производству строительного инструмента, а затем вернулся в родной институт инвестировать в молодых инженеров и развивать в России компетенции в области умной робототехники. Созданной им команде Starkit понадобилось всего три года, чтобы завоевать титул чемпионов мира по робофутболу.
В интервью «Истовому инженеру» Азер Бабаев рассказал, почему современные роботы — это прежде всего алгоритмы, смогут ли машины будущего тренировать людей и как советские стройотряды научили его управлять коллективами.
- сколько стоит датчик для автономного робота, имитирующий прикосновение
- каким образом робособака помогла гуманоидам встать на ноги
- зачем роботам-гуманоидам Model Predictive Control
- как китайцы скопировали разработки MIT и обогнали Boston Dynamics
Предпринимательство остается для меня фундаментом, на котором держится все остальное. Но профессорская деятельность в МФТИ — часть моей жизни с 2018 года. А профессором в Абу-Даби я стал недавно. Международные связи важны для того, чтобы наши студенты имели доступ к соревнованиям на мировом уровне. И, конечно, для этого необходимо финансирование.
Я помню по себе, каково это — быть студентом, хотеть развиваться и впитывать новые знания, но при этом быть стесненным в своих возможностях. В конце 1980-х время было непростое, приходилось совмещать учебу и подработку. Желающие подзаработать молодые люди тогда устраивались на лето в стройотряды. Таким образом накапливали средства к существованию на весь учебный год, и это уже считалось неплохо.
После первого курса, конечно, мне давали только неквалифицированную работу: «бери топор, руби деревья» или «бери кувалду, ломай бетон». И сначала мне казалось, что эту-то работу я делаю хорошо. Но на рабочем собрании произошел показательный случай. Все бойцы стройотряда — около 60 человек — оценили, как трудился каждый член команды, и мне поставили очень низкую оценку. А другого парня, на год старше, отметили высоко.
Глядя на этого парня, я многому научился и на второй год поехал уже мастером, на третий — бригадиром. Позже, как у бригадира, у меня сложилось понимание, что нужно сделать, чтобы работа в отряде выполнялась быстрее и эффективнее. Но одним физическим трудом добиться улучшения результатов невозможно — нужно правильно использовать технику. Сегодня эффективность труда человека и качество его жизни зависят от техники намного больше, чем в годы моего студенчества, и не только на стройке. Гуманоидные роботы — очень важный скачок в этом направлении.
Важна не только специальность, но и подход к решению задачи — с какого конца берешься за дело, как проводишь исследование, какие выводы делаешь. Я не жалею, что после окончания МФТИ продолжил научную работу в Институте высоких температур. Мне повезло с научным руководителем: он сделал научное открытие.
Мой руководитель открыл радиационные столкновения: когда две молекулы сталкиваются и в момент столкновения могут поглощать и излучать фотоны. Появились возможности для создания новых лазеров из различных газовых смесей.
Я проводил эксперименты с газами, делал чертежи, измерял спектры. Это чисто экспериментальная работа, но тоже важный урок того, как заниматься любой разработкой.
Период, когда механическое конструирование было главным элементом новаций, уже прошел. За последние десять лет функционал робототехники сильно изменился из-за увеличения скорости обработки информации. Компьютеры стали быстродействующими и при этом компактными — их можно размещать уже не на столе, а внутри самого робота, иногда даже внутри мотора. Миниатюризация привела к появлению множества сенсоров и датчиков, которые раньше были невозможны.
Хотя мы сами занимаемся разработкой механики, например, проектируем сервоприводы для собственных роботов, основные усилия лаборатории сосредоточены на методах обработки информации. Главные наши компетенции не в конструктивной части робототехники, а в алгоритмах для датчиков и контроллеров.

К тому моменту стало очевидно, что гуманоидная робототехника в России не дотягивает до мирового уровня. К примеру, российская команда на чемпионате мира по робофутболу заняла предпоследнее место и больше не участвовала. Я отдавал себе отчет: если «физтеховские мозги» займутся темой, обязательно будет успех. Чтобы способствовать этому, я предложил руководству МФТИ финансирование разработок на базе кампуса. Команда по робофутболу создавалась как структурное подразделение Лаборатории волновых процессов: 20 студентов, я и один преподаватель для организации.
Поступить так было бы большой ошибкой. Если есть возможность, то нужно использовать чужой опыт и за счет этого быстро нагонять других. Мы могли себе такое позволить: я договорился с командой из Франции, пятикратным чемпионом мира. Купил четырех роботов, они передали накопленный опыт и обучили наших студентов. Ребята съездили в Бордо, прошли курс обучения, а руководитель французской команды приезжал к нам в МФТИ.
Это принесло свои плоды, и мы быстро перешли на следующую ступень: начали думать об усовершенствовании приобретенных роботов, сделали множество конструктивных улучшений.

Цель изначально ставилась амбициозная: войти в элиту мировой робототехники и за пять лет стать если не чемпионами, то занять второе место в мире.
На меня тогда смотрели, как на белого слона, но, как показала практика, мы стали чемпионами мира не за пять лет, а за три года.
Это позволило нам получить государственные гранты и организовать штатную лабораторию, где уже не только студенты, но и ученые-профессионалы реализуют проекты государства и внешних спонсоров.

Нога гуманоидного робота обычно включает шесть сервомоторов, которые позволяют задать позицию стопы в трех пространственных координатах и ориентацию стопы в трех углах Эйлера. Классическим способом управления таким механическим узлом долгое время оставалась обратная кинематика: задаем желаемое положение и ориентацию стопы в пространстве, а алгоритм вычисляет, какие углы должны принять приводы. Но это расчет вслепую — процессор не получает обратной связи от реального положения тела, и мы не знаем, стоит робот или уже падает.
Без этой связи непросто, ведь человеческая ходьба требует высочайшей координации. Мы постоянно балансируем на грани падения, перебрасывая вес с одной ноги на другую. Процесс описывается нелинейными дифференциальными уравнениями — строгого аналитического решения не существует.
Но есть и другой метод — управление с предсказанием модели (Model Predictive Control, MPC), когда алгоритм прогнозирует, где окажется центр массы через доли секунды, и заранее рассчитывает, куда нужно шагнуть, чтобы не потерять равновесие. В Boston Dynamics используют MPC еще с 1980-х годов, но такой подход требует серьезной вычислительной мощности и датчиков с высокой частотой отклика — от 1000 до 2000 Гц. Для сравнения: управление в самодельных студенческих роботах работает в десять раз медленнее — на 100 Гц, что почти исключает стабильную динамическую походку.
Прорыв в этой сфере произошел около пяти-шести лет назад, когда инженеры Массачусетского технологического института (MIT) предложили новый способ измерения крутящего момента мотора через ток, проходящий по его обмоткам. Это открыло путь к точному контролю усилий двигателя (принцип torque control) без использования дорогих внешних датчиков.
Метод оказался особенно эффективным при низких редукциях. То есть вместо громоздких редукторов, которые обеспечивают тягу, но гасят обратную связь, инженеры стали использовать более «прямое» соединение мотора с суставом. Это дало роботам чувствительность и реактивность, близкую к мышцам животных.
Данные открыты, MIT опубликовал полный стек разработки: исходные коды, схемы электроники, CAD-модели. Более того, для выпуска опытных партий заказ разместили в Китае, передав документацию местным производителям. Китайцы не только воспроизвели технологию, но и оперативно ее доработали. В итоге китайские компании начали серийно выпускать высокоподвижных робособак, работающих на принципе torque control.
Boston Dynamics, несмотря на свою славу пионера в робототехнике, пришел к этому позже. Первая версия их робота Spot использовала традиционные методы с жесткими редукторами и позиционным управлением.
Сегодняшние китайские модели демонстрируют движения и координацию, которые на момент выхода оригинального Spot казались невозможными — от точных прыжков до адаптивной ходьбы по неровной поверхности.

Технологии, обкатанные на робособаках, теперь внедряются на гуманоидных роботах. Например, компания Unitree, известная своей моделью Go1, выпустила гуманоидного робота H1 — он построен на тех же принципах torque control, что и их четвероногие модели. Но уже набирает силу новый тренд — обучение с подкреплением или Reinforcement Learning: разновидность машинного обучения, где робот учится на собственном опыте, как ребенок, осваивающий новый навык через повторения и обратную связь.
Мы стали первыми в мире, кто применил такую технологию, чтобы научить робособаку ходить на двух ногах. Для эксперимента взяли китайскую Go1, добавили собственные алгоритмы прямохождения и на выставке в Новосибирске представили собаку, уверенно шагающую на своих двоих.
Представитель Unitree снял демонстрацию на видео, отправил коллегам в Китай, и спустя девять месяцев компания выпустила модель Go2 — уже со встроенной функцией хождения на двух ногах, официально заявленной как одна из возможностей платформы.
Этот случай лишний раз подтверждает, что в вопросах оперативной доработки прототипов Китай сегодня не имеет равных. В России, к сожалению, ситуация с этим иная. У китайцев на одного квалифицированного инженера или слесаря высшего разряда приходится сотня исполнителей, готовых быстро довести прототип до серийного продукта.

Сначала создаем цифрового двойника — виртуальную модель робота в симуляторе. Затем многократно прогоняем сценарии: робот совершает случайные движения, а алгоритм оценивает результат. За удачные действия назначается «награда», за ошибки — «штраф». Для этого используются среды вроде Webots, CoppeliaSim или PyBullet. Большой прогресс в этой области произошел с появлением специализированных платформ, оптимизированных под машинное обучение. Это Mujoco от Google и Isaac Gym от Nvidia. Последняя умеет проводить десятки тысяч экспериментов одновременно, используя вычислительную мощность GPU.
Такие параллельные вычисления позволяют ускорить обучение в сотни раз. Но есть нюанс: ради скорости приходится упрощать физику. Поэтому мы применяем стратегию sim-to-sim: сначала обучаем систему в быстром симуляторе, потом проверяем в более точной цифровой среде с достоверной динамикой. И только после этого переносим модель поведения на реального робота. Весь процесс может занять до года.
Нужны процессоры с высокой степенью параллелизма: GPU (графические ускорители), NPU (нейропроцессоры) и TPU (тензорные процессоры). NPU оптимизированы для выполнения нейросетей, а TPU — специально под задачи машинного обучения. Это архитектуры, близкие к тем, что применяются в криптомайнинге.
Важное отличие человека от робота — в объеме сенсорной информации. Например, в человеческой руке множество рецепторов, фиксирующих давление, температуру, вибрации. Воспроизвести такую плотность датчиков в механической конечности пока невозможно: она станет громоздкой и дорогой, а главное — потребуется огромная вычислительная мощность для обработки данных.
Но технологии развиваются: через пару лет цена может упасть до $ 1000, а затем — до сотен долларов. Массовый спрос ускорит этот процесс — и тогда роботы смогут «чувствовать» мир, как мы.
В обозримой перспективе слово «робот» будет вызывать у нас ассоциации не с искусственной собакой или пылесосом, а с человекоподобным домашним помощником. Он сможет вымыть окна, принести продукты, сыграть с вами в футбол и поддержать беседу. Такие роботы заменят узкоспециализированные устройства и станут полноценной частью домашней инфраструктуры.

Еще пять лет назад алгоритмы ходьбы для робота могли написать только профессора с опытом. Сегодня студенты МФТИ сами придумывают и реализуют модели локомоции, и у них действительно получается. Таких ребят сразу берут в команду профессиональных ученых — оформляют на полставки, платят зарплату еще до выпуска. То есть образование становится прикладным и встроенным в реальные проекты. Но хотя талантливых студентов становится все больше, их по-прежнему не хватает. Гуманоидная робототехника развивается стремительно — и крепких специалистов, способных работать в этой области, мы пока можем выращивать только внутри своей команды.
Главное — талант и амбиция. Важно не просто выполнять задачи, а ставить планку выше, идти туда, где еще никто не был. Без этого невозможно двигать границы познания. Но и про качество инженерного образования забывать, конечно, не следует. Современному робототехнику нужно быть одновременно программистом, математиком, инженером-конструктором и технологом. Он должен уметь работать с С++, Python, системой ROS 2, понимать, как устроены среды цифровых двойников. Без уверенного владения кодом и математикой не пройти даже первые уровни практики.
Человек получит помощника. Представьте футбольный матч, в котором на поле вышло только 10 игроков. Где взять остальных? Машины помогут доукомплектовать команды, тренироваться, отрабатывать тактику. А вот в роли судьи я бы точно поставил робота. В футболе чаще всего спорят из-за субъективных решений арбитра. Робот-судья объективен, не поддается давлению, фиксирует нарушения без эмоций и с микросекундной точностью. Это снижает конфликты и делает игру чище.
Что ещё изучить по теме
- Актуальное о команде Starkit
- Открытое ПО для разработки роботов-футболистов
- О деятельности Азера Бабаева на его канале в Rutube
- Интервью Азера Бабаева каналу «Говорит физтех»
- О робофутболе как образовательной платформе для ИИ — материал The robosoccer as a modern educational platform in the field of artificial intelligence // IEEE Proceedings of international conference on artificial intelligence: applications and innovations IC-AIAI-2019. 2019. P. 59−61.