Неочевидное, но вероятное: в Сколтехе создают цифрового двойника Сергея Капицы
Автор и бессменный ведущий телепередачи «Очевидное — невероятное» объяснял широкой аудитории самые сложные научные проблемы. Сможет ли это его цифровой двойник? Скоро узнаем. В Сколковском институте науки и технологий (Сколтех) стартовал проект Kapitsa.AI. Подробностями с «СР» поделился его научный руководитель — директор Центра прикладного искусственного интеллекта Евгений Бурнаев.
Досье
Сергей Капица родился 14 февраля 1928 года в Кембридже в семье будущего академика и лауреата Нобелевской премии по физике Петра Капицы.
Доктор физико-математических наук, профессор Сергей Капица — автор многочисленных научных работ в области аэродинамики, ускорителей, ядерной физики, демографии и проч. На протяжении почти 40 лет вел авторскую программу «Очевидное — невероятное», основал научно-популярный журнал «В мире науки» и вплоть до смерти был его главным редактором.
Скончался ученый 14 августа 2012 года, похоронен на Новодевичьем кладбище в Москве.
Идея
Суть проекта — наглядно показать, как устроен искусственный интеллект (ИИ) и приложения на его основе. Продемонстрируют это в ходе создания дипфейка, а затем и 3D-модели Сергея Капицы.
«Наше производство — это не завод, на который можно прийти с экскурсией, — говорит Евгений Бурнаев. — Мы не можем показать «станок», но можем продемонстрировать этапы работы и результат. Поэтому мы решили вести в соцсетях лабораторный журнал, с дотошностью режиссера-документалиста фиксировать все тонкости рождения ИИ-продукта. И если все получится, в финале мы установим в Сколтехе инсталляцию с двойником Сергея Петровича Капицы, с которым будут общаться наши студенты, сотрудники и гости.
Почему Капица? Во-первых, его знают многие, во-вторых, семья с интересом согласилась на наше предложение. Как сказала Мария Капица, дочь Сергея Петровича: «Отцу бы понравилась такая авантюра».
Команда
Разработкой аватара занимаются специалисты Центра прикладного искусственного интеллекта Сколтеха, Института искусственного интеллекта Самарского университета им. Королева и Института искусственного интеллекта AIRI.
Цифровой аватар совместит множество ИИ-решений: одни будут генерировать изображение, другие — синтезировать речь, третьи — имитировать эмоции, пластику, тембр и интонации, четвертые — подобно дирижеру, координировать эти технологии.
«Несмотря на то что все технологии известны, они требуют настройки под конкретный образ. Нам нужно перебрать множество алгоритмов и их сочетаний, чтобы вывести идеальную формулу», — поясняет Евгений Бурнаев. База данных.
Сейчас участники проекта сосредоточены на сборе мультимедиа — записей телеи радиопередач с участием Сергея Капицы. Сложность в том, что в течение жизни облик и голос человека меняются, поэтому материалы должны быть примерно одного периода.
По пожеланию Марии Капицы разработчики фокусируются на конце 1980-х. Кроме того, качество картинки и звука должно быть высоким, изображения — анфас и профиль, и как можно больше эмоций, иначе аватар не будет выглядеть живым.
Помимо видеоконтента в нейросеть загрузят текстовый: воспоминания ученого, интервью и выступления — чтобы как можно точнее имитировать стиль его речи и общения. Кстати, просматривая выпуски «Очевидного — невероятного», разработчики наткнулись на программу 1979 года о распознавании образов. Сергей Капица точно чувствовал горизонты развития технологий.
Тренировка
Дальше данные загрузят в алгоритм, который сгенерирует аватара. Но это будет не финальный вариант, а цифровой «полуфабрикат», который потребует тщательной доработки.
«Одна из самых трудоемких операций — подгон анимации губ под проговариваемый текст, — отмечает Евгений Бурнаев. — Если анимация некачественная, не будет ощущения разговора с живым собеседником».
Еще понадобится выбрать языковую модель. Их хватает — и зарубежных, и отечественных, например нейросеть GigaChat «Сбера» или YandexGPT «Яндекса». У каждой свои недостатки.
«Разрабатывать языковую модель с нуля слишком долго, мы возьмем готовую и дообучим на текстах Сергея Капицы, чтобы модель знала факты о нем и отвечала в его манере», — говорит Евгений Бурнаев.
Результат
Евгений Бурнаев надеется, что аватар будет превосходным.
«Но главное в нашей работе — показать широкой аудитории весь цифровой процесс, со всеми трудностями и изъянами, — подчеркивает он. — Это первое. Второе — мы создаем осязаемый объект, на примере которого можно наглядно объяснять, что такое современные технологии. Да и нам самим интересно объективно оценить возможности этого класса приложений. В-третьих, это будет полезный «тестовый стенд» для образовательных целей: можно показывать студентам, как устроены разные технологии, и отрабатывать навыки использования разных ИИ-решений и их комбинаций. Но, конечно, важно понимать, что аватар не может выдать новых знаний. Я лично планирую просто поболтать с ним на отвлеченные темы, чтобы протестировать разумность ответов на общие вопросы».
Проект получил грант Министерства науки и высшего образования РФ.