Изучите Agent0-VL, саморазвивающегося агента для визуально-языкового рассуждения с интеграцией инструментов.
Изучите ReDirector — метод создания видеоперезаписей любой длины с улучшенной локализацией объектов.
UltraViCo решает проблемы экстраполяции в видео трансформерах, улучшая качество и предотвращая повторяемость контента.
Изучите VQ-VA World, новый фреймворк для визуального вопросно-ответного взаимодействия с высококачественными данными.
Изучите мягкую адаптивную оптимизацию политики (SAPO) для улучшения обучения с подкреплением и повышения стабильности больших языковых моделей.
DiffSeg30k — набор данных для обнаружения редактирования AIGC с 30k изображениями и аннотациями на уровне пикселей.
Изучите GigaEvo — открытую платформу для эволюционных вычислений и LLM, позволяющую проводить эксперименты и оценивать сложные задачи оптимизации.
MajutsuCity — новая платформа для создания 3D городов с управляемыми макетами и объектами на основе языка.
SciEducator — первая многоагентная система для понимания научных видео, использующая итеративный подход и создающая мультимодальный образовательный контент.
Изучите Yo’City — платформу для персонализированной генерации 3D-городов с бесконечными возможностями.