OmniAlpha — унифицированная модель для генерации и редактирования RGBA-изображений, превосходящая специализированные подходы.
SSA (Sparse Sparse Attention) улучшает обработку длинных контекстов в языковых моделях, обеспечивая эффективное выравнивание спарсного и полного внимания.
Исследуем когнитивные элементы, влияющие на рассуждения LLMs, и анализируем их эффективность.
Исследуем, как большие языковые модели прогнозируют события в зависимости от формулировки запроса и контекста.
Изучите ORS3D, новую задачу для агентов ИИ, и набор данных ORS3D-60K.
Изучите MagicWorld — интерактивную модель видео мира с 3D геометрией и историческим извлечением.
Мы представляем DPP-GRPO для улучшения разнообразия видео в ответ на текстовые запросы.
Узнайте, как концепто-ориентированная выборка улучшает предобучение языковых моделей на визуальных данных.
Изучите инновационные методы оценки 3D-траектории и вращения мяча в настольном теннисе с использованием современных технологий.
Изучите STARFlow-V — генератор видео на основе нормализующих потоков с улучшенной согласованностью и эффективностью.