Автор: Редакция AI in Business

Без рубрики

OmniAlpha: Унифицированная модель для генерации RGBA-изображений

OmniAlpha — унифицированная модель для генерации и редактирования RGBA-изображений, превосходящая специализированные подходы.

Без рубрики

SSA: Спарсное внимание для обработки длинных контекстов

автор: Редакция AI in Business

SSA (Sparse Sparse Attention) улучшает обработку длинных контекстов в языковых моделях, обеспечивая эффективное выравнивание спарсного и полного внимания.

Без рубрики

Когнитивные основы рассуждений и их проявление в LLMs

автор: Редакция AI in Business

Исследуем когнитивные элементы, влияющие на рассуждения LLMs, и анализируем их эффективность.

Без рубрики

Будущее распределено неравномерно: как LLM предсказывают события

автор: Редакция AI in Business

Исследуем, как большие языковые модели прогнозируют события в зависимости от формулировки запроса и контекста.

Без рубрики

Разнообразная генерация видео с помощью DPP и GRPO

автор: Редакция AI in Business

Мы представляем DPP-GRPO для улучшения разнообразия видео в ответ на текстовые запросы.

Без рубрики

MagicWorld: Интерактивное исследование видео миров

автор: Редакция AI in Business

Изучите MagicWorld — интерактивную модель видео мира с 3D геометрией и историческим извлечением.

Без рубрики

Совместная готовка и уборка: обучение агентов для выполнения задач

автор: Редакция AI in Business

Изучите ORS3D, новую задачу для агентов ИИ, и набор данных ORS3D-60K.

Без рубрики

Инновации в настольном теннисе: оценка траектории и вращения

автор: Редакция AI in Business

Изучите инновационные методы оценки 3D-траектории и вращения мяча в настольном теннисе с использованием современных технологий.

Без рубрики

Улучшение предобучения языковых моделей с помощью выборки

автор: Редакция AI in Business

Узнайте, как концепто-ориентированная выборка улучшает предобучение языковых моделей на визуальных данных.

Без рубрики

STARFlow-V: Генерация видео с помощью нормализующих потоков

автор: Редакция AI in Business

Изучите STARFlow-V — генератор видео на основе нормализующих потоков с улучшенной согласованностью и эффективностью.