Step-Audio-R1 – новая модель, способная к аудио-рассуждениям, показывает превосходные результаты в понимании звуков.
Изучите, как Thinking-while-Generating улучшает визуальную генерацию через текстовое рассуждение.
Научитесь о NaTex — новом подходе к генерации текстур с использованием латентной диффузии цвета и управления геометрией в 3D-пространстве.
Исследуем масштабирование многомодальных моделей для развития пространственного интеллекта и их достижения в тестах.
ТуркКолБЕРТ: оценка плотных и поздних моделей для поиска информации на турецком языке.
Узнайте о SRPO – новой рамочной структуре для моделей VLA, преодолевающей ограничения с помощью самоссылок.
Узнайте, как модели Draft and Refine используют визуальные эксперты для улучшения мультимодального рассуждения.
BioBench — открытый бенчмарк для экологии, который улучшает оценку моделей в сравнении с ImageNet.
Метод EntroPIC обеспечивает стабильное долгосрочное обучение LLM, контролируя энтропию для оптимизации исследовательского процесса.
Исследуйте FinTRec — эффективный фреймворк на основе трансформеров для рекламы в финансовых услугах.