UltraFlux — новый подход к генерации 4K изображений из текста с учетом различных соотношений сторон и улучшенной качественной реконструкцией.
Узнайте о Target-Bench — первом бенчмарке для оценки моделей мира в планировании маршрутов без карт к семантическим целям.
SyncMV4D — новая модель для генерации взаимодействия рук и объектов с синхронизированными многокадровыми видео и 4D движениями.
Изучаем дистилляцию карт потока без использования данных и предлагаем новый подход, обеспечивающий высокое качество и устраняющий риски несоответствия.
Изучите HunyuanVideo 1.5 — мощную модель генерации видео с открытым исходным кодом, обеспечивающую высокое качество и эффективность.
Chain-of-Visual-Thought (COVT) помогает моделям VLMs лучше воспринимать визуальную информацию и принимать решения.
Pillar-0 — новая модель радиологии, показывающая выдающиеся результаты в задачах обработки медицинских изображений.
Изучите MASS, метод для улучшения пространственного и временного понимания в моделях VLM для решения физических задач.
Изучите DR Tulu, первую открытую модель для глубоких исследований, превосходящую существующие системы.
Краткая статья о том, как искусственный интеллект меняет подход к автоматизации в различных отраслях.