MinerU-HTML — новая система извлечения, повышающая качество данных для AI, достигая 81.8% ROUGE-N F1.
Узнайте о MSRNet — многоуровневой рекурсивной сети для точного обнаружения камуфлированных объектов в сложных условиях.
Исследование устойчивости представлений правды в больших языковых моделях и их способность различать истинное и ложное.
Изучите Upsample Anything — легковесный подход к высокому разрешению без обучения с выдающимися результатами.
EvoVLA — самообучающаяся модель VLA, преодолевающая проблемы долгосрочной манипуляции.
One4D — это платформа для 4D генерации и реконструкции, обеспечивающая высокое качество RGB кадров и точечных карт.
Изучите новый фреймворк ReVeL для оценки мультимодальных языковых моделей через открытые вопросы.
Изучите, как Adv-GRPO улучшает генерацию изображений с помощью награды и противодействия манипуляциям.
FuncBind — новый фреймворк для генерации атомных молекул, использующий нейронные поля и компьютерное зрение.
Изучите SteadyDancer — новую парадигму анимации, обеспечивающую сохранение первого кадра и точный контроль движений.