Введение
В данной статье мы представляем метод извлечения моносемантических нейронов. Эти нейроны определяются как скрытые измерения, которые соответствуют понятным и интерпретируемым концепциям, извлеченным из векторов пользователей и предметов в системах рекомендаций.
Методология
Наш подход использует разреженный автокодировщик (Sparse Autoencoder, SAE), чтобы выявить семантическую структуру внутри предобученных представлений. В отличие от работы с языковыми моделями, моносемантичность в рекомендациях должна сохранять взаимодействия между отдельными векторами пользователей и предметов.
Объект обучения
Для достижения этой цели мы вводим целевую функцию обучения, учитывающую предсказания взаимодействий. Этот подход позволяет нам обратно распространить градиенты через замороженную рекомендательную модель и согласовать изученную латентную структуру с предсказаниями пользовательской и товарной привязанности модели.
Результаты
Полученные нейроны захватывают такие свойства, как жанр, популярность и временные тренды. Это также поддерживает операции управления, такие как целевая фильтрация и продвижение контента, без необходимости изменения базовой модели.
Общие выводы
Наш метод обобщается на различные модели рекомендаций и наборы данных, предоставляя практический инструмент для интерпретируемой и управляемой персонализации.