Извлечение моносемантических концепций в системах рекомендаций

Введение

В данной статье мы представляем метод извлечения моносемантических нейронов. Эти нейроны определяются как скрытые измерения, которые соответствуют понятным и интерпретируемым концепциям, извлеченным из векторов пользователей и предметов в системах рекомендаций.

Методология

Наш подход использует разреженный автокодировщик (Sparse Autoencoder, SAE), чтобы выявить семантическую структуру внутри предобученных представлений. В отличие от работы с языковыми моделями, моносемантичность в рекомендациях должна сохранять взаимодействия между отдельными векторами пользователей и предметов.

Объект обучения

Для достижения этой цели мы вводим целевую функцию обучения, учитывающую предсказания взаимодействий. Этот подход позволяет нам обратно распространить градиенты через замороженную рекомендательную модель и согласовать изученную латентную структуру с предсказаниями пользовательской и товарной привязанности модели.

Результаты

Полученные нейроны захватывают такие свойства, как жанр, популярность и временные тренды. Это также поддерживает операции управления, такие как целевая фильтрация и продвижение контента, без необходимости изменения базовой модели.

Общие выводы

Наш метод обобщается на различные модели рекомендаций и наборы данных, предоставляя практический инструмент для интерпретируемой и управляемой персонализации.