Personalization Engine Design

본 문서는 Newsfork 뉴스 개인화 엔진의 설계 원칙, 데이터 흐름, 그리고 Redis 기반 캐시 전략을 정의합니다.

1. 개요

개인화 엔진은 사용자 클릭(click) 및 체류 시간(dwell time) 신호를 수집하여 관심사 벡터를 추정하고, 이를 기반으로 뉴스 피드의 순위를 조정합니다.

신호	설명	가중치 반영
클릭	기사 클릭 여부	클릭 시 해당 주제/엔티티 가중치 증가
체류 시간	기사 페이지 체류 시간(초)	임계값 초과 시 긍정 신호로 가중치 반영

클릭: 해당 기사의 카테고리/태그/엔티티에 대해 가중치를 일정 비율만큼 증가시킵니다.
체류 시간: 설정된 임계값(예: 30초) 이상일 경우, 클릭과 동일한 방향으로 가중치를 갱신합니다. 짧은 체류는 무시하거나 감쇠 적용합니다.
디케이(Decay): 시간이 지남에 따라 관심사 가중치를 주기적으로 감쇠시켜 최신 행동이 더 큰 영향을 갖도록 합니다.

아래 Mermaid 다이어그램은 개인화 엔진의 데이터 흐름을 나타냅니다.

이 설계는 초안(draft)이며, 구현 시 버전 1.0.0 기준으로 변경 이력을 유지합니다.