PUKYONG

ndCF: 메모리 기반 협업 필터링의 다차원 확장

Metadata Downloads
Alternative Title
ndCF: n-dimension expansion for memory-based Collaborative Filtering
Abstract
Collaborative filtering predicts the user's preference for items that have not yet been experienced. It is a system that finds users with a pattern similar to the user's evaluation record and predicts the user's future rating with the value they evaluated the item. Using this, if a system that selects and recommends items with high prediction ratings to users is provided, the user will be satisfied and use them. However, if the predicted rating is not accurate, the user may be dissatisfied with the recommended items, which poses a threat to the service. In order to predict the rating more accurately, users with similar patterns must be found more precisely, and to this end, the method of calculating similarities must be improved.

ndCF, a technique proposed in this paper, proposes a multidimensional similarity calculation method so that memory-based collaborative filtering reflects high-dimensional data. Existing collaborative filtering was calculated based on the user's evaluation records, so attribute-related trends such as group preference for specific attributes could not be reflected in user rating prediction. One item has several types of attributes. One movie has a genre, release year, and cast, and one food has nutrients and ingredients. The user's preference for these attributes is not explicitly revealed in the evaluation record. In this paper, this is defined as a "potential preference". Using the potential preference similarity between users will make the recommendation system more sophisticated. To this end, this paper introduces ndCF including the following four main techniques.


1. When attribute types are continuous, a method of categorizing them into categorical attribute types with order is presented.
2. When there is an order between each attribute type, a convolution application technique is proposed to express the association between the attributes.
3. Evaluate the user's item and link the attribute information of the item to calculate the user's potential preference for each attribute.
4. Combine the user's evaluation-like matrix with a number of latent preference-like matrices.

For performance evaluation, the proposed ndCF was compared with other collaborative filtering methods for MovieLens-100K and MovieLens-1M datasets. ndCF showed higher performance than memory-based collaborative filtering. In addition, the performance improved by 3.2 to 12.5% compared to collaborative filtering using the Pearson correlation coefficient, and the performance improved by about 139% or more compared to collaborative filtering using the Normal PCC.
협업 필터링은 사용자가 아직 경험하지 않은 아이템에 대한 선호를 예측한다. 사용자의 평가 기록과 유사한 패턴을 보이는 사용자들을 찾아 그들이 아이템을 평가한 값으로 사용자의 미래 평점을 예측하는 시스템이다. 이를 이용하여 사용자에게 예측 평점이 높은 아이템들을 선별 추천하는 시스템을 서비스한다면 사용자는 만족하며 이용할 것이다. 하지만 예측된 평점이 정확하지 않다면 사용자는 추천받는 아이템들에 불만을 가질 수 있고, 이는 서비스에 위협이 된다. 평점을 더 정확하게 예측하기 위해서는 유사한 패턴을 보이는 사용자들을 더 정교하게 찾아야 하며, 이를 위해 유사도 산출 방법을 개선하여야 한다.

본 논문에서 제안하는 기법인 ndCF(-dimension expansion for memory-based Collaborative Filtering)는 메모리 기반의 협업 필터링이 고차원의 데이터를 반영하도록 다차원 유사도 산출 방법을 제안한다. 기존의 협업 필터링은 사용자의 평가 기록을 중심으로 계산하기에 특정 속성에 대한 집단 선호도 등 속성 관련 트렌드를 사용자 평점 예측에 반영하지 못하였다. 하나의 아이템은 여러 종류의 속성을 가지고 있다. 한 영화는 장르, 출시연도, 출연배우 등을 가지고, 한 음식은 영양소, 성분 함유량 등을 가진다. 이러한 속성에 대한 사용자의 선호는 평가 기록에 명시적으로 드러나지 않는다. 본 논문에서는 이를 “잠재 선호”라 정의한다. 사용자 간의 잠재 선호 유사도를 이용하면 추천 시스템은 더욱 정교해 질 것이다. 본 논문은 이를 위하여 다음의 4가지 주요 기법을 포함한 ndCF를 소개한다.

① 속성 종류가 연속적일 때, 순서가 있는 범주형 속성 종류로 범주화하는 방법을 제시한다.
② 각 속성 종류 사이에 순서가 있을 때, 속성 사이의 연관성을 표현하기 위해 컨벌루션 적용 기법을 제안한다.
③ 사용자의 아이템에 대한 평가와 아이템의 속성 정보를 연결하여 각 속성들에 대한 사용자의 잠재 선호를 계산한다.
④ 사용자의 평가 유사 행렬과 다수의 잠재 선호 유사 행렬을 결합한다.

성능 평가를 위하여 MovieLens-100K, MovieLens-1M 데이터셋에 대해 다른 협업 필터링 방법들과 제안하는 ndCF를 비교하였다. ndCF는 메모리 기반 협업 필터링에 비해 높은 성능을 보였다. 또한, 피어슨 상관 계수를 이용한 협업 필터링에 비해 3.2~12.5%의 성능 향상을 보였으며, 정규화된 피어슨 상관 계수(Norm PCC)를 이용한 협업 필터링에 비해 약 139% 이상의 성능 향상을 보였다.
Author(s)
김종민
Issued Date
2022
Awarded Date
2022. 2
Type
Dissertation
Keyword
Collaborative Filtering Recommender System 협업필터링 추천시스템
Publisher
부경대학교
URI
https://repository.pknu.ac.kr:8443/handle/2021.oak/24145
http://pknu.dcollection.net/common/orgView/200000607083
Alternative Author(s)
Jongmin Kim
Affiliation
부경대학교 대학원
Department
대학원 IT융합응용공학과
Advisor
송하주
Table Of Contents
1. 서론 1
2. 관련 연구 3
3. 제안하는 기법: ndCF (메모리 기반 협업 필터링의 다차원 확장) 4
3.1. 용어 정리 6
3.2. 전처리: 연속적·순서 있는 속성 종류의 범주화 7
3.2.1. 연속적 속성 종류의 범주화 기법 7
3.2.2. 순서 있는 속성 종류의 컨벌루션 적용 기법 8
3.3. 잠재 선호 추정 기법 10
3.4. 사용자간 잠재 선호 유사도 계산 11
3.5. 사용자간 평가 유사도 계산 12
3.6. 유사도 결합 13
3.7. 평가값 예측 14
4. 성능 평가 15
4.1. 평가 기준 15
4.2. 평가 지표 15
4.3. 데이터셋 16
4.4. 평가 결과 17
5. 결론 22
참고문헌 23
부록 29
Abstract 30
Degree
Master
Appears in Collections:
대학원 > IT융합응용공학과
Authorize & License
  • Authorize공개
Files in This Item:

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.