简单易学的机器学习算法——协同过滤推荐算法(2)

简单易学的机器学习算法——协同过滤推荐算法(2)

一、基于协同过滤的推荐系统      协同过滤(Collaborative Filtering)的推荐系统的原理是通过将用户和其他用户的数据进行比对来实现推荐的。比对的具体方法就是通过计算两个用户数据之间的相似性,通过相似性的计算来说明两个用户数据之间的相似程度。相似度函数的设计必须满足度量空间的三点要求,即非负性,对称性和三角不等性。常用的相似度的计算方法有:欧式距离法、皮尔逊相关系数法和夹角余弦相似度法。具体的可以参见上一篇文章“ ”。

二、面临的问题      在基本的协同过滤的推荐系统中(主要指上面所提到的基本模型中),我们是在整个空间上计算相似度,进而实现推荐的。但是现实中的数据往往并不是那么规整,普遍的现象就是在用户数据中出现很多未评分项,如下面所示的数据:

www.zeeklog.com  - 简单易学的机器学习算法——协同过滤推荐算法(2)


   对于这样的稀疏矩阵,我们利用基本的协同过滤推荐算法的效率必将很低。对于这样的稀疏矩阵,我们可以利用SVD对其进行降维,将这样的稀疏矩阵映射到另一个具体的主题空间,SVD降维的原理可以参见博文“”。

三、利用SVD构造主题空间      我们对上面所示的这样一个矩阵进行SVD分解,分解的结果为:

1、U矩阵

www.zeeklog.com  - 简单易学的机器学习算法——协同过滤推荐算法(2)


   (U矩阵, 矩阵U主要反应的是用户信息)

2、对角阵S

www.zeeklog.com  - 简单易学的机器学习算法——协同过滤推荐算法(2)


   (S矩阵,矩阵S主要反映的是11个奇异值)

3、VT矩阵

www.zeeklog.com  - 简单易学的机器学习算法——协同过滤推荐算法(2)


   (VT矩阵,矩阵VT主要反映的是物品信息)

4、选取奇异值并映射主题空间     奇异值分解公式为:

www.zeeklog.com  - 简单易学的机器学习算法——协同过滤推荐算法(2)

,现在我们要将原始数据映射到反映物品的相互关系中。选取前5个奇异值,奇异值的选取符合能量的规则,选择出来的奇异值的能量要能反映90%的原始信息。这样新的主题空间的计算方式为:

www.zeeklog.com  - 简单易学的机器学习算法——协同过滤推荐算法(2)


   即可得新的主题空间:

www.zeeklog.com  - 简单易学的机器学习算法——协同过滤推荐算法(2)


四、实验的仿真      我们在这样的数据集上做推荐计算。其中user为2号用户。

www.zeeklog.com  - 简单易学的机器学习算法——协同过滤推荐算法(2)


   (相似度的计算)  

www.zeeklog.com  - 简单易学的机器学习算法——协同过滤推荐算法(2)


   (推荐结果)   MATLAB代码   主程序

%% 主函数

% 导入数据
%data = [4,4,0,2,2;4,0,0,3,3;4,0,0,1,1;1,1,1,2,0;2,2,2,0,0;1,1,1,0,0;5,5,5,0,0];
data = [2,0,0,4,4,0,0,0,0,0,0;0,0,0,0,0,0,0,0,0,0,5;0,0,0,0,0,0,0,1,0,4,0;3,3,4,0,3,0,0,2,2,0,0;5,5,5,0,0,0,0,0,0,0,0;
    0,0,0,0,0,0,5,0,0,5,0;4,0,4,0,0,0,0,0,0,0,5;0,0,0,0,0,4,0,0,0,0,4;0,0,0,0,0,0,5,0,0,5,0;0,0,0,3,0,0,0,0,4,5,0;
    1,1,2,1,1,2,1,0,4,5,0];

% reccomendation
%[sortScore, sortIndex] = recommend(data, 3, 'cosSim');
[sortScore, sortIndex] = recommend(data, 2, 'cosSim');

len = size(sortScore);

finalRec = [sortIndex, sortScore];
disp(finalRec);


SVD空间映射的函数

function [ score ] = SVDEvaluate( data, user, simMeas, item )
    [m,n] = size(data);
    simTotal = 0;
    ratSimTotal = 0;
    
    % 奇异值分解
    [U S V] = svd(data);
    % 求使得保留90%能量的奇异值
    sizeN = 0;%记录维数
    [m_1,n_1] = size(S);
    a = 0;%求总能量
    for i = 1:m_1
        a = a + S(i,i)*S(i,i);
    end
    b = a*0.9;%能量的90%
    c = 0;
    for i = 1:n_1
        c = c + S(i,i)*S(i,i);
        if c >= b
            sizeN = i;
            break;
        end
    end
    
    %物品降维后的空间
    itemTransformed = data' * U(:,1:sizeN) * S(1:sizeN,1:sizeN)^(-1);
    
    for j = 1:n
        userRating = data(user, j);%此用户评价的商品
        
        if userRating == 0 || j == item%只是找到已评分的商品
            continue;
        end
        
        vectorA = itemTransformed(item,:);
        vectorB = itemTransformed(j,:);
        switch simMeas
           case {'cosSim'}
               similarity = cosSim(vectorA,vectorB);
           case {'ecludSim'}
               similarity = ecludSim(vectorA,vectorB);
           case {'pearsSim'}
               similarity = pearsSim(vectorA,vectorB);
        end
        
        disp(['the ', num2str(item), ' and ', num2str(j), ' similarity is ', num2str(similarity)]);
        simTotal = simTotal + similarity;
        ratSimTotal = ratSimTotal + similarity * userRating;
    end
    if simTotal == 0
        score = 0;
    else
        score = ratSimTotal./simTotal;
    end
end


推荐的函数

function [ sortScore, sortIndex ] = recommend( data, user, simMeas )
    % 获取data的大小
    [m, n] = size(data);%m为用户,n为商品
    if user > m
        disp('The user is not in the dataBase');
    end
    
    % 寻找用户user未评分的商品
    unratedItem = zeros(1,n);
    numOfUnrated = 0;
    for j = 1:n
        if data(user, j) == 0
            unratedItem(1,j) = 1;%0表示已经评分,1表示未评分
            numOfUnrated = numOfUnrated + 1;
        end
    end
    
    if numOfUnrated == 0
        disp('the user has rated all items');
    end
    
    % 对未评分项打分,已达到推荐的作用
    itemScore = zeros(numOfUnrated,2);
    r = 0;
    for j = 1:n
        if unratedItem(1,j) == 1%找到未评分项
            r = r + 1;
            %score = evaluate(data, user, simMeas, j);
            score = SVDEvaluate(data, user, simMeas, j);
            itemScore(r,1) = j;
            itemScore(r,2) = score;
        end
    end
    %排序,按照分数的高低进行推荐
    [sortScore, sortIndex_1] = sort(itemScore(:,2),'descend');
    [numOfIndex,x] = size(sortIndex_1(:,1));
    sortIndex = zeros(numOfIndex,1);
    for m = 1:numOfIndex
        sortIndex(m,:) = itemScore(sortIndex_1(m,:),1);
    end
end


相似度的计算与博文 “   ”一致。

Read more

深入理解 Proxy 和 Object.defineProperty

在JavaScript中,对象是一种核心的数据结构,而对对象的操作也是开发中经常遇到的任务。在这个过程中,我们经常会使用到两个重要的特性:Proxy和Object.defineProperty。这两者都允许我们在对象上进行拦截和自定义操作,但它们在实现方式、应用场景和灵活性等方面存在一些显著的区别。本文将深入比较Proxy和Object.defineProperty,包括它们的基本概念、使用示例以及适用场景,以帮助读者更好地理解和运用这两个特性。 1. Object.defineProperty 1.1 基本概念 Object.defineProperty 是 ECMAScript 5 引入的一个方法,用于直接在对象上定义新属性或修改已有属性。它的基本语法如下: javascript 代码解读复制代码Object.defineProperty(obj, prop, descriptor); 其中,obj是目标对象,prop是要定义或修改的属性名,descriptor是一个描述符对象,用于定义属性的特性。 1.2 使用示例 javascript 代码解读复制代码//

By Ne0inhk

Proxy 和 Object.defineProperty 的区别

Proxy 和 Object.defineProperty 是 JavaScript 中两个不同的特性,它们的作用也不完全相同。 Object.defineProperty 允许你在一个对象上定义一个新属性或者修改一个已有属性。通过这个方法你可以精确地定义属性的特征,比如它是否可写、可枚举、可配置等。该方法的使用场景通常是需要在一个对象上创建一个属性,然后控制这个属性的行为。 Proxy 也可以用来代理一个对象,但是相比于 Object.defineProperty,它提供了更加强大的功能。使用 Proxy 可以截获并重定义对象的基本操作,比如访问属性、赋值、函数调用等等。在这些操作被执行之前,可以通过拦截器函数对这些操作进行拦截和修改。因此,通过 Proxy,你可以完全重写一个对象的默认行为。该方法的使用场景通常是需要对一个对象的行为进行定制化,或者需要在对象上添加额外的功能。 对比 以下是 Proxy 和 Object.defineProperty 的一些区别对比: 方面ProxyObject.defineProperty语法使用 new Proxy(target,

By Ne0inhk