简单易学的机器学习算法——岭回归(Ridge Regression)

简单易学的机器学习算法——岭回归(Ridge Regression)

一、一般线性回归遇到的问题

在处理复杂的数据的回归问题时,普通的线性回归会遇到一些问题,主要表现在:

  • 预测精度:这里要处理好这样一对为题,即样本的数量
www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)

和特征的数量

www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)
www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)

时,最小二乘回归会有较小的方差

www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)

时,容易产生过拟合

www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)

时,最小二乘回归得不到有意义的结果

  • 模型的解释能力:如果模型中的特征之间有相互关系,这样会增加模型的复杂程度,并且对整个模型的解释能力并没有提高,这时,我们就要进行特征选择。

以上的这些问题,主要就是表现在模型的方差和偏差问题上,这样的关系可以通过下图说明:

www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)


(摘自:机器学习实战)

方差指的是模型之间的差异,而偏差指的是模型预测值和数据之间的差异。我们需要找到方差和偏差的折中。

二、岭回归的概念

在进行特征选择时,一般有三种方式:

  • 子集选择
  • 收缩方式(Shrinkage method),又称为正则化(Regularization)。主要包括岭回归个lasso回归。
  • 维数缩减     岭回归(Ridge Regression)是在平方误差的基础上增加正则项
www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)

,

www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)


通过确定

www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)

的值可以使得在方差和偏差之间达到平衡:随着

www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)

的增大,模型方差减小而偏差增大。

www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)

求导,结果为

www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)


令其为0,可求得

www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)

的值:

www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)


三、实验的过程

我们去探讨一下取不同的

www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)

对整个模型的影响。

www.zeeklog.com  - 简单易学的机器学习算法——岭回归(Ridge Regression)


MATLAB代码

主函数

%% 岭回归(Ridge Regression)

%导入数据
data = load('abalone.txt');
[m,n] = size(data);

dataX = data(:,1:8);%特征
dataY = data(:,9);%标签

%标准化
yMeans = mean(dataY);
for i = 1:m
    yMat(i,:) = dataY(i,:)-yMeans;
end

xMeans = mean(dataX);
xVars = var(dataX);
for i = 1:m
    xMat(i,:) = (dataX(i,:) - xMeans)./xVars;
end

% 运算30次
testNum = 30;
weights = zeros(testNum, n-1);
for i = 1:testNum
    w = ridgeRegression(xMat, yMat, exp(i-10));
    weights(i,:) = w';
end

% 画出随着参数lam
hold on
axis([-9 20 -1.0 2.5]);
xlabel log(lam);
ylabel weights;
for i = 1:n-1
    x = -9:20;
    y(1,:) = weights(:,i)';
    plot(x,y);
end


岭回归求回归系数的函数

function [ w ] = ridgeRegression( x, y, lam )
    xTx = x'*x;
    [m,n] = size(xTx);
    temp = xTx + eye(m,n)*lam;
    if det(temp) == 0
        disp('This matrix is singular, cannot do inverse');
    end
    w = temp^(-1)*x'*y;
end

Read more

深入理解 Proxy 和 Object.defineProperty

在JavaScript中,对象是一种核心的数据结构,而对对象的操作也是开发中经常遇到的任务。在这个过程中,我们经常会使用到两个重要的特性:Proxy和Object.defineProperty。这两者都允许我们在对象上进行拦截和自定义操作,但它们在实现方式、应用场景和灵活性等方面存在一些显著的区别。本文将深入比较Proxy和Object.defineProperty,包括它们的基本概念、使用示例以及适用场景,以帮助读者更好地理解和运用这两个特性。 1. Object.defineProperty 1.1 基本概念 Object.defineProperty 是 ECMAScript 5 引入的一个方法,用于直接在对象上定义新属性或修改已有属性。它的基本语法如下: javascript 代码解读复制代码Object.defineProperty(obj, prop, descriptor); 其中,obj是目标对象,prop是要定义或修改的属性名,descriptor是一个描述符对象,用于定义属性的特性。 1.2 使用示例 javascript 代码解读复制代码//

By Ne0inhk

Proxy 和 Object.defineProperty 的区别

Proxy 和 Object.defineProperty 是 JavaScript 中两个不同的特性,它们的作用也不完全相同。 Object.defineProperty 允许你在一个对象上定义一个新属性或者修改一个已有属性。通过这个方法你可以精确地定义属性的特征,比如它是否可写、可枚举、可配置等。该方法的使用场景通常是需要在一个对象上创建一个属性,然后控制这个属性的行为。 Proxy 也可以用来代理一个对象,但是相比于 Object.defineProperty,它提供了更加强大的功能。使用 Proxy 可以截获并重定义对象的基本操作,比如访问属性、赋值、函数调用等等。在这些操作被执行之前,可以通过拦截器函数对这些操作进行拦截和修改。因此,通过 Proxy,你可以完全重写一个对象的默认行为。该方法的使用场景通常是需要对一个对象的行为进行定制化,或者需要在对象上添加额外的功能。 对比 以下是 Proxy 和 Object.defineProperty 的一些区别对比: 方面ProxyObject.defineProperty语法使用 new Proxy(target,

By Ne0inhk