优化算法——拟牛顿法之L-BFGS算法

优化算法——拟牛顿法之L-BFGS算法

一、BFGS算法

在“”中,我们得到了BFGS算法的校正公式:

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

利用Sherman-Morrison公式可对上式进行变换,得到

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

,则得到:

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

二、BGFS算法存在的问题

在BFGS算法中,每次都要存储近似Hesse矩阵

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

,在高维数据时,存储

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

浪费很多的存储空间,而在实际的运算过程中,我们需要的是搜索方向,因此出现了L-BFGS算法,是对BFGS算法的一种改进算法。在L-BFGS算法中,只保存最近的

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

次迭代信息,以降低数据的存储空间。

三、L-BFGS算法思路

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

,则BFGS算法中的

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

可以表示为:

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

若在初始时,假定初始的矩阵

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

,则我们可以得到:

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法
www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法
www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法
www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

若此时,只保留最近的

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

步:

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

这样在L-BFGS算法中,不再保存完整的

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

,而是存储向量序列

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

,需要矩阵

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

时,使用向量序列

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

计算就可以得到,而向量序列

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

也不是所有都要保存,只要保存最新的

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

步向量即可。

四、L-BFGS算法中的方向的计算方法

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

五、实验仿真

lbfgs.py

#coding:UTF-8

from numpy import *
from function import *

def lbfgs(fun, gfun, x0):
    result = []#保留最终的结果
    maxk = 500#最大的迭代次数
    rho = 0.55
    sigma = 0.4
    
    H0 = eye(shape(x0)[0])
    
    #s和y用于保存最近m个,这里m取6
    s = []
    y = []
    m = 6
    
    k = 1
    gk = mat(gfun(x0))#计算梯度
    dk = -H0 * gk
    while (k < maxk):             
        n = 0
        mk = 0
        gk = mat(gfun(x0))#计算梯度
        while (n < 20):
            newf = fun(x0 + rho ** n * dk)
            oldf = fun(x0)
            if (newf < oldf + sigma * (rho ** n) * (gk.T * dk)[0, 0]):
                mk = n
                break
            n = n + 1
        
        #LBFGS校正
        x = x0 + rho ** mk * dk
        #print x
        
        #保留m个
        if k > m:
            s.pop(0)
            y.pop(0)
            
        #计算最新的
        sk = x - x0
        yk = gfun(x) - gk
        
        s.append(sk)
        y.append(yk)
        
        #two-loop的过程
        t = len(s)
        qk = gfun(x)
        a = []
        for i in xrange(t):
            alpha = (s[t - i - 1].T * qk) / (y[t - i - 1].T * s[t - i - 1])
            qk = qk - alpha[0, 0] * y[t - i - 1]
            a.append(alpha[0, 0])
        r = H0 * qk
            
        for i in xrange(t):
            beta = (y[i].T * r) / (y[i].T * s[i])
            r = r + s[i] * (a[t - i - 1] - beta[0, 0])

            
        if (yk.T * sk > 0):
            dk = -r            
        
        k = k + 1
        x0 = x
        result.append(fun(x0))
    
    return result


function.py

#coding:UTF-8
'''
Created on 2015年5月19日

@author: zhaozhiyong
'''

from numpy import *

#fun
def fun(x):
    return 100 * (x[0,0] ** 2 - x[1,0]) ** 2 + (x[0,0] - 1) ** 2

#gfun
def gfun(x):
    result = zeros((2, 1))
    result[0, 0] = 400 * x[0,0] * (x[0,0] ** 2 - x[1,0]) + 2 * (x[0,0] - 1)
    result[1, 0] = -200 * (x[0,0] ** 2 - x[1,0])
    return result


testLBFGS.py

#coding:UTF-8
'''
Created on 2015年6月6日

@author: zhaozhiyong
'''

from lbfgs import *

import matplotlib.pyplot as plt  

x0 = mat([[-1.2], [1]])
result = lbfgs(fun, gfun, x0)
print result

n = len(result)
ax = plt.figure().add_subplot(111)
x = arange(0, n, 1)
y = result
ax.plot(x,y)

plt.show()


实验结果

www.zeeklog.com  - 优化算法——拟牛顿法之L-BFGS算法

参考文献

Read more

深入理解 Proxy 和 Object.defineProperty

在JavaScript中,对象是一种核心的数据结构,而对对象的操作也是开发中经常遇到的任务。在这个过程中,我们经常会使用到两个重要的特性:Proxy和Object.defineProperty。这两者都允许我们在对象上进行拦截和自定义操作,但它们在实现方式、应用场景和灵活性等方面存在一些显著的区别。本文将深入比较Proxy和Object.defineProperty,包括它们的基本概念、使用示例以及适用场景,以帮助读者更好地理解和运用这两个特性。 1. Object.defineProperty 1.1 基本概念 Object.defineProperty 是 ECMAScript 5 引入的一个方法,用于直接在对象上定义新属性或修改已有属性。它的基本语法如下: javascript 代码解读复制代码Object.defineProperty(obj, prop, descriptor); 其中,obj是目标对象,prop是要定义或修改的属性名,descriptor是一个描述符对象,用于定义属性的特性。 1.2 使用示例 javascript 代码解读复制代码//

By Ne0inhk

Proxy 和 Object.defineProperty 的区别

Proxy 和 Object.defineProperty 是 JavaScript 中两个不同的特性,它们的作用也不完全相同。 Object.defineProperty 允许你在一个对象上定义一个新属性或者修改一个已有属性。通过这个方法你可以精确地定义属性的特征,比如它是否可写、可枚举、可配置等。该方法的使用场景通常是需要在一个对象上创建一个属性,然后控制这个属性的行为。 Proxy 也可以用来代理一个对象,但是相比于 Object.defineProperty,它提供了更加强大的功能。使用 Proxy 可以截获并重定义对象的基本操作,比如访问属性、赋值、函数调用等等。在这些操作被执行之前,可以通过拦截器函数对这些操作进行拦截和修改。因此,通过 Proxy,你可以完全重写一个对象的默认行为。该方法的使用场景通常是需要对一个对象的行为进行定制化,或者需要在对象上添加额外的功能。 对比 以下是 Proxy 和 Object.defineProperty 的一些区别对比: 方面ProxyObject.defineProperty语法使用 new Proxy(target,

By Ne0inhk