分享好友 最新动态首页 最新动态分类 切换频道
机器学习十大经典算法之最小二乘法
2024-12-28 01:43

最小二乘法概述

机器学习十大经典算法之最小二乘法

最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。

简而言之,最小二乘法同梯度下降类似,都是一种求解无约束最优化问题的常用方法,并且也可以用于曲线拟合,来解决回归问题。

如果以最简单的一元线性模型来解释最小二乘法。回归分析中,如果只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。对于二维空间线性是一条直线;对于三维空间线性是一个平面,对于多维空间线性是一个超平面...

对于一元线性回归模型, 假设从总体中获取了m组观察值(X1,Y1),(X2,Y2), …,(Xm,Ym)。对于平面中的这m个点,可以使用无数条曲线来拟合。要求样本回归函数尽可能好地拟合这组值。综合起来看,这条直线处于样本数据的中心位置最合理。选择最佳拟合曲线的标准可以确定为:使总的拟合误差(即总残差)达到最小。有以下三个标准可以选择:

最常用的是普通最小二乘法( Ordinary Least Square,OLS):所选择的回归模型应该使所有观察值的残差平方和达到最小。

为了计算β0,β1的值,我们采取如下规则:β0,β1应该使计算出来的函数曲线与观察值的差的平方和最小。即Cost函数,用数学公式描述就是:

其中,

表示根据y=β0+β1x估算出来的值,yi是观察得到的真实值。

明确了前面的cost function以后,后面的优化求解过程反倒变得s容易了。 样本的回归模型很容易得出:

现在需要确定β0、β1,使cost function最小,即对公式进行求导,函数的极小值点为偏导为0的点。

将这两个方程稍微整理一下,使用克莱姆法则,很容易求解得出:

这就是最小二乘法的解法,就是求得平方损失函数的极值点。需要注意的一点是β0是常数项对应的系数,此处相当于添加了一个特征值x0且x0恒为1,也就是目标函数中的β0可以看成β0x0,这样的话就不同单独考虑常数项了(在后面的多元线性模型就用到了该性质)。

如果我们推广到更一般的情况,假如有更多的模型变量x1,x2,⋯,xn,可以用线性函数表示如下:

对于m个样本来说,可以用如下线性方程组表示:

如果将样本矩阵xij记为矩阵A,将参数矩阵记为向量β,真实值记为向量Y,上述线性方程组可以表示为:

对于最小二乘来说,最终的矩阵表达形式可以表示为:

其中m≥n,由于考虑到了常数项,故属性值个数由n变为n+1。

方程解法如下所示:

其中倒数第二行中的中间两项为标量,所以二者相等。然后利用该式对向量β求导:

(1)

由矩阵的求导法则: 

可知(1)式的结果为:

令上式结果等于0可得:

(2)

上式就是最小二乘法的解析解,它是一个全局最优解

1. 最小二乘法和梯度下降

(1)最小二乘法和梯度下降法在线性回归问题中的目标函数是一样的(或者说本质相同),都是通过最小化均方误差来构建拟合曲线。

(2)二者的不同点可见下图(正规方程就是最小二乘法):

需要注意的一点是最小二乘法只适用于线性模型(这里一般指线性回归);而梯度下降适用性极强,一般而言,只要是凸函数,都可以通过梯度下降法得到全局最优值(对于非凸函数,能够得到局部最优解)。

梯度下降法只要保证目标函数存在一阶连续偏导,就可以使用。

2.最小二乘法的一些限制和解决方法:

要保证最小二乘法有解,就得保证是一个可逆阵(非奇异矩阵);那如果ATA不可逆怎么办?什么情况下ATA不可逆?

关于ATA在什么情况下不可逆:

(1)当样本的数量小于参数向量(即β)的维度时,此时ATA一定是不可逆的。例如:你有1000个特征,但你的样本数目小于1000的话,那么构造出的ATA就是不可逆的。

(2)在所有特征中若存在一个特征与另一个特征线性相关或一个特征与若干个特征线性相关时,此时ATA也是不可逆的。为什么呢?

具体来说假设,A是m*n维的矩阵,若存在线性相关的特征,则R(A)<n,R(AT)<n,R(ATA)<n,所以ATA不可逆。

如果ATA不可逆,应该怎样解决?

(1)筛选出线性无关的特征,不保留相同的特征,保证不存在线性相关的特征。

(2)增加样本量。

(3)采用正则化的方法。对于正则化的方法,常见的是L1正则项和L2正则项,L1项有助于从很多特征中筛选出重要的特征,而使得不重要的特征为0(所以L1正则项是个不错的特征选择方法);如果采用L2正则项的话,实际上解析解就变成了如下的形式:

λ即正则参数(是一种超参数)后面的矩阵为(n+1)*(n+1)维,如果不考虑常数项的话,就是一个单位阵;此时括号中的矩阵一定是可逆的。

3.最小二乘法的改进

最小二乘法由于是最小化均方差,所以它考虑了每个样本的贡献,也就是每个样本具有相同的权重;由于它采用距离作为度量,使得他对噪声比较敏感(最小二乘法假设噪声服从高斯分布),即使得他它对异常点比较敏感。因此,人们提出了加权最小二乘法,

相当于给每个样本设置了一个权重,以此来反应样本的重要程度或者对解的影响程度。

《矩阵分析与应用》

https://www.cnblogs.com/wangkundentisy/p/7505487.html

最新文章
短剧出海系统全端开源,部署上线维护全包,支持iaa广告付费模式
var _hmt = _hmt || [];(function() {var hm = document.createElement("script");hm.src = "https://hm.baidu.com/hm.js?3877f389e858af44b729b97e5e50c214";var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBef
大理谷歌推广开户
大理谷歌推广开户欢迎联系在线客服 大理google海外推广是通过大理google进行网络营销推广的方式,通常我们可以理解为是大理谷歌竞价广告。大理谷歌海外推广依托Google AdWords、Google adsense、Google admob等Google的广告产品,可以将我
从铝土矿制备铝的工艺流程图NaAlO2溶液AlOH.PPT
专题3 从矿物到基础材料从铝土矿到铝合金2013年学业水平考试复习 温州中学陈欲晓《学业水平考试标准》的要求铝及其合金性能优越,用途广泛,完全有提取必要。铝元素在自然界以何种形式存在?地壳中铝的含量?矿石类型Al2O3SiO2Fe2O3其它一
挑战答案揭晓
## 《2022小鸡庄园今日挑战答案揭晓》——蚂蚁庄园答题攻略大放送在这个充满趣味与挑战的数字世界中,蚂蚁庄园无疑是一款深受广大用户喜爱的游戏。每日的挑战答题,不仅考验了我们的知识储备,更是对智慧和眼力的考验。今天,就让我们一起
用AI绘画生成超逼真美女写真,轻松成为摄影师!
超写实生成Max:这款工具专门针对想要生成高度逼真图像的用户,配备了强大的人工智能引擎,能够细致入微地描绘每一处细节。它支持多种参数调节,可以根据用户的喜好生成不同风格的写真。但是,使用起来的复杂度相对较高,新手用户可能会面
度晓晓和汪苏泷“虚实共舞”大放异彩,智能搜索原来还能这么玩
来源:时刻头条9月19日,百度App携手浙江卫视打造的国内首档好奇主题晚会“百度好奇夜”正式拉开序幕。众多明星大咖及百度移动生态的内容创作者汇聚一堂。不仅是一场星光熠熠的视听盛宴,由于融入了百度AI、智能搜索等创新科技,为观众带来
谷歌SEO的站外优化推广
如今谷歌SEO的站外优化已经不仅仅指外链。由于谷歌越来越重视社交媒体信号,网站的社交网络建设也变得越来越必要。无论是优质外链还是社交信号都是SEO中不可缺少的一部分。下面外贸网站建设Ueeshop将细说谷歌SEO该怎么来做外链,带你了解不
怎么创建自己的微信小程序
快速创建属于自己的小程序:第一步:进入https://mp.weixin.qq.com/官网,选择,【小程序】【开发】选项进入查看小程序开发文档。开发选项下你可以看到官方提供的教程、框架、组件、api、工具还有一些常见问题等。  这些在我们进行微信小程
宿豫区人民医院职业病体检系统、体检自助机软件以及体检微信商城软件采购项目成交结果公告
一、项目编号:JSTYSY[2024]04号 二、项目名称:宿豫区人民医院职业病体检系统、体检自助机软件以及体检微信商城软件采购项目三、成交信息供应商名称:中卫信软件股份有限公司供应商地址:无锡市经济开发区立诚道18银华金融大厦办公区域20
高清美女写真一键生成!最强AI绘画工具评测与使用攻略
5. 搜狐简单AI 最后,我们要介绍的是搜狐简单AI,这是一款功能丰富且用户友好的AI绘画工具。这款软件不仅保证了操作的简便性,而且涵盖了多种场景应用,适合新手用户。而且,搜狐简单AI是免费使用的,几乎适合大多数用户。许多用户反馈称,
相关文章
推荐文章
发表评论
0评