当前位置: 首页 > news >正文

经典机器学习算法的数学推导

线性回归

为什么叫h(x)  

为什么用θ表示参数

θ是向量还是矩阵?

为什么用x表示特征

为什么X是一个R^{d}来表示的向量

 为什么在表格添加一列1 ?便于矩阵计算

为什么用\varepsilon表示误差? 

K-means

基础概念:

1.要得到簇的个数,需要指定K值

2.质心:均值,即向量各维取平均即可

3.距离的度量:常用欧几里得距离和余弦相似度(先标准化)

4.优化目标: 就是每个簇内每个样本点到簇中心的距离之和最小

必须掌握的技巧

1.提出常数和取对数

 2.只关注含变量的部分

 3.用向量表示数组

4.转置符号的处理 

5.与对称阵求偏导的相关公式 

XX^{T}是对称矩阵

对于式子 \theta XX^{T}\theta ^{T} 对θ求偏导结果是两倍的对称阵乘变量(2XX^{T}\theta

 6.矩阵求导公式

都是对θ求导:我转你不转,你转我不转

\partial \theta ^{T}X^{T}y = X^{T}y

 \partial \theta X^{T}y = ( X^{T}y)^{T}

7.如何消去一个矩阵

X^{T}\theta -> θ 需要左乘(X^{T})^{-1}

8.如何理解梯度下降 是沿梯度的反方向

因为梯度一般是上升的 为了下山,应该往梯度的反方向走

9.如何理解分别对每个参数分别优化

因为所有的前提是独特征立的,既然特征是独立的,那么特征的系数(参数)也可以认为是独立的

10.只关注需要求偏导的变量的部分

对 \theta _{j}求偏导,那么其他\theta x的结构都是常数项,只有x_{j}\theta _{j}有关

 

必须记住的表示方法

1.用求和形式表示多项式,偏置项合并到关于θ的向量里

2.让损失函数越小越好

3.\varepsilon是独立并且具有相同的分布 服从均值为0,方差为θ^2的高斯分布

   \varepsilon为什么是独立的? 误差是由样本产生的,而样本之间是独立的

   \varepsilon为什么是同分布的?因为默认样本是同批产生的

   \varepsilon为什么服从的是高斯分布?

    θ是矩阵还是数值?

    高斯分布和正态分布的关系?

    为什么用高斯分布来表征?因为偏离均值特别多的值很少出现

4.高斯分布与多元高斯分布的数学表现形式

高斯分布

p(\varepsilon )=\frac{1}{\sqrt[2]{2\pi }\varepsilon }exp(-(\varepsilon -0)^{2}/2\sigma^{^{^{2}}}))

\varepsilon是均值

\sigma是方差

5.多元高斯分布

线性回归误差的高斯分布

得到线性回归误差的高斯分布是

        p(y|x;θ)越大越好

 6.似然函数

似然函数有什么用?就是描述什么样的参数和特征值组合后是真实值,所以似然函数都是越大越好

为什么似然函数是连乘的形式?因为默认误差是独立同分布的,所以联合概率分布是可以拆成各自概率分布连乘

 

        


http://www.taodudu.cc/news/show-4781427.html

相关文章:

  • 关键字详解
  • 1725 ssm资产管理系统myeclipse开发mysql数据库springMVC模式java编程计算机网页设计
  • JavaScript中带日期的操作
  • 软件工程期末复习(6)需求分析的任务
  • 什么是Keycloak?怎么样使用Keycloak实现登录和权限验证?
  • git bash各分支修改内容不同但合并后不显示冲突问题
  • 深度学习/机器学习入门基础数学知识整理(六):Hoeffding不等式,
  • 图数据库介绍及简单入门
  • 数据库基础知识汇总!
  • 数据库基础知识(必读)
  • 最新FreeBbs论坛社区APP源码
  • 解决无线打印机休眠后掉线无法进行局域网打印的问题
  • 富士施乐S2110显示J-4请更换感光鼓后无法进行HFSI计数器初始化的另类操作
  • Linux系统编程(二)–信号
  • 发那科机器人GI分配_发那科机器人调试离线编程与应用 “I/O的分配”
  • 发那科机器人override指令_【发那科】机器人控制指令介绍(二)
  • fanuc机器人刷机教程_FANUC机器人中文简易教程
  • fanuc机器人码垛编程实例_FANUC 机器人码垛编程详细讲解!
  • 发那科机器人点位编辑_发那科机器人指令编辑详细介绍
  • 发那科机器人override指令_发那科机器人程序是如何编写的呢——发那科机器人...
  • 发那科机器人GI分配_发那科机器人应用-数值寄存器 R[]
  • 关于发那科机器人程序偏移功能
  • NuGet安装Spire.OCR
  • Spire.OCR for .NET Patch
  • PHP 调用微信小程序 OCR 接口
  • 免费的图片识别接口,百度ocr的SDK使用java版
  • autojs之浩然ocr-不安装插件就能用ocr
  • autojs-ocr-easyedge-nodejs
  • 软件调试相关
  • Bongiovi DPS for mac(音频增强工具)
  • DPS学习心得(一)
  • 中学数字化探究实验室建设要求和规范
  • 医药工业洁净厂房配电系统设计与节能应用
  • 浅谈医药工业洁净类厂房智能照明设计与选型
  • ds服务器没检测到有响应,设备或资源dns没检测到有响应 网络无法连接
  • EasyCVR调用录像回看接口报错“查询文件失败”排查过程及解决方式