当前位置:网站首页>ML笔记-matrix fundamental, Gradient Descent

ML笔记-matrix fundamental, Gradient Descent

2022-06-22 13:53:00 阿达斯加

matrix fundamental

basic concepts:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
错题:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
matrix calculation:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Gradient Descent:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
We can speed up gradient descent by having each of our input values in roughly the same range. This is because θ will descend quickly on small ranges and slowly on large ranges, and so will oscillate inefficiently down to the optimum when the variables are very uneven.

The way to prevent this is to modify the ranges of our input variables so that they are all roughly the same. Ideally:
−1 ≤ x(i)​ ≤ 1
or
−0.5 ≤ x(i)​ ≤ 0.5

Two techniques to help with this are feature scaling and mean normalization. Feature scaling involves dividing the input values by the range (i.e. the maximum value minus the minimum value) of the input variable, resulting in a new range of just 1. Mean normalization involves subtracting the average value for an input variable from the values for that input variable resulting in a new average value for the input variable of just zero. To implement both of these techniques, adjust your input values as shown in this formula:
在这里插入图片描述
Where μ_iμi​ is the average of all the values for feature (i) and s_isi​ is the range of values (max - min), or s_isi​ is the standard deviation.
在这里插入图片描述

原网站

版权声明
本文为[阿达斯加]所创,转载请带上原文链接,感谢
https://blog.csdn.net/qq_27565603/article/details/125394635