机器学习算法笔记(十三):求数据的前n个主成分

上一篇文章中我们探讨了主成分分析法的基本思路以及第一主成分的求法。本文将着重探讨如何求数据的前n个主成分以及把我们的PCA算法封装起来,以便后续方便的调用。

一、求数据的前n个主成分的思路

阅读全文

机器学习算法笔记(十二):主成分分析(PCA)初探

主成分分析(Principal Component Analysis,简称PCA)是一个非监督的机器学习算法,主要用于数据的降维处理。通过降维,我们可以发现数据中更便于人类理解的特征,方便数据可视化,使人类更容易理解可视化后的数据。它也能提高算法的运行效率,经过主成分分析以后再用于机器学习算法,数据的被识别率也会更好。 阅读全文

机器学习算法笔记(十):随机梯度下降法

我们上一篇文章讨论的梯度下降法是要将我们想要最优化的那个损失函数相应在某一点 θ 的梯度值准确的求出来。要想求出准确的梯度,每一项都要对所有的样本进行计算,这样的梯度下降法又被称为批量梯度下降法(Batch Gradient Descent),每一次的计算过程都要将样本中所有的信息批量进行计算。但若我们的样本量非常大,我们的算法在计算梯度时就会非常耗时。为了解决样本量过大时的运行效率问题,我们就提出了随机梯度下降法(Stochastic Batch Gradient Descent)阅读全文