机器学习算法笔记(十六):多项式回归初探

线性回归法有一个很大的局限性,它要求假设我们数据背后是存在线性关系的。但在实际应用中,具有线性关系假设的数据集相对来说比较少,更多的数据之间具有的是非线性的关系。其实我们用一种非常简单的手段就能改进线性回归法,可以对非线性的数据进行处理和预测,也就是所谓的多项式回归(Polynomial Regression)阅读全文

机器学习算法笔记(十五):sklearn中的PCA与MNIST数据集

上面我们自己实现了PCA算法,本文将着重探讨sklearn库中PCA的调用和著名的手写数字数据集——MNIST数据集的处理与探索。

一、sklearn中PCA的调用

新建一个工程,创建一个main.py文件,实现以下代码: 阅读全文

机器学习算法笔记(十四):将高维数据映射为低维数据

上一篇文章讨论了如何求一个数据集的前n个主成分。我们虽然求出了这些主成分所代表的坐标轴的方向,但数据集本身依然是n维的,并没有进行降维。具体我们如何运用PCA对数据进行映射的呢?本篇文章将探讨高维数据向低位数据进行映射的过程。 阅读全文

机器学习算法笔记(十三):求数据的前n个主成分

上一篇文章中我们探讨了主成分分析法的基本思路以及第一主成分的求法。本文将着重探讨如何求数据的前n个主成分以及把我们的PCA算法封装起来,以便后续方便的调用。

一、求数据的前n个主成分的思路

阅读全文