线性回归法有一个很大的局限性,它要求假设我们数据背后是存在线性关系的。但在实际应用中,具有线性关系假设的数据集相对来说比较少,更多的数据之间具有的是非线性的关系。其实我们用一种非常简单的手段就能改进线性回归法,可以对非线性的数据进行处理和预测,也就是所谓的多项式回归(Polynomial Regression)。 阅读全文
分类: 机器学习
机器学习算法笔记(十五):sklearn中的PCA与MNIST数据集
上面我们自己实现了PCA算法,本文将着重探讨sklearn库中PCA的调用和著名的手写数字数据集——MNIST数据集的处理与探索。
一、sklearn中PCA的调用
新建一个工程,创建一个main.py文件,实现以下代码: 阅读全文
机器学习算法笔记(十四):将高维数据映射为低维数据
上一篇文章讨论了如何求一个数据集的前n个主成分。我们虽然求出了这些主成分所代表的坐标轴的方向,但数据集本身依然是n维的,并没有进行降维。具体我们如何运用PCA对数据进行映射的呢?本篇文章将探讨高维数据向低位数据进行映射的过程。 阅读全文