将SVD应用于特定数据集
在特定背景下分析PCA的结果
绘制并解释奇异值(碎石图)
选择r值以达到期望的方差捕获水平
在Python中实现K-Means算法
在Python中应用K-Means函数
在给定初始数据集的情况下解释K-Means和PCA的结果
使用scikit-learn进行K-Means聚类
比较两种不同的质心初始化方法(k-means++ vs. 随机初始化)
比较在给定数据集上的多种聚类技术的结果
数据归一化:首先通过减去均值并除以标准差对数据进行归一化处理。
执行SVD:在归一化的数据上执行奇异值分解(SVD)。
验证分解:通过矩阵乘法重构原始数据,并检查结果是否与归一化数据一致
思路:
1.区分线性模型和非线性模型
2.使用Plotly拟合简单线性回归线
3.计算平方误差和绝对误差
4.识别损失函数对离群值的反应
5.应用多种技术来最小化损失函数
6.使用多元线性回归模型预测结果
7.识别数据集中序数、名义和分类数据
X
欢迎来到安尔法!