该实验聚焦于学习机器学习回归和机器学习库sklearn的使用,在该实验中我完成了以下几个demo:
- 随机生成自变量x的数据,并添加随机噪声构建y,模拟实际情况中可能存在的测量误差或其他干扰隐私,拟合模型y=3x+2
- 波士顿房价预测: 使用波士顿房价数据集,该数据集包含不同特征(如房间数、房龄、距离市中心的距离等)以及相应的房价信息,构建模型预测房价。
很遗憾的是
load_boston
数据集已被scikit-learn
移除,因此我们选择使用加利福尼亚的放假数据集构建预测模型
- 乳腺癌检测实例: 我们使用经典的乳腺癌数据集(Breast Cancer Dataset)进行乳腺癌检测预测(该数据集包含569个样本,每个样本有30个特征,并标记为良性 0 或恶性 1 )训练一个逻辑回归模型,预测新的样本是良性还是恶性。