今天的话题是:人工智能生成人工智能。我们将在VS Code里面利用Code GPT帮助我们一步一步地生成一个线性回归预测的Python代码。模型数据集采用经典的波士顿房价数据集,可以根据一些特征预测未来的房价。
当然,在这里你还是需要对于你的预测对象和线性回归算法有一定的了解,CodeGPT可以辅助你生成代码的细节。充分理解和利用今天讲解的特性能够极大帮助你学习和创建AI模型。
如果已经在VS Code中安装并配置好Code GPT。我们创建一个新的Python文件:mycode02.py。创建完成之后,我们打开output窗口。
创建模型的第一步都是数据集,我们首先获取数据集。在mycode02.py的代码编辑器中输入如下的注释,并按照之前文章介绍的方法按键指令CodeGPT为我们生成代码:
# 用panda装载http://123.206.66.105:8080/kb/data/ai/boston_housing_data.csv 的房价数据
第一部分代码已经生成出来了,直接将其复制粘贴到我们的mycode02.py之中。为了能够展出效果,我们手动添加一行打印语句。然后我们运行这段代码,就可以在output窗口中看到我们的结果了。
现在我们对于我们所获取的房价数据进行简单的清理,将那些NaN的数据从DataFrame中移除。我们输入下列的注释:
# 清除数组boston_data中的NaN数据项
是时候将我们的数据集的数据用图表的形式展现一下了。我们输入下列的注释:
# 绘制以boston_data['LSTAT']为x轴,boston_data['MEDV']为y轴的散点图
运行一下看看结果。
在这一步中,将抽取训练数据的特征,生成特征数据集和标签数据集。由于这一步中的逻辑非常简单,因此我们没有使用CodeGPT生成,而是直接手工编写了这部分的代码。
现在将我们的特征数据集和标签数据集分割成训练数据集和测试数据集,比例为80:20。为此我们输入下列的注释:
# 将原数据集boston_data拆分成训练集和测试集,这里使用80%的数据做训练,20%的数据做测试boston_data
我们在拷贝了CodeGPT生成的代码之后,为了方便起见我们修改了变量的名称
这一步是最重要的一步,我们来让CodeGPT为我们生成代码线性回归的模型。为此我们输入下列的注释:
#分别以X_train, y_train为参数生成线性回归的训练模型,并且打印出模型的主要参数
最后我们手工加入打印模型主要参数的语句。
最后让我们来看看模型的运行结果。如图所示,
这个模型生成完毕了,也得除了运行结果。由于我们没有对这个模型进行任何的调参,所以不是最优的结果。但是不管怎么说,我们通过使用CodeGPT帮助我们生成了一个针对于波士顿房价预测的线性回归模型。整个的过程还是比较流畅的。让我们真实体验了一把“人工智能生成人工智能”的愉快过程。
#人工智能
评论留言