暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

薅羊毛 Colab使用外部数据的7种方法!

Coggle数据科学 2022-05-26
367

Colab作为非常强大且优惠的计算平台,一直广受大家喜爱。可以随时随地使用,还有免费的GPU可以薅羊毛。

那么如何在Colab中使用外部数据集,来完成竞赛呢,本文将给出几种常见的方法。

方法1:通过Files explorer上传

点击Notebook的Files explorer
面板:

然后点击上传按钮:

当上传结束后,就可以直接读取:


方法2:使用Colab files
上传

输入并运行下面代码:

from google.colab import files
uploaded = files.upload()

然后就可以选择对应的文件,完成上传:


方法3:读取Github链接

在github页面找到对应的文件路径,注意是文件的Raw
链接:

然后将链接写到对应的位置。


方法4:克隆Github项目

先从命令行下载项目:

!git clone https://github.com/BindiChen/machine-learning.git

然后从对应的路径完成数据读取。


方法5:使用wget/axel下载文件

在Notebook中可以使用Linux系统命令,可以使用wget
axel
下载数据:


方法6:读取谷歌硬盘数据

挂载了谷歌硬盘后,写好路径完成读取:


方法7:Kaggle API完成数据下载

首先在Kaggle账户的Kaggle API,点击Create New API Token,会下载一个kaggle.json
文件。

kaggle.json
文件上传后,就可以使用kaggle-api下载比赛数据或者数据集。

!kaggle competitions download -c titanic
!kaggle datasets download -d alexanderbader/forbes-billionaires-2021-30


学习交流群已成立
学习推荐系统,算法竞赛,组队参赛
添加👇微信拉你进群
加入了之前的社群不需要重复添加~

文章转载自Coggle数据科学,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论