HCA data downloads
HCA data downloads
PeRl`
还记得去年看的时候还是什么都没有,今年已经有数据可以下载了.
官方提供的下载方式是一次下载,幸福终生,我觉得这样有点坑,毕竟是几百G甚至上T的数据,哪能说下就下ORZ.
简单看了下官方提供的下载脚本:看到这个循环的 bundles 不由虎躯一震,怎么样也算是可以分开下载了,开熏.
简单的整理了一下脚本,可以分 uuid 进行分批下载,平行下载话怎么也能加快一些下载速度吧.
首先就是 python 的 pip 下载工具的安装:
sudo apt-get install python-pip
然后是安装HCA提供的官方下载包 {hca}
:
sudo pip install hca --upgrade --ignore-installed six
最后就是根据 uuid 进行下载啦:
hca dss download --bundle-uuid c94a43f9-257f-4cd0-b2fe-eaf6d5d37d18 --replica aws
又浪费了一下午,又该滚回去写论文了.