DeepFaceLab上云之阿里云使用全攻略!

说完滴滴云,一鼓作气,来说说阿里云。

阿里的云服务可以说是琳琅满目,看到人眼花缭乱。不过今天我们只关注GPU服务器。

为了写这篇文章还消耗了几百人民币,中途一不小心入了一个坑,还好最后成功跑了起来,并且简单测试了一下阿里云上的P4和V100,V100是真的快,火箭一般的速度。

下面我就分享一下这两天使用阿里云的经验。

如何开通云GPU

阿里云GPU服务地址:点击这里

打开后可以看到,默认推荐的为GN6(V100) , 后面还有P100, P4,M40,S7150。 还能看到这些服务器可以用来干嘛:AI深度学习,视频处理,科学计算,图形可视化。我们的目的简单明了,为了跑DeepFaceLab,直接点击P4(最便宜) 进入购买。

 

阿里云的付费方式有三种,包年包月,按量付费,抢占式实例。 包月的话大概一个月几千块。按量的话,几十块一个小时。

+

我这里选的是按量付费,如果账户余额少于100元,他会提示你充值。

 

很多人会发现其中有一个GPU虚拟化型特别便宜,那么到底好不要用呢? 用血的教训告诉大家,这是坑,不要入。 为了演示我跳坑的血泪史,我这里选了GPU轻量(你们直接选GPU计算型下面的P4),其他基础配置如上图。下面的配置不管你选的那个型号都是一样滴,

镜像:选公共镜像,windwo server  2016数据中心版64位中文版。

存储:高效云盘,50G (实际使用100G要的。

 

网络与安全可以全部默认,直接下一步。

系统配置:这一步主要是输入登陆密码。 这个密码就是操作系统的登陆密码,账号统一为:Administrator

 

 

分组设置 可以全部默认

 

确认订单

 

创建实例。

出现绿色的创建成功 ,就证明你已经完成了。可以点击管理控制台进入后台

后台注意顶部的分区,如果选错分区这里什么都看不到。左侧选择实例。右侧显示实例列表

列表中可以看到核心配置,公网IP,右侧有管理远程连接

 

如何连接云服务器?

连接云服务器,和滴滴云差不多,也分两种方式,一种网页连接,一种远程桌面。

1.网页连接远程电脑,点击上一步中的远程连接

跳出一个窗口,告诉你了一个连接密码,这个密码只会出现一次,如果你以后需要使用这种方式连接,记得把这个密码记录下来。

 

输入这个密码,确定立马开始连接。

显示Windwo的启动后的界面

此时点击左上角发送远程命令,发送Ctrl+Alt-Delete命令解锁。

输入自己设置的密码,即可登录系统。

登录后可以查看下计算机的系统信息,

显示系统为 Server 2016 Datacenter,

处理器 Xeon E5-2682 V4,  2.50Ghz,

内存 6GB

 

方法2: 远程桌面(推荐)

远程桌面是Windows系统自带的软件,通过快捷键WIN+R,调出运行

输入mstsc  确定,启动远程桌面。

 

输入服务器的外网IP地址,点击连接

 

输入账号:Administrator

密码:自己想,就是前面设置的。

勾选,记住我的凭证

确定

 

勾选,是(Y)

登录成功,同样可以看一下系统信息。 阿里云相比滴滴云是贵了不少,但是在上面下载东西是真的快,包括这个远程桌面链接也很稳定,操作几乎不存在延时(杭州->北京)。

 

如何使用云GPU?

登录之后就可以开始后续的配置了。正常情况下,可以通过自带的IE浏览器下载所需的软件。

1.DeepFaceLab软件(必须)

2.N卡驱动(必须)

3.Chrome浏览器(可选,用着爽)

4. QQ(可选,下软件,传文件)

5.迅雷(可选,下软件)

6. GPUZ (可选,查看显卡信息)

下载QQ,迅雷,GPUZ这些大家肯定都会的,去官网下载就好了。

可能会遇到的问题是,IE会拦截,不让你下载。此时只需把网址添加到信任列表就好了。

DeepFaceLab软件我是通过登录QQ,打开群659480116,从群文件中下载的,阿里云的速度很快,一下子就下完了。

我也尝试过用Pandownload,但是遇到了各种问题,浏览器内核下载失败,无法登录,只能放弃了。

 

N卡驱动下载: https://www.nvidia.cn/Download/index.aspx?lang=cn

我选的是P4,如上图,搜索,下载即可。

下载之后双击安装立马出错,我一头雾水,尝试下载了CUDA tookit ,安装成功,但是依旧无法使用DFL。

这就是我前说的坑,因为选了虚拟化GPU,驱动装不上,显卡识别不出来。

倒腾了很久才意识到问题所在:贪便宜。只能重新创建了一个实例,问题立马解决。

真的不要贪便宜…会吃亏的。浪费了时间,浪费了钱,还浪费了好心情。

 

驱动安装成功,一切就是按部就班了。DeepFaceLab 具体的使用方法,参考之前的文章,云端和本地使用方法没有任何差别。

阿里云P4跑H128的速度大概就是这样了,好像还比滴滴云慢了一丢丢(五六十毫秒)。

 

说好了,上云是为了大显存,为了快。光演示P4肯定是不行的。所以又搞了一台V100,显存16G

作为云端最强,V100不负众望。有2080ti的可以对比下速度。

V100 跑H128一个迭代只需要135ms

BS开到32很轻松,单次迭代只需0.5秒。这速度比P4快了可不是一点点。

即便是SAE256也不是问题,启动后一个迭代的速度为750ms

既然用了阿里云,就果断开V100了(不要一下搞8张V100哦,DFL不能并行使用),实在不行搞个P100也好,要显存大的话开M40 24G 。

 

相比滴滴云,阿里云有高配显卡,网络速度快等优点,缺点就是:贵。

阿里云还有一个优点就是可以一对一分享镜像,有了镜像就不需要各种下载,各种安装,各种配置了,各种等待,只需通过镜像直接创建一台云服务器,远程登录之后直接使用DeepFaceLab软件,这样一来即便你不会装环境也可以轻松上云了。

有需要的可以加群659480116 ,私聊群主(就是我^_^)。

阿里云GPU服务地址:点击这里

腾讯云,百度云,华为云…大家觉得还有必要写一写么? 感觉大都雷同,主要是开通页面可以能有些差别!

   

--------------------------------------------------------------------------

申明:图文均由deepfakes 中文网原创,转发请注明出处,谢谢!

 网站官方入门交流群:659480116,663199843,672316851交流更方便,群文件!  

微信公众号:托尼是塔克(TonyIsStark)第一时间获取最新消息。

--------------------------------------------------------------------------

8 Comments

Add a Comment

电子邮件地址不会被公开。 必填项已用*标注