AutoDL 深度学习服务器使用教程
前言
随着大模型和复杂神经网络的快速发展,对于没有 GPU 或 GPU 性能不足的用户来说,训练深度学习模型存在硬件限制。使用深度学习云服务器是有效的解决方案。市场上有多种平台可供选择,如 AutoDL、恒源云、矩池云等,用户可根据需求选择。
一、AutoDL 使用教程
Xshell7 和 Xftp7 安装
推荐使用免安装版软件。关闭自动检测更新功能。
[图片]
Xftp 连接服务器,上传数据与下载数据
开机实例后,获取 SSH 登录指令(格式通常为 ssh -p 端口 root@主机地址)。在 Xftp 中创建新会话:
- 名称:自定义
- 协议:SFTP
- 主机:远程服务器地址
- 端口号:SSH 端口
- 用户名:root
- 密码:登录密码
连接成功后,左侧为本地文件,右侧为服务器文件,支持拖拽上传/下载。
[图片]
Xftp 双击'此电脑'强制退出问题
在 Win11 系统下,Xftp 7 版本双击'此电脑'可能导致崩溃。若'此电脑'下存在百度网盘快捷方式或其他冲突项,建议关闭相关进程后再试。
[图片]
Xshell 连接服务器
XShell 连接时需注意命令格式,端口号置于末尾,无需 -p 参数:
ssh [email protected] 44562
已配置 SSH 登录后可直接使用 Xshell 集成的 Xftp 进行文件传输。
AutoDL 注意事项
请将大型数据集上传至 /root/autodl-tmp(数据盘),该目录空间大且不占用系统盘。可使用 source ~/.bashrc 查看系统盘和数据盘使用情况。
更多操作参考官方帮助文档。
环境配置
AutoDL 平台提供多种深度学习框架镜像(如 PyTorch、TensorFlow)。若镜像未包含所需版本,可手动安装。
conda create -n tf python=3.7
conda init bash && source /root/.bashrc
conda activate tf
也可使用社区镜像直接加载已配置好的环境。
训练模型
租服务器
在控制台创建新实例,选择计费方式、地区、GPU 型号及数量,选择合适的镜像后创建。
[图片]
上传数据
通过 Xftp 将本地数据拖拽至服务器 /root/autodl-tmp 目录。建议压缩后上传以节省时间。
环境配置
根据源码依赖安装包,例如:
pip install paddlepaddle-gpu
批量安装可读取 requirements.txt。
训练
根据源码说明配置数据集路径和预训练模型路径,执行训练命令即可。
[图片]
下载数据
训练完成后,通过 Xftp 将生成的模型文件从服务器拖拽至本地。
二、Linux 常用命令
文件管理命令
- 新建:
touch创建文件, 创建文件夹, 编辑文件。


