跳转至

5.4 趋动云使用《扩展》

趋动云使用《补充》

一、注册登陆

1.1 进入官网地址

1.2 手机号注册、登陆

1.3 显示登录成功

image-20231206171104914

1.4 查看账户信息


二、创建项目

  • 注意我们想要使用趋动云进行模型代码的微调实现,需要创建项目进行运行。但是因为我们使用的数据集和预训练模型都属于本地自己拥有的,所以需要在趋动云上首先「添加数据源」和「添加预训练模型」

2.1 添加数据源

2.1.1 选择"数据"工具

2.1.2 创建数据

2.1.3 配置数据信息

2.1.4 选择网页上传方式进行数据传输

2.1.5 拖拽本地数据上传

2.1.6 数据上传成功展示

此时,重新刷新页面,会在数据工具栏显示,已经创建好的数据源

2.2 添加预训练模型

2.2.1 选择"模型"工具,创建模型

2.2.2 配置模型信息

2.2.3 选择SFTP方式进行数据传输

  • 因为模型文件过大

2.2.4 点击SFTP方式之后, 选择文件传输

2.2.5 获取SFTP配置信息

2.2.6 使用CMD传输数据(Windows)

windows10 最新版及以上版本都支持 CMD 传输数据。

  1. 输入 win+r 键,系统左下角弹出运行框。
  2. 输入 cmd 并回车,进入命令行。
  3. 去复制 连接字符
  4. 在命令行中粘贴 连接字符 并回车。
  5. 如返回如下信息,则输入 yes
Are you sure you want to continue connecting (yes/no/[fingerprint])?
  1. 返回如下信息时,输入 密码 并回车,密码 从上述图片处获取。
roif48iKYp@cluster1-dev4.virtaicloud.com's password:
  1. 最后返回 sftp 命令行即如下信息时,表示连接成功。
sftp>
  1. 在 sftp 命令行中输入传输命令。
put -r D:\Git\tool\ /upload

注意:您只需修改命令中 D:\Git\tool\ 为您实际要上传的数据在您本地的存储路径。

2.2.6 使用Mac终端传输数据

  1. Command + 空格 打开搜索栏。
  2. 搜索栏中输入 终端 并回车,打开终端。
  3. 去复制 连接字符
  4. 在命令行中粘贴 连接字符 并回车。
  5. 如返回如下信息,则输入 yes
Are you sure you want to continue connecting (yes/no/[fingerprint])?
  1. 返回如下信息时,输入 密码 并回车,密码 从上述图片处获取。
roif48iKYp@cluster1-dev4.virtaicloud.com's password:
  1. 最后返回 sftp 命令行即如下信息时,表示连接成功。
sftp>
  1. 在 sftp 命令行中输入传输命令。
put -r D:\Git\tool\ /upload

注意:您只需修改命令中 D:\Git\tool\ 为您实际要上传的数据在您本地的存储路径。

2.2.7 连接成功上传数据展示

注意:当你的模型数据传输完成后,可以关闭通道。

2.3 创建项目

2.3.1 点击右上角创建项目

2.3.2 依次配置项目内容

注意:创建项目后,数据会默认保存的路径为:/gemini/data1下,预训练模型会自动保存在/genmini/pretrain下

2.3.3 镜像环境选择

2.3.4 创建完项目后,要求上传本地代码(拖拽式)

注意:上传的代码文件,需要进行压缩后上传

2.3.5 项目创建成功展示

三、运行服务环境、训练模型

3.1 初始化开发环境

3.1.1 点击开发工具,进入开发环境实例配置界面

3.1.2 进行开发环境实例配置

3.1.3 等待资源配置

3.1.4 资源配置完成,等待进入开发环境

3.2 配置开发环境

3.2.1 进入开发环境

3.2.2 开发环境展示

3.2.3 进入网页终端操作

3.2.4 查看代码、数据、预训练模型

3.2.5 安装依赖库

  • 默认安装的有pytorch=2.0.1,并且支持cuda
  • 安装其他第三方库
pip install protobuf==3.20.0 transformers==4.27.1 icetk cpm_kernels  
pip install peft==0.11.1

3.3 训练模型

3.3.1 路径修改

  • 因为在趋动云服务下,数据、预训练模型、代码的位置都发生了改变,所以要改变相应的引用数据位置
  • config文件类的路径修改
  • 还需要将train.py,model=model.float()改为model=model.half(),加快模型训练

3.3.2 训练脚本

  • 命令
python train.py
  • 执行结果
  • 资源监控
  • 耗时
  • 1h20min

3.4 模型预测

  • 注意修改inference.py脚本里模型的路径
  • 结果展示

3.5 模型下载本地实现预测

3.5.1 SSH配置

  • 进入 “平台设置” 页面
  • 登录平台。
  • 下拉右上角账户处,选择 平台设置

  • 点击平台设置

  • 平台设置 页面的 SSH Key 处,您可管理 密码凭证秘钥凭证(SSH Key)。

image-20231206224843274

注意:需要自己设定用户名和密码、ssh key自动生成即可

  • 在具体项目中选择 开发,进入 开发环境实例 页 获取开发环境的 ssh 连接串用于连接开发环境。
  • 注意:在修改SSH配置中,选择开启,然后再启动环境

image-20231206225305759

注意只要进入开发环境,就会产生费用,为了节省资源,可以将实例规格进行减配,节省算力

  • 启动环境后,出现ssh连接串

image-20231206230009232

3.5.2 终端操作连接云服务

  • 复制ssh连接串,进行修改
ssh -p 30022 itheima@root@ssh-736af97802ac911f1b7f454489821925.swwutgwduthw@ssh.virtaicloud.com

主机名ssh.virtaicloud.com

端口号30022

用户名itheima@root@ssh-736af97802ac911f1b7f454489821925.swwutgwduthw@
  • 获取模型保存路径
/gemini/code/checkpoints/ptune/model_best
  • 将模型下载到本地桌面
  • 命令
scp -p 30022 -r itheima@root@ssh-736af97802ac911f1b7f454489821925.swwutgwduthw@ssh.virtaicloud.com:/gemini/code/checkpoints/ptune/model_best ~/Desktop

image-20231206231700271