PaddleX客户端常见问题

1. 训练出错,提示『训练任务异常中止,请查阅错误日志具体确认原因』?

请按照以下步骤来查找原因

  • 1.首先根据提示,找到错误日志,根据日志提示判断原因
  • 2.如无法确定原因,测a)尝试重新训练,看是否能正常训练; b)调低batchsize(同时按比例调低学习率)排除是否是显存不足原因导致
  • 3.如第2步仍然失败,请前往GitHub提ISSUE,a) 描述清楚问题 b) 贴上训练参数截图 c) 附上错误日志 https://github.com/PaddlePaddle/PaddleX/issues
  • 4.如无Github帐号,则可加QQ群1045148026在线咨询工程师(咨询时请附上出错日志)

2. 没有使用GPU,使用CPU,错误日志仍然提示”cuda error”

部分Windows机型由于GPU型号或驱动较老,导致训练时无法使用GPU,还会导致使用不了CPU,针对此情况,可采取如下方式解决

  • 1.在PaddleX客户端安装目录下,删除”paddle”文件夹
  • 2.下载paddlepaddle-cpu(压缩文件可在百度网盘下载,提取码iaor,约57M),下载解压后,将目前中的paddle文件夹拷贝至PaddleX客户端安装目录下即可
  • 3.重新启动PaddleX客户端,替换后客户端仅支持使用CPU训练模型

3. 如何升级PaddleX客户端

PaddleX客户端目前需用户手动下载最新版升级,旧版本可直接删除原安装目录即可。升级前请备份好工作空间下的3个workspace.*.pb文件,避免升级过程可能导致项目信息丢失。

PaddleX更新历史和下载地址: https://www.paddlepaddle.org.cn/paddlex/download

4. 如何卸载PaddleX客户端

客户端安装本质只是解压文件到相应目录,因此卸载直接删除安装目录和桌面快捷方式即可。

5. 使用客户端训练检测模型在测试图片中出现很多目标框,甚至同一物体上出现多个目标框

目标检测模型和实例分割模型,在模型预测阶段,会将所有可能的目标都输出,对于输出,我们需要可以按如下方式来处理

  • 1.观察预测出来的各个目标框,各框上应该还同时包含相应框的置信度分数
  • 2.设定一个threshold,过滤掉低置信度的目标框 上面两个步骤,在客户端的评估界面,我们可以手动输入threshold后,重新再预测;而对于在实际使用,例如Python预测部署,则根据得到结果中的’score’进行过滤

6. 使用CPU训练时,如何设置CPU_NUM多CPU卡进行训练

Windows平台上由于缺少NCCL库,无法使用多GPU或多CPU训练。而对于v1.1.5版本及以下版本,当前无法设置多CPU进行训练(v1.1.5版本及以下版本,请勿在环境变量中设置CPU_NUM,可能会导致无法使用CPU进行模型训练)

7. 如何查看GPU的使用情况

Windows/Linux上都可以在打开命令终端后(Windows为CMD命令行)后,输入nvidia-smi命令查看GPU使用情况。不建议使用其它方式(如任务管理器等)。如若提示此命令不存在,可在网上搜索相应解决方法。