PaddleX模型库

图像分类模型

表中模型准确率均为在ImageNet数据集上测试所得,表中符号-表示相关指标暂未测试,预测速度测试环境如下所示:
  • CPU的评估环境基于骁龙855(SD855)。
  • GPU评估环境基于T4机器,在FP32+TensorRT配置下运行500次测得(去除前10次的warmup时间)。

移动端系列

模型 模型大小 SD855 time(ms) bs=1 Top1准确率(%) Top5准确率(%)
MobileNetV1 17.4MB 32.523048 71.0 89.7
MobileNetV2 15.0MB 23.317699 72.2 90.7
MobileNetV3_large 22.8MB 19.30835 75.3 93.2
MobileNetV3_small 12.5MB 9.2745 68.2 88.1
MobileNetV3_large_ssld 22.8MB 19.30835 79.0 94.5
MobileNetV3_small_ssld 12.5MB 6.5463 71.3 90.1
ShuffleNetV2 10.2MB 10.941 68.8 88.5

其他系列

模型 模型大小 GPU time(ms) bs=1 Top1准确率(%) Top5准确率(%)
ResNet18 46.2MB 1.45606 71.0 89.9
ResNet34 87.9MB 2.34957 74.6 92.1
ResNet50 103.4MB 3.47712 76.5 93.0
ResNet101 180.4MB 6.07125 77.6 93.6
ResNet50_vd 103.5MB 3.53131 79.1 94.4
ResNet101_vd 180.5MB 6.11704 80.2 95.0
ResNet50_vd_ssld 103.5MB 3.53131 82.4 96.1
ResNet101_vd_ssld 180.5MB 6.11704 83.7 96.7
DarkNet53 167.4MB - 78.0 94.1
Xception41 109.2MB 4.96939 79.6 94.4
Xception65 161.6MB 7.26158 80.3 94.5
DenseNet121 33.1MB 4.40447 75.7 92.6
DenseNet161 118.0MB 10.39152 78.6 94.1
DenseNet201 84.1MB 8.20652 77.6 93.7
HRNet_W18 21.29MB 7.40636 76.9 93.4
AlexNet 244.4MB - 56.7 79.2

目标检测模型

表中模型精度BoxAP通过evaluate()接口测试MSCOCO验证集得到,符号-表示相关指标暂未测试,预测时间在以下环境测试所的:
  • 测试环境:
    • CUDA 9.0
    • CUDNN 7.5
    • PaddlePaddle v1.6
    • TensorRT-5.1.2.2
    • GPU分别为: Tesla V100
  • 测试方式:
    • 为了方便比较不同模型的推理速度,输入采用同样大小的图片,为 3x640x640。
    • Batch Size=1
    • 去掉前10轮warmup时间,测试100轮的平均时间,单位ms/image,包括输入数据拷贝至GPU的时间、计算时间、数据拷贝至CPU的时间。
    • 采用Fluid C++预测引擎,开启FP32 TensorRT配置。
    • 测试时开启了 FLAGS_cudnn_exhaustive_search=True,使用exhaustive方式搜索卷积计算算法。
模型 模型大小 预测时间(ms/image) BoxAP(%)
FasterRCNN-ResNet18-FPN 173.2MB - 32.6
FasterRCNN-ResNet50 136.0MB 146.124 35.2
FasterRCNN-ResNet50_vd 136.1MB 144.767 36.4
FasterRCNN-ResNet101 212.5MB 150.985 38.3
FasterRCNN-ResNet50-FPN 167.7MB 24.758 37.2
FasterRCNN-ResNet50_vd-FPN 167.8MB 25.292 38.9
FasterRCNN-ResNet101-FPN 244.2MB 30.331 38.7
FasterRCNN-ResNet101_vd-FPN 244.3MB 29.969 40.5
FasterRCNN-HRNet_W18-FPN 115.5MB - 36
PPYOLO 329.1MB - 45.9
YOLOv3-DarkNet53 249.2MB 20.252 38.9
YOLOv3-MobileNetV1 99.2MB 11.834 29.3
YOLOv3-MobileNetV3_large 100.7MB - 31.6
YOLOv3-ResNet34 170.3MB 14.125 36.2

实例分割模型

表中模型精度BoxAP/MaskAP通过evaluate()接口测试MSCOCO验证集得到,符号-表示相关指标暂未测试,预测时间在以下环境测试所的
  • 测试环境:
    • CUDA 9.0
    • CUDNN 7.5
    • PaddlePaddle v1.6
    • TensorRT-5.1.2.2
    • GPU分别为: Tesla V100
  • 测试方式:
    • 为了方便比较不同模型的推理速度,输入采用同样大小的图片,为 3x640x640。
    • Batch Size=1
    • 去掉前10轮warmup时间,测试100轮的平均时间,单位ms/image,包括输入数据拷贝至GPU的时间、计算时间、数据拷贝至CPU的时间。
    • 采用Fluid C++预测引擎,开启FP32 TensorRT配置。
    • 测试时开启了 FLAGS_cudnn_exhaustive_search=True,使用exhaustive方式搜索卷积计算算法。
模型 模型大小 预测时间(毫秒) BoxAP (%) MaskAP (%)
MaskRCNN-ResNet18-FPN 189.1MB - 33.6 30.5
MaskRCNN-ResNet50 143.9MB 159.527 38.2 33.4
MaskRCNN-ResNet50-FPN 177.7MB 83.567 38.7 34.7
MaskRCNN-ResNet50_vd-FPN 177.7MB 97.929 39.8 35.4
MaskRCNN-ResNet101-FPN 253.6MB 97.929 39.5 35.2
MaskRCNN-ResNet101_vd-FPN 253.7MB 97.647 41.4 36.8
MaskRCNN-HRNet_W18-FPN 120.7MB - 38.7 34.7

语义分割模型

以下指标均在MSCOCO验证集上测试得到,表中符号-表示相关指标暂未测试。
模型 模型大小 预测时间(毫秒) mIoU(%)
DeepLabv3_MobileNetV2_x1.0 14.7MB - -
DeepLabv3_Xception65 329.3MB - -
UNet 107.3MB - -
以下指标均在Cityscapes验证集上测试得到,表中符号-表示相关指标暂未测试。
模型 模型大小 预测时间(毫秒) mIoU(%)
DeepLabv3_MobileNetV3_large_x1_0_ssld 9.3MB - 73.28
DeepLabv3_MobileNetv2_x1.0 14.7MB - 69.8
DeepLabv3_Xception65 329.3MB - 79.3
HRNet_W18 77.3MB - 79.36
Fast-SCNN 9.8MB - 69.64