AI训练平台-项目信息与数据分析、数据增强

AI 训练平台

AI 训练平台能够快速构建和优化分类、检测、实例分割等 AI 模型,实现 AI 视觉应用。

训练2

项目信息

在【项目信息】页面,你可以修改【项目名称】,【数据集路径】,【工作目录】。

下面的设备信息可以看到该设备的 CPU、GPU、内存大小等信息。

数据分析

加载数据集

首次创建的项目,需要先点击一次【加载数据集】,得到类别信息,因为模型初始化需要类别数量。

我们在右边的表格中可以看到类别列表,每个类别的数量,以及占整个数据集的比例。

图像分布

除了类别分布,我们有时还会关注图像尺寸的大小,在下方可以【加载尺寸分布】。一般工业项目的尺寸都是固定的,如:

如果是在互联网上爬取的图片,尺寸分布会比较离散:

数据增强

每个项目会有一个默认的数据增强。

检测默认的数据增强为调整图像大小(Resize):640X640,分类默认的数据增强为调整图像大小(Resize):224

可根据数据集的特性、任务目标去设置数据增强,目前支持添加的数据增强类型有:调整图像大小、随机裁剪、随机旋转、随机翻转、随机调整亮度、随机调整对比度、随机JPG编码等数据增强。

选择合适的数据增强

  • 随机裁剪可以增加模型的泛化性能,减少过拟合,裁剪比例在原图的80%左右。
  • 随机翻转适用于分类和检测任务,但某些场景可能不适用,比如文字检测不适合使用随机翻转,避免把6翻转为9。
  • 随机旋转可以增加模型的泛化性,需要设置合适的范围,可以多刷新几次,检查增强后的图像是否合理。
  • 随机调整亮度、对比度,适用于光照变化大的场景。