AI 训练平台
AI 训练平台能够快速构建和优化分类、检测、实例分割等 AI 模型,实现 AI 视觉应用。
项目信息
在【项目信息】页面,你可以修改【项目名称】,【数据集路径】,【工作目录】。
下面的设备信息可以看到该设备的 CPU、GPU、内存大小等信息。
数据分析
加载数据集
首次创建的项目,需要先点击一次【加载数据集】,得到类别信息,因为模型初始化需要类别数量。
我们在右边的表格中可以看到类别列表,每个类别的数量,以及占整个数据集的比例。
图像分布
除了类别分布,我们有时还会关注图像尺寸的大小,在下方可以【加载尺寸分布】。一般工业项目的尺寸都是固定的,如:
如果是在互联网上爬取的图片,尺寸分布会比较离散:
数据增强
每个项目会有一个默认的数据增强。
检测默认的数据增强为调整图像大小(Resize):640X640,分类默认的数据增强为调整图像大小(Resize):224
可根据数据集的特性、任务目标去设置数据增强,目前支持添加的数据增强类型有:调整图像大小、随机裁剪、随机旋转、随机翻转、随机调整亮度、随机调整对比度、随机JPG编码等数据增强。
选择合适的数据增强
- 随机裁剪可以增加模型的泛化性能,减少过拟合,裁剪比例在原图的80%左右。
- 随机翻转适用于分类和检测任务,但某些场景可能不适用,比如文字检测不适合使用随机翻转,避免把6翻转为9。
- 随机旋转可以增加模型的泛化性,需要设置合适的范围,可以多刷新几次,检查增强后的图像是否合理。
- 随机调整亮度、对比度,适用于光照变化大的场景。