云锦微智能科技
认识 Vision-T 训练平台(VT-Station)
1、平台简介
Vision-T 训练平台 2.0 是面向行业个性化场景算法的一站式模型定制平台,支持私有化部署,可在客户本地电脑安装,保障数据和模型的本地化存储,避免数据泄露风险。平台提供友好易用的操作界面,即使是零算法开发基础的用户,也能轻松完成从数据准备到模型部署的全流程操作,助力企业快速构建 AI 算法生产能力,加速 AI 应用落地。
2、核心功能概览
- 数据标注:支持图像检测、分类、分割等多种标注类型,提供自动标注(基于预置模型或已有模型)和手动标注功能。自动标注可提升效率,手动标注支持精细操作,满足不同场景需求。
- 模型训练:涵盖自动训练和专业训练模式。自动训练提供便捷的流程,专业训练支持选择算法框架(如 Pytorch、Tensorflow 等),适配不同用户的训练需求,支持图像数据类型的模型训练。
- 模型部署:支持将训练好的模型一键部署到边缘计算设备,实现离线推理,方便在各类终端设备上应用。
3、工作流程总览
1. 数据准备:收集图像数据,通过创建数据集、导入数据(支持本地数据集、平台已有数据集、视频流导入)等操作管理数据。
2. 数据标注:对数据进行预处理(去模糊、剪裁、旋转、镜像等),然后通过自动或手动标注为数据添加标签。
3. 模型训练:创建模型,选择部署方式、算法网络和数据集,启动训练,平台自动评估模型效果。
4. 模型发布与部署:发布审核通过的模型,将其部署到边缘设备,完成 AI 项目落地。
小贴士:特别适合的行业场景
o 工业领域:用于产品缺陷检测、生产流程监控等,本地化部署保障数据安全,快速实现产线智能化。
o 安防行业:支持人脸人体检测、行为识别等,满足安防场景对实时性和数据隐私的高要求。
智能硬件:方便将模型部署到边缘设备,如智能摄像头、工业机器人等,提升设备智能化水平。
界面导览与基本概念
1、主界面介绍
- 系统管理:包含资源管理(查看 CPU、内存、GPU 等系统资源使用情况)、角色管理(设置数据中心和模型中心权限)、账号管理(管理用户账号,进行禁用、启用、重置密码等操作)。
- 数据中心:用于数据集管理,包括创建数据集、新增数据集版本、导入数据、预处理、标注(自动 / 手动)、建立测试集、发布数据集等功能。
- 模型中心:支持创建模型、新增训练(选择部署方式、算法网络、数据集)、模型验证、模型发布等操作,管理模型训练全流程。
- 模型部署:对发布后的模型进行管理,支持将模型部署到边缘设备,进行升级等操作。
- 设备管理:添加、编辑设备,支持探索设备或手动输入设备 IP、密钥等信息,管理边缘计算设备。
2、关键概念解释
- 项目:在平台中,项目以数据集和模型为核心,围绕特定 AI 任务(如图像检测)组织数据、标注、训练和部署等操作,是实现 AI 应用的基本单元。
- 数据集:存储图像数据的集合,可包含多个版本,每个版本可继承历史数据并独立操作,支持图像检测、分类、分割等标注类型。
- 标签:用于描述数据特征,如图像检测中的物体类别、图像分类的类别名称等,是数据标注和模型训练的关键信息。
- 模型:通过训练数据集得到的算法模型,包含模型网络(如 Yolov4、Yolov5 等)、部署方式(专有硬件一体机、GPU 服务器等)等信息,是 AI 应用的核心组件。
- 任务类型:平台支持的 AI 任务类型包括图像检测(定位并识别图像中的物体)、图像分类(将图像归类到特定类别)、图像分割(对图像中的不同区域进行像素级分类)。
小贴士:如何快速找到需要的功能
- 菜单导航:通过左侧菜单栏的系统管理、数据中心、模型中心、模型部署、设备管理等模块,快速定位到相应功能页面。
- 搜索功能:在数据中心、模型中心等页面,可通过搜索框输入数据集、模型名称等关键词,快速查找目标内容。
- 操作指引:首次使用时,注意界面中的提示信息和操作按钮(如 “新增”“详情” 等),按照流程引导进行操作。
创建您的第一个 AI 项目
1. 创建数据集
- 操作路径:数据中心 → 数据集管理 → 创建数据集
- 配置项:
- 名称:输入项目名称(如 “安全帽检测”)。
- 数据类型:选择 “图像”。
- 标注类型:根据任务选择 “图像检测”“图像分类” 或 “图像分割”。
- 存储路径:默认本地存储,支持自定义路径。
2. 导入数据
- 点击「导入数据集」→「本地数据集」,选择压缩包(支持 ZIP/TAR/RAR 格式,单包≤5GB)。
- 若数据已标注,需按平台模板(VOC 格式)整理标签文件。
3. 手动标注
- 图像检测:
a. 点击图片进入标注界面,选择 “新增标签”(如 “安全帽”“未戴安全帽”)。
b. 使用矩形框标注目标
c. 标注完成后点击 “保存”,系统自动统计标注进度。
- 图像分类:
a. 选择图片,点击标签箭头将其归类(如 “站立”“跌倒”)。
4. 建立测试集
本步骤非必须,如果没有添加测试集,系统会自动划分 10% 数据为测试集
- 操作路径:数据集详情 → 选择已标注数据 → 添加至测试集
- 比例建议:测试集占比 10-30%(如总数据量 1000 张,测试集选 200 张)。
5. 发布数据集
o 操作路径:数据集详情 → 发布
o 审核流程:
a. 提交发布申请后,系统管理员账号将收到审核通知。
b. 审核通过后,数据集状态变为 “已发布”,可用于模型训练。
模型训练与优化
1. 创建模型
- 操作路径:模型中心 → 创建模型
- 配置项:
- 模型名称:输入名称(如 “安全帽检测模型”)。
- 任务类型:选择与数据集一致的类型(如 “图像检测”)。
2. 新增训练
- 操作路径:模型详情 → 新增训练
- 关键步骤:
a. 部署方式:选择 “专有硬件一体机” 或 “GPU 服务器”。
专有硬件一体机支持 ZN04 和 ZN16 两个平台,训练完成后会自动量化并生成平台相关升级包。GPU服务器仅生成 onnx 模型用于平台部署和测试。
b. 算法网络:
- 检测模型 可选 “Yolov8s” 或 "Yolov5s” 等 yolo 系列检测模型。
- 分类模型:可选 ResNet18、MobileNetV2 等分类模型。
c. 数据集选择:勾选已发布的数据集(如 “安全帽检测 V1”)。
d. 数据增广:
- 默认配置:系统自动应用旋转、缩放等增强。
- 手动配置:自定义增强策略(如添加高斯噪声)。
3. 启动训练
- 自动训练:点击 “开始训练”,系统自动分配资源并生成模型,训练时长约数小时至数天(取决于数据量和硬件)。
4. 模型验证
- 操作路径:模型中心 → 模型验证
- 步骤:
a. 上传验证图像(支持 JPG/PNG 格式)。
b. 选择模型版本,点击 “开始验证”。
c. 查看评估指标:
- 图像检测:AP 值(平均精度)、MAE(平均绝对误差)。
- 图像分类:准确率、混淆矩阵。
5. 模型发布
- 操作路径:模型详情 → 发布
- 审核流程:
a. 提交发布申请后,系统管理员审核模型性能(如 AP≥0.9)。
b. 审核通过后,模型状态变为 “已发布”,可部署至边缘设备。
实战指南目录
1. 模型部署
- 操作路径:模型部署 → 选择模型 → 下载升级包
- 设备验证:登录设备,进入"设置"->"维护"页面,在"系统升级"部分,选择”点击上传“, 选择刚才下载到本地的升级包, 点击"升级"就可以了。系统重启后,在"智能分析"页面就可以看到新训练的模型了
小贴士:项目命名规范建议
- 清晰明确:名称应直接反映项目的核心任务和应用场景,避免使用模糊或过于简略的词汇。
- 唯一性:在平台中项目名称需全局唯一,可通过添加版本号、场景关键词等方式确保唯一性,如 “安全帽检测项目_202407”。
- 结构化:采用 “任务类型 - 应用场景 - 版本” 的格式,例如 “图像检测 - 工地安全帽 - V1”,方便后期项目管理和检索。
通过以上步骤,您可以顺利创建第一个 AI 项目,后续可根据流程进行数据导入、标注、训练和部署等操作,逐步完成 AI 应用的开发和落地。
实战指南目录
开篇:零代码构建专属AI模型
VT-Station实战指南开篇点击查阅:
VT-Station实战指南:零代码构建专属AI模型(开篇)
第一章:基础入门 (Getting Started)
Recipe 1.1: 认识 VT-Station
o目标:了解 VT-Station 是什么,能做什么,核心优势。
o内容:平台简介,核心功能(标注、训练、部署)概览,工作流程总览。
o小贴士:VT-Station 特别适合哪些行业场景?
Recipe 1.2: 界面导览与基本概念
o目标:熟悉 VT-Station 的用户界面布局和常用术语。
o内容:主界面介绍(项目管理、数据集、模型、部署等区域),关键概念解释(项目、数据集、标签、模型、任务类型 - 如分类、检测)。
o小贴士:如何快速找到我需要的功能?
Recipe 1.3: 创建您的第一个 AI 项目
o目标:走通创建项目的基本流程。
o内容:如何新建项目,项目设置(名称、描述、任务类型选择)。
o小贴士:项目命名规范建议。
第二章:数据准备与标注 (Preparing Your Data)
Recipe 2.1: 导入您的数据
o目标:学会将不同来源的数据导入 VT-Station。
o内容:支持的数据格式(图片、视频?),从本地上传,从云存储导入(如果支持),数据集的组织方式。
o小贴士:导入前需要注意的数据整理事项。
Recipe 2.2: 理解不同的标注类型
o目标:了解何时使用何种标注工具。
o内容:分类标签、矩形框 (Bounding Box)、多边形 (Polygon)、关键点 (Keypoint) 等(根据 VT-Station 支持的功能选择),各自适用的场景解释。
Recipe 2.3: 实战:图像分类标注
o目标:掌握为图像打分类标签的操作。
o内容:打开标注界面,选择图片,添加/选择标签,批量操作技巧。
o小贴士:如何定义清晰、无歧义的分类标签?
Recipe 2.4: 实战:目标检测标注 (矩形框)
o目标:掌握使用矩形框标注目标物体。
o内容:选择矩形框工具,框选目标,为框选区域选择或输入标签,修改/删除标注框。
o小贴士:标注框应该多紧密?包含多少背景?
Recipe 2.5: 标注数据质量核查与管理
o目标:学习如何检查和提升标注数据质量。
o内容:检查标注一致性,查找漏标/错标,版本管理(如果支持),多人协作标注流程(如果支持)。
o小贴士:为什么高质量标注如此重要?"Garbage in, garbage out."
Recipe 2.6: 数据增强简介与应用
o目标:了解数据增强的作用,并使用平台提供的功能。
o内容:什么是数据增强(旋转、翻转、亮度调整等),为何需要它(增加数据量、提升模型鲁棒性),如何在 VT-Station 中配置数据增强策略。
第三章:模型训练 (Training Your Model)
Recipe 3.1: 选择合适的模型模板/类型
o目标:根据任务类型和数据情况选择合适的起点。
o内容:平台提供的预设模型/模板介绍(例如,通用分类模型、快速检测模型、高精度检测模型),选择建议。
o小贴士:新手该如何选择?
Recipe 3.2: 配置训练参数 (简化版)
o目标:了解关键训练参数的含义并进行基本配置。
o内容:解释最重要的几个参数(如训练时长/轮数 Epochs、批次大小 Batch Size),提供建议值或预设选项(如 "快速训练"、"均衡模式"、"追求高精度")。
o小贴士:首次训练建议使用默认或推荐设置。
Recipe 3.3: 启动与监控模型训练
o目标:学会开始训练并理解训练过程中的状态信息。
o内容:如何点击“开始训练”,查看训练日志,理解关键指标曲线(如 Loss 下降、Accuracy/mAP 上升)的简单含义。
o小贴士:训练需要多长时间?如何判断训练是否在正常进行?
Recipe 3.4: 理解训练结果报告
o目标:初步解读模型训练完成后的效果。
o内容:查看关键评估指标(准确率、召回率、mAP 等)的含义,了解模型的基本表现。
第四章:模型评估与优化 (Evaluating and Improving Your Model)
Recipe 4.1: 可视化模型预测结果
o目标:直观地查看模型在验证/测试数据上的表现。
o内容:使用平台的评估工具,查看模型预测的标注框/分类结果与真实标注的对比,找出模型容易出错的样本。
o小贴士:这是最直观了解模型好坏的方式。
Recipe 4.2: 深入解读评估指标
o目标:更详细地理解模型的性能。
o内容:混淆矩阵 (Confusion Matrix) 的解读(分类任务),精度 (Precision) 与召回率 (Recall) 的权衡(检测任务)。
o小贴士:没有完美的模型,关键是满足业务需求。
Recipe 4.3: 识别常见训练问题
o目标:了解模型可能遇到的问题及初步判断。
o内容:简单解释过拟合(模型只在训练数据上表现好)和欠拟合(模型没学好),如何通过训练曲线和评估结果初步判断。
Recipe 4.4: 优化技巧:增加或修正数据
o目标:学习通过改进数据来提升模型效果。
o内容:根据 Recipe 4.1 发现的错误样本,针对性地增加相似数据或修正错误标注,重新训练。
o小贴士:数据是提升模型效果最有效的手段之一。
Recipe 4.5: 优化技巧:调整训练参数
o目标:学习通过微调参数改进模型。
o内容:基于 Recipe 4.3 的判断,尝试调整训练时长、学习率(如果平台开放)等参数,重新训练。
o小贴士:参数调整通常需要多次尝试。
Recipe 4.6: 模型版本管理
o目标:管理不同次训练得到的模型。
o内容:如何保存、命名和比较不同版本的模型。
第五章:模型部署与应用 (Deploying Your Model)
Recipe 5.1: 理解部署选项
o目标:了解 VT-Station 支持的部署方式及其适用场景。
o内容:云端 API 部署、边缘设备部署等。
Recipe 5.2: 实战:一键部署为边缘设备
o目标:将训练好的模型发布为一个可供调用的服务。
o内容:选择要部署的模型,点击部署按钮,获取 API 地址和调用凭证。
o小贴士:部署前确认模型效果满足要求。
Recipe 5.3: 如何调用已部署的 API
o目标:学会向部署好的模型发送数据并获取预测结果。
o内容:提供简单的 API 调用示例代码(如 Python requests),解释输入数据格式和输出结果格式。
o小贴士:确保调用时的数据预处理与训练时一致(平台通常会自动处理)。
Recipe 5.4: 监控已部署模型的运行状态
o目标:了解模型服务的健康状况。
o内容:查看调用量、响应时间、错误率等基本监控信息(如果平台提供)。
第六章:进阶技巧与最佳实践 (Advanced Tips & Best Practices)
Recipe 6.1: 处理不均衡数据
o场景:某些类别的样本数量远多于其他类别。
o技巧:数据增强、重采样(如果平台支持)、特殊损失函数(平台内部可能已处理)。
Recipe 6.2: 利用主动学习/智能标注加速标注
o场景:数据量很大,如何高效标注?
o技巧:介绍主动学习概念,如何在 VT-Station 中使用该功能让模型辅助筛选需要优先标注的数据。
Recipe 6.3: 何时需要寻求外部专家帮助?
o场景:遇到难以解决的问题或效果瓶颈。
o技巧:设定合理预期,了解 VT-Station 的能力边界,何时考虑引入 AI 专家。
附录 (Appendix)
o术语表 (Glossary): 解释 Cookbook 中出现的关键 AI 和平台术语。
o常见问题解答 (FAQ): 汇总用户在使用过程中可能遇到的常见问题和解决方案。
获取帮助与支持: 如何联系 VT-Station 的技术支持或查找更多文档资源。