英特尔“芯”AI,赋能云边端|第二期:用英特尔 Arc 系列显卡高效训练 YOLO 和 Qwen-7B

在 AI 驱动的 2025 年,模型训练是企业数字化转型的关键一步。然而,高昂的硬件成本和复杂的技术门槛让许多中小企业望而却步。传统 GPU(如 Nvidia H100)动辄数千美元的单价,以及高功耗带来的维护成本,成为 AI 普及的瓶颈。上海亿琪软件有限公司推出的 YiCoreAI 平台,通过英特尔 Arc 系列显卡(如 Arc A770/B580)为核心的 YiAISTUDIO 模块,提供了一个低成本、高效率的训练解决方案,适配零售、安防、物流、教育等多样化场景。
目录
演示视频挑战:高成本与低效率
YiAISTUDIO:低成本、高效率的训练解决方案
硬件支持:Arc A770 的新颖性
软件优化:IPEX 和 IPEX-LLM 的加持
数据准备:Label Studio 的支持
训练成果
Kubeflow 的强大作用:提升训练管理效率
通用性与扩展性
亿琪软件的技术积累
演示视频
英特尔“芯”AI,赋能云边端 第二期
挑战:高成本与低效率
中小企业在 AI 训练上面临两大难题:成本高:传统 GPU 解决方案(如 Nvidia RTX 3060 约 500 美元,H100 更高达 5000 美元)让预算有限的企业难以负担。
效率低:复杂的数据准备和模型优化流程需要专业团队支持,延长开发周期。
YiAISTUDIO:低成本、高效率的训练解决方案
YiAISTUDIO 是 YiCoreAI 平台的核心训练模块,利用英特尔 Arc 系列 GPU 和 Xeon CPU,结合 PyTorch、IPEX 和 IPEX-LLM 工具,实现了高效模型训练。我们以 YOLOv8/v11(对象检测) 和 Qwen-7B(智能问答) 两个通用模型为例,展示其能力。
硬件支持:Arc A770 的新颖性
英特尔 Arc A770 GPU 是一款性价比极高的显卡,单价仅 300 美元,却能提供接近 Nvidia RTX 3060 的性能(训练速度达 250 images/sec)。结合 Xeon CPU 的计算能力,YiAISTUDIO 在成本和性能之间找到完美平衡:成本:相比传统方案(5000 美元/节点),YiCoreAI 单节点成本仅 2000 美元,节省 20-60%。
性能:支持 FP16 混合精度训练,显著提升计算效率。
软件优化:IPEX 和 IPEX-LLM 的加持
亿琪软件成功将 IPEX 容器引入到 Kubeflow亿琪软件成功将 IPEX 容器引入到 Kubeflow,并将其与 YiAISTUDIO 模块相结合,实现了高效的模型训练。
IPEX xpu - 作为 PyTorch 容器实现训练
IPEX xpu-jupyter - 作为 Jupyter Notebook 开发环境
IPEX(Intel® Extension for PyTorch):通过 FP16 混合精度和英特尔硬件优化,加速 YOLO 模型训练,COCO 数据集上 mAP 0.5:0.9 达 0.45。
IPEX-LLM(原 BigDL-LLM):针对大语言模型优化,支持 INT4 量化,降低 Qwen-7B 内存占用 50%,训练后问答延迟 <100m****r/>
数据准备:Label Studio 的支持
YiAISTUDIO 集成 Label Studio 进行数据标注,支持多种数据类型:YOLOv8/v11:基于 COCO 数据集(80 类,12 万张图像)标注目标检测数据。
Qwen-7B:标注问答数据集(10 万条问答对),覆盖通用场景。
其他:支持图像、文本、传感器数据,满足多样化需求。
同时,我们还采用了自动化数据标注工具,如 Label Studio 对接 OpenVINO 驱动的模型进行自动标注,提高效率。
训练成果
YOLOv8/v11:训练 50 个 epoch,batch size 16,mAP 0.5:0.9 达 0.45,适用于零售库存管理、安防监控等场景。Qwen-7B:训练 30 个 epoch,batch size 4,问答延迟 <100ms,可用于客服、教育问答等领域。
Kubeflow 的强大作用:提升训练管理效率
亿琪软件成功将 英特尔 Arc 系列显卡引入到 Kubeflow
亿琪软件成功将 英特尔 Arc 系列显卡引入到 Kubeflow,并将其与 YiAISTUDIO 模块相结合,实现了高效的模型训练。
Intel i915 驱动支持 - gpu.intel.com/i915
Intel Xe 驱动支持 - gpu.intel.com/xe
Kubeflow 是 YiCoreAI 平台中管理训练流程的关键工具,通过其模块化功能优化了 YiAISTUDIO 的工作流:
Model Registry:集中存储训练好的 YOLOv8/v11 和 Qwen-7B 模型,版本管理支持快速回滚和复现。
Trainer:自动化训练任务,结合 IPEX 和 Arc A770 GPU,动态调整超参数,优化训练性能。
Pipeline:定义端到端工作流,从 Label Studio 标注数据到模型训练(YOLOv8 mAP 0.45),一键执行。
Model Serving:将训练模型部署至 YiCONNECT,分发至边缘设备,减少人工干预。 通过 Kubeflow,训练流程自动化程度提升 30%,显著缩短开发周期。
通用性与扩展性
YiAISTUDIO 不仅支持 YOLOv8/v11 和 Qwen-7B,还可扩展至其他模型(如 ResNet、BERT),适配多种数据类型(图像、文本)。开发者可通过调整参数,满足不同行业需求,例如:零售:YOLOv8/v11 检测货架商品。
教育:Qwen-7B 提供智能问答支持。
亿琪软件的技术积累
作为 EdgeX 社区成员,亿琪软件在数据处理和模型训练方面有深厚积累。YiAISTUDIO 结合 YiSTUDIO(数据标注,依托 Label Studio)、YiEDGE(端云协同),并通过 Kubeflow 集成管理能力。
0个评论