基于AnalyticDB Ray实现图片打标和模型微调
更新时间:
在互联网游戏行业中,图片打标识别是一种常见需求,例如对角色、装备、道具等图片打标,应用于游戏陪玩助手、内容安全审核、美术资产管理与检索等业务场景。在图片打标实现中,面临图片处理、识别模型微调等开发工作,包含对原始图片的泛化增强、模型的微调等,以提高识别准确率。本文介绍基于AnalyticDB Ray的解决方案,旨在提供一套高效、精准的图片打标与模型微调一体化流程。
产品方案
阿里云基于AnalyticDB Ray+Lance,提供从多模态图片存储、多模态数据处理、分布式微调和评测到推理的一站式解决方案,具体流程如下:
数据上传与存储:图片数据集上传存储在AnalyticDB湖中,可识别增量上传图片,自动触发下游处理流程;支持冷存和高性能存储,提供不同读写带宽性能。
数据处理:通过AnalyticDB Ray Data实现源数据格式的高效加载和转换,将图片统一转换为Lance格式,减少远程IO。
模型微调:基于Ray Train可快速部署LLaMA-Factory微调框架,底层GPU资源灵活调度。
模型推理:基于Ray Serve部署推理服务,进行图片批量推理,支持自定义算子开发。
客户收益
一站式解决方案:实现从数据标注到模型微调的一站式方案。
提升开发效率与识别准确率:AnalyticDB Ray提供端到端的工具链,涵盖数据处理、微调和推理,明显提升开发效率,图片识别准确率达90%以上,LLaMA-Factory on Ray分布式微调效率提升3到5倍。
性能优化:Ray+Lance实现分布式数据打标和增量更新(新增列),对比Parquet速度提升193%。
该文章对您有帮助吗?