版本发布
V1.10版本(2025.4.21)
👉版本更新概览
- 新增 YOL0 小模型训练功能。
- 优化 AI 工作助手用户体验。
- 支持“中训边推”服务,数据中心集中训练,批量下发模型至边缘终端进行推理。
- 支持“集成手动部署模型”,扩展平台模型的管理范围。
- 支持“集群管理”,管理智算集群,查询集群资源使用情况。
V1.9版本(2025.3.31)
👉版本更新概览
- 新增 YOLO 训练功能。
- AI助手输入体验提升了,并修复了多个Bug。
- 为 rerank 模型增加文档。
V1.8版本(2025.2.28)
👉版本更新概览
- 新增AI助手,支持文件问答、知识库问答,知识库共享。
- 增加忘记密码的功能。
V1.7版本(2025.1.21)
👉版本更新概览
- 新增数据标注中心,支持计算机视觉、自然语言、音频、视频等主流场景的数据标注。
- 支持本地知识库的上传、解析、检索测试,以及通过API上传知识。
- 支持知识库、提示词和模型快速构建RAG应用,并通过api或网页接入业务
- 支持通过工作流构建智能体应用。
V1.6版本(2024.12.18)
👉版本更新概览
- 支持模型微调、微调监控。
- 支持下载微调后的成果物
- 支持微调后的模型推理
- 支持模型推理算力指标,用户选择模型和算力更方便
- 支持GPU资源纳管、主机明细和业务支撑查询
V1.5版本(2024.10.31)
👉版本更新概览
- 支持平台注册及双因子认证登录。
- 支持监管人员通过算力中心数据查询
- 支持模型发布共享,用户通过 Api-Key 调用时可以统计到 token 使用量
- 支持调用统计
V1.4版本(2024.08.31)
👉版本发布预告
- 🚀1.支持提供统一具有鉴权的推理api接口,完成提供RAG应用、公司内行业部门模型应用以及RAG OS等第三方平台服务的闭环。
- 🚀2. VLLM框架优化升级,优化推理监控
- 🚀3.支持通过工作构建RAG应用,实现多模型组合应用,提升推理精准度。
V1.3版本(2024.07.17)
👉版本更新概要
- ✅1.支持计费计费管理,根据计量计费规则,生成订单,计费,具备充值、订单生成、订单明细、扣费、账单等功能。
- ✅2.支持英伟达推理闭环,具备调度英伟达资源调度的推理能力。
- ✅3.优化推理闭环的工作流,具备Stable Diffusion的推理和监控的能力。
- ✅4.支持智算资源自动化调度,构建自动调度算法。
- ✅5.支持自动化部署maas平台,优化部署架构。
V1.2版本(2024.04.28)
👉版本更新概要
- ✅1.支持用户权限管理
- ✅2.支持GPU厂家镜像管理
- ✅3.支持模型管理
- ✅4.支持数据集管理
- ✅5.支持基于k8s的分布式推理任务管理,包括寒武纪、登临、天数智芯三个厂商的chatglm3,baichuan2,llama2三个模型。
- ✅6.支持基于nginx双层负载均衡的模型推理及混合卡推理。
- ✅7.支持推理输入和输出内容审查,需要接入百度的内容审查接口
- ✅8.支持推理监控,包含推理资源的占用情况以及推理过程数据。
- ✅9.完成平台推理功能测试和智算GPU服务器测试。