# wl **Repository Path**: lfs-org/wl ## Basic Information - **Project Name**: wl - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2024-10-18 - **Last Updated**: 2026-03-28 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 整体目标 "1. CI端到端时间,时间与GPU一致,p90挑战60min 2. CI集群能力,提供与GitHub 一致的能力,新集群 3. 资源利用率大于30%,支持蓝区实验室资源接入 4. 新社区接入:支持github action,buildkite两大主要" Q1 Q2 Q3 Q4 "排队时间各项目减少到5min以内 通过资源池化和用例分层,资源利用率达到30% 支持buildkite CI系统,1天内可接入新社区" "编译时间减少到10min以内 依赖安装时间减少到10min以内" "支持精准测试,实现用例执行时间小于60min 支持资源池HA,多集群接入同一个项目,利用率提升30%" 具体指标 子目标/p90 措施拆解 计划 进展 责任人 备注 CI排队时间 排队时间(p90<15min),时间低于GPU "建设统一资源池,不同项目之间可互相借用,实现各项目潮汐调度,弹性伸缩,同时基于队列资源管理调度,保障公平性。 " 330 "1.a2资源池已完成 " done 文浪 2.队列资源管理调度配置完成 done 文浪 资源池支持 1800/日任务执行 3.a3资源池正在建设中,待华为云资源到位 进行中 文浪 存在风险,华为云资源到位时间暂未确定 CI准备时间 CI python依赖下载时间<5min CI集群内置Nginx缓存服务,覆盖debain、pypi、pytorch等来源 630 已完成 done 文浪 各项目接入依赖下载缓存 通过修改workflow,接入依赖下载缓存 新接入的tilenang-ascend待接入依赖下载缓存 进行中 文浪 模型加载时间<5min 当前是通过网络存储加载 在sglang中时间较长,加载时长根因分析中 进行中 陶飞虎 编译时间减少到10min以内 "通过sccache提供分布式编译缓存 sccache不支持bisheng-compiler,需适配" 630 待启动 进行中 陶飞虎 CI执行时间 NPU端到端时间持平GPU 重点优化full用例,通过精准触发减少时间 930 待启动 待启动 鲁卫军 资源利用率 NPU>30% 基于binpack的资源利用率优化调度,减少资源碎片化 430 已完成 done 文浪 集群高可用改造 由于集群分散会长期存在,分析github controller 的HA模式,能够实现多个集群共同接入一个项目 930 待启动 进行中 李超然 10行代码启动一个多机任务 多机action设计,支持业界主流的多机集群调度方案,支持各项目多机CI易用性提升 630 "vllm/sglang等已实现基于volcano的多机方案 veRL需要ray集群,待分析方案" 进行中 陶飞虎 新社区接入 triton-ascend CI对接到triton-ascend代码仓 310 阻塞 文浪 tilelang-ascend CI对接到triton-ascend代码仓 306 已完成 done 文浪 veRL对接蓝区资源池 蓝区8台A2对接veRL 316 已完成 done 文浪 vllm-omni 对接vllm-project/vllm-omni 330 buildkite方案调研中,初步分析可行 进行中 吴鹤俊