# wl

**Repository Path**: lfs-org/wl

## Basic Information

- **Project Name**: wl
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 1
- **Created**: 2024-10-18
- **Last Updated**: 2026-03-28

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

整体目标	"1. CI端到端时间，时间与GPU一致，p90挑战60min
2. CI集群能力，提供与GitHub 一致的能力，新集群
3. 资源利用率大于30%，支持蓝区实验室资源接入
4. 新社区接入：支持github action，buildkite两大主要"			Q1	Q2	Q3	Q4
				"排队时间各项目减少到5min以内
通过资源池化和用例分层，资源利用率达到30%
支持buildkite CI系统，1天内可接入新社区"	"编译时间减少到10min以内
依赖安装时间减少到10min以内"	"支持精准测试，实现用例执行时间小于60min
支持资源池HA，多集群接入同一个项目，利用率提升30%"	
具体指标	子目标/p90	措施拆解	计划	进展		责任人	备注
CI排队时间	排队时间（p90<15min），时间低于GPU	"建设统一资源池，不同项目之间可互相借用，实现各项目潮汐调度，弹性伸缩，同时基于队列资源管理调度，保障公平性。
"	330	"1.a2资源池已完成
"	done	文浪	
				2.队列资源管理调度配置完成	done	文浪	
	资源池支持 1800/日任务执行			3.a3资源池正在建设中，待华为云资源到位	进行中	文浪	存在风险，华为云资源到位时间暂未确定
CI准备时间	CI python依赖下载时间<5min	CI集群内置Nginx缓存服务，覆盖debain、pypi、pytorch等来源	630	已完成	done	文浪	
	各项目接入依赖下载缓存	通过修改workflow，接入依赖下载缓存		新接入的tilenang-ascend待接入依赖下载缓存	进行中	文浪	
	模型加载时间<5min	当前是通过网络存储加载		在sglang中时间较长，加载时长根因分析中	进行中	陶飞虎	
	编译时间减少到10min以内	"通过sccache提供分布式编译缓存
sccache不支持bisheng-compiler，需适配"	630	待启动	进行中	陶飞虎	
CI执行时间	NPU端到端时间持平GPU	重点优化full用例，通过精准触发减少时间	930	待启动	待启动	鲁卫军	
资源利用率	NPU>30%	基于binpack的资源利用率优化调度，减少资源碎片化	430	已完成	done	文浪	
	集群高可用改造	由于集群分散会长期存在，分析github controller 的HA模式，能够实现多个集群共同接入一个项目	930	待启动	进行中	李超然	
	10行代码启动一个多机任务	多机action设计，支持业界主流的多机集群调度方案，支持各项目多机CI易用性提升	630	"vllm/sglang等已实现基于volcano的多机方案
veRL需要ray集群，待分析方案"	进行中	陶飞虎	
新社区接入	triton-ascend	CI对接到triton-ascend代码仓	310		阻塞	文浪	
	tilelang-ascend	CI对接到triton-ascend代码仓	306	已完成	done	文浪	
	veRL对接蓝区资源池	蓝区8台A2对接veRL	316	已完成	done	文浪	
	vllm-omni	对接vllm-project/vllm-omni	330	buildkite方案调研中，初步分析可行	进行中	吴鹤俊