1
1
apiVersion : mcad.ibm.com/v1beta1
2
2
kind : AppWrapper
3
3
metadata :
4
- name : unit-cmd-cluster
5
- namespace : default
4
+ name : mnisttest
5
+ namespace : opendatahub
6
6
spec :
7
7
priority : 9
8
8
resources :
@@ -18,23 +18,23 @@ spec:
18
18
memory : 8G
19
19
nvidia.com/gpu : 0
20
20
- limits :
21
- cpu : 1
22
- memory : 2G
23
- nvidia.com/gpu : 1
21
+ cpu : 2
22
+ memory : 4G
23
+ nvidia.com/gpu : 0
24
24
replicas : 2
25
25
requests :
26
- cpu : 1
27
- memory : 2G
28
- nvidia.com/gpu : 1
26
+ cpu : 2
27
+ memory : 4G
28
+ nvidia.com/gpu : 0
29
29
generictemplate :
30
30
apiVersion : ray.io/v1alpha1
31
31
kind : RayCluster
32
32
metadata :
33
33
labels :
34
- appwrapper.mcad.ibm.com : unit-cmd-cluster
34
+ appwrapper.mcad.ibm.com : mnisttest
35
35
controller-tools.k8s.io : ' 1.0'
36
- name : unit-cmd-cluster
37
- namespace : default
36
+ name : mnisttest
37
+ namespace : opendatahub
38
38
spec :
39
39
autoscalerOptions :
40
40
idleTimeoutSeconds : 60
62
62
valueFrom :
63
63
fieldRef :
64
64
fieldPath : status.podIP
65
- image : rayproject/ray:latest
65
+ image : ghcr.io/foundation-model-stack/base:ray2.1.0-py38-gpu-pytorch1.12.0cu116-20221213-193103
66
66
imagePullPolicy : Always
67
67
lifecycle :
68
68
preStop :
@@ -90,12 +90,12 @@ spec:
90
90
nvidia.com/gpu : 0
91
91
rayVersion : 1.12.0
92
92
workerGroupSpecs :
93
- - groupName : small-group-unit-cmd-cluster
93
+ - groupName : small-group-mnisttest
94
94
maxReplicas : 2
95
95
minReplicas : 2
96
96
rayStartParams :
97
97
block : ' true'
98
- num-gpus : ' 1 '
98
+ num-gpus : ' 0 '
99
99
replicas : 2
100
100
template :
101
101
metadata :
@@ -110,7 +110,7 @@ spec:
110
110
valueFrom :
111
111
fieldRef :
112
112
fieldPath : status.podIP
113
- image : rayproject/ray:latest
113
+ image : ghcr.io/foundation-model-stack/base:ray2.1.0-py38-gpu-pytorch1.12.0cu116-20221213-193103
114
114
lifecycle :
115
115
preStop :
116
116
exec :
@@ -121,13 +121,13 @@ spec:
121
121
name : machine-learning
122
122
resources :
123
123
limits :
124
- cpu : 1
125
- memory : 2G
126
- nvidia.com/gpu : 1
124
+ cpu : 2
125
+ memory : 4G
126
+ nvidia.com/gpu : 0
127
127
requests :
128
- cpu : 1
129
- memory : 2G
130
- nvidia.com/gpu : 1
128
+ cpu : 2
129
+ memory : 4G
130
+ nvidia.com/gpu : 0
131
131
initContainers :
132
132
- command :
133
133
- sh
@@ -142,14 +142,14 @@ spec:
142
142
kind : Route
143
143
metadata :
144
144
labels :
145
- odh-ray-cluster-service : unit-cmd-cluster -head-svc
146
- name : ray-dashboard-unit-cmd-cluster
147
- namespace : default
145
+ odh-ray-cluster-service : mnisttest -head-svc
146
+ name : ray-dashboard-mnisttest
147
+ namespace : opendatahub
148
148
spec :
149
149
port :
150
150
targetPort : dashboard
151
151
to :
152
152
kind : Service
153
- name : unit-cmd-cluster -head-svc
153
+ name : mnisttest -head-svc
154
154
replica : 1
155
155
Items : []
0 commit comments