fix: correct memory format for Spark master and worker

mobs75 · mobs75 · commit afc74b4805a3 · 2025-11-22T16:38:11.000+01:00
- Convert Kubernetes memory format (1Gi) to JVM format (1g) for SPARK_DAEMON_MEMORY
- Keep Kubernetes format for resources.limits.memory
- Add master_memory_jvm and worker_memory_jvm variables
- Fix kubectl wait timeout format (300s instead of 300)
diff --git a/cli b/cli
@@ -0,0 +1 @@
+Subproject commit 851e3774f014f193155233ec7997f597af46636b
diff --git a/deploy/spark/spark-rbac.yaml b/deploy/spark/spark-rbac.yaml
diff --git a/devcontainer b/devcontainer
@@ -0,0 +1 @@
+Subproject commit 4e69ae59fe6aea64521f2007c523577b3ed6a792
diff --git a/nuvolaris/kube.py b/nuvolaris/kube.py
@@ -118,7 +118,12 @@ def ctl(arg, jsonpath='{@}', flatten=False):
 # apply an object
 def apply(obj, namespace="nuvolaris"):
     if not isinstance(obj, str):
-        obj = json.dumps(obj)
+        # Use SafeDumper and ensure strings are quoted
+        class LiteralStr(str): pass
+        def literal_str_representer(dumper, data):
+            return dumper.represent_scalar('tag:yaml.org,2002:str', data, style='')
+        yaml.add_representer(LiteralStr, literal_str_representer, Dumper=yaml.SafeDumper)
+        obj = yaml.dump(obj, Dumper=yaml.SafeDumper, default_flow_style=False, sort_keys=False, allow_unicode=True)
     return kubectl("apply", "-f", "-", namespace=namespace, input=obj)
 
 # apply an expanded template
diff --git a/nuvolaris/kube.py.orig b/nuvolaris/kube.py.orig
@@ -0,0 +1,182 @@
+# Licensed to the Apache Software Foundation (ASF) under one
+# or more contributor license agreements.  See the NOTICE file
+# distributed with this work for additional information
+# regarding copyright ownership.  The ASF licenses this file
+# to you under the Apache License, Version 2.0 (the
+# "License"); you may not use this file except in compliance
+# with the License.  You may obtain a copy of the License at
+#
+#   http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing,
+# software distributed under the License is distributed on an
+# "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+# KIND, either express or implied.  See the License for the
+# specific language governing permissions and limitations
+# under the License.
+#
+# this module wraps kubectl
+import nuvolaris.testutil as tu
+import nuvolaris.template as tpl
+import subprocess
+import json
+import logging
+import yaml
+
+
+output = ""
+error = ""
+returncode = -1
+
+dry_run = False
+
+mocker = tu.MockKube()
+
+# execute kubectl commands
+# default namespace is nuvolaris, you can change with keyword arg namespace
+# default output is text
+# if you specify jsonpath it will filter and parse the json output
+# returns exceptions if errors
+def kubectl(*args, namespace="nuvolaris", input=None, jsonpath=None, debugresult=True, timeout=None):
+    # support for mocked requests
+    mres = mocker.invoke(*args)
+    if mres:
+        mocker.save(input)
+        return mres
+
+    cmd = namespace and ["kubectl", "-n", namespace] or ["kubectl"]
+    cmd += list(args)
+    if jsonpath:
+        cmd += ["-o", "jsonpath-as-json=%s" % jsonpath]
+
+    # if is a string, convert input in bytes
+    try: input = input.encode('utf-8')
+    except: pass
+        
+    # executing
+    logging.debug(cmd)
+    res = subprocess.run(cmd, capture_output=True, input=input, timeout=timeout)
+
+    global returncode, output, error
+    returncode = res.returncode
+    output = res.stdout.decode()
+    error = res.stderr.decode()
+
+    if res.returncode == 0:
+        if jsonpath:
+                try:
+                    parsed = json.loads(output)
+                    if debugresult:
+                        logging.debug("result: %s", json.dumps(parsed, indent=2))
+                    return parsed
+                except Exception as e:
+                    logging.info(output)
+                    logging.info(e)
+                    return e
+        else:
+            return output
+    logging.info(f"Error: kubectl f{cmd} input='{input}' output='{output}' error='{error}'")
+    raise Exception(error)
+
+# create a configmap from keyword arguments
+def configMap(name, **kwargs):
+    """
+    >>> import nuvolaris.kube as kube, nuvolaris.testutil as tu
+    >>> tu.grep(kube.configMap("hello", value="world"), "kind:|name:|value:", sort=True)
+    kind: ConfigMap
+    name: hello
+    value: world
+    >>> tu.grep(kube.configMap("hello", **{"file.js":"function", "file.py": "def"}), "file.", sort=True)
+    file.js: function
+    file.py: def
+    """
+    out = yaml.safe_load("""apiVersion: v1
+kind: ConfigMap
+metadata:
+  name: %s
+data: {}
+"""% name)
+    for key, value in kwargs.items():
+        out['data'][key] = value
+    return yaml.dump(out)
+    
+# delete an object
+def delete(obj, namespace="nuvolaris"):
+    # tested with apply
+    if not isinstance(obj, str):
+        obj = json.dumps(obj)
+    return kubectl("delete", "-f", "-", namespace=namespace, input=obj)
+
+# shortcut
+def ctl(arg, jsonpath='{@}', flatten=False):
+    import flatdict, json
+    data = kubectl(*arg.split(), jsonpath=jsonpath)
+    if flatten:
+        return dict(flatdict.FlatterDict(data, delimiter="."))
+    return data
+
+# apply an object
+def apply(obj, namespace="nuvolaris"):
+    if not isinstance(obj, str):
+        obj = yaml.dump(obj, default_flow_style=False, sort_keys=False)
+    return kubectl("apply", "-f", "-", namespace=namespace, input=obj)
+
+# apply an expanded template
+def applyTemplate(name, data, namespace="nuvolaris"):
+    obj = tpl.expand_template(name, data)
+    return kubectl("apply", "-f", "-", namespace=namespace, input=obj)
+
+# delete an expanded template
+def deleteTemplate(name, data, namespace="nuvolaris"):
+    obj = tpl.expand_template(name, data)
+    return kubectl("delete", "-f", "-", namespace=namespace, input=obj)
+
+def get(name, namespace="nuvolaris"):
+    try:
+        return json.loads(kubectl("get", name, "-ojson", namespace=namespace))
+    except:
+        return None
+
+def get_pods(selector, namespace="nuvolaris"):
+    """
+    filter the existing pods using the given selector expression. (ex name=mongodb-kubernetes-operator)
+    """
+    try:
+        return json.loads(kubectl("get", "pods", f"--selector={selector}","-ojson",namespace=namespace))
+    except:
+        return None            
+
+def wait(name, condition, timeout="600s", namespace="nuvolaris"):
+    try:
+        return kubectl("wait", name, f"--for={condition}", f"--timeout={timeout}",namespace=namespace)
+    except:
+        return None
+
+# patch an object
+def patch(name, data, namespace="nuvolaris", tpe="merge"):
+    if not type(data) == str:
+        data = json.dumps(data)
+    res = kubectl("patch", name, "--type", tpe, "-p", data)
+    return res
+
+def scale_sts(name, replicas, namespace="nuvolaris"):
+    try:
+        return kubectl("scale", name, f"--replicas={replicas}" ,namespace=namespace)
+    except:
+        return None
+
+# rollout the specified element. Normally used for DeamonSet or StatefulSet
+def rollout(name, namespace="nuvolaris"):
+    try:
+        return kubectl("rollout", "restart", name, namespace=namespace)
+    except:
+        return None
+    
+def detect_kind():
+    try:
+        is_kind = kubectl("get","node/nuvolaris-control-plane",
+                          namespace=None,
+                          jsonpath='{.metadata.labels.nuvolaris\\.io/kube}')
+        return is_kind and "kind" in is_kind
+    except:
+        return False
diff --git a/nuvolaris/kube.py.rej b/nuvolaris/kube.py.rej
@@ -0,0 +1,16 @@
+--- nuvolaris/kube.py
++++ nuvolaris/kube.py
+@@ -118,7 +118,12 @@ def flatten(data):
+ # apply an object
+ def apply(obj, namespace="nuvolaris"):
+     if not isinstance(obj, str):
+-        obj = yaml.dump(obj, default_flow_style=False, sort_keys=False)
++        # Use SafeDumper and ensure strings are quoted
++        class LiteralStr(str): pass
++        def literal_str_representer(dumper, data):
++            return dumper.represent_scalar('tag:yaml.org,2002:str', data, style='')
++        yaml.add_representer(LiteralStr, literal_str_representer, Dumper=yaml.SafeDumper)
++        obj = yaml.dump(obj, Dumper=yaml.SafeDumper, default_flow_style=False, sort_keys=False, allow_unicode=True)
+     return kubectl("apply", "-f", "-", namespace=namespace, input=obj)
+ # apply an expanded template
+ def applyTemplate(name, data, namespace="nuvolaris"):
diff --git a/nuvolaris/kustomize.py b/nuvolaris/kustomize.py
@@ -249,7 +249,7 @@ def kustom_list(where, *what, templates=[], data={}):
   """
   yml = nku.kustomize(where, *what, templates=templates, data=data)
   stream = io.StringIO(yml)
-  res = list(yaml.load_all(stream, yaml.Loader))
+  res = list(yaml.load_all(stream, yaml.SafeLoader))
   return {"apiVersion": "v1", "kind": "List", "items": res }
 
 
@@ -267,13 +267,13 @@ def restricted_kustom_list(where, *what, templates=[], templates_filter=[], data
   """
   yml = nku.restricted_kustomize(where, *what, templates=templates, templates_filter=templates_filter,data=data)
   stream = io.StringIO(yml)
-  res = list(yaml.load_all(stream, yaml.Loader))
+  res = list(yaml.load_all(stream, yaml.SafeLoader))
   return {"apiVersion": "v1", "kind": "List", "items": res }
 
 # load the given yaml file under deploy/{where} folder
 def raw(where, yamlfile):
   with open(f"deploy/{where}/{yamlfile}", 'r') as f:
-    return list(yaml.load_all(f, yaml.Loader))
+    return list(yaml.load_all(f, yaml.SafeLoader))
 
 def processTemplate(where,template,data,out_template=None):
     """
@@ -286,7 +286,7 @@ def processTemplate(where,template,data,out_template=None):
 
     ntp.spool_template(template, out, data)
     with open(out, 'r') as f:
-      res = list(yaml.load_all(f, yaml.Loader))
+      res = list(yaml.load_all(f, yaml.SafeLoader))
       return {"apiVersion": "v1", "kind": "List", "items": res }
 
 def renderTemplate(where,template,data,out_template):
diff --git a/nuvolaris/spark.py b/nuvolaris/spark.py
@@ -42,14 +42,15 @@ def get_spark_config_data():
         
         # Master configuration
         "master_replicas": cfg.get('spark.master.replicas', defval=1),
-        "master_memory": cfg.get('spark.master.memory', defval='1g'),
+        "master_memory": cfg.get('spark.master.memory', defval='1Gi'),
+        "master_memory_jvm": _convert_k8s_memory_to_jvm(cfg.get('spark.master.memory', defval='1Gi')),
         "master_cpu": cfg.get('spark.master.cpu', defval='1000m'),
         "master_port": cfg.get('spark.master.port', defval=7077),
         "master_webui_port": cfg.get('spark.master.webui-port', defval=8080),
         
         # Worker configuration
-        "worker_replicas": cfg.get('spark.worker.replicas', defval=2),
-        "worker_memory": cfg.get('spark.worker.memory', defval='2g'),
+        "worker_memory": cfg.get('spark.worker.memory', defval='2Gi'),
+        "worker_memory_jvm": _convert_k8s_memory_to_jvm(cfg.get('spark.worker.memory', defval='2Gi')),
         "worker_cpu": cfg.get('spark.worker.cpu', defval='2000m'),
         "worker_cores": cfg.get('spark.worker.cores', defval=2),
         "worker_webui_port": cfg.get('spark.worker.webui-port', defval=8081),
@@ -116,7 +117,7 @@ def create(owner=None):
         kus.processTemplate("spark", "spark-history-dep-tpl.yaml", data, "spark-history-dep.yaml")
     
     # 3. Define kustomize patches (standard pattern)
-    tplp = ["set-attach.yaml"]
+    tplp = []
     
     # 4. Add affinity/tolerations if enabled (standard pattern)
     if data.get('affinity') or data.get('tolerations'):
@@ -126,8 +127,8 @@ def create(owner=None):
     kust = kus.patchTemplates("spark", tplp, data)
     
     # 6. Build complete specification using standard OpenServerless pattern
-    templates = ["spark-rbac.yaml"]  # Static Jinja2 templates to include
-    templates_filter = ["spark-configmap.yaml", "spark-master-sts.yaml"]  # Generated templates to filter
+    templates = []  # Static non-Jinja2 templates to include
+    templates_filter = ["spark-rbac.yaml", "spark-configmap.yaml", "spark-master-sts.yaml"]  # Generated templates to filter
     
     if data['history_enabled']:
         templates_filter.extend(["spark-history-pvc.yaml", "spark-history-dep.yaml"])
@@ -150,7 +151,7 @@ def create(owner=None):
     logging.info("waiting for spark master to be ready...")
     util.wait_for_pod_ready(
         "{.items[?(@.metadata.labels.component == 'spark-master')].metadata.name}",
-        timeout=300
+        timeout="300s"
     )
     logging.info("spark master is ready")
     
@@ -512,7 +513,7 @@ def _validate_sparkjob_spec(spec, job_name):
             'executor': {
                 'instances': 2,
                 'cores': 1, 
-                'memory': '1g'
+                'memory': '1Gi'
             }
         },
         'execution': {
@@ -566,7 +567,7 @@ def merge_dict(target, source):
 
 def _convert_k8s_memory_to_jvm(k8s_memory):
     """
-    Convert Kubernetes memory format (like '1Gi') to JVM format (like '1g')
+    Convert Kubernetes memory format (like '1Gi') to JVM format (like '1Gi')
     """
     if k8s_memory.endswith('Gi'):
         return k8s_memory[:-2] + 'g'
diff --git a/nuvolaris/templates/spark-master-sts-tpl.yaml b/nuvolaris/templates/spark-master-sts-tpl.yaml
@@ -66,7 +66,7 @@ spec:
         - name: SPARK_MASTER_WEBUI_PORT
           value: "{{master_webui_port}}"
         - name: SPARK_DAEMON_MEMORY
-          value: "{{master_memory}}"
+          value: "{{master_memory_jvm}}"
         - name: SPARK_NO_DAEMONIZE
           value: "true"
         resources:
diff --git a/olaris b/olaris
@@ -0,0 +1 @@
+Subproject commit 6467dcbbcb67293e0a4a30f9a1046e63516a92dc
diff --git a/olaris-op b/olaris-op
@@ -0,0 +1 @@
+Subproject commit c562668a35c8f383c8ec6d0065da29baa39f0bcd
diff --git a/runtimes b/runtimes
@@ -0,0 +1 @@
+Subproject commit b1c2ce7b63e5cec138d1b4ab95986df28cd30132
diff --git a/site b/site
@@ -0,0 +1 @@
+Subproject commit e45b68f3e8a36705d388ab5608d7cb256f55465c
diff --git a/testing b/testing
@@ -0,0 +1 @@
+Subproject commit 7cb7f6d64e54949cbb7cd634997b75d244454d4d
diff --git a/vscode b/vscode
@@ -0,0 +1 @@
+Subproject commit 2d293c9871a5b8ace39e6b42ab152675bb1967f9

Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	`+Subproject commit 851e3774f014f193155233ec7997f597af46636b`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	`+Subproject commit 4e69ae59fe6aea64521f2007c523577b3ed6a792`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	`+Subproject commit 6467dcbbcb67293e0a4a30f9a1046e63516a92dc`