GoogleCloudPlatform · functicons · Feb 1, 2021 · Dec 8, 2020 · Dec 16, 2020 · Jan 3, 2021
diff --git a/api/v1beta1/flinkcluster_types.go b/api/v1beta1/flinkcluster_types.go
@@ -98,10 +98,11 @@ const (
 	SavepointStateFailed        = "Failed"
 	SavepointStateSucceeded     = "Succeeded"
 
-	SavepointTriggerReasonUserRequested = "user requested"
-	SavepointTriggerReasonScheduled     = "scheduled"
-	SavepointTriggerReasonJobCancel     = "job cancel"
-	SavepointTriggerReasonUpdate        = "update"
+	SavepointTriggerReasonUserRequested    = "user requested"
+	SavepointTriggerReasonScheduled        = "scheduled"
+	SavepointTriggerReasonScheduledInitial = "scheduled initial" // The first triggered savepoint has slightly different flow
+	SavepointTriggerReasonJobCancel        = "job cancel"
+	SavepointTriggerReasonUpdate           = "update"
 )
 
 // ImageSpec defines Flink image of JobManager and TaskManager containers.
@@ -347,6 +348,9 @@ type JobSpec struct {
 	// Allow non-restored state, default: false.
 	AllowNonRestoredState *bool `json:"allowNonRestoredState,omitempty"`
 
+	// Should take savepoint before upgrading the job, default: false.
+	TakeSavepointOnUpgrade *bool `json:"takeSavepointOnUpgrade,omitempty"`
+
 	// Savepoints dir where to store savepoints of the job.
 	SavepointsDir *string `json:"savepointsDir,omitempty"`
 
@@ -567,6 +571,9 @@ type JobStatus struct {
 	// Last savepoint trigger ID.
 	LastSavepointTriggerID string `json:"lastSavepointTriggerID,omitempty"`
 
+	// Last successful or failed savepoint operation timestamp.
+	LastSavepointTriggerTime string `json:"lastSavepointTriggerTime,omitempty"`
+
 	// Last successful or failed savepoint operation timestamp.
 	LastSavepointTime string `json:"lastSavepointTime,omitempty"`
 

diff --git a/api/v1beta1/zz_generated.deepcopy.go b/api/v1beta1/zz_generated.deepcopy.go
diff --git a/config/crd/bases/flinkoperator.k8s.io_flinkclusters.yaml b/config/crd/bases/flinkoperator.k8s.io_flinkclusters.yaml
@@ -163,6 +163,8 @@ spec:
                   type: integer
                 cancelRequested:
                   type: boolean
+                takeSavepointOnUpgrade:
+                  type: boolean
                 className:
                   type: string
                 cleanupPolicy:
@@ -5146,6 +5148,8 @@ spec:
                       type: string
                     id:
                       type: string
+                    lastSavepointTriggerTime:
+                      type: string
                     lastSavepointTime:
                       type: string
                     lastSavepointTriggerID:

diff --git a/controllers/flinkcluster_reconciler.go b/controllers/flinkcluster_reconciler.go
@@ -468,31 +468,29 @@ func (reconciler *ClusterReconciler) reconcileJob() (ctrl.Result, error) {
 		var jobID = reconciler.getFlinkJobID()
 		var restartPolicy = observed.cluster.Spec.Job.RestartPolicy
 		var recordedJobStatus = observed.cluster.Status.Components.Job
+		var jobSpec = reconciler.observed.cluster.Spec.Job
 
 		// Update or recover Flink job by restart.
-		var restartJob bool
 		if shouldUpdateJob(observed) {
 			log.Info("Job is about to be restarted to update")
-			restartJob = true
+			err := reconciler.restartJob(*jobSpec.TakeSavepointOnUpgrade)
+			return requeueResult, err
 		} else if shouldRestartJob(restartPolicy, recordedJobStatus) {
 			log.Info("Job is about to be restarted to recover failure")
-			restartJob = true
-		}
-		if restartJob {
-			err := reconciler.restartJob()
-			if err != nil {
-				return requeueResult, err
-			}
-			return requeueResult, nil
+			err := reconciler.restartJob(false)
+			return requeueResult, err
 		}
 
 		// Trigger savepoint if required.
 		if len(jobID) > 0 {
-			if ok, savepointTriggerReason := reconciler.shouldTakeSavepoint(); ok {
-				newSavepointStatus, _ = reconciler.takeSavepointAsync(jobID, savepointTriggerReason)
+			shouldTakeSavepont, savepointTriggerReason := reconciler.shouldTakeSavepoint()
+			if shouldTakeSavepont {
+				err = reconciler.updateSavepointTriggerTimeStatus()
+				if err != nil {
+					newSavepointStatus, _ = reconciler.takeSavepointAsync(jobID, savepointTriggerReason)
+				}
 			}
 		}
-
 		log.Info("Job is not finished yet, no action", "jobID", jobID)
 		return requeueResult, nil
 	}
@@ -575,14 +573,15 @@ func (reconciler *ClusterReconciler) getFlinkJobID() string {
 	return ""
 }
 
-func (reconciler *ClusterReconciler) restartJob() error {
+func (reconciler *ClusterReconciler) restartJob(shouldTakeSavepoint bool) error {
 	var log = reconciler.log
 	var observedJob = reconciler.observed.job
 	var observedFlinkJob = reconciler.observed.flinkJobStatus.flinkJob
 
 	log.Info("Stopping Flink job to restart", "", observedFlinkJob)
+	shouldTakeSavepoint = shouldTakeSavepoint && canTakeSavepoint(*reconciler.observed.cluster)
 
-	var err = reconciler.cancelRunningJobs(false /* takeSavepoint */)
+	var err = reconciler.cancelRunningJobs(shouldTakeSavepoint /* takeSavepoint */)
 	if err != nil {
 		return err
 	}
@@ -744,19 +743,31 @@ func (reconciler *ClusterReconciler) shouldTakeSavepoint() (bool, string) {
 		return false, ""
 	}
 
+	var nextOkTriggerTime = getNextOkTime(jobStatus.LastSavepointTriggerTime, SavepointTimeoutSec)
+	if time.Now().Before(nextOkTriggerTime) {
+		return false, ""
+	}
+
 	// First savepoint.
 	if len(jobStatus.LastSavepointTime) == 0 {
-		return true, v1beta1.SavepointTriggerReasonScheduled
+		return true, v1beta1.SavepointTriggerReasonScheduledInitial
 	}
 
-	// Interval expired.
-	var tc = &TimeConverter{}
-	var lastTime = tc.FromString(jobStatus.LastSavepointTime)
-	var nextTime = lastTime.Add(
-		time.Duration(int64(*jobSpec.AutoSavepointSeconds) * int64(time.Second)))
+	// Scheduled, check if next trigger time arrived.
+	var nextTime = getNextOkTime(jobStatus.LastSavepointTime, int64(*jobSpec.AutoSavepointSeconds))
 	return time.Now().After(nextTime), v1beta1.SavepointTriggerReasonScheduled
 }
 
+// Convert raw time to object and add `addedSeconds` to it
+func getNextOkTime(rawTime string, addedSeconds int64) time.Time {
+	var tc = &TimeConverter{}
+	var lastTriggerTime = time.Time{}
+	if len(rawTime) != 0 {
+		lastTriggerTime = tc.FromString(rawTime)
+	}
+	return lastTriggerTime.Add(time.Duration(addedSeconds * int64(time.Second)))
+}
+
 // Trigger savepoint for a job then return savepoint status to update.
 func (reconciler *ClusterReconciler) takeSavepointAsync(jobID string, triggerReason string) (*v1beta1.SavepointStatus, error) {
 	var log = reconciler.log
@@ -819,6 +830,14 @@ func (reconciler *ClusterReconciler) takeSavepoint(
 	return err
 }
 
+func (reconciler *ClusterReconciler) updateSavepointTriggerTimeStatus() error {
+	var cluster = v1beta1.FlinkCluster{}
+	reconciler.observed.cluster.DeepCopyInto(&cluster)
+	var jobStatus = cluster.Status.Components.Job
+	setTimestamp(&jobStatus.LastSavepointTriggerTime)
+	return reconciler.k8sClient.Status().Update(reconciler.context, &cluster)
+}
+
 func (reconciler *ClusterReconciler) updateSavepointStatus(
 	savepointStatus flinkclient.SavepointStatus) error {
 	var cluster = v1beta1.FlinkCluster{}

diff --git a/controllers/flinkcluster_util.go b/controllers/flinkcluster_util.go
@@ -42,7 +42,7 @@ const (
 	ControlRetries            = "retries"
 	ControlMaxRetries         = "3"
 
-	SavepointTimeoutSec = 60
+	SavepointTimeoutSec = 900 // 15 mins
 SavepointTimeoutSec = 60 
 RevisionNameLabel = "flinkoperator.k8s.io/revision-name" 
 // TODO: need to be user configurable 
 SavepointAgeForJobUpdateSec      = 300 
 SavepointRequestRetryIntervalSec = 10 
 SavepointTimeoutSec = 60 
  
 RevisionNameLabel = "flinkoperator.k8s.io/revision-name" 
  
 // TODO: need to be user configurable 
 SavepointAgeForJobUpdateSec      = 300 
 SavepointRequestRetryIntervalSec = 10 
 
 	RevisionNameLabel = "flinkoperator.k8s.io/revision-name"
 

diff --git a/controllers/flinkcluster_util_test.go b/controllers/flinkcluster_util_test.go
@@ -230,9 +230,10 @@ func TestShouldUpdateJob(t *testing.T) {
 		cluster: &v1beta1.FlinkCluster{
 			Status: v1beta1.FlinkClusterStatus{
 				Components: v1beta1.FlinkClusterComponentsStatus{Job: &v1beta1.JobStatus{
-					State:             v1beta1.JobStateRunning,
-					LastSavepointTime: tc.ToString(savepointTime),
-					SavepointLocation: "gs://my-bucket/savepoint-123",
+					State:                    v1beta1.JobStateRunning,
+					LastSavepointTime:        tc.ToString(savepointTime),
+					LastSavepointTriggerTime: tc.ToString(savepointTime),
+					SavepointLocation:        "gs://my-bucket/savepoint-123",
 				}},
 				CurrentRevision: "1", NextRevision: "2",
 			},
@@ -264,9 +265,10 @@ func TestShouldUpdateJob(t *testing.T) {
 		cluster: &v1beta1.FlinkCluster{
 			Status: v1beta1.FlinkClusterStatus{
 				Components: v1beta1.FlinkClusterComponentsStatus{Job: &v1beta1.JobStatus{
-					State:             v1beta1.JobStateRunning,
-					LastSavepointTime: tc.ToString(savepointTime),
-					SavepointLocation: "gs://my-bucket/savepoint-123",
+					State:                    v1beta1.JobStateRunning,
+					LastSavepointTime:        tc.ToString(savepointTime),
+					LastSavepointTriggerTime: tc.ToString(savepointTime),
+					SavepointLocation:        "gs://my-bucket/savepoint-123",
 				}},
 				CurrentRevision: "1", NextRevision: "2",
 			},
@@ -325,9 +327,10 @@ func TestIsSavepointUpToDate(t *testing.T) {
 	var savepointTime = time.Now()
 	var observeTime = savepointTime.Add(time.Second * 100)
 	var jobStatus = v1beta1.JobStatus{
-		State:             v1beta1.JobStateFailed,
-		LastSavepointTime: tc.ToString(savepointTime),
-		SavepointLocation: "gs://my-bucket/savepoint-123",
+		State:                    v1beta1.JobStateFailed,
+		LastSavepointTime:        tc.ToString(savepointTime),
+		LastSavepointTriggerTime: tc.ToString(savepointTime),
+		SavepointLocation:        "gs://my-bucket/savepoint-123",
 	}
 	var update = isSavepointUpToDate(observeTime, jobStatus)
 	assert.Equal(t, update, true)
@@ -336,9 +339,10 @@ func TestIsSavepointUpToDate(t *testing.T) {
 	savepointTime = time.Now()
 	observeTime = savepointTime.Add(time.Second * 500)
 	jobStatus = v1beta1.JobStatus{
-		State:             v1beta1.JobStateFailed,
-		LastSavepointTime: tc.ToString(savepointTime),
-		SavepointLocation: "gs://my-bucket/savepoint-123",
+		State:                    v1beta1.JobStateFailed,
+		LastSavepointTime:        tc.ToString(savepointTime),
+		LastSavepointTriggerTime: tc.ToString(savepointTime),
+		SavepointLocation:        "gs://my-bucket/savepoint-123",
 	}
 	update = isSavepointUpToDate(observeTime, jobStatus)
 	assert.Equal(t, update, false)
@@ -347,8 +351,9 @@ func TestIsSavepointUpToDate(t *testing.T) {
 	savepointTime = time.Now()
 	observeTime = savepointTime.Add(time.Second * 500)
 	jobStatus = v1beta1.JobStatus{
-		State:             v1beta1.JobStateFailed,
-		LastSavepointTime: tc.ToString(savepointTime),
+		State:                    v1beta1.JobStateFailed,
+		LastSavepointTime:        tc.ToString(savepointTime),
+		LastSavepointTriggerTime: tc.ToString(savepointTime),
 	}
 	update = isSavepointUpToDate(observeTime, jobStatus)
 	assert.Equal(t, update, false)
@@ -408,8 +413,8 @@ func TestIsFlinkAPIReady(t *testing.T) {
 			Status: v1beta1.FlinkClusterStatus{NextRevision: "cluster-85dc8f749-2"},
 		},
 		configMap:      &corev1.ConfigMap{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
-		jmStatefulSet:   &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
-		tmStatefulSet:   &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
+		jmStatefulSet:  &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
+		tmStatefulSet:  &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
 		jmService:      &corev1.Service{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
 		flinkJobStatus: FlinkJobStatus{flinkJobList: &flinkclient.JobStatusList{}},
 	}
@@ -425,10 +430,10 @@ func TestIsFlinkAPIReady(t *testing.T) {
 			},
 			Status: v1beta1.FlinkClusterStatus{NextRevision: "cluster-85dc8f749-2"},
 		},
-		configMap:    &corev1.ConfigMap{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
+		configMap:     &corev1.ConfigMap{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
 		jmStatefulSet: &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
 		tmStatefulSet: &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
-		jmService:    &corev1.Service{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
+		jmService:     &corev1.Service{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
 	}
 	ready = isFlinkAPIReady(observed)
 	assert.Equal(t, ready, false)
@@ -442,9 +447,9 @@ func TestIsFlinkAPIReady(t *testing.T) {
 			},
 			Status: v1beta1.FlinkClusterStatus{NextRevision: "cluster-85dc8f749-2"},
 		},
-		configMap:    &corev1.ConfigMap{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
+		configMap:     &corev1.ConfigMap{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
 		tmStatefulSet: &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
-		jmService:    &corev1.Service{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
+		jmService:     &corev1.Service{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
 	}
 	ready = isFlinkAPIReady(observed)
 	assert.Equal(t, ready, false)
@@ -458,10 +463,10 @@ func TestIsFlinkAPIReady(t *testing.T) {
 			},
 			Status: v1beta1.FlinkClusterStatus{NextRevision: "cluster-85dc8f749-2"},
 		},
-		configMap:    &corev1.ConfigMap{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
+		configMap:     &corev1.ConfigMap{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
 		jmStatefulSet: &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-aa5e3a87z"}}},
 		tmStatefulSet: &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
-		jmService:    &corev1.Service{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
+		jmService:     &corev1.Service{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
 	}
 	ready = isFlinkAPIReady(observed)
 	assert.Equal(t, ready, false)
@@ -478,11 +483,11 @@ func TestGetUpdateState(t *testing.T) {
 				Components:      v1beta1.FlinkClusterComponentsStatus{Job: &v1beta1.JobStatus{State: v1beta1.JobStateRunning}},
 				CurrentRevision: "cluster-85dc8f749-2", NextRevision: "cluster-aa5e3a87z-3"},
 		},
-		job:          &batchv1.Job{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
-		configMap:    &corev1.ConfigMap{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
+		job:           &batchv1.Job{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
+		configMap:     &corev1.ConfigMap{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
 		jmStatefulSet: &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
 		tmStatefulSet: &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
-		jmService:    &corev1.Service{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
+		jmService:     &corev1.Service{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
 	}
 	var state = getUpdateState(observed)
 	assert.Equal(t, state, UpdateStatePreparing)
@@ -497,7 +502,7 @@ func TestGetUpdateState(t *testing.T) {
 		},
 		jmStatefulSet: &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-aa5e3a87z"}}},
 		tmStatefulSet: &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
-		jmService:    &corev1.Service{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
+		jmService:     &corev1.Service{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-85dc8f749"}}},
 	}
 	state = getUpdateState(observed)
 	assert.Equal(t, state, UpdateStateInProgress)
@@ -510,12 +515,12 @@ func TestGetUpdateState(t *testing.T) {
 			},
 			Status: v1beta1.FlinkClusterStatus{CurrentRevision: "cluster-85dc8f749-2", NextRevision: "cluster-aa5e3a87z-3"},
 		},
-		job:          &batchv1.Job{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-aa5e3a87z"}}},
-		configMap:    &corev1.ConfigMap{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-aa5e3a87z"}}},
+		job:           &batchv1.Job{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-aa5e3a87z"}}},
+		configMap:     &corev1.ConfigMap{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-aa5e3a87z"}}},
 		jmStatefulSet: &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-aa5e3a87z"}}},
 		tmStatefulSet: &appsv1.StatefulSet{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-aa5e3a87z"}}},
-		jmService:    &corev1.Service{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-aa5e3a87z"}}},
-		jmIngress:    &extensionsv1beta1.Ingress{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-aa5e3a87z"}}},
+		jmService:     &corev1.Service{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-aa5e3a87z"}}},
+		jmIngress:     &extensionsv1beta1.Ingress{ObjectMeta: metav1.ObjectMeta{Labels: map[string]string{RevisionNameLabel: "cluster-aa5e3a87z"}}},
 	}
 	state = getUpdateState(observed)
 	assert.Equal(t, state, UpdateStateFinished)

diff --git a/docs/crd.md b/docs/crd.md
@@ -69,6 +69,7 @@ FlinkCluster
         |__ args
         |__ fromSavepoint
         |__ allowNonRestoredState
+        |__ takeSavepointOnUpgrade
         |__ autoSavepointSeconds
         |__ savepointsDir
         |__ savepointGeneration
@@ -261,6 +262,7 @@ FlinkCluster
       * **autoSavepointSeconds** (optional): Automatically take a savepoint to the `savepointsDir` every n seconds.
       * **savepointsDir** (optional): Savepoints dir where to store automatically taken savepoints.
       * **allowNonRestoredState** (optional):  Allow non-restored state, default: false.
+      * **takeSavepointOnUpgrade** (optional):  Should take savepoint before upgrading the job, default: false.
       * **savepointGeneration** (optional): Update this field to `jobStatus.savepointGeneration + 1` for a running job
         cluster to trigger a new savepoint to `savepointsDir` on demand.
       * **parallelism** (optional): Parallelism of the job, default: 1.

diff --git a/helm-chart/flink-operator/Chart.yaml b/helm-chart/flink-operator/Chart.yaml
@@ -2,7 +2,7 @@ apiVersion: v1
 name: flink-operator
 appVersion: "1.0"
 description: A Helm chart for flink on Kubernetes operator
-version: "0.2.0"
+version: "0.2.1"
 keywords:
   - flink
 home: https://github.com/GoogleCloudPlatform/flink-on-k8s-operator
diff --git a/helm-chart/flink-operator/templates/flink-cluster-crd.yaml b/helm-chart/flink-operator/templates/flink-cluster-crd.yaml
@@ -164,6 +164,8 @@ spec:
                   type: integer
                 cancelRequested:
                   type: boolean
+                takeSavepointOnUpgrade:
+                  type: boolean
                 className:
                   type: string
                 cleanupPolicy:
@@ -4976,6 +4978,8 @@ spec:
                       type: string
                     lastSavepointTime:
                       type: string
+                    lastSavepointTriggerTime:
+                      type: string
                     lastSavepointTriggerID:
                       type: string
                     name: