separate structs for parse and analyze

sfc-gh-abozkurt · sfc-gh-abozkurt · commit a90584748923 · 2026-01-20T14:36:35.000+03:00
Signed-off-by: Aykut Bozkurt &lt;aykut.bozkurt@snowflake.com&gt;
diff --git a/pg_lake_engine/src/data_file/data_file_stats.c b/pg_lake_engine/src/data_file/data_file_stats.c
@@ -256,7 +256,7 @@ ExtractMinMaxForColumn(Datum map, char *colName, List **names, List **mins, List
 
 	if (minText != NULL && maxText != NULL)
 	{
-		*names = lappend(*names, pstrdup(colName));
+		*names = lappend(*names, colName);
 		*mins = lappend(*mins, minText);
 		*maxs = lappend(*maxs, maxText);
 	}
diff --git a/pg_lake_iceberg/include/pg_lake/iceberg/api/partitioning.h b/pg_lake_iceberg/include/pg_lake/iceberg/api/partitioning.h
@@ -39,7 +39,8 @@ typedef enum IcebergPartitionTransformType
 	PARTITION_TRANSFORM_VOID
 }			IcebergPartitionTransformType;
 
-typedef struct IcebergPartitionTransform
+/* Represents a parsed partition transform from table's partition_by string option. */
+typedef struct ParsedIcebergPartitionTransform
 {
 	IcebergPartitionTransformType type;
 
@@ -52,13 +53,22 @@ typedef struct IcebergPartitionTransform
 		size_t		truncateLen;
 	};
 
-	IcebergPartitionSpecField *specField;
+	const char *columnName;
+}			ParsedIcebergPartitionTransform;
+
+/* Represents an analyzed partition transform with all necessary info. */
+typedef struct IcebergPartitionTransform
+{
+	/* parsed transform info */
+	ParsedIcebergPartitionTransform parsedTransform;
+
+	/* spec field info */
+	IcebergPartitionSpecField specField;
 
 	/* source field of the column to which transform applies */
-	DataFileSchemaField *sourceField;
+	DataFileSchemaField sourceField;
 
 	/* Postgres column info to which transform applies */
-	const char *columnName;
 	AttrNumber	attnum;
 	PGType		pgType;
 
diff --git a/pg_lake_iceberg/src/iceberg/partitioning/partition.c b/pg_lake_iceberg/src/iceberg/partitioning/partition.c
@@ -225,7 +225,7 @@ FindPartitionTransformById(List *transforms, int32_t partitionFieldId, bool erro
 	{
 		IcebergPartitionTransform *transform = (IcebergPartitionTransform *) lfirst(cell);
 
-		if (transform->specField->field_id == partitionFieldId)
+		if (transform->specField.field_id == partitionFieldId)
 			return transform;
 	}
 
diff --git a/pg_lake_iceberg/src/iceberg/partitioning/spec_generation.c b/pg_lake_iceberg/src/iceberg/partitioning/spec_generation.c
@@ -60,7 +60,7 @@ BuildPartitionSpecFromPartitionTransforms(Oid relationId, List *partitionTransfo
 	{
 		IcebergPartitionTransform *transform = lfirst(transformCell);
 
-		spec->fields[fieldIndex] = *(transform->specField);
+		spec->fields[fieldIndex] = transform->specField;
 		fieldIndex++;
 	}
 
diff --git a/pg_lake_table/src/fdw/data_file_pruning.c b/pg_lake_table/src/fdw/data_file_pruning.c
@@ -676,7 +676,7 @@ GetColumnBoundConstraintsFromPartition(Oid relationId, ColumnToFieldIdMapping *
 			continue;
 
 		/* skip if transform's sourceId does not match the entry's fieldId */
-		if (partitionTransform->sourceField->id != entry->fieldId)
+		if (partitionTransform->sourceField.id != entry->fieldId)
 			continue;
 
 		Expr	   *boundsConstraint =
@@ -699,7 +699,7 @@ static Expr *
 PartitionFieldBoundConstraint(PartitionField * partitionField, IcebergPartitionTransform * partitionTransform,
 							  ColumnToFieldIdMapping * entry)
 {
-	IcebergPartitionTransformType type = partitionTransform->type;
+	IcebergPartitionTransformType type = partitionTransform->parsedTransform.type;
 
 	if (type != PARTITION_TRANSFORM_IDENTITY &&
 		partitionField->value == NULL)
@@ -751,7 +751,7 @@ IdentityPartitionFieldBoundConstraint(PartitionField * partitionField,
 	{
 		bool		isNull = false;
 		Datum		partitionDatum =
-			PartitionValueToDatum(partitionTransform->type, partitionField->value, partitionField->value_length,
+			PartitionValueToDatum(partitionTransform->parsedTransform.type, partitionField->value, partitionField->value_length,
 								  partitionTransform->resultPgType, &isNull);
 
 		OpExpr	   *columnBoundEquality = copyObject(entry->equalityOperatorExpression);
@@ -780,7 +780,7 @@ TruncatePartitionFieldBoundConstraint(PartitionField * partitionField,
 	if (pgType.postgresTypeOid == INT4OID || pgType.postgresTypeOid == INT2OID)
 	{
 		int32		partitionValue = *(int32_t *) partitionField->value;
-		int			truncateLen = partitionTransform->truncateLen;
+		int			truncateLen = partitionTransform->parsedTransform.truncateLen;
 
 		int32		upperBound;
 
@@ -798,7 +798,7 @@ TruncatePartitionFieldBoundConstraint(PartitionField * partitionField,
 	else if (pgType.postgresTypeOid == INT8OID)
 	{
 		int64		partitionValue = *(int64_t *) partitionField->value;
-		int			truncateLen = partitionTransform->truncateLen;
+		int			truncateLen = partitionTransform->parsedTransform.truncateLen;
 
 		int64		upperBound;
 
@@ -825,7 +825,7 @@ TruncatePartitionFieldBoundConstraint(PartitionField * partitionField,
 			return NULL;
 		}
 
-		int			truncateLen = partitionTransform->truncateLen;
+		int			truncateLen = partitionTransform->parsedTransform.truncateLen;
 		char	   *truncatedUpperBound = TruncateUpperBoundForText(pstrdup(partitionValue), truncateLen);
 
 		if (truncatedUpperBound == NULL)
@@ -848,7 +848,7 @@ TruncatePartitionFieldBoundConstraint(PartitionField * partitionField,
 		memcpy(VARDATA_ANY(partitionValue), partitionField->value, partitionField->value_length);
 
 		bytea	   *partitionValueCopy = (bytea *) pg_detoast_datum_copy((struct varlena *) partitionValue);
-		int			truncateLen = partitionTransform->truncateLen;
+		int			truncateLen = partitionTransform->parsedTransform.truncateLen;
 
 		/* increment the last byte of the upper bound, which does not overflow */
 		partitionValueCopy = TruncateUpperBoundForBytea(partitionValueCopy, truncateLen);
@@ -1813,7 +1813,7 @@ ExtendClausesForBucketPartitioning(Partition * partition, List *partitionTransfo
 		if (partitionTransform == NULL)
 			continue;
 
-		if (partitionTransform->type != PARTITION_TRANSFORM_BUCKET)
+		if (partitionTransform->parsedTransform.type != PARTITION_TRANSFORM_BUCKET)
 		{
 			/* only extend restrict info for bucket transform */
 			continue;
diff --git a/pg_lake_table/src/fdw/partition_transform.c b/pg_lake_table/src/fdw/partition_transform.c
@@ -152,7 +152,7 @@ PartitionTransformsEqual(IcebergPartitionSpec * spec, List *partitionTransforms)
 		 * ErrorIfColumnEverUsedInIcebergPartitionSpec(). Still, let's be
 		 * defensive and also check source field ids.
 		 */
-		if (specField->source_id != transform->sourceField->id)
+		if (specField->source_id != transform->sourceField.id)
 			return false;
 
 		/*
@@ -162,7 +162,7 @@ PartitionTransformsEqual(IcebergPartitionSpec * spec, List *partitionTransforms)
 		 * Iceberg does here:
 		 * https://github.com/apache/iceberg/blob/8b55ac834015ce664f879ecfe1e80a941a994420/api/src/main/java/org/apache/iceberg/PartitionSpec.java#L239-L259
 		 */
-		if (strcasecmp(specField->name, transform->specField->name) != 0)
+		if (strcasecmp(specField->name, transform->specField.name) != 0)
 		{
 			return false;
 		}
@@ -251,31 +251,35 @@ GetPartitionTransformFromSpecField(Oid relationId, IcebergPartitionSpecField * s
 {
 	IcebergPartitionTransform *transform = palloc0(sizeof(IcebergPartitionTransform));
 
-	transform->specField = specField;
+	transform->specField = *specField;
 
 	transform->attnum =
 		GetAttributeForFieldId(relationId, specField->source_id);
-	transform->columnName = get_attname(relationId, transform->attnum, false);
+	transform->parsedTransform.columnName = get_attname(relationId, transform->attnum, false);
 	transform->pgType = GetAttributePGType(relationId, transform->attnum);
 
 	if (IsInternalIcebergTable(relationId))
 	{
-		transform->sourceField = GetRegisteredFieldForAttribute(relationId, transform->attnum);
+		DataFileSchemaField *sourceField = GetRegisteredFieldForAttribute(relationId, transform->attnum);
+
+		transform->sourceField = *sourceField;
 	}
 	else
 	{
 		Assert(IsExternalIcebergTable(relationId));
 
 		DataFileSchema *schema = GetDataFileSchemaForTable(relationId);
 
-		transform->sourceField = GetDataFileSchemaFieldById(schema, specField->source_id);
+		DataFileSchemaField *sourceField = GetDataFileSchemaFieldById(schema, specField->source_id);
+
+		transform->sourceField = *sourceField;
 	}
 
 	/* parse transform name */
-	ParseTransformName(transform->specField->transform,
-					   &transform->type,
-					   &transform->bucketCount,
-					   &transform->truncateLen);
+	ParseTransformName(transform->specField.transform,
+					   &transform->parsedTransform.type,
+					   &transform->parsedTransform.bucketCount,
+					   &transform->parsedTransform.truncateLen);
 
 	/* set transform's postgres type */
 	transform->resultPgType = GetTransformResultPGType(transform);
@@ -411,13 +415,13 @@ ApplyPartitionTransformToTuple(IcebergPartitionTransform * transform, TupleTable
 {
 	PartitionField *field = palloc0(sizeof(PartitionField));
 
-	field->field_name = pstrdup(transform->specField->name);
-	field->field_id = transform->specField->field_id;
+	field->field_name = pstrdup(transform->specField.name);
+	field->field_id = transform->specField.field_id;
 
 	bool		isNull = false;
 	Datum		columnValue = slot_getattr(slot, transform->attnum, &isNull);
 
-	switch (transform->type)
+	switch (transform->parsedTransform.type)
 	{
 		case PARTITION_TRANSFORM_IDENTITY:
 			field->value = ApplyIdentityTransformToColumn(transform, columnValue, isNull,
@@ -451,7 +455,7 @@ ApplyPartitionTransformToTuple(IcebergPartitionTransform * transform, TupleTable
 			ereport(ERROR,
 					(errcode(ERRCODE_FEATURE_NOT_SUPPORTED),
 					 errmsg("applying transform %s is not yet support ",
-							transform->specField->transform)));
+							transform->specField.transform)));
 	}
 
 	field->value_type = GetTransformResultAvroType(transform);
@@ -475,7 +479,7 @@ ApplyIdentityTransformToColumn(IcebergPartitionTransform * transform, Datum colu
 		return NULL;
 	}
 
-	return PGIcebergBinarySerializePartitionFieldValue(columnValue, transform->sourceField->type,
+	return PGIcebergBinarySerializePartitionFieldValue(columnValue, transform->sourceField.type,
 													   transform->pgType, valueSize);
 }
 
@@ -496,7 +500,7 @@ ApplyTruncateTransformToColumn(IcebergPartitionTransform * transform, Datum colu
 
 	PGType		sourceType = transform->pgType;
 	PGType		resultType = transform->resultPgType;
-	int64_t		truncateLen = (int64_t) transform->truncateLen;
+	int64_t		truncateLen = (int64_t) transform->parsedTransform.truncateLen;
 	Datum		truncatedColumnValue = 0;
 
 	if (sourceType.postgresTypeOid == INT2OID)
@@ -765,7 +769,7 @@ ApplyBucketTransformToColumn(IcebergPartitionTransform * transform, Datum column
 	{
 		int64_t		value = (int64_t) DatumGetInt16(columnValue);
 
-		*bucketValue = (MurmurHash3_32_Long(value) & INT32_MAX) % transform->bucketCount;
+		*bucketValue = (MurmurHash3_32_Long(value) & INT32_MAX) % transform->parsedTransform.bucketCount;
 	}
 	else if (transform->pgType.postgresTypeOid == INT4OID)
 	{
@@ -775,27 +779,27 @@ ApplyBucketTransformToColumn(IcebergPartitionTransform * transform, Datum column
 		 */
 		int64_t		value = (int64_t) DatumGetInt32(columnValue);
 
-		*bucketValue = (MurmurHash3_32_Long(value) & INT32_MAX) % transform->bucketCount;
+		*bucketValue = (MurmurHash3_32_Long(value) & INT32_MAX) % transform->parsedTransform.bucketCount;
 	}
 	else if (transform->pgType.postgresTypeOid == INT8OID)
 	{
 		int64_t		value = DatumGetInt64(columnValue);
 
-		*bucketValue = (MurmurHash3_32_Long(value) & INT32_MAX) % transform->bucketCount;
+		*bucketValue = (MurmurHash3_32_Long(value) & INT32_MAX) % transform->parsedTransform.bucketCount;
 	}
 	else if (transform->pgType.postgresTypeOid == TEXTOID ||
 			 transform->pgType.postgresTypeOid == VARCHAROID ||
 			 transform->pgType.postgresTypeOid == BPCHAROID)
 	{
 		const char *value = TextDatumGetCString(columnValue);
 
-		*bucketValue = (MurmurHash3_32_Bytes(value, strlen(value)) & INT32_MAX) % transform->bucketCount;
+		*bucketValue = (MurmurHash3_32_Bytes(value, strlen(value)) & INT32_MAX) % transform->parsedTransform.bucketCount;
 	}
 	else if (transform->pgType.postgresTypeOid == BYTEAOID)
 	{
 		bytea	   *value = DatumGetByteaP(columnValue);
 
-		*bucketValue = (MurmurHash3_32_Bytes(VARDATA_ANY(value), VARSIZE_ANY_EXHDR(value)) & INT32_MAX) % transform->bucketCount;
+		*bucketValue = (MurmurHash3_32_Bytes(VARDATA_ANY(value), VARSIZE_ANY_EXHDR(value)) & INT32_MAX) % transform->parsedTransform.bucketCount;
 	}
 	else if (transform->pgType.postgresTypeOid == DATEOID)
 	{
@@ -807,47 +811,47 @@ ApplyBucketTransformToColumn(IcebergPartitionTransform * transform, Datum column
 		 * spec normally hashes int bytes for date type but spark hashes long
 		 * bytes of date. We follow spark here.
 		 */
-		*bucketValue = (MurmurHash3_32_Long(daysFromEpoch) & INT32_MAX) % transform->bucketCount;
+		*bucketValue = (MurmurHash3_32_Long(daysFromEpoch) & INT32_MAX) % transform->parsedTransform.bucketCount;
 	}
 	else if (transform->pgType.postgresTypeOid == TIMESTAMPOID)
 	{
 		Timestamp	value = DatumGetTimestamp(columnValue);
 
 		int64_t		microsecsFromEpoch = AdjustTimestampFromPostgresToUnix(value);
 
-		*bucketValue = (MurmurHash3_32_Long(microsecsFromEpoch) & INT32_MAX) % transform->bucketCount;
+		*bucketValue = (MurmurHash3_32_Long(microsecsFromEpoch) & INT32_MAX) % transform->parsedTransform.bucketCount;
 	}
 	else if (transform->pgType.postgresTypeOid == TIMESTAMPTZOID)
 	{
 		TimestampTz value = DatumGetTimestampTz(columnValue);
 
 		int64_t		microsecsFromEpoch = AdjustTimestampFromPostgresToUnix(value);
 
-		*bucketValue = (MurmurHash3_32_Long(microsecsFromEpoch) & INT32_MAX) % transform->bucketCount;
+		*bucketValue = (MurmurHash3_32_Long(microsecsFromEpoch) & INT32_MAX) % transform->parsedTransform.bucketCount;
 	}
 	else if (transform->pgType.postgresTypeOid == TIMEOID)
 	{
 		TimeADT		value = DatumGetTimeADT(columnValue);
 
 		int64_t		microsecsFromMidnight = value;
 
-		*bucketValue = (MurmurHash3_32_Long(microsecsFromMidnight) & INT32_MAX) % transform->bucketCount;
+		*bucketValue = (MurmurHash3_32_Long(microsecsFromMidnight) & INT32_MAX) % transform->parsedTransform.bucketCount;
 	}
 	else if (transform->pgType.postgresTypeOid == UUIDOID)
 	{
 		size_t		valueSize = 0;
-		unsigned char *value = PGIcebergBinarySerializePartitionFieldValue(columnValue, transform->sourceField->type,
+		unsigned char *value = PGIcebergBinarySerializePartitionFieldValue(columnValue, transform->sourceField.type,
 																		   transform->pgType, &valueSize);
 
-		*bucketValue = (MurmurHash3_32_Bytes(value, valueSize) & INT32_MAX) % transform->bucketCount;
+		*bucketValue = (MurmurHash3_32_Bytes(value, valueSize) & INT32_MAX) % transform->parsedTransform.bucketCount;
 	}
 	else if (transform->pgType.postgresTypeOid == NUMERICOID)
 	{
 		size_t		valueSize = 0;
-		unsigned char *value = PGIcebergBinarySerializePartitionFieldValue(columnValue, transform->sourceField->type,
+		unsigned char *value = PGIcebergBinarySerializePartitionFieldValue(columnValue, transform->sourceField.type,
 																		   transform->pgType, &valueSize);
 
-		*bucketValue = (MurmurHash3_32_Bytes(value, valueSize) & INT32_MAX) % transform->bucketCount;
+		*bucketValue = (MurmurHash3_32_Bytes(value, valueSize) & INT32_MAX) % transform->parsedTransform.bucketCount;
 	}
 	else
 	{
@@ -975,7 +979,7 @@ SerializePartitionValueToPGText(void *value, size_t valueLength, IcebergPartitio
 	/* First, deserialize back */
 	bool		isNull = false;
 	Datum		partitionDatum =
-		PartitionValueToDatum(transform->type, value, valueLength,
+		PartitionValueToDatum(transform->parsedTransform.type, value, valueLength,
 							  transform->resultPgType, &isNull);
 
 	if (isNull)
diff --git a/pg_lake_table/src/fdw/partitioning/partition_by_parser.c b/pg_lake_table/src/fdw/partitioning/partition_by_parser.c
diff --git a/pg_lake_table/src/test/test_partition_tuple.c b/pg_lake_table/src/test/test_partition_tuple.c

Original file line number	Diff line number	Diff line change
`@@ -256,7 +256,7 @@ ExtractMinMaxForColumn(Datum map, char colName, List names, List *mins, List`
`256`	`256`
`257`	`257`	`if (minText != NULL && maxText != NULL)`
`258`	`258`	`{`
`259`		`- names = lappend(names, pstrdup(colName));`
	`259`	`+ names = lappend(names, colName);`
`260`	`260`	`mins = lappend(mins, minText);`
`261`	`261`	`maxs = lappend(maxs, maxText);`
`262`	`262`	`}`
Original file line number	Diff line number	Diff line change
`@@ -225,7 +225,7 @@ FindPartitionTransformById(List *transforms, int32_t partitionFieldId, bool erro`
`225`	`225`	`{`
`226`	`226`	`IcebergPartitionTransform transform = (IcebergPartitionTransform ) lfirst(cell);`
`227`	`227`
`228`		`- if (transform->specField->field_id == partitionFieldId)`
	`228`	`+ if (transform->specField.field_id == partitionFieldId)`
`229`	`229`	`return transform;`
`230`	`230`	`}`
`231`	`231`
Original file line number	Diff line number	Diff line change
`@@ -60,7 +60,7 @@ BuildPartitionSpecFromPartitionTransforms(Oid relationId, List *partitionTransfo`
`60`	`60`	`{`
`61`	`61`	`IcebergPartitionTransform *transform = lfirst(transformCell);`
`62`	`62`
`63`		`- spec->fields[fieldIndex] = *(transform->specField);`
	`63`	`+ spec->fields[fieldIndex] = transform->specField;`
`64`	`64`	`fieldIndex++;`
`65`	`65`	`}`
`66`	`66`
Original file line number	Diff line number	Diff line change
`@@ -152,7 +152,7 @@ PartitionTransformsEqual(IcebergPartitionSpec * spec, List *partitionTransforms)`
`152`	`152`	`* ErrorIfColumnEverUsedInIcebergPartitionSpec(). Still, let's be`
`153`	`153`	`* defensive and also check source field ids.`
`154`	`154`	`*/`
`155`		`- if (specField->source_id != transform->sourceField->id)`
	`155`	`+ if (specField->source_id != transform->sourceField.id)`
`156`	`156`	`return false;`
`157`	`157`
`158`	`158`	`/*`
`@@ -162,7 +162,7 @@ PartitionTransformsEqual(IcebergPartitionSpec * spec, List *partitionTransforms)`
`162`	`162`	`* Iceberg does here:`
`163`	`163`	`* https://github.com/apache/iceberg/blob/8b55ac834015ce664f879ecfe1e80a941a994420/api/src/main/java/org/apache/iceberg/PartitionSpec.java#L239-L259`
`164`	`164`	`*/`
`165`		`- if (strcasecmp(specField->name, transform->specField->name) != 0)`
	`165`	`+ if (strcasecmp(specField->name, transform->specField.name) != 0)`
`166`	`166`	`{`
`167`	`167`	`return false;`
`168`	`168`	`}`
`@@ -251,31 +251,35 @@ GetPartitionTransformFromSpecField(Oid relationId, IcebergPartitionSpecField * s`
`251`	`251`	`{`
`252`	`252`	`IcebergPartitionTransform *transform = palloc0(sizeof(IcebergPartitionTransform));`
`253`	`253`
`254`		`- transform->specField = specField;`
	`254`	`+ transform->specField = *specField;`
`255`	`255`
`256`	`256`	`transform->attnum =`
`257`	`257`	`GetAttributeForFieldId(relationId, specField->source_id);`
`258`		`- transform->columnName = get_attname(relationId, transform->attnum, false);`
	`258`	`+ transform->parsedTransform.columnName = get_attname(relationId, transform->attnum, false);`
`259`	`259`	`transform->pgType = GetAttributePGType(relationId, transform->attnum);`
`260`	`260`
`261`	`261`	`if (IsInternalIcebergTable(relationId))`
`262`	`262`	`{`
`263`		`- transform->sourceField = GetRegisteredFieldForAttribute(relationId, transform->attnum);`
	`263`	`+ DataFileSchemaField *sourceField = GetRegisteredFieldForAttribute(relationId, transform->attnum);`
	`264`	`+`
	`265`	`+ transform->sourceField = *sourceField;`
`264`	`266`	`}`
`265`	`267`	`else`
`266`	`268`	`{`
`267`	`269`	`Assert(IsExternalIcebergTable(relationId));`
`268`	`270`
`269`	`271`	`DataFileSchema *schema = GetDataFileSchemaForTable(relationId);`
`270`	`272`
`271`		`- transform->sourceField = GetDataFileSchemaFieldById(schema, specField->source_id);`
	`273`	`+ DataFileSchemaField *sourceField = GetDataFileSchemaFieldById(schema, specField->source_id);`
	`274`	`+`
	`275`	`+ transform->sourceField = *sourceField;`
`272`	`276`	`}`
`273`	`277`
`274`	`278`	`/* parse transform name */`
`275`		`- ParseTransformName(transform->specField->transform,`
`276`		`- &transform->type,`
`277`		`- &transform->bucketCount,`
`278`		`- &transform->truncateLen);`
	`279`	`+ ParseTransformName(transform->specField.transform,`
	`280`	`+ &transform->parsedTransform.type,`
	`281`	`+ &transform->parsedTransform.bucketCount,`
	`282`	`+ &transform->parsedTransform.truncateLen);`
`279`	`283`
`280`	`284`	`/* set transform's postgres type */`
`281`	`285`	`transform->resultPgType = GetTransformResultPGType(transform);`
`@@ -411,13 +415,13 @@ ApplyPartitionTransformToTuple(IcebergPartitionTransform * transform, TupleTable`
`411`	`415`	`{`
`412`	`416`	`PartitionField *field = palloc0(sizeof(PartitionField));`
`413`	`417`
`414`		`- field->field_name = pstrdup(transform->specField->name);`
`415`		`- field->field_id = transform->specField->field_id;`
	`418`	`+ field->field_name = pstrdup(transform->specField.name);`
	`419`	`+ field->field_id = transform->specField.field_id;`
`416`	`420`
`417`	`421`	`bool isNull = false;`
`418`	`422`	`Datum columnValue = slot_getattr(slot, transform->attnum, &isNull);`
`419`	`423`
`420`		`- switch (transform->type)`
	`424`	`+ switch (transform->parsedTransform.type)`
`421`	`425`	`{`
`422`	`426`	`case PARTITION_TRANSFORM_IDENTITY:`
`423`	`427`	`field->value = ApplyIdentityTransformToColumn(transform, columnValue, isNull,`
`@@ -451,7 +455,7 @@ ApplyPartitionTransformToTuple(IcebergPartitionTransform * transform, TupleTable`
`451`	`455`	`ereport(ERROR,`
`452`	`456`	`(errcode(ERRCODE_FEATURE_NOT_SUPPORTED),`
`453`	`457`	`errmsg("applying transform %s is not yet support ",`
`454`		`- transform->specField->transform)));`
	`458`	`+ transform->specField.transform)));`
`455`	`459`	`}`
`456`	`460`
`457`	`461`	`field->value_type = GetTransformResultAvroType(transform);`
`@@ -475,7 +479,7 @@ ApplyIdentityTransformToColumn(IcebergPartitionTransform * transform, Datum colu`
`475`	`479`	`return NULL;`
`476`	`480`	`}`
`477`	`481`
`478`		`- return PGIcebergBinarySerializePartitionFieldValue(columnValue, transform->sourceField->type,`
	`482`	`+ return PGIcebergBinarySerializePartitionFieldValue(columnValue, transform->sourceField.type,`
`479`	`483`	`transform->pgType, valueSize);`
`480`	`484`	`}`
`481`	`485`
`@@ -496,7 +500,7 @@ ApplyTruncateTransformToColumn(IcebergPartitionTransform * transform, Datum colu`
`496`	`500`
`497`	`501`	`PGType sourceType = transform->pgType;`
`498`	`502`	`PGType resultType = transform->resultPgType;`
`499`		`- int64_t truncateLen = (int64_t) transform->truncateLen;`
	`503`	`+ int64_t truncateLen = (int64_t) transform->parsedTransform.truncateLen;`
`500`	`504`	`Datum truncatedColumnValue = 0;`
`501`	`505`
`502`	`506`	`if (sourceType.postgresTypeOid == INT2OID)`
`@@ -765,7 +769,7 @@ ApplyBucketTransformToColumn(IcebergPartitionTransform * transform, Datum column`
`765`	`769`	`{`
`766`	`770`	`int64_t value = (int64_t) DatumGetInt16(columnValue);`
`767`	`771`
`768`		`- *bucketValue = (MurmurHash3_32_Long(value) & INT32_MAX) % transform->bucketCount;`
	`772`	`+ *bucketValue = (MurmurHash3_32_Long(value) & INT32_MAX) % transform->parsedTransform.bucketCount;`
`769`	`773`	`}`
`770`	`774`	`else if (transform->pgType.postgresTypeOid == INT4OID)`
`771`	`775`	`{`
`@@ -775,27 +779,27 @@ ApplyBucketTransformToColumn(IcebergPartitionTransform * transform, Datum column`
`775`	`779`	`*/`
`776`	`780`	`int64_t value = (int64_t) DatumGetInt32(columnValue);`
`777`	`781`
`778`		`- *bucketValue = (MurmurHash3_32_Long(value) & INT32_MAX) % transform->bucketCount;`
	`782`	`+ *bucketValue = (MurmurHash3_32_Long(value) & INT32_MAX) % transform->parsedTransform.bucketCount;`
`779`	`783`	`}`
`780`	`784`	`else if (transform->pgType.postgresTypeOid == INT8OID)`
`781`	`785`	`{`
`782`	`786`	`int64_t value = DatumGetInt64(columnValue);`
`783`	`787`
`784`		`- *bucketValue = (MurmurHash3_32_Long(value) & INT32_MAX) % transform->bucketCount;`
	`788`	`+ *bucketValue = (MurmurHash3_32_Long(value) & INT32_MAX) % transform->parsedTransform.bucketCount;`
`785`	`789`	`}`
`786`	`790`	`else if (transform->pgType.postgresTypeOid == TEXTOID \|\|`
`787`	`791`	`transform->pgType.postgresTypeOid == VARCHAROID \|\|`
`788`	`792`	`transform->pgType.postgresTypeOid == BPCHAROID)`
`789`	`793`	`{`
`790`	`794`	`const char *value = TextDatumGetCString(columnValue);`
`791`	`795`
`792`		`- *bucketValue = (MurmurHash3_32_Bytes(value, strlen(value)) & INT32_MAX) % transform->bucketCount;`
	`796`	`+ *bucketValue = (MurmurHash3_32_Bytes(value, strlen(value)) & INT32_MAX) % transform->parsedTransform.bucketCount;`
`793`	`797`	`}`
`794`	`798`	`else if (transform->pgType.postgresTypeOid == BYTEAOID)`
`795`	`799`	`{`
`796`	`800`	`bytea *value = DatumGetByteaP(columnValue);`
`797`	`801`
`798`		`- *bucketValue = (MurmurHash3_32_Bytes(VARDATA_ANY(value), VARSIZE_ANY_EXHDR(value)) & INT32_MAX) % transform->bucketCount;`
	`802`	`+ *bucketValue = (MurmurHash3_32_Bytes(VARDATA_ANY(value), VARSIZE_ANY_EXHDR(value)) & INT32_MAX) % transform->parsedTransform.bucketCount;`
`799`	`803`	`}`
`800`	`804`	`else if (transform->pgType.postgresTypeOid == DATEOID)`
`801`	`805`	`{`
`@@ -807,47 +811,47 @@ ApplyBucketTransformToColumn(IcebergPartitionTransform * transform, Datum column`
`807`	`811`	`* spec normally hashes int bytes for date type but spark hashes long`
`808`	`812`	`* bytes of date. We follow spark here.`
`809`	`813`	`*/`
`810`		`- *bucketValue = (MurmurHash3_32_Long(daysFromEpoch) & INT32_MAX) % transform->bucketCount;`
	`814`	`+ *bucketValue = (MurmurHash3_32_Long(daysFromEpoch) & INT32_MAX) % transform->parsedTransform.bucketCount;`
`811`	`815`	`}`
`812`	`816`	`else if (transform->pgType.postgresTypeOid == TIMESTAMPOID)`
`813`	`817`	`{`
`814`	`818`	`Timestamp value = DatumGetTimestamp(columnValue);`
`815`	`819`
`816`	`820`	`int64_t microsecsFromEpoch = AdjustTimestampFromPostgresToUnix(value);`
`817`	`821`
`818`		`- *bucketValue = (MurmurHash3_32_Long(microsecsFromEpoch) & INT32_MAX) % transform->bucketCount;`
	`822`	`+ *bucketValue = (MurmurHash3_32_Long(microsecsFromEpoch) & INT32_MAX) % transform->parsedTransform.bucketCount;`
`819`	`823`	`}`
`820`	`824`	`else if (transform->pgType.postgresTypeOid == TIMESTAMPTZOID)`
`821`	`825`	`{`
`822`	`826`	`TimestampTz value = DatumGetTimestampTz(columnValue);`
`823`	`827`
`824`	`828`	`int64_t microsecsFromEpoch = AdjustTimestampFromPostgresToUnix(value);`
`825`	`829`
`826`		`- *bucketValue = (MurmurHash3_32_Long(microsecsFromEpoch) & INT32_MAX) % transform->bucketCount;`
	`830`	`+ *bucketValue = (MurmurHash3_32_Long(microsecsFromEpoch) & INT32_MAX) % transform->parsedTransform.bucketCount;`
`827`	`831`	`}`
`828`	`832`	`else if (transform->pgType.postgresTypeOid == TIMEOID)`
`829`	`833`	`{`
`830`	`834`	`TimeADT value = DatumGetTimeADT(columnValue);`
`831`	`835`
`832`	`836`	`int64_t microsecsFromMidnight = value;`
`833`	`837`
`834`		`- *bucketValue = (MurmurHash3_32_Long(microsecsFromMidnight) & INT32_MAX) % transform->bucketCount;`
	`838`	`+ *bucketValue = (MurmurHash3_32_Long(microsecsFromMidnight) & INT32_MAX) % transform->parsedTransform.bucketCount;`
`835`	`839`	`}`
`836`	`840`	`else if (transform->pgType.postgresTypeOid == UUIDOID)`
`837`	`841`	`{`
`838`	`842`	`size_t valueSize = 0;`
`839`		`- unsigned char *value = PGIcebergBinarySerializePartitionFieldValue(columnValue, transform->sourceField->type,`
	`843`	`+ unsigned char *value = PGIcebergBinarySerializePartitionFieldValue(columnValue, transform->sourceField.type,`
`840`	`844`	`transform->pgType, &valueSize);`
`841`	`845`
`842`		`- *bucketValue = (MurmurHash3_32_Bytes(value, valueSize) & INT32_MAX) % transform->bucketCount;`
	`846`	`+ *bucketValue = (MurmurHash3_32_Bytes(value, valueSize) & INT32_MAX) % transform->parsedTransform.bucketCount;`
`843`	`847`	`}`
`844`	`848`	`else if (transform->pgType.postgresTypeOid == NUMERICOID)`
`845`	`849`	`{`
`846`	`850`	`size_t valueSize = 0;`
`847`		`- unsigned char *value = PGIcebergBinarySerializePartitionFieldValue(columnValue, transform->sourceField->type,`
	`851`	`+ unsigned char *value = PGIcebergBinarySerializePartitionFieldValue(columnValue, transform->sourceField.type,`
`848`	`852`	`transform->pgType, &valueSize);`
`849`	`853`
`850`		`- *bucketValue = (MurmurHash3_32_Bytes(value, valueSize) & INT32_MAX) % transform->bucketCount;`
	`854`	`+ *bucketValue = (MurmurHash3_32_Bytes(value, valueSize) & INT32_MAX) % transform->parsedTransform.bucketCount;`
`851`	`855`	`}`
`852`	`856`	`else`
`853`	`857`	`{`
`@@ -975,7 +979,7 @@ SerializePartitionValueToPGText(void *value, size_t valueLength, IcebergPartitio`
`975`	`979`	`/* First, deserialize back */`
`976`	`980`	`bool isNull = false;`
`977`	`981`	`Datum partitionDatum =`
`978`		`- PartitionValueToDatum(transform->type, value, valueLength,`
	`982`	`+ PartitionValueToDatum(transform->parsedTransform.type, value, valueLength,`
`979`	`983`	`transform->resultPgType, &isNull);`
`980`	`984`
`981`	`985`	`if (isNull)`