Create PackedData from cudf PackedColumns #228

nirandaperera · 2025-04-24T23:41:34Z

Current PackedData cython API does not contain a constructor that takes in cudf packed columns. This PR adds it.

wence- · 2025-04-25T11:37:03Z

python/rapidsmpf/rapidsmpf/buffer/packed_data.pyx

+    def __init__(self, PackedColumns packed_columns) -> None:
+        self.c_obj = make_unique[cpp_PackedData](
+            move(deref(packed_columns.c_obj).metadata),
+            move(deref(packed_columns.c_obj).gpu_data))


This needs to very clearly document that it takes ownership of the data in the passed in PackedColumns object.

nirandaperera · 2025-04-25T18:01:07Z

/ok to test

python/rapidsmpf/rapidsmpf/buffer/packed_data.pyx

Co-authored-by: Mads R. B. Kristensen <[email protected]>

This reverts commit 9802c17.

madsbk

Looks good, only some minor suggestions.

python/rapidsmpf/rapidsmpf/benchmarks/streaming_benchmark.py

madsbk · 2025-04-29T06:10:07Z

python/rapidsmpf/rapidsmpf/buffer/packed_data.pyx

@@ -13,3 +15,39 @@ cdef class PackedData:
        cdef PackedData self = PackedData.__new__(PackedData)
        self.c_obj = move(obj)
        return self
+
+    @staticmethod
+    def from_cudf_packed_columns(PackedColumns packed_columns) -> PackedData:


No type notation in pyx

Suggested change

def from_cudf_packed_columns(PackedColumns packed_columns) -> PackedData:

def from_cudf_packed_columns(PackedColumns packed_columns):

madsbk · 2025-04-29T06:13:20Z

python/rapidsmpf/rapidsmpf/buffer/packed_data.pyx

@@ -13,3 +15,39 @@ cdef class PackedData:
        cdef PackedData self = PackedData.__new__(PackedData)
        self.c_obj = move(obj)
        return self
+
+    @staticmethod


Make it a @classmethod and do cls.__new__(cls) like in the spill manager: https://github.com/rapidsai/rapidsmpf/blob/b77ed56a56a357d4e1f1bcb6208098a8078fb740/python/rapidsmpf/rapidsmpf/buffer/spill_manager.pyx#L95C33

python/rapidsmpf/rapidsmpf/buffer/packed_data.pyx

Co-authored-by: Mads R. B. Kristensen <[email protected]>

Signed-off-by: niranda perera <[email protected]>

…ra/rapidsmpf into packed_data_from_packed_cols

pentschev

Thanks @nirandaperera , left a few comments.

python/rapidsmpf/rapidsmpf/buffer/packed_data.pyx

pentschev · 2025-05-09T20:13:49Z

python/rapidsmpf/rapidsmpf/buffer/packed_data.pyi

 class PackedData:
-    pass
+    def __init__(self) -> None: ...
+    @staticmethod


Should this be @classmethod like in the pyx file?

yes, good catch. Thanks @pentschev

python/rapidsmpf/rapidsmpf/benchmarks/streaming_benchmark.py

Co-authored-by: Peter Andreas Entschev <[email protected]>

Signed-off-by: niranda perera <[email protected]>

…ra/rapidsmpf into packed_data_from_packed_cols

Signed-off-by: niranda perera <[email protected]>

pentschev

LGTM, thanks @nirandaperera !

madsbk

Looks good, I only one suggestion

madsbk · 2025-05-12T10:28:48Z

python/rapidsmpf/rapidsmpf/buffer/packed_data.pyx

+        """
+        cdef PackedData ret = cls.__new__(cls)
+        with nogil:
+            if not (deref(packed_columns.c_obj).metadata and


Also check that packed_columns.c_obj isn't null

Signed-off-by: niranda perera <[email protected]>

python/rapidsmpf/rapidsmpf/buffer/packed_data.pyx

Co-authored-by: Mads R. B. Kristensen <[email protected]>

nirandaperera · 2025-05-14T23:26:19Z

/merge

adding api

0f0585c

nirandaperera requested a review from a team as a code owner April 24, 2025 23:41

nirandaperera added improvement Improves an existing functionality non-breaking Introduces a non-breaking change labels Apr 24, 2025

nirandaperera requested a review from wence- April 24, 2025 23:42

reverting precommit mess

c5e9fcd

wence- reviewed Apr 25, 2025

View reviewed changes

add docs

49d90ab

nirandaperera requested a review from wence- April 25, 2025 15:30

precommit

0e8c0de

madsbk requested changes Apr 28, 2025

View reviewed changes

python/rapidsmpf/rapidsmpf/buffer/packed_data.pyx Outdated Show resolved Hide resolved

python/rapidsmpf/rapidsmpf/buffer/packed_data.pyx Show resolved Hide resolved

nirandaperera and others added 3 commits April 28, 2025 13:10

fixinf deadlock and moving to a static method

b74d853

precommit

9802c17

Apply suggestions from code review

e63bc3f

Co-authored-by: Mads R. B. Kristensen <[email protected]>

nirandaperera requested a review from madsbk April 28, 2025 20:13

nirandaperera added 3 commits April 28, 2025 13:44

Revert "precommit"

539a408

This reverts commit 9802c17.

precommit

af38917

Merge branch 'branch-25.06' into packed_data_from_packed_cols

77fa021

madsbk requested changes Apr 29, 2025

View reviewed changes

nirandaperera and others added 4 commits April 29, 2025 16:27

Apply suggestions from code review

c2ff4ef

Co-authored-by: Mads R. B. Kristensen <[email protected]>

addressing comments

de4c135

Signed-off-by: niranda perera <[email protected]>

Merge branch 'packed_data_from_packed_cols' of github.com:nirandapere…

716359e

…ra/rapidsmpf into packed_data_from_packed_cols

Merge branch 'branch-25.06' into packed_data_from_packed_cols

f37ccd8

nirandaperera requested a review from madsbk May 9, 2025 17:18

pentschev reviewed May 9, 2025

View reviewed changes

nirandaperera and others added 3 commits May 9, 2025 14:02

Apply suggestions from code review

b3e3653

Co-authored-by: Peter Andreas Entschev <[email protected]>

addressing comments

700fccd

Signed-off-by: niranda perera <[email protected]>

Merge branch 'packed_data_from_packed_cols' of github.com:nirandapere…

3da69b3

…ra/rapidsmpf into packed_data_from_packed_cols

nirandaperera requested a review from pentschev May 9, 2025 21:51

minor change

926cc98

Signed-off-by: niranda perera <[email protected]>

pentschev approved these changes May 10, 2025

View reviewed changes

madsbk requested changes May 12, 2025

View reviewed changes

checking c_obj null

70adcac

Signed-off-by: niranda perera <[email protected]>

nirandaperera requested a review from madsbk May 12, 2025 20:04

madsbk approved these changes May 13, 2025

View reviewed changes

python/rapidsmpf/rapidsmpf/buffer/packed_data.pyx Outdated Show resolved Hide resolved

nirandaperera and others added 2 commits May 14, 2025 16:25

Update python/rapidsmpf/rapidsmpf/buffer/packed_data.pyx

55b843e

Co-authored-by: Mads R. B. Kristensen <[email protected]>

Merge branch 'branch-25.06' into packed_data_from_packed_cols

6932a92

Update packed_data.pyx

74cd3c6

rapids-bot bot merged commit d03f885 into rapidsai:branch-25.06 May 14, 2025
23 checks passed

	def from_cudf_packed_columns(PackedColumns packed_columns) -> PackedData:
	def from_cudf_packed_columns(PackedColumns packed_columns):

Create PackedData from cudf PackedColumns #228

Create PackedData from cudf PackedColumns #228

Uh oh!

Conversation

nirandaperera commented Apr 24, 2025

Uh oh!

wence- Apr 25, 2025

Choose a reason for hiding this comment

Uh oh!

nirandaperera commented Apr 25, 2025

Uh oh!

Uh oh!

Uh oh!

madsbk left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

madsbk Apr 29, 2025

Choose a reason for hiding this comment

Uh oh!

madsbk Apr 29, 2025

Choose a reason for hiding this comment

Uh oh!

Uh oh!

pentschev left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Uh oh!

Uh oh!

pentschev May 9, 2025

Choose a reason for hiding this comment

Uh oh!

nirandaperera May 9, 2025

Choose a reason for hiding this comment

Uh oh!

Uh oh!

pentschev left a comment

Choose a reason for hiding this comment

Uh oh!

madsbk left a comment

Choose a reason for hiding this comment

Uh oh!

madsbk May 12, 2025

Choose a reason for hiding this comment

Uh oh!

Uh oh!

nirandaperera commented May 14, 2025

Uh oh!

Uh oh!

Uh oh!