Proposal: Update DatasetVersion versioning

There has been some discussion (mostly in #1977) about reworking the versioning system for `DatasetVersion`. 

### Motivation
The current `DatasetVersion` versioning system leads to confusion (e.g. #1883). `DatasetVersion` has a `uuid` field (of type `UUID`) and a `version` field (also of type `UUID`). In a practical sense, I think these fields are redundant.

Additionally, external data systems might already support dataset versioning (e.g. delta, iceberg). It'd make sense for Marquez to support these.

### Proposal
I propose that a `Version`'s `uuid` field should assume the functionality currently provided by `Version`'s `version` field, and add an additional field `external_version` to support dataset versions provided by external applications. This would have a downstream impact on `JobVersion`.

#### Work required
1. Update [Version.getValue()](https://github.com/MarquezProject/marquez/blob/main/api/src/main/java/marquez/common/models/Version.java#L27) to be of type `String`
2. Drop `DatasetVersion`'s [`version` field](https://github.com/MarquezProject/marquez/blob/main/api/src/main/java/marquez/db/models/ExtendedDatasetVersionRow.java#L26)
3. Add a field to `DatasetVersion`: `external_version` (`String`)
4. Drop `JobVersion`'s [`version` field](https://github.com/MarquezProject/marquez/blob/main/api/src/main/java/marquez/db/models/ExtendedJobVersionRow.java#L32)
5. Add a field to `JobVersion`: `external_version` (`String`). 
    1. I'm not sure if this is currently necessary, but it seems reasonable to assume that data applications might support job versions tied to code in the future if they don't already.
7. Use OpenLineage's [`DatasetVersionDatasetFacet` facet](https://github.com/OpenLineage/OpenLineage/blob/main/spec/facets/DatasetVersionDatasetFacet.json) to support external dataset versions.
8. Upstream/downstream code changes to support 1-6 (e.g. updating queries to use `dv.uuid` instead of `dv.version`)
9. Database migrations

If this proposal is accepted, I'll open an [official proposal](https://github.com/MarquezProject/marquez/tree/main/proposals#submitting-a-proposal-for-review).

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Proposal: Update DatasetVersion versioning #2071

Motivation

Proposal

Work required

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Proposal: Update DatasetVersion versioning #2071

Description

Motivation

Proposal

Work required

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions