Python Data Sanity

This code will validate pandas dataframes and create new columns with the result of the validation.

Result

The result will be written to a CSV file in the folder:

validation_job/output_data/daframe_validation.csv

Executing the job

make run

Adding new validations

There is a list with all validations that will be performed by the job.

validation_list = [
        {"output_column_name": "position_value_checked", "args": {"column_name": "position", "column_values": ["C", "1B", "2B", "3B", "SS", "LF", "CF", "RF", "P", "DH"]},
         "function": lambda row, args: check_column_values(row, args)},

        {"output_column_name": "league_player_value_checked", "args": {"column_name": "league_player", "column_values": ["AL", "NL"]},
         "function": lambda row, args: check_column_values(row, args)},

        {"output_column_name": "league_compare_value_checked", "args": {"columns_to_compare": ["league_player", "league_team"]},
         "function": lambda row, args: compare_columns(row, args)},

        {"output_column_name": "id_team_null_value_checked", "args": {"column_name": "id_team"},
         "function": lambda row, args: check_null_values(row, args)},

        {"output_column_name": "player_first_name_ascii_checked", "args": {"column_name": "first_name"},
         "function": lambda row, args: check_is_ascii(row, args)},
    ]

output_column_name: name of the column that will store the validation result
args: arguments of the validation function
function: function responsible for execute the data validation

To create new validation you can create a new validation function or reuse a existing function in a new column.

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
validation_job		validation_job
.gitignore		.gitignore
Makefile		Makefile
README.md		README.md
requirements.txt		requirements.txt
validation_job.zip		validation_job.zip

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Python Data Sanity

Result

Executing the job

Adding new validations

About

Uh oh!

Releases

Packages

Uh oh!

Languages

matheusnd/python-data-sanity

Folders and files

Latest commit

History

Repository files navigation

Python Data Sanity

Result

Executing the job

Adding new validations

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages