Ga naar inhoud

CLI-referentie

De eencijferho CLI verwerkt DUO-bestanden via losse stappen of in één pipeline-aanroep.

Altijd actueel

Gebruik eencijferho --help of eencijferho <commando> --help voor de meest actuele beschrijving rechtstreeks uit de tool.


Gedeelde opties

Alle commando's vereisen:

Optie Beschrijving
--input PATH Map met invoerbestanden (data/01-input)
--output PATH Map voor uitvoerbestanden (data/02-output)

Commando's

pipeline — alles in één stap

eencijferho pipeline --input data/01-input --output data/02-output

Voert extract → validate → convert achter elkaar uit.

eencijferho.cli.cmd_pipeline

Run the complete end-to-end pipeline (extract → validate → convert).


extract

eencijferho extract --input data/01-input --output data/02-output

eencijferho.cli.cmd_extract

Extract metadata from input files into /metadata/.


validate

eencijferho validate --input data/01-input --output data/02-output

eencijferho.cli.cmd_validate

Validate extracted metadata and match input files.


convert

eencijferho convert --input data/01-input --output data/02-output [opties]

eencijferho.cli.cmd_convert

Run the full turbo convert pipeline.

Uitvoer-opties

Optie Effect
--skip-decode Geen _decoded CSV-varianten
--skip-enrich Geen _enriched CSV-varianten
--skip-parquet Geen Parquet-compressie
--skip-encrypt BSN-kolommen niet versleutelen
--skip-snake-case Originele kolomnamen behouden
--skip-ev EV-bestanden overslaan
--skip-vakhavw VAKHAVW-bestanden overslaan
--decode-columns KOLOM ... Alleen opgegeven kolommen decoderen
--enrich-variables VAR ... Alleen opgegeven variabelen verrijken

decode

eencijferho decode --input data/01-input --output data/02-output

eencijferho.cli.cmd_decode

Decode CSV files using Dec_* lookup tables (Dec-only, no label substitution).


enrich

eencijferho enrich --input data/01-input --output data/02-output

eencijferho.cli.cmd_enrich

Apply variable_metadata label substitution to decoded CSV files.

Skips decode_fields entirely when no variable_metadata mappings apply to the columns of a given file (avoids unnecessary computation on large files).


validate-output

eencijferho validate-output --input data/01-input --output data/02-output

eencijferho.cli.cmd_validate_output

Validate converted output files: column values and DEC decoder files.


Uitvoerstructuur

Na een volledige pipeline-run:

data/02-output/
├── metadata/
│   ├── json/
│   │   ├── EV_2023.json
│   │   └── variable_metadata.json
│   ├── logs/
│   │   ├── (3)_xlsx_validation_log_latest.json
│   │   ├── (4)_file_matching_log_latest.json
│   │   └── (5)_conversion_log_latest.json
│   └── EV_2023.xlsx
├── EV_2023.csv
├── EV_2023_decoded.csv
├── EV_2023_enriched.csv
└── EV_2023.parquet