Tips til datavask

Prosjektet har fått en del spørsmål fra markedsaktørene om hvordan de kan starte med datavask allerede nå. Her presenterer vi noen tips og tanker basert på innspill fra markedsaktører som allerede har begynt med datavask.

Hvordan gjøre datavask?

- En del kan gjøres automatisk, mens en del må gjøres manuelt
- De store volumene vaskes automatisk, mens problemsakene må løses manuelt
- Viktig å knytte til seg en partner som kan bistå i vask og vaske mot eksterne registre:
  - Folkeregisteret
  - Brønnøysund
  - Postens adresseregister
  - Teleselskapenes registre
  - Andre: Matrikkelen


Automatisk vask

- Viktig med intelligens i vaskeverktøyet, f. eks. såkalt soundex-funksjonalitet som kan luke ut mindre feil som f. eks. rettskrivning.
- Ikke alle registrene inneholder all informasjon, derfor viktig å kjøre flere iterasjoner der dataene gradvis berikes, f. eks.:
  - Kunde mangler adresse og fødselsdato og gir derfor ikke treff i Folkeregisteret.
  - Kunde berikes med adresse etter treff i teleoperatørens katalog.
  - Kunde gir treff etter neste iterasjon i Folkeregisteret.


Vaskesyklus

- Manuell forvask: En del arbeidslister kan hentes ut fra KIS, der man vet at man ikke vil få treff i den automatiske behandlingen
- Automatisk vask: Vask mot ulike eksterne registre i flere iterasjoner
- Manuell ettervask: Det som ikke lot seg vaske automatisk kan trekkes ut som arbeidslister fra vaskeverktøyet. Denne fasen inneholder mye telefonering til kundene


Manuell vask som kan startes i dag basert på arbeidslister – Kunde

- Kunder med både organisasjonsnummer og fødselsdato
  → Hvem er den egentlige kunden? Bedrift eller privatperson?
- Firma uten organisasjonsnummer
  → Hent nummer fra brreg, eller omregistrer på annen kunde
- Personkunder uten fødselsdato
  → Finn dato, ellers får du ikke treff i Folkeregisteret
- Fornavn som innehar ordet «og», «/» eller «&»
  → Mest sannsynlig mann og kone. Hvem av dem er kunden?
- Fornavn og etternavn som innehar «død»
  → Kunden er død. Hvem er den egentlige kunden?
- Gateadresse som innehar ord «post» og eller «boks», samt «co»
  → Må vaskes i forbindelse med AMS-utrulling


Manuell vask som kan startes i dag basert på arbeidslister – Målepunkt

- Manglende EAN (GSRN) nr.
  → Alle målepunkter skal ha et entydig GSRN-nummer i henhold til nettselskapets tildelte serie
- Stipulert over lang tid
  → Antatt årlig forbruk er sannsynligvis feil
- Manglende X og Y koordinater
  → Må vaskes i forbindelse med AMS-utrulling


Manuell vask som kan startes i dag basert på arbeidslister – Kontrakt

- Sluttbrukergruppe mot næringskode
  → Næringskode skal stemme i forhold til om det er industri, husholdning, produksjon etc.
- Enova-avgift, MVA, sertifikatpliktig forbruk
  → Skal stemme i forhold til næringskode spesifikt for hvert enkelt målepunkt