- Publisert
Datasyn og dokumentanalyse med OCR, ANPR og automatisk validering
Innledning
I en verden der bilder, videoer og dokumenter utgjør en stadig større del av den digitale informasjonsstrømmen, blir evnen til å automatisk forstå og analysere visuelt innhold avgjørende. Datasyn (computer vision) og dokumentanalyse med OCR (optisk tegngjenkjenning) er teknologier som gjør det mulig å ekstrahere meningsfull informasjon fra ustrukturerte kilder.
QIVRA tilbyr en plattform som kombinerer avanserte modeller for bilskiltgjenkjenning (ANPR), dokument‑OCR, billettering, kvitterings‑ og fakturakontroll, bilidentifikasjon og datasammenligning. Dette innlegget gir en oversikt over hvordan disse verktøyene fungerer og hvilke problemer de løser.
Hva er datasyn og dokumentanalyse?
Datasyn er feltet innen kunstig intelligens som fokuserer på å la maskiner «se» og forstå bilder og video. Eksempler inkluderer gjenkjenning av objekter, ansiktsgjenkjenning, bevegelsesanalyse og bilde‑segmentering.
Dokumentanalyse er bruk av datasyn og NLP til å tolke skannede dokumenter, PDF‑filer og bilder av tekst. OCR er en grunnleggende teknologi her, men moderne systemer går lenger ved å forstå layout, tabeller, signaturer og sammenhengen mellom ulike felter.
ANPR/ALPR – automatisk bilskiltgjenkjenning
ANPR (Automatic Number Plate Recognition) eller ALPR (Automatic License Plate Recognition) er en spesialisert form for datasyn som identifiserer kjøretøyers registreringsskilt.
Bruksområder utover parkering
- Tollstasjoner: Automatisk registrering og fakturering.
- Trafikkovervåking: Måling av kjøretøyets hastighet, telling av biler, analyse av trafikkflyt.
- Sikkerhet: Identifisering av stjålne kjøretøy eller kjøretøy knyttet til kriminalitet.
- Logistikk: Sporing av lastebiler inn og ut av terminaler.
QIVRAs ANPR‑løsning
Vår plattform bruker dype nevrale nettverk som er trent på nordiske bilskilt (inkludert norske gule og hvite skilt). Den håndterer utfordringer som:
- Dårlig belysning: Natt, regn, solblending.
- Vinklede bilder: Skilt tatt fra side, forover eller bakfra.
- Skittne eller skadede skilt: Delvis dekket av snø, gjørme eller skrap.
- Forskjellige skrifttyper og formater: Norske, svenske, danske, EU‑skilt.
Systemet returnerer ikke bare skiltteksten, men også en tillitsverdi og et avklipp av det opprinnelige bildet for manuell verifisering om nødvendig.
Dokument‑OCR for fakturaer, kvitteringer og kontrakter
Mange virksomheter mottar tusenvis av papir‑ eller PDF‑fakturaer hver måned. Manuell registrering er tidkrevende og feilutsatt. QIVRAs dokument‑OCR løser dette ved å:
- Automatisk importere dokumenter fra e‑post, skanner, kamera eller filsystem.
- Forbedre bildekvalitet (deskew, kontrast, støyfjerning).
- Gjenkjenne tekst med høy nøyaktighet (over 99 % for rent trykt tekst).
- Forstå dokumentstruktur – identifisere avsender, mottaker, dato, beløp, varenummer, totalsum.
- Validere mot forhåndsdefinerte regler (f.eks. at totalsum stemmer med summen av linjene).
- Eksportere strukturerte data til ERP, regnskapssystem eller database.
Støtte for komplekse dokumenttyper
- Fakturaer: Ulike layouter fra hundrevis av leverandører.
- Kvitteringer: Kassekvitteringer med varierende kvalitet (termal‑papir, foldede, slitte).
- Kontrakter: Identifisering av parter, signatur‑steder, viktige klausuler.
- Søknader: Skjemaer fylt ut for hånd (handskrevet OCR).
- ID‑dokumenter: Pass, førerkort, nasjonale ID‑kort.
Billettering, kvitterings‑ og fakturakontroll
I bransjer som parkering, kollektivtransport, underholdning og kultur er billetter og kvitteringer sentrale. QIVRA tilbyr verktøy for å:
- Validere billetter: Skanne QR‑kode eller strekkode og sjekke mot database for gyldighet.
- Detektere forfalskninger: Analysere bilde på jakt etter tegn på manipulasjon (kopierte koder, kloning, photoshop).
- Automatisk stempling: Registrere bruk av billett og oppdatere status i sanntid.
- Generere kvitteringer: Etter gjennomført transaksjon lages en digital kvittering som sendes til kunden.
Bilidentifikasjon og datasammenligning
Ut over bilskilt kan datasyn brukes til å identifisere selve kjøretøyet – merke, modell, farge, årgang – og sammenligne med registrerte data.
Anvendelser
- Forsikring: Ved skademelding kan et bilde av skadet kjøretøy automatisk matches mot kundens polise for å bekrefte dekning.
- Bilutleie: Ved innlevering sammenlignes bilder tatt ved utleie med bilder ved retur for å oppdage nye skader.
- Bruktbilhandel: Automatisk vurdering av bilens tilstand basert på bilder.
QIVRAs tilnærming
Vi bruker convolutional neural networks (CNN) som er trent på store datasett med bilder av biler fra ulike vinkler og under ulike lysforhold. Systemet kan:
- Kategorisere bilmerke og modell med over 95 % nøyaktighet.
- Estimere årsmodell basert på designelementer.
- Detektere skader (bulker, riper, glasskader) og måle deres størrelse/lokasjon.
- Sammenligne to bilder og rapportere forskjeller.
Feiloppdaging og automatisk validering
En av de største fordelene med automatisert analyse er muligheten til å oppdage feil som mennesker kan overse.
Eksempler på automatisk validering
- Faktura: Beløpet i tekst («tolv tusen fem hundre kroner») stemmer ikke med beløpet i tall (12 500).
- Bilskilt: Skiltet som ble lest stemmer ikke med kjøretøytype registrert i database (f.eks. lastebil vs. personbil).
- Billett: Samme billettkode brukes på to forskjellige steder innenfor kort tid (indikerer mulig svindel).
- Dokument: Manglende signatur eller dato på en kontrakt som krever det.
Når en feil oppdages, kan systemet enten korrigere automatisk (hvis det er høy tillit), flagge for manuell gjennomgang eller avvise transaksjonen.
Case: Logistikkbedrift med automatisk fakturabehandling
En nordisk logistikkbedrift mottok over 5000 fakturaer månedlig fra underleverandører. Før QIVRA‑implementering brukte to heltidsansatte kun på manuell registrering og validering. Etter automatisering:
- Behandlingstid per faktura gikk fra 8 minutter til under 30 sekunder.
- Feilrate i regnskapet sank fra 4 % til 0,2 %.
- Ansatte kunne omfordeles til mer verdiskapende oppgaver som forhandling og analyse.
- Betalingsforsinkelser redusert fordi fakturaer ble behandlet samme dag som de kom inn.
Konklusjon
Datasyn og dokumentanalyse er ikke lenger eksperimentell teknologi – de er modne verktøy som kan gi umiddelbar effekt på nøyaktighet, hastighet og kostnader. Ved å kombinere ANPR, dokument‑OCR, bilidentifikasjon og automatisk validering i én plattform gjør QIVRA det enkelt for virksomheter å utnytte kraften i visuell data.
Er du interessert i å automatisere analyse av bilder eller dokumenter? Kontakt oss for en uforpliktende samtale eller bestill en demo av våre datasyn‑verktøy.
Denne artikkelen er basert på QIVRAs arbeid med datasyn for offentlige etater, transport‑ og logistikkselskaper, forsikringsbransjen og detaljhandel.
Ta kontakt
La oss vise deg plattformen i praksis
Book en demo eller send oss en e-post – vi setter opp et opplegg tilpasset deres drift.