Danmarks Meteorologiske Institut (DMI) har i samarbejde med Rigsarkivet og teknologivirksomheden Oracle fuldført digitaliseringen af meteorologiske årbøger, der dækker perioden 1873 til 1983. Med hjælp fra agentbaseret kunstig intelligens er omkring 40 millioner håndskrevne og trykte vejrobservationer omsat til strukturerede datafiler, som nu er frit tilgængelige for alle via DMI's hjemmeside.
Baggrund
Siden 1873 har vejrstationer i Danmark, Færøerne og Grønland dagligt registreret målinger af temperatur, nedbør, lufttryk og en række andre meteorologiske parametre. Observationerne blev samlet i trykte meteorologiske årbøger og den såkaldte 'Maanedsoversigt' for hvert år fra 1874 til 1980. Materialet har hidtil kun været tilgængeligt som fysiske bøger eller indscannede billedfiler, hvilket har gjort det vanskeligt at anvende i tekniske analyser, klimamodeller og ingeniørberegninger.
Agentbaseret AI løser digitaliseringsopgaven
Projektet, der blev igangsat i 2024 med finansiering fra Iværksætterpuljen, anvender en agentbaseret AI-tilgang, hvor flere digitale agenter samarbejder om at behandle de historiske data:
- Én agent aflæser tabeller fra scannede sider
- En anden omdanner aflæsningerne til strukturerede tabeller
- En tredje kontrollerer, om tallene er sandsynlige i forhold til forventede vejrmønstre
AI-teknologien har desuden hjulpet med at afkode håndskrift i de ældste årbøger. DMI's forskere har efterfølgende kvalitetssikret hele processen for at sikre troværdige data.
Morten Thaarup, afdelingschef for Data og digitalisering hos DMI:
Vi vidste, at historisk viden om et områdes klima kan være guld værd i mange brancher, og at DMI's gamle årbøger indeholdt masser af viden, som kun gavner dem, der sidder med papiret i hånden. Derfor satte vi i 2024 opgaven i gang med at få løftet notaterne fra papir til datafiler, hvilket er lykkedes med hjælp fra Iværksætterpuljen og et samarbejde mellem Rigsarkivet, Oracle og vores forskere.
Anvendelser på tværs af brancher
De digitaliserede data er tilgængelige i CSV-format og kan bruges i alt fra regneark til avancerede beregningsprogrammer. Behovet for lange, historiske tidsserier er stort i flere sektorer:
| Branche | Anvendelse |
|---|---|
| Landbrug | Såtidspunkter, afgrødevalg og klimastrategier |
| Byggeri og infrastruktur | Klimaanalyser forud for planlægning |
| Forsikring | Risikovurdering baseret på historiske mønstre |
| Teknologi og forskning | Træning af AI-modeller og klimaanalyse |
Virksomheden Cordulus, der specialiserer sig i at omsætte vejrdata til indsigter for industrier som landbruget, illustrerer anvendelsesmulighederne. Virksomhedens navn er inspireret af DMI's grundlægger Niels Henrik Cordulus Hoffmeyer.
Morten Birk, CTO hos Cordulus:
Data er krumtappen for sådan nogle som os i Cordulus, der arbejder med modellering af vejr ved hjælp af kunstig intelligens. Vi fodrer vores neurale netværk med data, de kan lære af, heriblandt meget store mængder data fra DMI. Det hjælper os med at forstå, hvordan vejret udvikler sig, om der f.eks. optræder en acceleration i forekomsten af ekstremvejr, eller om 'normalt vejr' i dag er det samme som for 150 år siden.
Datasættet i overblik
| Detalje | Information |
|---|---|
| Periode | 1873–1983 |
| Antal observationer | Ca. 40 millioner |
| Geografisk dækning | Danmark, Færøerne og Grønland |
| Format | CSV og strukturerede datafiler |
| Kilde | Meteorologiske årbøger og 'Maanedsoversigt' |
Dataene er frit tilgængelige og stilles til rådighed via DMI's hjemmeside.





