Bli datadrevet i stor skala med data mesh

26/04/21

Børge Kristiansen, rådgiver i PwC

– For å unngå at data-prosjekter blir en bedrift i en bedrift, og at resultatet blir best mulig for hele forretningen, så er data mesh en god rettesnor, sier Børge Ellingsen Kristiansen som hjelper bedrifter med dataanalyse.

– Skal du lage gull av dine data så nytter det ikke å bare ansette en data scientist. Du må få det inn i kulturen, sier Børge Kristiansen, Senior Manager i Data & Analytics i PwC.

Data mesh prinsipp 1: Forretningsorientert data- og løsningseierskap

Tradisjonelt har man organisert utvikling av data- og analyseløsninger med utviklerkompetanse på et sted og eierskap til forretningsbehov et annet sted. De som forstår behovene til kundene best kjenner ikke alltid mulighetene og begrensningene som ligger i teknologi. Og utviklerne kjenner ikke alltid forretningsbehovene. 

– En alternativ måte å organisere seg på er at hele eierskapet og utviklingen av data- og analysetjenester ligger på forretningssiden så det ikke blir noe kun IT-miljøet jobber med, sier Kristiansen. 

I data mesh kalles dette for domeneorientert desentralisert dataeierskap og arkitektur – vi kaller det forretningsorientert data- og løsningseierskap. Et domene kan for eksempel være skade innenfor forsikring. Innenfor domenet jobber ett eller flere produktteam som tar eierskap til forretningsprosesser, -behov, arkitektur, systemer og ikke minst data. Hvert domene er ansvarlig for data og løsninger som trengs til eget bruk, men i tillegg må de også legge til rette for at data skal kunne tas i bruk av andre domener i virksomheten. Her kommer konseptet med dataprodukter inn.

Les mer i blogginnlegget: «Data mesh prinsipp 1: Forretningsorientert data- og løsningseierskap»

Data mesh prinsipp 2: Data som et produkt

Data kan være vanskelig å finne, vanskelig å forstå, vanskelig å få tak i – og hvis man til slutt får tak i det – ikke alltid til å stole på. For å senke denne terskelen, må data både utformes og tilbys på en slik måte at den både er lett å finne og lett å bruke. Men hva innebærer egentlig å tilby noe som et dataprodukt?

1: Dataene må kunne tas i bruk der og da

Det er ikke tilstrekkelig å tilrettelegge noen datastrukturer på en dataplattform og be folk forsyne seg: Det må også inneholde nødvendige beskrivelser, forklaringer og verktøy, slik som programkode, API-er, eksempler på analyser, osv. som kan bidra til å senke terskelen for bruk.

2: Dataene må være selvforklarende

For det andre må dataene være selvforklarende og inngi tillit. Dersom man uansett ikke stoler på kvaliteten, eller må lese gjennom en tykk manual før man kan få noe fornuftig ut av dataene, blir de ikke tatt i bruk. Dette innebærer eksempelvis at data må være renset for det som brukere oppfatter som støy, og at det er utformet på en slik måte at det fremkommer tydelig hvordan det henger sammen med forretningsprosessene.

3: Produktteam med forretning og utviklingskompetanse

For det tredje må dataprodukt forvaltes og utvikles av et eget produktteam som er de som har best kunnskap om dataene og forretningsprosessen rundt. Et slikt team bør settes sammen av utviklere og personer med god kjennskap til dataene det dreier seg om, altså personer som er involvert i forretningsprosessene som skaper dem. Ved å involvere personer med riktig forretningskompetanse tettere i utviklingen oppnår man å redusere tiden det tar skape et dataprodukt, samtidig som man i mange tilfeller sikrer høyere tillit til dataene.

Les mer i blogginnlegget: «Data mesh prinsipp 2: Data som et produkt»

Data mesh prinsipp 3: Delt styringsmodell

Når man skal gå fra en sentralisert produksjon av data, innsikt og dataprodukter til en modell der dette ansvaret ligger distribuert, vil det være nødvendig med en annen modell for data governance enn det man tradisjonelt har operert med. Det handler om å standardisere og sette premisser sentralt og la produktteamene ta et helhetlig ansvar for forvaltning av sine dataprodukter.

Her er tips til organisering av virksomheten for å lykkes med kunstig intelligens.

En delt modell henger svært tett sammen med prinsippet om å tenke data som et produkt. Det blir da de forretningsnære produktteamene som som vil ha det operasjonelle ansvaret for governance av sine dataprodukter. I dette ligger blant annet det å beskrive innholdet i dataproduktet, sette klassifikasjonsnivå på dataproduktet og håndtere datakvalitetsutfordringer.

Standardiseringsjobben er viktig

Samtidig kan man ikke overlate alt til produktteamene. For at et slikt system skal fungere så er det nødvendig at man fra sentralt hold tar ansvaret for å definere standarder som det ikke er hensiktsmessig at alle finner opp selv. Eksempler på dette kan være hvordan man definerer metadata om dataproduktene, navngiving på grensesnitt for dataproduktene eller klassifiserer dataprodukter i henhold til informasjonssikkerhet og personvern. Standardiseringsarbeidet blir dermed et av de viktigste – om ikke det viktigste – bidraget fra sentralt hold.

Litt som når entreprenører bygger veier for plan– og bygningsetaten

Denne modellen kan på mange måter sammenlignes med det ansvaret plan- og bygningsetaten har for kommune- og reguleringsplaner. Gjennom disse planene definerer man fra sentralt hold på et overordnet nivå ting som hvor ulike bygninger skal ligge og hvor veier skal gå, byggehøyde og krav til utnyttelsesgrad. Samtidig overlater man det byggtekniske ansvaret av hus og veier til entreprenørene som har en viss frihet, så lenge de forholder seg til reguleringsplanen.

Les mer i blogginnlegget: «Data mesh prinsipp 3: Delt styringsmodell»

Saken fortsetter etter bildet.

Torstein Heien-Sunde, rådgiver i Data & Analytics i PwC

– Særlig de virksomhetene som planlegger å sette i gang flere data- og analyseinitiativer samtidig vil kunne ha stor nytte av å sjekke ut data mesh, sier Torstein Heien Sunde, Senior Manager, Data & Analytics i PwC.

Data mesh prinsipp 4: Selvbetjening på en felles, tilrettelagt plattform

På lik linje med tradisjonelle dataplattformer er tilgjengelighet av ulike verktøy, komponenter og teknologier ,  og at disse snakker sammen, en forutsetning for å sette teori ut i praksis. Men også her vil det melde seg behov for å tenke nytt: I en distribuert modell, bør de enkelte teamene selv få bestemme hvilke teknologier som tas i bruk og ha ansvaret for oppsett og drift av disse? Eller bør dette være organisert på en felles plattform?

Sånn får du orden på data governance så du kan få brukt alle dataene i din bedrift.

Bedre med sentral databank enn ti plattformer med hvert sitt språk

Et kjent dogme er at data øker mer i verdi om de sammenstilles, sammenlignet med hva de representerer hver for seg. Det er derfor sentralt at dataprodukter tilgjengeliggjøres for konsum av andre domener og interessenter. Dersom hvert enkelt domene bruker egne standarder og teknologier for tilgang og konsum, vil imidlertid arbeidet med å innhente disse fort by på mange utfordringer. For å unngå dette, er det behov for en felles, tilrettelagt plattform med standardiserte grensesnitt og teknologier som minimerer nødvendig innsats for å benytte seg av dataene som er tilgjengeliggjort.

Derfor er felles infrastruktur viktig

Med autonome, selvstendige team som har sitt fokus på å tilby de beste dataproduktene, kunne det også tenke seg at det bør være opp til hver enkelt å bestemme hvilken teknologi de bruker for å hente inn og prosessere data – så lenge disse tilbys ut i et standardisert grensesnitt. Moderne dataplattformer som Azure, Google Cloud og Amazon Web Services tilbyr alle et stort utvalg av komponenter. Men det å sette sammen disse i en fungerende arkitektur krever ofte kompetanse som både koster skjorta og er en mangelvare i mange virksomheter. Det er derfor urealistisk å forvente at hvert enkelt domene selv skal sørge for infrastrukturen i en desentralisert modell.

Selvbetjent plattform

Til forskjell fra en tradisjonell, monolittisk dataplattform der det sentrale datateamet gjerne deler samme miljø, bør heller hvert enkelt domeneteam tilby sine dataprodukter på en egen instans av en felles løsning som forvaltes og driftes sentralt. I en slik løsning er det viktig å abstrahere bort mest mulig av kompleksiteten og minimere arbeidet med å etablere en ny instans, samtidig som man unngår fellen det er å tilpasse felles løsninger til individuelle team sine behov. En slik selvbetjent, felles plattform vil for mange virksomheter representere både ny teknologi og en ny metode for hvordan løsninger tilbys til sluttbruker. Dette er imidlertid et nødvendig steg i reisen som paradigmeskiftet til data mesh representerer.

{{filterContent.facetedTitle}}

{{contentList.dataService.numberHits}} {{contentList.dataService.numberHits == 1 ? 'resultat' : 'resultater'}}
{{contentList.loadingText}}

Kontakt oss

Lars Meinich Andersen

Lars Meinich Andersen

Partner | Leder Data & AI, PwC Norway

Tlf: 916 62 243