Szia, üdvözöllek a blogomon!
Ha a Bronze réteg a bizalom alapja, akkor a Silver az a pont, ahol az adat használhatóvá válik. Itt történik az, amit sokan egyszerűen csak „transzformációnak” hívnak – de valójában ez az adatplatform egyik legkritikusabb része.
Képzelj el egy helyzetet. A forrásrendszerből érkező adatok technikailag rendben vannak, de üzletileg nem egységesek. Ugyanaz a státusz többféleképpen szerepel, dátumformátumok eltérnek, előfordulnak duplikált rekordok. A Bronze rétegben ez még nem probléma – ott az a cél, hogy hűen megőrizzük a forrást. A Silverben viszont már dönteni kell.
Az első kérdés: mit tekintünk „tiszta adatnak”?
Duplikáció esetén melyik rekord az érvényes? Az utolsó módosítás? A legfrissebb időbélyeg? Vagy a forrásrendszer státusza alapján döntünk?
Ez már nem pusztán technikai kérdés. Üzleti logika él a transzformációban.
A Silver rétegben gyakran jelenik meg az incremental load logika is. Nem töltünk be mindent újra minden nap, hanem csak a változásokat. Itt jön be az upsert (merge) szemlélet: ha létezik a rekord, frissítjük; ha nem, beszúrjuk. Ez hatékonyabb, de csak akkor működik jól, ha van stabil kulcsmezőnk és konzisztens változáskezelésünk.
Ha rosszul választjuk meg a kulcsot, vagy nem idempotens a pipeline, akkor egy hiba után a rendszer állapota torzulhat. Például egy újrafuttatás duplikációt okozhat. Az idempotencia azt jelenti: ugyanazt a futtatást többször végrehajtva is ugyanazt az eredményt kapjuk. Ez Silver szinten kritikus.
Egy másik fontos döntés a séma (schema) kezelése. Mi történik, ha a forrás új oszlopot küld? Automatikusan átengedjük? Megállítjuk a pipeline-t? Naplózzuk és jelzést küldünk? Ezek mind tervezési döntések.
Elemzőként számomra a Silver réteg az a hely, ahol az adat először válik üzleti értelemben konzisztenssé. Ha itt kompromisszumot kötünk, a Gold rétegben már csak „szépítgetni” tudunk.
A 32. nap tanulsága számomra az, hogy a Silver nem pusztán tisztítás. Ez az a réteg, ahol a technikai adatból üzletileg értelmezhető információ lesz – és itt dől el, mennyire stabil az alap.
Köszönöm, hogy elolvastad! Legyen szép napod!
#MicrosoftFabric #100DaysOfLearning #DataAnalytics #BusinessAnalyst #TanulásNyilvánosan