Szia, üdvözöllek a blogomon!
Amikor eljutunk a Gold rétegig, előbb-utóbb szembejön a kérdés: hogyan modellezzük az adatot? Klasszikus csillagséma (star schema), külön dimenziókkal és fact táblával? Vagy inkább egy széles, „lapos” tábla, ahol minden egy helyen van?
Elsőre a star schema tűnik a szakmailag „helyes” válasznak. Külön dimenziók (pl. termék, ügyfél, dátum), és egy fact tábla, amely a mért adatokat tartalmazza. Ez jól skálázható, tiszta logikájú, és BI eszközökben optimalizált működést ad. A dimenziók újrahasználhatók, a definíciók konzisztenssé válnak.
De nézzünk egy másik helyzetet. Egy kisebb csapat, kevés riport, viszonylag egyszerű adatszerkezet. Itt a csillagséma néha túltervezés. Egy jól strukturált, lapos tábla gyorsabb fejlesztést tesz lehetővé, és a riportkészítés is egyszerűbb lehet.
A lapos modell viszont könnyen redundanciát hoz be. Ha ugyanaz a dimenzió több fact jellegű adat mellett is ismétlődik, a változtatás nehezebb lesz. Ráadásul nagyobb adatmennyiségnél teljesítményproblémák jelenhetnek meg.
A star schema előnyei:
– tiszta üzleti entitások
– jobb újrahasznosíthatóság
– konzisztens KPI logika
– skálázhatóság
A lapos modell előnyei:
– gyorsabb indulás
– kevesebb join
– egyszerűbb mentális modell kisebb csapatnál
Fejlesztői szemmel a döntés gyakran teljesítmény- és karbantarthatósági kérdés. BA szemmel viszont az a fontos, hogy a modell mennyire támogatja az üzleti gondolkodást. Ha a felhasználó nem érti, mi a dimenzió és mi a fact, a „szép” modell is zavaró lehet.
Én azt tanultam, hogy nincs univerzális válasz. A modellnek a használati módhoz kell illeszkednie. Ha a rendszer növekedni fog, érdemes előre gondolkodni. Ha viszont gyors validáció a cél, nem biztos, hogy azonnal enterprise-szintű modellt kell építeni.
A 38. nap tanulsága számomra az, hogy az adatmodell nem esztétikai kérdés. Ez az a réteg, ahol a technikai struktúra és az üzleti értelmezhetőség találkozik.
Köszönöm, hogy elolvastad! Legyen szép napod!
#MicrosoftFabric #100DaysOfLearning #DataAnalytics #BusinessAnalyst #TanulásNyilvánosan