Az adattárház építésének 8 lépése
Az adattárház segít a pontos előrejelzési modellek kialakításában és a hatásos trendek azonosításában. Az adattárház építése során fontos, hogy felismerje a következő lépéseket, és alaposan foglalkozzon mindegyik lépéssel.
1. Az üzleti követelmények meghatározása
Mivel egy adattárház az üzleti tevékenység minden területét felöleli, elengedhetetlen, hogy minden részleg részt vegyen a tervezési folyamatban. A követelmények összegyűjtésének folyamata valamennyi érdekelt felet bevonja, és segít minden részlegnek megérteni az adattárház célját, azt, hogy milyen előnyökkel jár majd számukra, és milyen eredményekre számíthatnak.
A követelménygyűjtés történhet egyéni vagy közös megbeszélések formájában. Ez a fázis gyakran az adattárházak megvalósításának egyik legnehezebb részének bizonyul. Mivel egy adattárház nagyon sok forrásból származó, több részlegre kiterjedő adatokat tartalmaz, gyakran előfordulhatnak tárgyalások az információk megosztásáról és a prioritások meghatározásáról. Egy képzett üzleti elemző külső közvetítőként felléphet, hogy minden érdekelt fél elégedett legyen a meghatározott projektcélokkal.
A követelménygyűjtési fázis nagyon fontos annak biztosításában, hogy a részlegek céljai összhangban legyenek az átfogó projekttel, és hogy az összes érintett fél beleegyezését elnyerje. Az elemzéshez használt adatokba való mélyreható betekintésből a jelenlegi és jövőbeli igények kiemelésében is segíthet, ami valószínűleg feltárja, hogy az adatokat hol használják és hol nem használják fel hatékonyan.
2. Fizikai környezetek beállítása
Az adattárháza jellemzően három környezettel rendelkezik, ami a szoftverfejlesztés legjobb gyakorlatát utánozza. A három környezet a fejlesztési, a tesztelési és a termelési környezet, és ezeket együttesen használják annak biztosítására, hogy a változtatásokat a sértetlenség és a biztonság szempontjából teszteljék, mielőtt a termelési környezetbe éles üzembe helyezik őket. Ezek lehetővé teszik, hogy a fejlesztés és a minőségbiztosítás a produktív környezet befolyásolása nélkül történjen.
Három különálló környezetre van szükség a tesztadatok futtatásához, a javítandó töréspontok azonosításához és a szerverterhelések stresszének csökkentéséhez is. Nem elég, ha egyszerűen különböző fizikai környezeteket állítunk be. A különböző folyamatokat (például ETL, OLAP-kocka és jelentéskészítés) is megfelelően kell beállítani az egyes környezetekhez.
3. Az adatmodellezés bevezetése
Az adatmodellezés az a tervrajz, amelyből az adattárház felépül. Segíthet az adatkapcsolatok vizualizálásában, az elnevezési konvenciók szabványosításában és a biztonsági folyamatok megfelelőségének megállapításában.
Ez az adattárház tervezésének legösszetettebb fázisaként ismert. Egy jó adatmodell lehetővé teszi, hogy az adattárházi rendszer könnyen növekedjen és jól teljesítsen!
Az adatmodellezés általában az adattároló szintjén történik, és az adattárházba ágazik. A három legnépszerűbb adattárházi adatmodell a Snowflake, a Star és a Galaxy séma. A választott modell hatással lesz az adattárház és az adatmárkák szerkezetére, és segít irányítani a raktáron belüli általános architektúrát.
4. Az ETL-megoldás kiválasztása
Az ETL az Extract, Transform and Load (kivonás, átalakítás és betöltés) rövidítése, és a különböző forrásokból származó adatok összegyűjtését és feldolgozását jelenti egy központi adattárolóba, ahol később elemezhetőek. Az Ön vállalkozása számos adatforráshoz hozzáfér, de gyakran olyan módon jelenik meg, hogy azokat nehéz vagy lehetetlen fogyasztani.
Egy jó ETL-folyamat jelentheti a különbséget egy lassú és nehezen használható adattárház és egy olyan elegáns adattárház között, amely a szervezet minden részének értéket ad. Ezért létfontosságú a megfelelő ETL-megoldás kiválasztása.
5. Online analitikai feldolgozás (OLAP-kocka)
Az OLAP-kocka segít az adattárházban vagy adattárolóban lévő adatok elemzésében. Mivel a raktárában több forrásból származó adatokat válogat, az OLAP-kocka segít az összes adatot többdimenziós formátumba rendezni, ami megkönnyíti az elemzést.
6. Front-end létrehozása
Ez a szakasz a front-end vizualizációra vonatkozik, ahol a felhasználók megérthetik és alkalmazhatják az adatkérések eredményeit. Ha a felhasználók nem tudják megjeleníteni a jelentéseket, az adattárház valószínűleg kevés értéket nyújt számukra, így a front-end fejlesztése az adattárház-kezdeményezés fontos része. Egy másik fontos terület a jelentési eszköz összetettsége.
- Milyen gyakran kell jelentéseket közzétenni?
- Igényelnek-e különleges formázást?
- És a felhasználónak szüksége van-e olyan felületre, amely lehetővé teszi a jelentések testreszabhatóságát?
7. A lekérdezések optimalizálása
Minél több adatot küld vissza egy lekérdezés, annál több erőforrásra van szüksége az adatbázisnak az adatok feldolgozásához és tárolásához. Ezért fontos, hogy csak minimálisra csökkentsük az adatlekérdezést, különösen akkor, ha külön fizetünk a lekérdezési teljesítményért.
Ez a szakasz nagyon is az egyes szervezetek igényeihez igazodik.
8. A végtermék bevezetése
A kemény munka már megtörtént, és közel áll ahhoz, hogy értéket kapjon a fényes, új adattárházából. Ezen a ponton a csapattagokat ki kell képezni a használatára. A folyamat során a minőségbiztosítás és a tesztelés biztosítjsa, hogy ne legyenek hibák vagy használhatósági problémák.
Bár ezek az adattárház létrehozásának standard lépései, fontos megjegyezni, hogy minden forgatókönyv más és más. Lehetnek további lépések, amelyeket az Ön vállalkozásának a követelmények vagy a szervezet igényeinek összetettsége alapján meg kell tennie.