Vai al contenuto

Data warehouse

Da Wikipedia.

Un data warehouse (an anglèis, ciamà ëdcò archivi analìtich) a l'é na base ëd dàit centralisà progetà për sostnì l'anàlisi e la pijà decisional ant le organisassion. A memorisa dàit stòrich e corent da vàire sorziss, organisà an manera coerenta për permitte dë studi ëd tendense, report, e business intelligence. A l'é diferent dai database operativ, ch'a gestisso transassion an temp real.

  • Ani 1980: Concet ëd base ëd dàit për anàlisi a nasso ant le amprese gròsse.
  • 1990: Bill Inmon e Ralph Kimball a definisso ij prinsipi dij data warehouse modern, con l'adossion dël model ETL (Estraction, Transformation, Loading).
  • Ani 2000: Espansion dij data warehouse an sle piataforme cloud (Amazon Redshift, Google BigQuery).
  • Al di d'ancheuj: Integrassion con AI e machine learning për anàlisi preditiva.

Strutura e Component

[modìfica | modifiché la sorgiss]

Un data warehouse a comprend:

  • Sorziss dij dàit: Database operativ, file CSV, API, sensor IoT.
  • ETL: Process për estrae, trasformé, e carié ij dàit.
  • Storage: Archivi central ëd dàit stòrich, organisà për schema a stèila o fiòca nen normalisà.
  • Metadata: Anformassion ch'a descrivo l'orìgin e la strutura dij dàit.
  • Strument d'acess: Dashboard, strument ëd BI (Tableau, Power BI), query SQL.
  1. Enterprise Data Warehouse (EDW): Archivi unificà për tuta l'organisassion.
  2. Data Mart: Sot-archivi specialisà për un dipartiment (es. vèndite, marketing).
  3. Operational Data Store (ODS): Base ëd dàit temporanja për analisi an temp quasi-real.
  4. Cloud Data Warehouse: Archivi gestì an sla rej (es. Snowflake, Azure Synapse).

Ij data warehouse a servo për:

  • Anàlisi ëd vendite: Identifiché tendense ëd mërcà.
  • Gestion dl'arzigh: Monitoré indicator finansiari.
  • Customer Insights: Analisé ël comportament dij client.
  • Salute: Studi epidemiològich e gestion dij tratament.

Avantagi e Svantagi

[modìfica | modifiché la sorgiss]
  • Avantagi:
    • Dàit unificà: Vista coerenta ëd vàire sorziss.
    • Decision basà an sij dat: Misure ëd performansa e KPI.
    • Scalabilità: Gestion ëd grand volum ëd dàit.
  • Svantagi:
    • Còst àut: Anfrastruture e manteniment.
    • Complessità: Progetassion ëd schema e process ETL.
    • Temp ëd amplementassion: Mèis o agn për archivi gròss.

Evolussion Tecnològica

[modìfica | modifiché la sorgiss]
  • Ani 2010: Migrassion vers solussion cloud con pagament a consum.
  • Ani 2020:
    • Data Lakehouse: Combinassion ëd data warehouse e data lake.
    • Anàlisi an temp real: Strument com Apache Kafka për streaming.
    • Automassion dël ETL: Utilisassion ëd tool com Apache Airflow.
    • AI integrà: Modèj preditiv generà diretament da l'archivi.
  1. Inmon, W. H. (2005). *Building the Data Warehouse*. Wiley.
  2. Kimball, R. (2008). *The Data Warehouse Toolkit*. Wiley.