Business Analytics con lo zEnterprise


Spesso mi capita che dei titoli di alcuni articoli, o dei post suscitino il mio interesse, ma non avendo il tempo per leggerli, li “conservo” con degli strumenti di “lettura postuma” come Read it Later o Readability. Ieri avevo trovato il tempo per curiosare tra queste informazioni potenzialmente interessanti e mi ha preso un articolo apparso sul numero di Bancamatica di Nov/Dic del 2011 intitolato Perchè con lo zEnterprise la business analytics è meglio a firma di Giancarlo Marino. Se il titolo aveva catturato precedentemente la mia attenzione, l’autore mi ha incuriosito di più; si perché Giancarlo lo conosco, è un mio collega ed ha il ruolo di Sw Sales Manager in IBM Italia.

Giancarlo nell’articolo descrive le problematiche che esistono attorno al tema della Business Analytics, la difficoltà di avere una visione di insieme dei dati su cui poter realizzare il reporting necessario, i tempi di risposta dei sistemi di data warehouse; successivamente illustra la soluzione IBM DB2 Analytics Accelerator  che, con l’utilizzo del sistema Netezza fornisce una risposta a queste tematiche.

Riporto qui di seguito uno stralcio dell’articolo:
[…] L’interazione tra IDAA e il Database DB2 permette di far convergere le applicazioni operative di tutti i giorni e quelle analitiche, in modo che i risultati analitici vengano utilizzati direttamente nel contesto di un flusso di lavoro per guidare l’esecuzione operativa e le modifiche dinamiche dei processi. […]

Questa nuova architettura e soluzione integrata OLTP-OLAP su sistemi Mainframe IBM permette finalmente alle aziende di evitare, come accaduto negli ultimi 10 anni, di spendere ingenti risorse per i soli processi di trasporto dei dati verso le piattaforme di BI distribuite, senza considerare i ritardi, le duplicazioni di dati, e i problemi di affidabilità introdotti da questi passaggi spesso poco sorvegliati. La maggior parte di questi processi di trasporto preleva dati dalla piattaforma Mainframe per destinarli a processi di BI basati su architetture distribuite. Oggi vengono eliminati questi passaggi costosi che non aggiungono alcun valore ed anzi introducono alti costi, ritardi, e rischi.
Dal punto di vista piu’ tecnico, l’IDAA, si basa sulla tecnologia Netezza acquisita da IBM nel 2010. le caratteristiche salienti dell’IDAA sono:

  • La distribuzione del workload su N baldes multiprocessore
  • L’elevato parallelismo su cui sono eseguite le query
  • L’utilizzo di speciali dispositivi HW (Field Programmable Gateway Arrays) che si occupano di:
    – Comprimere e decomprimere i dati
    – Eliminare le colonne non richieste
    – Filtrare i dati non necessari al calcolo del risultato.

[…]

Al termine della lettura mi sono reso conto che la curiosità aveva superato l’iniziale interesse ed ho voluto capire di più su questa soluzione, quindi ho iniziato a cercare altro materiale. Anzi mi piacerebbe ospitare nelle pagine di mainframeitalia.com un approfondimento, dal punto di vista tecnico,  dei componenti di questa soluzione: che ne dite? Anzi, c’è qualche entusiasta che vuole farsene carico?

Come risultato del mio (rapido) approfondimento ho trovato questo redpaper di 16 pagine: The Netezza Data Appliance Architecture: A Platform for High Performance Data Warehousing and Analytics. Lo trovo fatto veramente bene per chi vuole capire un pò più a fondo l’architettura Netezza Asymmetric Massively Parallel
Processing (AMPP) ed i meccanismi alla base dell’orchestrazione delle query che permettono di ottenere velocità di esecuzione sorprendenti.

Annunci