I big data sono oggi uno dei motori principali dell'evoluzione IT. La ragione è semplice: i volumi di informazioni crescono a ritmo enorme e una parte sempre più ampia di questi dati non ha una struttura ordinata.
Per questo elaborarli diventa più complesso. Lo stesso vale per interpretarli in modo corretto. Le tecnologie di big data rendono questi processi gestibili e possono essere utili in settori molto diversi.
Che cosa sono i big data?
I big data possono essere immaginati come un database, ma con una differenza essenziale: sono progettati per archiviare ed elaborare quantità molto grandi di informazioni. Non è l'unica distinzione. Cambiano anche le soluzioni tecniche necessarie per conservare, distribuire e analizzare i dati.
Un database tradizionale di solito ha alcune caratteristiche precise: capacità misurata fino all'ordine dei terabyte, archiviazione centralizzata e un modello verticale basato su dati strutturati con relazioni forti tra le informazioni.
I big data funzionano in modo diverso: gestiscono volumi che possono andare dai petabyte agli exabyte, usano sistemi di archiviazione decentralizzati e si basano su un modello orizzontale, adatto a dati semi-strutturati o non strutturati con relazioni più deboli.
I principi e le caratteristiche principali di una piattaforma di big data includono i seguenti aspetti.
- Il primo elemento è il volume. Grandi quantità di dati accumulati rendono più difficile sia l'archiviazione sia l'elaborazione. I big data affrontano il problema con strumenti più avanzati.
- Anche la velocità di elaborazione è decisiva. Oggi le aspettative sono sempre più alte e molte aziende puntano all'analisi in tempo reale. Le piattaforme di big data permettono anche questo. Consentono di elaborare e analizzare in parallelo dati strutturati, semi-strutturati e non strutturati, anche quando provengono da formati diversi. Oggi la quota di informazioni non strutturate è molto più ampia rispetto al passato. Arriva sempre più spesso dai social network e si presenta in forme eterogenee. Prima di diventare utile, questo tipo di informazione richiede un'analisi più articolata rispetto ai dati già strutturati.
- Una piattaforma di big data può migliorare l'affidabilità dei dati disponibili. Molte aziende hanno difficoltà nell'analisi perché non riescono a distinguere le azioni automatizzate dal comportamento reale degli utenti. I big data aiutano a risolvere questo problema.
- Un sistema di big data deve produrre valore concreto per l'organizzazione che lo utilizza.
Una buona soluzione di big data integra tutte queste caratteristiche. Per questo gli ambiti di applicazione continuano ad ampliarsi.
Oggi l'uso più diffuso riguarda banche e marketing. Anche il servizio clienti può trarre vantaggi significativi da queste tecnologie.
Tecnologie per i big data
Anche se le tecnologie per l'archiviazione dei big data sono relativamente recenti, oggi possono essere considerate mature e rilevanti in molte
attività. Per descriverle in modo chiaro conviene distinguere tre aree: software, infrastruttura hardware e servizi di supporto.
Software per elaborare i big data
Oggi si possono distinguere cinque principali categorie di software.
- SQL è un linguaggio di interrogazione strutturato che consente di lavorare con i big data. Permette di creare e modificare dati, mentre la gestione degli insiemi informativi avviene tramite un DBMS adeguato.
- NoSQL significa «not only SQL», cioè «non solo SQL». Include diversi approcci alla realizzazione di database per grandi moli di dati, diversi dai modelli tradizionali usati nei database standard. È particolarmente adatto a dataset costruiti con dati provenienti dai social network.
- MapReduce viene usato per eseguire calcoli su grandi quantità di dati in parallelo. In questo modello non sono i dati a essere inviati a un programma unico: a specifici gruppi di dati viene assegnato un programma separato. L'elaborazione avviene in due passaggi sequenziali, da cui deriva il nome della tecnologia: Map seleziona i dati necessari, Reduce li aggrega.
- Hadoop è spesso impiegato per gestire funzioni di ricerca e indicizzazione su siti ad alto traffico. Una sua caratteristica importante è la tolleranza ai guasti: ogni blocco ha una copia su un nodo vicino.
- SAP HANA è una versione ad alte prestazioni del primo tipo di software. Il suo obiettivo è garantire una rapida elaborazione delle richieste ricevute.
Hardware
L'hardware principale comprende server e componenti infrastrutturali. I server sono il deposito diretto delle informazioni raccolte, mentre l'infrastruttura include acceleratori, alimentatori per garantire continuità operativa, console server e altri elementi simili.
Servizi
Questa parte sostiene il funzionamento dei big data attraverso la progettazione dell'architettura del database, la configurazione, l'ottimizzazione per esigenze specifiche e la sicurezza dell'archiviazione.
Nel loro insieme, questi componenti formano piattaforme dedicate all'elaborazione di grandi volumi di dati.
La validazione del sito può aiutare ad accelerare il caricamento del sito.
Per capire che cosa influenza l'usabilità di un sito, leggi il nostro articolo.
Un design poco efficace e testi troppo lunghi possono peggiorare le reazioni comportamentali dei visitatori. Scopri come evitarlo.
Applicazioni dei big data
I big data vengono usati in molti settori, anche nella gestione pubblica. Gli esempi più immediati si trovano però in finanza, marketing e business.
Banche
Le organizzazioni creditizie sono tra gli utilizzatori più attivi dei sistemi di big data.
Il motivo è che questi strumenti permettono di analizzare rapidamente l'affidabilità creditizia di chi richiede un prestito.
Nel retail banking, l'analisi dei dati consente di valutare meglio i profili dei clienti e proporre offerte più mirate. Applicata correttamente, questa logica può migliorare la qualità delle campagne commerciali e rendere più efficiente la gestione del portafoglio prestiti.
Le banche usano gli stessi strumenti anche per segmentare la clientela, individuare segnali di frode e gestire il rischio in modo più tempestivo.
Business
Anche nel business la strategia basata sui dati è ormai diffusa. Oggi le tecnologie di big data sono utilizzate attivamente dal 75% degli specialisti del retail. Molti operatori le considerano necessarie per sviluppare e promuovere un'azienda.
Nella distribuzione e nell'e-commerce, queste tecnologie aiutano a pianificare meglio la logistica e a ridurre il tempo necessario per preparare report periodici, soprattutto quando coprono intervalli lunghi. Molte aziende usano i dati anche per costruire offerte personalizzate.
Marketing
Nel marketing, il potenziale dei dati è difficile da sopravvalutare. Permettono di progettare nuovi prodotti e costruire campagne di ampia portata. L'accesso ai dati in tempo reale aiuta ad analizzare meglio le informazioni raccolte, verificare rapidamente le ipotesi e condurre esperimenti.
La tecnologia dei big data si è dimostrata efficace per definire criteri come interessi del pubblico target, attività dei consumatori, domanda e raccolta di informazioni sull'audience.
Per questo i big data sono tra gli strumenti più precisi per costruire previsioni e stimare l'evoluzione futura delle campagne pubblicitarie.
I big data sono ormai presenti in molti settori. Oggi è difficile immaginare un ambito in cui non possano offrire almeno un'applicazione concreta.
LIVEsurf
IT
RU


.bf739e4e9fd1c7bfdfa4.png)







