teradata

Il viaggio di Teradata nel cloud

Tempo di lettura: 5 minuti

Teradata ha  compiuto 40 anni quest’anno, come nel piccolo gruppo di nomi di famiglie IT come IBM, SAS e Oracle che sono nati o (nel caso di IBM) sopportato i mali di poliestere e discoteca. Quando la società è stata costituita, l’idea di un terabyte di dati era praticamente inimmaginabile. Fortunatamente, quando qualcuno ha messo su una diapositiva che mostra come le frontiere dello storage sono passate da terabyte a gigabyte, petabyte e zetabyte, abbiamo emesso un sospiro di sollievo che Teradata non sentiva la necessità di cambiare il suo nome per tenersi aggiornato.

Per ricapitolare, Larry Dignan ha riassunto  i titoli  dell’evento annuale Teradata Universe della scorsa settimana, con il punto forte nella nostra mente che Teradata ha abbracciato l’architettura e il modello di business nativi del cloud.

Teradata ha appena visto un grande cambio di guardia, contrassegnato dall’ascesa all’inizio di quest’anno di  Oliver Ratzesberger  come CEO, e da importanti cambiamenti al resto della suite C. Per noi, il significato è che questa è la prima volta da decenni che Teradata è guidata da un tecnologo piuttosto che da un uomo d’affari.

Inizieremo con un fatto che non è cambiato. Teradata definisce il suo mercato indirizzabile come ciò che definisce “Megadata Companies”, ovvero le organizzazioni con i problemi analitici più complicati in base a complessità e dimensioni. In altre parole, non è in competizione con MySQL, PostgreSQL, Redshift o Snowflakes del mondo per il mercato più ampio di data mart di carichi di lavoro di data warehousing di medie dimensioni. Ciò pone Teradata in rotta di collisione con  Cloudera.

Un’altra cosa che non è cambiata sono i tentativi dell’azienda di liberarsi dall’hardware: è un messaggio che è cresciuto e scemato negli anni da quando Teradata ha introdotto le sue piattaforme “sistemi aperti” negli anni ’90. Fino ad ora, è stata una vendita difficile, perché i tipi di carichi di lavoro in cui Teradata eccelle, SQL estremamente complesso con numerosi join, fino a terabyte (o più) di dati e con supporto per concorrenza molto elevata richiedevano hardware appositamente ottimizzato.

Teradata vendeva apparecchiature specializzate orientate alle variazioni dei carichi di lavoro: ad alta intensità di calcolo, ad alta intensità di IOPS e / o ad alta concorrenza. Con l’ultima generazione di hardware con marchio  IntelliFlex , tali variazioni potrebbero essere configurate tramite software. Ci sono ancora funzionalità specifiche di Teradata come le interconnessioni Bynet, ma con tendenze come una Ethernet più veloce, ci aspettiamo che il campo di gioco con l’hardware delle materie prime finisca per livellarsi.

Ma la notizia ancora migliore è che il cloud potrebbe finalmente rendere l’intera questione accademica: risolvi una volta per tutte che Teradata è una società di software. Ed è qui che entra in gioco il capitolo di quest’anno. L’architettura cloud-native della piattaforma Teradata, ora chiamata  Vantage , separa i dati dal calcolo e offre supporto nativo per l’archiviazione degli oggetti come un altro livello. Teradata è quasi l’unico ad abbracciare l’architettura nativa del cloud. In effetti, abbiamo appena parlato di  SAP che fa lo stesso turno con HANA . E comunque, anche Cloudera e Hadoop.

E con elaborazione e archiviazione separate, questo apre la strada a Teradata per iniziare a offrire prezzi basati sul consumo. Quindi, se stai usando il servizio cloud gestito di Teradata, non ci sono prezzi Tcore più complessi, invece paghi come faresti per qualsiasi servizio gestito dal cloud; per quantità di spazio di archiviazione e quindi solo il calcolo utilizzato. Questo è un passo importante per rendere Teradata più facile con cui fare affari e abbracciare i prezzi pay-as-you-go, renderà il servizio molto più accessibile.

Faremo un ulteriore passo avanti. Come parte dell’attuale versione di Vantage c’è il supporto per la containerizzazione. Il prossimo passo logico sarà l’estensione del supporto a Kubernetes. Per Teradata, ciò aprirebbe un percorso alla creazione e potenzialmente alla gestione di cloud privati ​​per i clienti che non vogliono spostare i loro carichi di lavoro nel cloud pubblico. Non saremmo sorpresi se Teradata aggiungesse il supporto di Kubernetes l’anno prossimo.

Dietro questi sviluppi c’è, come notato sopra, la crescente parità dell’hardware delle materie prime. Ma parla anche alla crescente varietà di istanze di calcolo del cloud. Ad esempio, su AWS, ora puoi  selezionare da  un portafoglio di istanze EC2 ottimizzate per elaborazione, memoria, elaborazione ad alta velocità o archiviazione: proprio come ai vecchi tempi, scegli le appliance di Teradata ottimizzate per elaborazione, IOPS, o carichi di lavoro misti. Hai anche una varietà di opzioni di  archiviazione . Nel frattempo, i fornitori di cloud stanno aggiungendo processori specializzati su misura per carichi di lavoro specifici, come i  TPU ottimizzato per i carichi di lavoro TensorFlow su Google Cloud. Per concludere l’affare, i backplane dei provider di servizi cloud stanno diventando sufficientemente veloci da offrire alternative “abbastanza buone” all’infrastruttura altamente ottimizzata delle tradizionali apparecchiature Teradata.

L’altra tendenza chiave è il posizionamento di Vantage come, in effetti, una piattaforma multi-workload. E, come notato sopra, è qui che si scontra con Hadoop. La chiave per lo sviluppo di Vantage è che è frutto della  piattaforma Aster Data Discovery . All’epoca, Teradata teneva la piattaforma Aster separata dalla nave madre, indirizzandola alle organizzazioni che lavorano con l’analisi dei Big Data. Il risultato fu la confusione nella base di Teradata sul fatto che Aster sarebbe diventato strategico o incantato. Il contributo di Aster sono state le  centinaia di librerie  che hanno esteso SQL per supportare approcci come MapReduce, grafico, machine learning e programmazione R e Python. Senza Aster, la piattaforma Vantage non sarebbe stata altrettanto arrotondata.

Certo, Teradata non è il solo a rendere il database relazionale più estensibile. Mentre tradizionalmente, la  pratica comune  era estrarre dati o tabelle sul laptop e quindi visualizzare e analizzare i dati in framework come Pandas, sempre più spesso, i fornitori di database stanno portando l’elaborazione R e Python direttamente nel database. Il vantaggio è l’eliminazione della necessità di copiare i dati (e finire con più versioni della verità), per non parlare dell’utilizzo dei motori di esecuzione del database per ridimensionare il funzionamento dei modelli.

Oggi  Microsoft supporta l’elaborazione Python e R  nel database con SQL Server 2019 tramite funzioni definite dall’utente; Oracle sta ora aggiungendo API R e Python  per l’esecuzione di modelli nel database; mentre  IBM supporta l’  esecuzione di Go, Ruby, Python, PHP, Java, Node.js e Sequelize, tra le altre lingue in Db2. Anche la capacità di utilizzare i notebook Jupyter per lo sviluppo e la distribuzione di modelli per l’esecuzione nel database è diventata una posta in gioco. Il differenziatore di Teradata offre un ricco portafoglio di librerie analitiche ottimizzate per il database.

Il risultato è che Teradata ritiene di avere un’alternativa più credibile per le organizzazioni che hanno lottato con Hadoop. Ha annunciato un programma di migrazione di Hadoop che include un impegno multifase di valutazione, pianificazione e implementazione. Emerge parallelamente alla promozione di “laghi di dati relazionali” di artisti del calibro di SAP. L’idea guida è che, data l’ampia base di competenze esistente degli sviluppatori SQL, rendere SQL estensibile per supportare alcuni dei nuovi approcci di analisi programmatica sarà più pratico per le organizzazioni che non dispongono di basi di competenze adeguate in Python o R. Non a caso, un’esposizione improvvisata la sessione sul pavimento che introduceva il nuovo programma di migrazione di Hadoop ha attirato una folla di persone in piedi.

Ed è arrivato sulla scia della crisi di mezza età di Hadoop che ha visto  la fusione di Cloudera e Hortonworks e  l’acquisizione di FireR di MapR da parte di HPE. È diventato di moda denunciare la morte di Hadoop e, sfortunatamente, Teradata è stata incoerente nella sua messaggistica su Hadoop. In alcune diapositive, si riferisce a Hadoop come “tecnologia morente”. Tuttavia, i suoi praticanti sul campo riconoscono che Hadoop continuerà a svolgere un ruolo e, a proposito, Teradata ha ancora una partnership con Cloudera. Teradata deve ripulire la sua messaggistica Hadoop ed essere più positivo. I laghi di dati relazionali sono adatti per le organizzazioni in cui prevalgono le competenze SQL. Finché Teradata posiziona la migrazione di Hadoop come meglio adattata alle competenze della sua base di clienti, ciò dovrebbe evitare il rumore e la distrazione inutili che la sua incoerente messaggistica metterà sul suo cammino.