Crea una data lakehouse aperta, gestita e intelligente su Google Cloud
Unifica e gestisci i tuoi dati multimodali con una data lakehouse ad alte prestazioni integrata con l'AI leader del settore di Google. Ottieni il massimo da Apache Iceberg e dal primo Spark serverless con scalabilità automatica del settore per semplificare l'elaborazione dei dati, l'analisi e le iniziative AI.
Le nuove innovazioni nei formati di dati aperti, la governance intelligente dai dati fino all'AI, l'elaborazione accelerata dei dati e gli strumenti di sviluppo avanzati assistiti dall'AI si combinano per semplificare la gestione dei dati e accelerare l'innovazione.
BigLake
Ottieni l'apertura di Apache Iceberg con la gestione dello spazio di archiviazione di livello enterprise
BigLake fornisce un motore di archiviazione Iceberg nativo per l'interoperabilità di Cloud Storage, offre una gestione unificata dei metadati di runtime, consente l'analisi avanzata e la data science e fornisce una gestione automatizzata dei dati con governance integrata. Qualsiasi motore compatibile con Iceberg può utilizzare la gestione automatizzata delle tabelle di BigLake per migliorare le prestazioni delle query e ridurre i costi.
“La collaborazione con Google Cloud è stata fondamentale nel nostro percorso per creare la lakehouse aperta di nuova generazione di Snap e per democratizzare Spark e Iceberg nella nostra community di sviluppatori.”
Zhengyi Liu, Senior Manager, Software Engineer, Snap
Google Cloud Serverless per Apache Spark
Spark serverless offre prestazioni elevate ed elaborazione rapidissima, senza necessità di gestione del cluster
Trasforma il tuo lakehouse con Google Cloud Serverless per Apache Spark. Prova l'esperienza di un avvio rapido e un overhead operativo pari a zero, migliorando al contempo le prestazioni dei tuoi workload Spark con il nuovo Lightning Engine. Questa potente combinazione con Gemini aumenta la produttività e offre un TCO fino al 60% inferiore.
“Consideriamo SQL e Spark due modi complementari per accedere ai dati e trasformarli. Spark è particolarmente utile per i casi d'uso che richiedono una logica di business complessa, che sebbene di nicchia, è estremamente critica per l'azienda. Avere una piattaforma unificata per SQL, Spark e AI, con l'esperienza di sviluppo nei notebook, semplificherà notevolmente questi casi d'uso critici.”
Andrés Sopeña Pérez, Head of Content Engineering, Trivago
Dataplex Universal Catalog
Semplifica l'individuazione, la comprensione e l'affidabilità dei dati per il tuo lakehouse di dati
Dataplex Universal Catalog è la soluzione unificata di governance dai dati fino all'AI per Google Cloud. Il catalogo basato sull'AI centralizza i metadati aziendali, tecnici e operativi in Google Cloud e fornisce insight basati sull'AI. Supporta formati aperti come Apache Iceberg per consentire una governance integrata nell'intero lakehouse.
“Dataplex è stato fondamentale per trasformare la nostra piattaforma dati in un ecosistema di dati sicuro, efficiente e scalabile. Con un focus sulla governance, la scoperta, l'osservabilità e la conformità alla sicurezza dei dati, siamo attrezzati per affrontare le sfide della gestione dei dati nell'era digitale. Dataplex consente ai nostri team di sbloccare il pieno potenziale dei dati e di promuovere la crescita e l'innovazione continue di Box.Inc.”
Asmita Kulkarni Senior Product Manager, Box.Inc
BigQuery Studio ed estensioni IDE
Migliorare Apache Spark per workload avanzati di data science e AI/ML all'interno di architetture lakehouse semplificando lo sviluppo e le operazioni
Dataproc migliora Spark per AI/ML su lakehouse con nuove innovazioni per runtime ML con driver GPU e librerie ML comuni. I notebook di Colab Enterprise in BigQuery Studio e gli IDE di terze parti forniscono MLOps integrato con Vertex AI e pipeline di produzione semplificate per accelerare il data science.
“Shopify ha investito nella creazione di un team con una vasta gamma di competenze per rimanere al passo con le tendenze di data science ed engineering. Nei primi test con BigQuery Studio, ci è piaciuta la capacità di Google di collegare strumenti diversi per utenti diversi all'interno di un'esperienza semplificata. Vediamo questa come un'opportunità per ridurre gli attriti nel nostro team senza sacrificare la scalabilità che ci aspettiamo da BigQuery.”
Zac Roberts, Data Engineering Manager, Shopify
BigLake
Ottieni l'apertura di Apache Iceberg con la gestione dello spazio di archiviazione di livello enterprise
BigLake fornisce un motore di archiviazione Iceberg nativo per l'interoperabilità di Cloud Storage, offre una gestione unificata dei metadati di runtime, consente l'analisi avanzata e la data science e fornisce una gestione automatizzata dei dati con governance integrata. Qualsiasi motore compatibile con Iceberg può utilizzare la gestione automatizzata delle tabelle di BigLake per migliorare le prestazioni delle query e ridurre i costi.
“La collaborazione con Google Cloud è stata fondamentale nel nostro percorso per creare la lakehouse aperta di nuova generazione di Snap e per democratizzare Spark e Iceberg nella nostra community di sviluppatori.”
Zhengyi Liu, Senior Manager, Software Engineer, Snap
Google Cloud Serverless per Apache Spark
Spark serverless offre prestazioni elevate ed elaborazione rapidissima, senza necessità di gestione del cluster
Trasforma il tuo lakehouse con Google Cloud Serverless per Apache Spark. Prova l'esperienza di un avvio rapido e un overhead operativo pari a zero, migliorando al contempo le prestazioni dei tuoi workload Spark con il nuovo Lightning Engine. Questa potente combinazione con Gemini aumenta la produttività e offre un TCO fino al 60% inferiore.
“Consideriamo SQL e Spark due modi complementari per accedere ai dati e trasformarli. Spark è particolarmente utile per i casi d'uso che richiedono una logica di business complessa, che sebbene di nicchia, è estremamente critica per l'azienda. Avere una piattaforma unificata per SQL, Spark e AI, con l'esperienza di sviluppo nei notebook, semplificherà notevolmente questi casi d'uso critici.”
Andrés Sopeña Pérez, Head of Content Engineering, Trivago
Dataplex Universal Catalog
Semplifica l'individuazione, la comprensione e l'affidabilità dei dati per il tuo lakehouse di dati
Dataplex Universal Catalog è la soluzione unificata di governance dai dati fino all'AI per Google Cloud. Il catalogo basato sull'AI centralizza i metadati aziendali, tecnici e operativi in Google Cloud e fornisce insight basati sull'AI. Supporta formati aperti come Apache Iceberg per consentire una governance integrata nell'intero lakehouse.
“Dataplex è stato fondamentale per trasformare la nostra piattaforma dati in un ecosistema di dati sicuro, efficiente e scalabile. Con un focus sulla governance, la scoperta, l'osservabilità e la conformità alla sicurezza dei dati, siamo attrezzati per affrontare le sfide della gestione dei dati nell'era digitale. Dataplex consente ai nostri team di sbloccare il pieno potenziale dei dati e di promuovere la crescita e l'innovazione continue di Box.Inc.”
Asmita Kulkarni Senior Product Manager, Box.Inc
BigQuery Studio ed estensioni IDE
Migliorare Apache Spark per workload avanzati di data science e AI/ML all'interno di architetture lakehouse semplificando lo sviluppo e le operazioni
Dataproc migliora Spark per AI/ML su lakehouse con nuove innovazioni per runtime ML con driver GPU e librerie ML comuni. I notebook di Colab Enterprise in BigQuery Studio e gli IDE di terze parti forniscono MLOps integrato con Vertex AI e pipeline di produzione semplificate per accelerare il data science.
“Shopify ha investito nella creazione di un team con una vasta gamma di competenze per rimanere al passo con le tendenze di data science ed engineering. Nei primi test con BigQuery Studio, ci è piaciuta la capacità di Google di collegare strumenti diversi per utenti diversi all'interno di un'esperienza semplificata. Vediamo questa come un'opportunità per ridurre gli attriti nel nostro team senza sacrificare la scalabilità che ci aspettiamo da BigQuery.”
Zac Roberts, Data Engineering Manager, Shopify

Lettura di 10 minuti

Lettura di 10 minuti

Lettura di 10 minuti

Lettura di 15 minuti

10-min

Lettura di 15 minuti