Jangan Cuma Disimpan, Tumpukan Data Bisa Diolah Menjadi Solusi
Senin, 19 Oktober 2020 - 11:01 WIB
loading...
A
A
A
Dengan integrasi data lifecycle data engineer, data analysts, dan data scientist dapat bekerja pada data yang sama secara aman dan efisien, tidak peduli di mana data tersebut berada atau di mana proses analitiknya dilakukan. CDP tidak semata-mata membantu meningkatkan produktivitas spesialis data tapi juga membantu tim data bekerja sama dengan lebih baik lagi, berkat arsitektur data hybrid yang unik.
Arun menjelaskan, arsitektur ini mengintegrasikan pengalaman analitik di seluruh data lifecycle di seluruh public dan private cloud. Pengelolaan dan pengamanan kumpulan data secara efektif, enrichment, analisis, eksperimentasi dan visualisasi analitik, sangat penting untuk mengarungi badai data.
Hasilnya adalah para ‘pahlawan data’ bisa berkolaborasi dengan lebih baik dan lebih cepat dalam menyajikan use case berbasis data (data-driven use cases), seperti maintenance dan pemahaman komprehensif mengenai pelanggan yang bersifat prediktif. Hal ini yang dibutuhkan oleh bisnis untuk bersaing dan melayani customer dengan lebih baik lagi.
“Customer kami memahami pentingnya data lifecycle untuk pengambilan keputusan berdasarkan data di seluruh lini bisnis mereka, yang secara tradisional akan mengintegrasikan kluster data untuk NiFi, Kafka, Spark, Impala, Hive, HBase, dan sebagainya,” kata Arun.
Dikatakannya, hal-hal seperti ini masih dilakukan oleh para pakar data –baik arsitek dan developer- yang dapat menggunakan layanan klaster data lifecycle Cloudera, yakni CDP Data Hub.
"Kini dengan pengalaman analitik pada CDP, pakar data seperti teknisi, analis, dan data scientist akan mendapatkan apa yang mereka butuhkan untuk bekerja lebih baik, tanpa harus memahami atau mengelola kluster, dengan keamanan dan tata kelola terintegrasi di seluruh data lifecycle untuk memudahkan TI. Ini adalah data cloud kelas enterprise yang cocok bagi semua kalangan," tandasnya.
![Jangan Cuma Disimpan, Tumpukan Data Bisa Diolah Menjadi Solusi]()
CDP Data Engineering
CDP Data Engineering merupakan layanan Apache Spark yang paling powerful di Kubernetes. Ini mencakup berbagai kemampuan untuk produktivitas lebih tinggi, yang biasanya tidak akan disediakan oleh layanan data engineering tingkat dasar.
Antara lain, monitoring, troubleshooting, dan performance tuning berbasis Visual GUI untuk menghasilkan debugging dan penyelesaian masalah secara lebih cepat; Native Apache Airflow dan API yang mantap untuk melakukan orkestrasi dan otomatisasi penjadwalan job dan pengiriman berbagai data pipeline yang kompleks ke mana saja;
Lalu isolasi sumber daya dan job management berbasis GUI yang terpusat. Serta integrasi data lifecycle CDP dan keamanan serta tata Kelola SDX.
“Peran data engineering dalam mempersiapkan data science sangat penting untuk operasional," timpal Stewart Bond, Research Director of IDC’s Data Integration and Intelligence Software service.
Arun menjelaskan, arsitektur ini mengintegrasikan pengalaman analitik di seluruh data lifecycle di seluruh public dan private cloud. Pengelolaan dan pengamanan kumpulan data secara efektif, enrichment, analisis, eksperimentasi dan visualisasi analitik, sangat penting untuk mengarungi badai data.
Hasilnya adalah para ‘pahlawan data’ bisa berkolaborasi dengan lebih baik dan lebih cepat dalam menyajikan use case berbasis data (data-driven use cases), seperti maintenance dan pemahaman komprehensif mengenai pelanggan yang bersifat prediktif. Hal ini yang dibutuhkan oleh bisnis untuk bersaing dan melayani customer dengan lebih baik lagi.
“Customer kami memahami pentingnya data lifecycle untuk pengambilan keputusan berdasarkan data di seluruh lini bisnis mereka, yang secara tradisional akan mengintegrasikan kluster data untuk NiFi, Kafka, Spark, Impala, Hive, HBase, dan sebagainya,” kata Arun.
Dikatakannya, hal-hal seperti ini masih dilakukan oleh para pakar data –baik arsitek dan developer- yang dapat menggunakan layanan klaster data lifecycle Cloudera, yakni CDP Data Hub.
"Kini dengan pengalaman analitik pada CDP, pakar data seperti teknisi, analis, dan data scientist akan mendapatkan apa yang mereka butuhkan untuk bekerja lebih baik, tanpa harus memahami atau mengelola kluster, dengan keamanan dan tata kelola terintegrasi di seluruh data lifecycle untuk memudahkan TI. Ini adalah data cloud kelas enterprise yang cocok bagi semua kalangan," tandasnya.

CDP Data Engineering
CDP Data Engineering merupakan layanan Apache Spark yang paling powerful di Kubernetes. Ini mencakup berbagai kemampuan untuk produktivitas lebih tinggi, yang biasanya tidak akan disediakan oleh layanan data engineering tingkat dasar.
Antara lain, monitoring, troubleshooting, dan performance tuning berbasis Visual GUI untuk menghasilkan debugging dan penyelesaian masalah secara lebih cepat; Native Apache Airflow dan API yang mantap untuk melakukan orkestrasi dan otomatisasi penjadwalan job dan pengiriman berbagai data pipeline yang kompleks ke mana saja;
Lalu isolasi sumber daya dan job management berbasis GUI yang terpusat. Serta integrasi data lifecycle CDP dan keamanan serta tata Kelola SDX.
“Peran data engineering dalam mempersiapkan data science sangat penting untuk operasional," timpal Stewart Bond, Research Director of IDC’s Data Integration and Intelligence Software service.
Lihat Juga :