Mengenal Istilah Big Data

 

Big data adalah istilah yang menggambarkan volume data yang besar, baik data yang terstruktur maupun data yang tidak terstruktur. Big Data adalah istilah umum untuk segala himpunan data (data set) dalam jumlah yang sangat besar sehingga menjadikannya sukar ditangani apabila hanya menggunakan perkakas manajemen basis data biasa atau aplikasi pemroses data tradisional belaka. 

Pengertian lain dari Big data adalah istilah khusus yang digunakan untuk data yang melebihi kapasitas pemrosesan database konvensional karena berjumlah terlalu besar, bergerak terlalu cepat, dan tidak sesuai dengan kemampuan struktural dari arsitektur database tradisional. Sehingga dilakukan suatu proses dengan sistem terintegrasi yang mampu menangani Big data yang disebut big data analytics.

Ada juga yang mengartikan bahwa big data adalah kumpulan data yang sangat besar yang mana tidak bisa diproses dan dikelola menggunakan pemrosesan data biasa. Data besar dari suatu bisnis mungkin bisa diabaikan sehingga tidak perlu pengelolaan menggunakan big data, tapi perlu diketahui bahwa dalam big data banyak variabel baru yang bisa disimpulkan dan tentunya bisa digunakan untuk mengatasi persoalan yang terjadi.

Big data kini sudah banyak digunakan dalam bisnis skala besar. Tidak hanya besar data yang menjadi poin utama tetapi apa yang harus dilakukan organisasi dengan data tersebut. Big Data dapat dianalisis untuk wawasan yang mengarah pada pengambilan keputusan dan strategi bisnis yang lebih baik.

Hal terpenting dari Big Data bukanlah sekedar kemampuan teknis untuk mengolah data melainkan manfaat yang dapat disadari oleh perusahaan dengan menggunakan Big Data Analytics Terminology. Big Data diyakini berasal dari perusahaan pencarian web yang mengolah data dengan agregasi yang terdistribusi sangat besar dan tidak terstruktur

 

Big Data memuat arti yang lebih kompleks sehingga perlu definisi yang sedikit lebih kompleks pula demi mendeskripsikannya secara keseluruhan.

Mengapa butuh definisi yang lebih kompleks? Fakta menunjukkan bahwa bukan hanya NoSQL saja yang mampu mengolah data dalam skala raksasa (petabyte). Beberapa perusahaan telah menggunakan RDBMS untuk memberdayakan data dalam kapasitas yang sangat besar. Sebagai contoh, Bank of America memiliki DWH dengan kapasitas lebih dari 1,5 petabyte, Wallmart Stores yang bergerak dalam bisnis retail (supermarket) berskala dunia telah mengelola data berkapasitas lebih dari 2,5 petabyte, dan bahkan situs auction (lelang) eBay memiliki DWH yang menyimpan lebih dari 6 petabyte data. Oleh karena itu, hanya karena telah berskala petabyte saja, suatu data belum bisa disebut Big Data. Sekedar referensi, DWH dengan kapasitas sangat besar seperti beberapa contoh di atas disebut EDW(Enterprise Data Warehouse) dan database yang digunakannya disebut VLDB(Very Large Database).

NoSQL dikenal memiliki potensi dan kapabilitas Scale Up (peningkatan kemampuan mengolah data dengan menambah jumlah server atau storage) yang lebih unggul daripada RDBMS. Tetapi, bukan berarti RDBMS tak diperlukan. NoSQL memang lebih tepat untuk mengolah data yang sifatnya tak berstruktur seperti data teks dan gambar, namun NoSQL kurang tepat bila digunakan untuk mengolah data yang sifatnya berstruktur seperti data-data numerik, juga kurang sesuai untuk memproses data secara lebih detail demi menghasilkan akurasi yang tinggi. Pada kenyataannya, Facebook juga tak hanya menggunakan NoSQL untuk memproses data-datanya, Facebook juga tetap menggunakan RDBMS. Lain kata, penggunaan RDBMS dan NoSQL mesti disesuaikan dengan jenis data yang hendak diproses dan proses macam apa yang dibutuhkan guna mendapat hasil yang optimal.

Karakteristik Big Data

Big data mempunyai 4 karakteristik yang menyebabkan database konvensional tidak mampu menangani data tersebut yang disebut dengan “four Vs“:

  • Volume/Ukuran Data
    Berbeda dengan data biasa yang berukuran kilobyte (1kb = 1.000byte) hingga gigabyte (1gb = 1.000.000kb), big data berukuran terabyte (1tb = 1.000gb) hingga (1pt = 1.000tb) bahkan lebih.
  • Velocity/Kecepatan Data
    Big data mempunyai pertumbuhan data (data velocity) yang sangat cepat. Data velocity adalah pertumbuhan ukuran data tiap detiknya. Big data mempunyai kecepatan data berkisaran antara 30kb hingga 30gb tiap detiknya. Dengan kecepatan data yang tinggi, teknologi yang digunakan harus mempunyai kecepatan hardware dengan algoritma yang optimal untuk membuat keputusan secara real time.
  • Variety/Keanekaragaman Struktur Data
    Big data mempunyai berbagai struktur data yaitu structured data, semi-structured data, dan unstructured data.
  • Structured data adalah data yang dibuat, diproses, dan dimanipulasi dengan menggunakan database konvensional (traditional relational database management system). Misalnya data jumlah pengunjung suatu website setiap detiknya.
  • Semi-structured data adalah data yang tidak sesuai dengan arsitektur database management system data terstruktur, namun tetap memiliki tag-tag yang dapat digunakan untuk menentukan karakteristik dari variabel-variabel data tersebut. Misalnya file log, file XML, atau JSON.
  • Unstructured data adalah data yang benar-benar tidak terstruktur, yang umumnya datang dari aktivitas manusia sebagai pengguna sistem. Misalnya data dokumen word dan email.
  • Value/Nilai Data
    Big data mempunyai nilai data yang rendah terhadap kuantitasnya. Data engineering akan melakukan penataan data mentah sehingga data tersebut lebih bernilai. Kemudian data yang sudah ditata, dapat dilakukan analisis oleh data scientist.

 

Manfaat Teknologi Big Data

Teknologi big data dimanfaatkan di berbagai sektor industri. Teknologi big data adalah keseluruhan teknologi yang dapat menangani Big Data. Berikut ini adalah penggunaan big data berdasarkan sumber lalu lintas big data terbanyak diantaranya adalah:

  • Sosial Media, seperti Facebook dan Twitter mempunyai pertumbuhan data yang paling cepat. 
  • Transaksi Finansial
    Perkembangan e-commerce yang sangat pesat menyebabkan data transaksi finansial antar bank semakin besar. 
  • Data Publik
    Walaupun pertumbuhannya lebih lambat dari data transaksi finansial, data publik mempunyai ukuran dan keanekaragaman yang sangat besar.
  • Data Sensor
    Data sensor adalah data yang diolah oleh suatu perangkat berupa input dan output. Data sensor banyak digunakan di bidang robotika dan astronomi.
  • Data Perusahaan
    Banyak perusahaan mempunyai data intern yang berjumlah besar, misalnya data pelanggan, data lisensi, data penjualan, dan lain-lain

 

 

Sumber dari:

  1. https://www.codepolitan.com/mengenal-big-data
  2. https://id.wikipedia.org/wiki/Mahadata
  3. https://www.advernesia.com/blog/data-science/apa-itu-big-data-dan-big-data-analytics/
  4. http://www.teknologi-bigdata.com/2013/12/memahami-definisi-big-data.html
  5. https://bootup.ai/blog/big-data-adalah-data-besar-benarkah-berikut-penjelasannya/
  6. https://www.sas.com/id_id/insights/big-data/what-is-big-data.html
  7. https://www.it-jurnal.com/pengertian-big-data/

2 Comments

  1. Triyono

    Data RPU, data Marketing, data Prodi dan data lainnya. Kl menjadi 1 sistem terintegrasi, suatu big data yg luar biasa. Semoga tercapai.. Aamiin

Leave Comment

error

Enjoy this blog? Please spread the word :)

Facebook
YouTube
Instagram