Perbedaan Data Scientist, Data Analyst dan Data Engineer
Saat ini adalah zaman serba digital tentu kita pernah mendengar profesi data scientist, data analyst, dan data engineer? Nah sekarang saya ingin membahas tentang ketiga profesi tersebut yang sangat erat sekali hubungannya dengan perkembangan teknologi dan pengolahan data.
Seiring dengan populernya big data di dunia kerja, muncullah banyak cabang pekerjaan baru. Ilmu data merupakan bidang yang populer saat ini dimana hampir seluruh perusahaan mempekerjakan seorang ilmuan data untuk mengetahui masalah secara rinci dan jelas. Data merupakan sebuah hal yang sangat penting bagi proses di dalam bisnis. Dengan besarnya pertumbuhan data setiap harinya di era digital saat ini, tidak mungkin seluruh data tersebut hanya disimpan hanya pada suatu sistem yang tradisional, maka solusi yang tepat yaitu menggunakan big data solution agar data dapat dikumpulkan secara terstruktur. Oleh sebab itu banyak perusahan teknologi di Indonesia yang membutuhkan profesi ini untuk menjadi bagian dari perusahaannya.
Lalu yang menjadi pertanyaan bagaimana deskripsi kerjanya, apa saja yang harus dikuasai, dan sebagainya? Meskipun jika dilihat dari ketiga nama pekerjaan tersebut memiliki kesamaan nama, namun ketiganya tetap memiliki perbedaan yang cukup signifikan.
Perbedaan Profesi Pengolahan Data
Data Analyst
Profesi Data analyst mengharuskan berhadapan dengan banyak data untuk dibersihkan, dianalisis, dan dibuatkan visualisasinya. Tugas seorang data analyst adalah mencari insight untuk memajukan bisnis dari berbagai aspek, lalu kemudian diberikan pada data engineer. Data analyst juga bertanggung jawab untuk mengolah bahan yang diberikan untuk membuat eksperimen dan menentukan strategi bisnis lanjutan. Setiap hari melakukan visualisasi data yang menjadi penghubung tim pemasaran, tim penjualan, tim teknis, dan strategi bisnis.
Data analyst juga bertanggung jawab menyelesaikan pertanyaan seperti “bagaimana cara kami menjelaskan kepada manajemen bahwa kenaikan biaya memengaruhi jumlah konsumen?” dan “apa yang mendorong pertumbuhan bisnis?”
Dikarenakan Data Analyst harus berhubungan langsung dengan bisnis maka ia harus memahami dengan benar bagaimana naik turunnya permainan dalam pasar penjualan. Dengan begitu Data Analyst juga dapat mengolah bahan secara langsung untuk membuat eksperimen inovasi terbaru yang sekiranya akan disukai oleh traffic pasar saat ini. Hasil dari eksperimen tersebut nanti akan diberikan kepada Data Scientist dan Data Engineer sebagai insights.
Untuk menyelesaikan pekerjaan sehari-hari, data analyst akan bekerja dengan program Excel, Tableau, dan SQL. Mereka harus menguasai istilah bisnis dan tools yang digunakan untuk membuat grafik/infografik.
Data Engineer
Data engineer bertugas untuk mengembangkan dan membuat desain arsitektur manajemen data dan memonitor infrastrukturnya di dalam sebuah perusahaan. Data Engineer akan mengelola jalur data untuk perusahaan yang menangani data dalam jumlah besar, juga harus memastikan bahwa data bisa dikumpulkan dan diambil secara efisien dari sumber ketika dibutuhkan, dibersihkan dan diproses. Tujuannya adalah untuk membangun dan mengoptimalkan sistem perusahaan yang memungkinkan bagi data analyst dan data scientist menyelesaikan pekerjaan mereka. Data Engineer harus memiliki keahlian di bidang programming, big data, dan matematika.
Sebagai contoh pada sebuah restoran ternama, Data Engineer merupakan orang yang menyiapkan, memilih serta mengolah bahan terbaiknya untuk kemudian diberikan kepada chef yang paling hebat pada restoran tersebut. Disamping menyiapkan bahan-bahan yang terbaik, data engineer juga harus memastikan bahan tersebut tetap fresh dan bisa diambil kapanpun ketika chef tersebut membutuhkan.
Dalam hal ini untuk bisa mendapatkan bahan-bahan yang terbaik tersebut, makanya data engineer harus memiliki koneksi penjual agar bisa memperoleh bahan-bahan yang fresh dan terbaik. Dengan begitu data engineer harus memahami bagaimana mengatur arus atau proses pengantaran dari bahan tersebut agar sampai dalam keadaaan yang paling fresh.
Jika dilihat dari analogi tersebut dapat ditarik kesimpulan bahwa setiap individu data engineer merupakan sebagai penyedia data yang nanti akan diberikan pada Data Scientist (DS) dan Data Analyst (DA). Semua data yang nantinya diberikan kepada DS dan DA harus sesuai dengan apa yang dibutuhkannya, dan data-data tersebut harus 100% bersih dan benar.
Umumnya ketahui bahwa Data Engineer memiliki keterkaitan dengan istilah Pipeline dan juga Big Data. Bisa dikatakan bahwa Data Engineer merupakan sebagai pembuat infrastruktur dari proses bagaimana data yang didapatkan dan diolah itu sesuai dengan apa yang dibutuhkan oleh DS dan DA.
Tak hanya itu, Data Engineer juga harus memperhatikan dimana data tersebut harus disimpan dan juga bagaimana bentuk dari data tersebut. Seperti analogi di restoran tadi, Data Engineer harus memastikan dan memperhatikan dengan baik bagaimana data yang diambil tersebut baik dan kembali dengan bersih dan fresh. Bahkan jika data yang dikirimkan tersebut gagal hingga sampai tujuan juga merupakan tugas dari Data Engineer.
Data Engineer harus bisa menguasai Databases (NoSQL,RDBMS, Data Lake, Data Warehouse, etc), SQL, Pipeline (Kafka, Azkaban, Airflow, Luigi, etc), ETL Tools (Ab Initio, Pentaho, etc), dan pastinya pemrograman dasar serta shell script.
Data Scientist
Mengolah lebih lanjut data yang telah dikumpulkan oleh data engineer. Mulai dari data extraction, lalu data preparation (cleansing), data processing, dan analysis. Data scientist perlu memastikan kondisi data baik dan sesuai untuk dianalisis dan diambil insightsnya. Data scientist biasanya melakukan eksperimentasi dengan menggunakan teknik machine learning dan metode statistik untuk digunakan dalam pemodelan prediktif dan preskriptif.
Ketika Anda memiliki setumpuk data yang terlalu besar bagi seorang manusia untuk mengurai dan terlalu berharga untuk diabaikan, Anda perlu beberapa cara menarik wawasan yang dapat dicerna darinya. Itulah pekerjaan dasar dari seorang ilmuwan data: mengkombinasikan beberapa pasang data untuk mengungkap suatu pola. Contohnya, kebiasaan dan preferensi konsumen. Pola yang dicari ini nantinya dapat digunakan sebagai acuan untuk memprediksi pergerakan bisnis suatu produk.
Seorang data scientist bertanggung jawab membersihkan, memproses, dan mengolah data besar yang sudah dikumpulkan oleh data engineer di suatu perusahaan. Data scientist juga tak jarang harus melakukan eksperimen untuk membuktikan dan memberikan saran yang paling tepat untuk perkembangan sebuah organisasi, perusahaan, dan badan usaha.
Dalam pekerjaan sehari-hari, data scientist akan sering berhadapan dengan pertanyaan seperti “berapa banyak jenis pengguna yang dimiliki oleh perusahaan?” dan “bisakah menciptakan model yang bisa memprediksi suatu produk yang akan laris jika dijual untuk target pasar tertentu?”
Pada intinya, pekerjaan sebagai data scientist adalah bagaimana bisa menghasilkan suatu kesimpulan yang dapat dicerna dan diterima oleh semuanya, berdasar dari kumpulan data besar yang sudah ada.
Setiap hari, data scientist berhadapan dengan program olah data seperti SQL dan Python. Persyaratan: Teknologi yang akan Anda gunakan termasuk Python, scikit-learn, Pandas, SQL, dan mungkin Flask, Spark dan/atau TensorFlow/PyTorch. Setidaknya, mereka harus menguasai bidang pemrograman data, komunikasi, matematika, statistik, dan ekonomi.
Pada uraian pekerjaan di atas tidak berdiri sendiri dalam semua kasus. Pada startup tahap awal, misalnya, seorang ilmuwan data mungkin harus menjadi insinyur data dan atau analis data. Tetapi sebagian besar pekerjaan akan jauh lebih rapi ke dalam salah satu kategori ini daripada yang lain. Dan semakin besar perusahaan tersebut, maka semakin banyak kategori ini dibutuhkan.
Orang-orang bekerja dalam mengolah data tidak boleh kehilangan fokus karena akan berakibat fatal dan tentu hal ini merupakan pekerjaan sulit. Sebagai contoh, beberapa perusahaan menerapkan model sederhana untuk dataset yang besar, beberapa menerapkan model yang kompleks untuk dataset kecil, beberapa melatih model mereka dengan cepat, dan beberapa tidak menggunakan model (konvensional) sama sekali.
Baik itu data scientist, data analyst, ataupun data engineer, ketiga pekerjaan tersebut masih berhubungan dan saling terkait. Data analyst dan data scientist tidak akan bisa bekerja tanpa data engineer. Sedangkan data engineer juga tidak akan maksimal kerjanya tanpa data analyst dan data scientist.
Sumber dari:
- https://www.dewaweb.com/blog/perbedaan-data-scientist-data-analyst-dan-data-engineer/
- https://jobhun.id/apa-sih-bedanya-data-analyst-data-engineer-dan-data-scientist/
- https://dtc.co.id/blog/kenalan-dengan-profesi-milenial-saat-ini-data-scientist-data-engineer-dan-data-analyst
- https://idcloudhost.com/mengenal-perbedaan-data-scientist-data-analyst-dan-data-engineer/
Triyono
25 April 2020Wkt kuliah pak joko nihh yg jelasin.
Dari ketiga profesi itu yg upahnya gede yg mana bu.. Hehe..
Syafnidawati
28 April 2020sama-sama gede hehehe…tapi paling gede data scientist (tingkatan dari ketiganya dia sebagai managernya)