Tag Archives: bigdata

Apa Itu BIG DATA ?

Pengertian Big Data

Menurut (Gordon B Davis), Data merupakan bahan mentah bagi informasi, yang dirumuskan sebagai kelompok lambang-lambang tidak acak yang menunjukkan jumlah-jumlah, tindakan-tindakan, hal-hal, dan sebagainya. Data- data disusun untuk mengolah tujuan-tujuan menjadi susunan data, susunan kearsipan, & pusat data / landasan data.

Berdasarkan pengertian di atas data adalah fakta-fakta mentah yang harus dikelola untuk menghasilkan suatu informasi yang memiliki arti bagi suatu organisasi atau perusahaan. Data terdiri atas fakta-fakta dan angka-angka yang secara relatif tidak berarti bagi pemakai atau fakta mentah yang belum diolah.

Menurut (Eaton, Dirk, Tom, George, & Paul) Big Data merupakan istilah yang berlaku untuk informasi yang tidak dapat diproses atau dianalisis menggunakan alat tradisional.

Menurut (Dumbill, 2012) , Big Data adalah data yang melebihi proses kapasitas dari kovensi sistem database yang ada. Data terlalu besar dan terlalu cepat atau tidak sesuai dengan struktur arsitektur database yang ada. Untuk mendapatkan nilai dari data, maka harus memilih jalan altenatif untuk memprosesnya. Berdasarkan pengertian para ahli di atas, dapat disimpulkan bahwa Big Data adalah data yang memiliki volume besar sehingga tidak dapat diproses menggunakan alat tradisional biasa dan harus menggunakan cara dan alat baru untuk mendapatkan nilai dari data tersebut.

Dimensi Big Data

IBM di situs resminya mendefinisikan Big Data ke dalam tiga istilah yaitu volume , variety , dan velocity. Volume di sini berkaitan dengan ukuran media penyimpanan data yang sangat besar atau mungkin tak terbatas. Sementara variety berarti tipe atau jenis data yang dapat diakomodasi. Sedangkan velocity dapat diartikan sebagai kecepatan prose IBM di situs resminya mendefinisikan Big Data ke dalam tiga istilah yaitu volume , variety , dan velocity. Volume di sini berkaitan dengan ukuran media penyimpanan data yang sangat besar atau mungkin tak terbatas. Sementara variety berarti tipe atau jenis data yang dapat diakomodasi. Sedangkan velocity dapat diartikan sebagai kecepatan prose

  • Volume, Banyak faktor yang mempengaruhi peningkatan jumlah data yang beredar seperti data berkas transaksi yang disimpan bertahun tahun lamanya, lalu juga seperti data tentang akun yang berada pada media sosial, adanya data tentang chace yang ada  pada mesin-mesin pabrik yang disimpan, dan masih banyak lagi. Sebetulnya  permasalahan tentang membludaknya volume data ini sudah ada sejak dulu, dan solusipun telah diterapkan dengan mengurangi biaya yang harus dikeluarkan untuk melakukan penyimpanan data. Tetapi seiring dengan berjalannya waktu, masalah lain muncul. Yaitu tentang bagaimana cara untuk mengolah data yang begitu banyak sampai  bisa menghasilkan sebuah nilai yang berarti.  Volume data juga terus meningkat dan belum pernah terjadi sampai sehingga ini sehingga tidak dapat diprediksi jumlah pasti dan juga ukuran dari data sekitar lebih kecil dari petabyte sampai zetabyte. Dataset big data sekitar 1 terabyte sampai 1 petabyte perperusahaan jadi jika big data digabungkan dalam sebuah organisasi / group perusahaan ukurannya mungkin bisa sampai zetabyte dan jika hari ini jumlah data sampai 1000 zetabyte, besok pasti akan lebih tinggi dari 1000 zetabyte.
  •  Variety, volume data yang banyak tersebut bertambah dengan kecepatan yang begitu cepat sehingga sulit bagi kita untuk mengelola hal tersebut. Untuk proses dalam waktu sensitif seperti penangkapan penipuan, data yang besar harus digunakan sebagai aliran ke dalam suatu perusahaan untuk memaksimalkan nilainya.  Berbagai jenis data dan sumber data. Variasi adalah tentang mengelolah kompleksitas beberapa jenis data, termasuk structured data, unstructured data dan semi -structured data. Organisasi perlu mengintegrasikan dan menganalisis data dari array yang kompleks dari kedua sumber informasi Traditional dan non traditional informasi, dari dalam dan luar perusahaan. Dengan begitu banyaknya sensor, perangkat pintar (smart device) dan teknologi kolaborasi sosial, data yang dihasilkan dalam bentuk yang tak terhitung jumlahnya,  termasuk text, web data, tweet, sensor data, audio, video, click stream, log file dan banyak lagi.
  • Velocity, Bagian ini merupakan tantangan yang cukup berat bagi sebagian besar perusahaan. Karena mereka berurusan dengan waktu, jadi mereka harus mengelola data yang ada yang begitu banyaknya dengan cepat atau bahkan hampir mendekati kata real -time. Kecepatan atau velocity mereferensi kepada peningkatan pengumpulan data dan seberapa cepat data yang dikumpulkan harus dievaluasi dan diaplikasikan untuk meningkatkan nilai bisnis.

Tantangan Dalam Pemanfaatan Big Data

Dalam usaha pemanfaatan Big Data dapat terdapat banyak hambatan dan tantangan, beberapa hal diantaranya berhubungan dengan data dimana melibatkan acquisition, sharing dan privasi data, serta dalam analisis dan pengolahan dataDalam usaha pemanfaatan Big Data dapat terdapat banyak hambatan dan tantangan, beberapa hal diantaranya berhubungan dengan data dimana melibatkan acquisition, sharing dan privasi data, serta dalam analisis dan pengolahan data

  • Privasi  Privasi merupakan isu yang paling sensitif, dengan konseptual, hukum, dan teknologi, Privasi dapat dipahami dalam arti luas sebagai usaha perusahaan untuk melindungi daya saing dan konsumen mereka. Data-data yang digunakan / disimpan sebagai big data
  • Access dan sharing Akses terhadap data, baik data lama maupun data baru dapat menjadi hambatan dalam mendapatkan data untuk big data, terlebih pada data lama dimana data- data tersimpan dalam bentuk – bentuk yang berbeda-beda dan beragam ataupun dalam bentuk fisik, akses terhadap data baru juga membutuhkan usaha yang lebih kerana diperlukannya izin dan lisensi untuk mengakses data-data non-public secara legal.
  • Analisis Bekerja dengan sumber data baru membawa sejumlah tantangan analitis. relevansi dan tingkat keparahan tantangan akan bervariasi tergantung pada jenis analisis sedang dilakukan, dan pada jenis keputusan yang akhirnya akan bisa diinformasikan oleh data.Tergantung dari jenis data terdapat 3 kategori dalam analisis data
  1. Penentuan gambaran yang benar Masalah ini biasanya ditemukan dalam penanganan unstructured user-generated text-based data dimana data yang didapatkan belum tentu benar karena data atau sumber yang salah.
  2. Interpreting Data Kesalahan –kesalahan seperti Sampling selection bias merupakan hal yang sering ditemukan dimana data yang ada tidak dapat digunakan untuk mepresentasikan semua populasi yang ada, dan apophenia, melihat adanya pola walaupun tidak benar- benar ada dikarenakan jumlah data yang besar, dan kesalahan dalam menginterpreasikan hubungan dalam data.
  3.  Defining and detecting anomalies Tantangan sensitivitas terhadap spesifisitas pemantauansistem. Sensitivitas mengacu pada kemampuan sistem pemantauan untuk mendeteksi semua kasus sudah diatur untuk mendeteksi sementara spesifisitas mengacu pada kemampuannya untuk mendeteksi hanya kasus-kasus yang relevan. kegagalan untukmencapai hasil yang terakhir “Tipe I kesalahan keputusan”, juga dikenal sebagai “positif palsu”; kegagalanuntuk mencapai mantan “Type II error”, atau “negatif palsu.” Kedua kesalahan yang tidak diinginkan ketika mencoba untuk mendeteksi malfungsi atau anomali, bagaimanapun didefinisikan, untuk berbagai alasan. Positif palsu merusak kredibilitas sistem sementara negatif palsu dilemparkan ragu pada relevansinya. Tapi apakah negatif palsu lebih atau kurang bermasalah daripada positif palsu tergantung pada apa yang sedang dipantau, dan mengapa itu sedang dipantau.

Teknik Analisis Big Data

Beberapa jenis metode atau teknik dalam melakukan analisis big data :

  1. Analisis Teks, merupakan proses menganalisis data teks (unstructured-data) seperti blog, email, forum, tweet, forum dan bentuk lainnya.
  2. Data Mining, merupakan suatu proses menemukan hubungan yang berarti, pola, dan kecenderungan dari sekumpulan besar data dengan menggunakan teknik pengenalan pola seperti statisik dan matematika
  3. Machine Learning
  4. Analisis Prediksi (Predictive Analytics)
  5. Analisis Statistik
  6. NLP (Natural Language Processing)

Contoh Aplikasi Analisa  Big Data

Berikut ini beberapa contoh Aplikasi yang ditawarkan oleh perusahaan/vendor dalam hal analisis terhadap big data :

  1. IBM Big data Analytics
  2. HP Big Data
  3. SAP Big Data Analytics
  4. Microsoft Big Data Analytics
  5. Oracle Big Data Analytics
  6. Talend Open Studio
  7. Teradata Big Data Analytics
  8. SAS Big Data Analytics
  9. Dell Big Data Analytics,
  10. Pentaho Big Data Analytics

 

Sumber :

  • http://dosenit.com/kuliah-it/sistem-informasi/pengertian-sistem-informasi
  • http://www.seputarpendidikan.com/2015/11/9/pengertian-data-menurut-para-ahli.htmlhttp://www.definisi-pengertian.com/2015/03/definisi-dan-pengertian-informasi.html
  • http://www.indriany.com/arti-pengertian-definisi-knowledge-management-atau-manajemen-pengetahuan/
  • http://simsofianaistinfarani-septialutfi.blogspot.co.id/2016/12/makalah-big-data.html