MACHINE LEARNING II


Hasil gambar untuk data mining





Jelaskan Perbedaan data mining, data analisis, data science

Data Mining

Data Mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan
buatan, machine learning  untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat

Data Science

Data Science adalah penggalian atau bisa juga disebut mengekstrak data agar dapat difilter serta
didapatkan data yang benar untuk menghasilkan produk data yang sebenar-benarnya.

Data analisis

Data Analysis adalah suatu proses atau upaya pengolahan data menjadi sebuah informasi baru agar
karakteristik data tersebut menjadi lebih mudah dimengerti dan berguna untuk solusi suatu permasalahan.

Hubungan antara machine learning, deep learning dan AI

Machine Learning

Machine learning (ML) adalah sub bidang dari artificial intelligence (AI). Machine learning bertujuan untuk membawa kecerdasan buatan melalui belajar dari data. Data digunakan machine learning sebagai kode untuk komputasi tradisional. Cara lain untuk memperoleh kecerdasan dalam mesin bisa melalui pemrograman logis, penalaran induktif berdasarkan aturan dasar dan sebagainya.
Dengan demikian machine learning dapat dianggap sebagai salah satu pendekatan menuju kecerdasan buatan.
Berdasarkan sifat dari berbagai masalah yang ada dan kelimpahan data untuk masalah itu, wajar saja bahwa machine learning merupakan pendekatan untuk mencapai AI. Fakta bahwa korpus data sangat besar dan terus meningkat, sumber daya komputasi (mesin dan manusia) terbatas dan tidak mungkin untuk bekerja melalui pemrogramanberbasis aturan telah mendorong pendekatan AI keseluruhan terhadap ML.

Hasil gambar untuk Machine learning


Deep Learning

Deep learning di sisi lain adalah metode machine learning yang berkembang pesat. Dalam pengaturan machine learning yang normal, salah satu masalah yang paling sulit adalah rekayasa fitur. Rekayasa fitur berkaitan dengan ekstraksi fitur yang sesuai yang dapat dimasukkan ke dalam model. Jika fitur tidak lengkap atau kurang, model ini cacat (bias tinggi) dan jika fitur terlalu banyak dan tidak semuanya berkontribusi pada keluaran model, model ini kembali cacat (varian tinggi). 
Jika kita memiliki terlalu banyak fitur, kita memerlukan dataset yang sangat sangat besar untuk dipelajari dari model yang salah. Dalam machine learning ada sub-bidang yang disebut ‘pembelajaran representasional’ juga dikenal sebagai ‘pembelajaran fitur’ yang bertujuan mengekstrak fitur dari data seperti gambar di mana fitur pengambilan tangan oleh insinyur manusia sama sekali tidak layak.



AI (Artificial Intelligence)

Artificial Intelligence atau Kecerdasan Buatan adalah istilah yang sangat luas yang bertujuan untuk membawa perilaku cerdas ke dalam mesin. Machine Learning dapat dianggap sebagai salah satu filosofi yang mana tujuan utamanya adalah, “bukan mesin pemrograman secara eksplisit, hanya memberi mereka data dan biarkan mereka belajar”.
Dalam beberapa pendekatan machine learning ini juga ada terlalu banyak sub kategori: pembelajaran yang diawasi (melatih dataset berlabel dan membuat model untuk memprediksi dataset tanpa label), pembelajaran tanpa pengawasan (menggambar kesimpulan yang bermakna dari dataset tanpa label, pengelompokan menjadi contoh yang paling populer), pembelajaran penguatan (pemberian Algoritma dan fungsi obyektif untuk mengoptimalkan berdasarkan hadiah langsung untuk setiap tindakan yang diperlukan, misalnya: catur bermain robot), dll.

Berikan contoh yang berhubungan dengan data maining

Classification

Classification adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatuobjek yang labelnya tidak diketahui. Model itu sendiri bisa berupa aturan "jika-maka", berupa decision tree, formula matematis atau neural network. Decision tree adalah salah satu metode classification yang paling populer karena mudah untuk diinterpretasi oleh manusia. Disini setiap percabangan menyatakan kondisi yang harus dipenuhi dan tiap ujung pohon menyatakan kelas data. Algoritma decision tree yang paling terkenal adalah C4.5, tetapi akhir-akhir ini telah dikembangkan algoritma yang mampu menangani data skala besar yang tidak dapat ditampung di main memory seperti RainForest. Metode-metode classification yang lain adalah Bayesian, neural network, genetic 
algorithm, fuzzy, case-based reasoning, dan k-nearest neighbor. 
Proses classification biasanya dibagi menjadi dua fase, learning dan test. Pada fase learning, sebagian data yang telah diketahui kelas datanya diumpankan untuk membentuk model perkiraan. Kemudian pada fase test, model yang sudah terbentuk di uji dengan sebagian data lainnya untuk mengetahui akurasi dari model tersebut. Bila akurasinya mencukupi model ini dapat dipakai untuk prediksi kelas data yang belum diketahui.

Apa kaitannya antara data mining dan data science

saling berhubungan dalam rangka mengolah data dan mendapatkan informasi dari berbagai
macam data yang telah berhasil dikumpulkan. Semisal data piala dunia 2018, dengan berbagai
macam teknik pengolahan data kita bisa memprediksi siapa yang akan menjadi juaranya.


Apa yang dimaksud dengan dat big data smart data data scinece bisnis intiligence dan data aksitektur

  • Data
data adalah sekumpulan keterangan atau fakta mentah berupa simbol, angka, kata-kata, atau citra, yang didapatkan melalui proses pengamatan atau pencarian ke sumber-sumber tertentu.
Pendapat lain mengatakan, definisi data adalah kumpulan keterangan-keterangan atau deskripsi dasar dari suatu hal (objek atau kejadian) yang diperoleh dari hasil pengamatan (observasi) dan dapat diolah menjadi bentuk yang lebih kompleks, seperti; informasi, database, atau solusi untuk masalah tertentu.


  • Big Data
Pengertian Big Data bukan berarti besarnya data yang kita punya. Big Data berarti sekumpulan data yang sangat besar yang tidak dapat ditangani oleh aplikasi database biasa, 
Big Data adalah buzzword atau menangkap-frase yang digunakan untuk menggambarkan volume besar, baik dari data terstruktur dan tidak terstruktur yang begitu besar sehingga sulit untuk memproses dengan menggunakan teknik database dan perangkat lunak biasa. Dalam kebanyakan kejadian data perusahaan yang terlalu besar atau bergerak terlalu cepat atau melebihi kapasitas pengolahan saat ini. Big data memiliki potensi untuk membantu perusahaan meningkatkan operasi, membuat lebih cepat dan keputusan yang lebih cerdas.

  • Business Intelligence
Business Intelligence adalah sekumpulan teknik dan alat untuk mentransformasi dari data mentah menjadi informasi yang 
berguna dan bermakna untuk tujuan analisis bisnis. Teknologi BI dapat menangani data yang tak terstruktur dalam jumlah yang sangat besar untuk membantu mengidentifikasi.

  • Smart Data
Smart Data adalah informasi digital yang diformat sehingga dapat ditindaklanjuti pada 
titik pengumpulan sebelum dikirim ke platform analitik akhir untuk konsolidasi dan analitik 
data lebih lanjut. Istilah Smart data sering dikaitkan dengan Internet of Things (IoT) dan 
data yang dihasilkan oleh sensor cerdas dalam objek fisik.

  • Data Science
Data science adalah salah satu disiplin ilmu yang secara khusus mempelajari soal data 
terutama data kuantitatif atau data numerik. Saat ini, ilmu yang satu ini mulai menjelma 
menjadi suatu profesi baru di bidang teknologi yang banyak dicari oleh berbagai jenis perusahaan.

  • Data Arsitektur
Arsitektur Data adalah menyediakan kerangka dengan mengidentifikasi dan memahami 
bagaimana data akan pindah melalui sistem dan digunakan dalam perusahaan. Arsitektur 
data warehouse terdiri dari struktur dan komponen yang saling berhubungan satu sama 
lain dalam membangun data warehouse.


0 komentar:

Posting Komentar

Model Linier

LINIER Model Linier model linier digunakan dalam berbagai cara sesuai dengan konteksnya. Kejadian yang paling umum adalah sehub...

About me

Photostream