MATAHARI CERIA: UTS DATA MINING

1.Melimpahnya data (overload data) yang dialami oleh berbagai institusi, perusahaan atau organisasi.

Merlimpahnya data ini merupakan akumulasi data transaksi yang terekam bertahun-tahun..

Data–data tersebut merupakan data transaksi yang umumnya diproses menggunakan aplikasi komputer yang biasa disebut dengan OLTP (On Line Transaction Processing).

2.1. Data selection

Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.

2. Pre-processing / cleaning

Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data.

3. Transformation

Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.

4. Data mining

Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.

5. Interpretation / evalution

Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.

3.Atribut identik dengan istilah “kolom data” tetapi dapat menunjukkan fungsinya sebagai pembentuk karakteristik (sifat-sifat) yang melekat dalam sebuah tabel.Pada penerapan aturan normalisasi, bisa berdampak pada penghilangan atau penambahan kolom tertentu, atau bahkan dapat memebentuk suatu tabel baru.

Selain penamaan yang unik berdasarkan fungsinya di tiap tabel, atribut juga dapat dibedakan berdasarkan sejumlah pengelompokkan sbb :

Atribut kunci dan Atribut Deskriptif
Atribut Sederhana ( Simple Attribute ) dan Atribut Komposit ( Composite Attribute )
Atribut Bernilai Tunggal ( Single-Valued Attribute ) dan Atribut Bernilai Banyak ( Multi-Valued Attribute )
Atribut Harus Bernilai ( Mandatory Attribute ) dan Atribut Nilai Null ( Null Value Attribute)
Atribut Turunan ( Derrived Attribute )

tribut DeskriptifAtribut Deskriptif adalah atribut-atribut yang tidak menjadi atau merupakan anggota dari primary key.Jadi, dalam tabel mahasiswa yang menjadi atribut deskriptif adalah selain NIM.Atribut Sederhana (simple attribute )Atribut Sederhana adalah atribut atomik yang tidak dapat dipilah lagi. Contoh Atribut Sederhana pada tabel customer adalah no_identitas dan jaminan, dimana atribut ini tidak bisa dipecah lagi.Atribut Komposit (composite attribute )Atribut Komposit (composite attribute ) adalah atribut yang masih dapat diuraikan lagi menjadi sub-sub atribut yang masing-masing memiliki makna.

Contoh pada tabel customer adalah atribut alamat, dimana dapat diuraikan lagi menjadi alamat, kota dan kode_pos.

Atribut Bernilai Tunggal (single-valued attribute)
Atribut bernilai tunggal adalah atribut-atribut yang memiliki paling banyak satu nilai untuk setiap baris data. Contoh : Bila seorang mahasiswa memiliki 2 tempat tinggal, maka hanya 1 saja yang boleh diisikan ke atribut alamat_mhs.Atribut Bernilai Banyak (multiple-valued attribute)Atribut bernilai banyak adalah atribut-atribut yang dapat diisi dengan lebih dari satu nilai, tetapi jenisnya sama. Contoh : Atribut hobi pada data mahasiswa.Ada mahasiswa yang punya banyak hobi, ada yang cuma satu hobi dan ada yang tidak ada sama sekali.Atribut Harus Bernilai (mandatory attribute)Atribut harus bernilai adalah jika berisi data dan nilainya tidak boleh kosong.
Contoh : no_identitas dan nama_customer harus ada nilainya dalam tabel customer.Atribut Nilai Null ( non-mandatory attribute )Atribut nilai null adalah atribut yang nilainya boleh dikosongkan. Dapat digunakan untuk menyatakan/mengisi atribut-atribut yang nilainya memang belum siap atau tidak ada.Nilai null tidak sama dengan spasi.Atribut TurunanAtribut turunan adalah atribut-atribut yang nilai-nilainya diperoleh dari pengolahan atau dapat diturunkan dari atribut tabel lain yang berhubungan.Dapat ditiadakan dari sebuah tabel, karena nilainya bergantung pada nilai yang ada di atribut lain.

4. Predictive Modeling

Aplikasi Predictive Modeling menghasilkan klasifikasi atau prediksi. Tujuan dari predictive modeling adalah menemukan pola yang melibatkan variabel untuk memprediksi dan mengklasifikasi perilaku masa depan dari sebuah entitas. Ada dua tipe masalah yang diselesaikan oleh predictive modeling: klasifikasi dan regresi.

Discovery

Aplikasi discovery adalah pendekatan eksploratoris untuk analisis data. Aplikasi discovery menggunakan teknik yang menganalisis data set yang besar untuk menemukan association rules(atau pola), atau menemukan kluster dari sampel yang dapat dikelompokan. Hasil dari metode discovery umumnya dimaksudkan untuk pengguna. Walau begitu, hasilnya juga dapat diaplikasikan ke metode data mining yang lain

Deviation Detection

Deviation Detection melakukan deteksi anomali secara otomatis. Tujuannya untuk mengidentifikasi kebiasaan suatu entitas dan menetapkan sejumlah norm melalui pattern discovery. Sampel yang berdeviasi dari norm lalu diidentifikasi sebagai tidak biasa. teknik Deviation Detection melalui visualisasi melalui parallel coordinates, scatterplots, dan surface plots.

5. Object X masuk ke Class II

If attr A <= 50 and Attr C < 20 Then Class I

If attr A <= 50 and Attr C >= 20 and Attr B = 10 Then Class I

If attr A <= 50 and Attr C >= 20 and Attr B = 0 Then Class II

If attr A < 5 and Attr B = 0 Then Class I

If attr A < 5 and Attr B = 10 and Attr A < 20 Then Class II

If attr A < 5 and Attr B = 10 and Attr A >= 20 Then Class III

6.TERJADINYA PERCERAIAN ATAU TIDAK

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEje6xqSptzBM535BXwzvJERcXDSyL530slBPM5LmeUvPhByLYb1miQ9reAqTX9eglcOsbwaM2JhwdRPmv0xdmk7o5M6MkSSUIZ5nPttcC2vR9GKkvWMqrUB7acoB2Vu0FaOd3vBl7KhSeA/s400/4.jpg

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikoYQiAfbwEq0OrERTeCdUcSmlh9QgFTtDYLpFK9qvKwXpoDyymnNpOQ2OFyvqRvxCG_lmbfOGBx3O94s6gGeZNyz1tNUIaJ_rP7wiITDdgWdCppriOADa8BJdseXmP8mcdWBsF5WO2Uo/s400/1.jpg

Tabel Perhitungan Node

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiuRcyezEvNTmJGoWWgo7IOIEW49nWT7nmRfmRZ0qV3RFUll7sl7qa-hBN6tGS39Z-b56jrdK9NRbeiJcLee0XB_NDuZnn6vHkHcEXlkEH6F7i2tOWTovk_OoOrNrLl8VLQX5c9tqq5twk/s400/2.jpg

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEim-dZ6-3Xcg3qsgIYYRPpvccQvBgkP9qvbafkBmGKtLSp4HLmwtExZ1W2FuTTKNHwOGEhyt0OVKVtP3nsCcjNSPKRW4-PAzLQU8OGS6SF6x7OOnV7VDq4nHsnLn_3K_D1C6XVn383n0fQ/s400/3.jpg

NAMA KELUARGA	KOMUNIKASI	HUBUNGAN SEX	TEMPAT TINGGAL	PERCERAIAN
A	TERBUKA	TIDAK PERNAH	BERBEDA	TIDAK
B	TERTUTUP	PERNAH	SAMA	YA
C	KADANG-KADANG	JARANG	BERBEDA	TIDAK
D	TERTUTUP	JARANG	BERBEDA	YA
E	TERBUKA	TIDAK PERNAH	SAMA	TIDAK
F	TERTUTUP	PERNAH	SAMA	YA

MATAHARI CERIA

Thursday, 19 September 2019

UTS DATA MINING

No comments:

Post a Comment

PROSEDUR KESELAMATAN KERJA DALAM MERAKIT PC

BTemplates.com

pages