PERBEDAAN WEKA dan TANAGRA
PERBEDAAN WEKA dan TANAGRA
WEKA
Weka adalah sebuah perangkat lunak yang memiliki banyak algoritma machine learning untuk keperluan data mining. Weka juga memiliki banyak tools untuk pengolahan data, mulai dari pre-processing, classification, regression, clustering, association ules, dan visualization. Weka adalah perangkat lunak open sourceberbasis Java dan kita dapat menggunakannya secara langsung atau melalui program Java kita. Weka juga bisa diimplementasikan ke program python. Untuk penjelasan Weka lebih lengkap, kamu bisa membuka halaman dokumentasinya di sini.
Empat
tombol diatas dapat digunakan untuk menjalanankan Aplikasi :
Explorer
digunkan untuk menggali lebih jauh data dengan aplikasi WEKA
Experimenter
digunakan untuk melakukan percobaan dengan pengujian statistic skema
belajar
Knowledge
Flow digunakan untuk pengetahuan pendukung
Simple
CLI antar muka dengan menggunakan tampilan command-line yang memungkinkan
langsung mengeksekusi perintah weka untuk Sistem Operasi yg tidak menyediakan
secara langsung
Kita
bisa menggunakan file dari komputer kita atau dari jaringan. Untuk contoh kali
ini, akan menggunakan file lokal. File yang bisa digunakan sebagai data, harus
memiliki atribut yang sama dengan data training. Mulai dari banyak atribut dan
tipe atribut. Untuk data tes yang akan diprediksi kelasnya, isi kelas yang akan
diprediksi dengan tanda tanya “?”
Klik
close untuk melanjutkan.
Pada
WEKA, ada pilihan untuk menggunakan ID3 ini, dengan nama yang sama. Namun,
jelas semua atribut harus bertipe nominal, dan tidak boleh ada yang kosong
Sedangkan,
C4.5 merupakan pengembangan dari ID3. Beberapa perbedaannya antara lain :
1.
Mampu menangani atribut dengan tipe diskrit atau kontinu.
2.
Mampu menangani atribut yang kosong (missing value)
3.
Bisa memangkas cabang.
Sedangkan untuk melihat
hasil proses dari Weka dapat dilihat pada gambar di bawah ini:
TANAGRA
Tanagra
merupakan salah satu software data mining yang didalamnya disediakan beberapa
metoda data mining mulai dari mengekplorasi analisis data, pembelajaran
statistik, pembelajaran mesin, dan database.
Tidak
seperti software data mining kebanyakan, tanagra merupakan suatu software
berbasis open source di mana semua orang dapat mengakses source codenya, dan
menambahkan algoritma mereka sendiri, sejauh dia setuju dan menyesuaikan dengan
lisensi pendistribusian softwarenya.
Tujuan
Pembuatan Software Tanagra
Memberi
peneliti dan mahasiswa suatu software data mining yang mudah digunakan, sesuai
dengan aturan yang ada dari pengembangan software dan memperbolehkan
menganalisa data real maupun sintetis.
Mengusulkan
pada peneliti suatu arsitektur yang memperbolehkan mereka untuk secara mudah
menambah metode data mining mereka sendiri, untuk membandingkan performannya.
Tanagra bertindak lebih sebagai platform percobaan dalam hal memperbolehkan
mereka menuju ke pekerjaan pokok mereka, menyalurkan mereka berhadapan dengan
bagian yang tak menyenangkan dalam pemograman tool seperti ini: manajeman data.
Bertujuan
untuk menyebarkan metodologi yang mungkin untuk membangun software seperti ini.
Mereka harus mengambil keuntungan dalam hal akses bebas ke source code, melihat
bagaimana software seperti ini dibangun, masalah untuk dihindari, langkah utama
dari proyek, dan tools atau libraries yang mana yang harus digunakan dan untuk
apa digunakan. Dalam hal ini, Tanagra dapat dianggap sebagai alat untuk
mendidik untuk belajar teknik pemrograman.
Tanagra
merupakan sebuah software yang biasanya digunakan untuk keperluan akademik dan
riset. Sebagian besar pengguna Tanagra adalah peneliti dan mahasiswa.
Metode
atau Teknik Pengolahan Data di Tanagra
A. Metode
Prediksi
Teknik
Classification dan Regression
1)
Dalam Teknik Classification tanagra meggunakan Decision Tree dengan componets
ID3 dan C4.5
2)
Dalam Teknik Regression tanagra menggunakan Tabs Regression yang sudah ada pada
bagian Regression components.
B. Metode Deskripsi
Teknik
Clustering dan Association Rule Discovery
1)
Dalam Teknik Clustering tanagra menggunakan Tabs Clustering yang sudah
ada pada bagian Clustering components.
2)
Dalam Teknik Association Rule tanagra menggunakan Tabs Association Rule yang
sudah ada pada bagian Association Rule components.
Kelebihan
dan Kelamahan Tanagra
Dalam
segi fitur Tanagra cukup baik karena selain memiliki beberapa pembelajaran
terkontrol juga paradigma lain seperti clustering, analisis faktorial,
statistik parametrik dan non parametrik, aturan asosiasi, feature selection,
dan construction algorithms. Akan tetapi tanagra tidak memasukkan apa yang
membuat semua kekuatan yang dimiliki software komersil dalam area ini, seperti
set sumber data yang luas, akses langsung ke datawarehouses dan databases, data
cleansing, dan interactive utilization.
Format
Data pada Software Tanagra
Data
Input dalam Software Tanagra
1)
Microssoft Excel
Kebanyakan
data yang diolah oleh Tanagra bersumber dari data yang di tulis dari Microssoft
Excel.
2)
TXT
Data
yang di import menggunakan format TXT berupa data yang di buat dengan
menggunakan Excel kemudian di exspor nya ke txt.
3)
ARFF
Data
yang formatnya Arff (Attribute-Relation File Format) ini merupakan format yang
digunakan oleh Weka dan Tanagra juga bisa menggunakan langsung.
Data
Output dalam Software Tanagra
1)
Binary description of the stream diagram(*.bdm).
File
yang berformat (*.bdm) ini hanya dapat di manfaatkan oleh Tanagra.
Keuntungan
utama dari format ini adalah bahwa data yang di impornya sekali dan hanya
sekali. Di sisi lain, ketidaknyamanan utama format ini adalah bahwa penyusunan
analisis diagram yang definitif yang di definisikan atas data yang diimpor.
Jadi jika data berubah, dengan menambahkan beberapa catatan misalnya, data
harus diimpor lagi, maka diagram harus didefinisikan ulang. Jadi kesimpulan
format ini adalah data yang di hasilkan tidak seharusnya ada perubahan lagi.
2)
Textual description of the stream diagram (*.TDM).
Format
ini, berdasarkan format file INI Windows, menjelaskan dalam sebuah file teks
analisis penyusunan diagram. Jadi file ini dapat dibuka dan diperiksa dengan
editor teks apapun. Keuntungan format ini yaitu hanya ada referensi ke data
dalam file yang disimpan, jika data nya terjadi perubahanh, maka eksekusi
berikutnya akan bekerja pada versi baru dari data, dan menghasilkan hasil yang
diperbarui, file yang dihasilakan menghormati spesifikasi INI, sehingga
memungkinkan untuk mendefinisikan diagram baru, tanpa membuka Tanagra.
Kekurangan utama dari format penyimpanannya adalah jika kebutuhan untuk
mengimpor data setiap kali maka Anda menjalankan diagram aliran.
Tampilan TANAGRA
Gambar 1 : GUI Tanagra
Gambar 2 : Input Data
Ganbar 3 : Tab Menu
Gambar 4 : Hasil
Comments
Post a Comment