PERBEDAAN WEKA dan TANAGRA

PERBEDAAN WEKA dan TANAGRA

WEKA
Weka adalah sebuah perangkat lunak yang memiliki banyak algoritma machine learning untuk keperluan data mining. Weka juga memiliki banyak tools untuk pengolahan data, mulai dari pre-processing, classification, regression, clustering, association ules, dan visualization. Weka adalah perangkat lunak open sourceberbasis Java dan kita dapat menggunakannya secara langsung atau melalui program Java kita. Weka juga bisa diimplementasikan ke program python. Untuk penjelasan Weka lebih lengkap, kamu bisa membuka halaman dokumentasinya di sini.


Empat tombol diatas dapat digunakan untuk menjalanankan Aplikasi : 
Explorer digunkan untuk menggali lebih jauh data dengan aplikasi WEKA 
Experimenter digunakan untuk melakukan percobaan dengan pengujian statistic skema belajar 
Knowledge Flow digunakan untuk pengetahuan pendukung 
Simple CLI antar muka dengan menggunakan tampilan command-line yang memungkinkan langsung mengeksekusi perintah weka untuk Sistem Operasi yg tidak menyediakan secara langsung

Kita bisa menggunakan file dari komputer kita atau dari jaringan. Untuk contoh kali ini, akan menggunakan file lokal. File yang bisa digunakan sebagai data, harus memiliki atribut yang sama dengan data training. Mulai dari banyak atribut dan tipe atribut. Untuk data tes yang akan diprediksi kelasnya, isi kelas yang akan diprediksi dengan tanda tanya “?”
Klik close untuk melanjutkan.
Pada WEKA, ada pilihan untuk menggunakan ID3 ini, dengan nama yang sama. Namun, jelas semua atribut harus bertipe nominal, dan tidak boleh ada yang kosong
Sedangkan, C4.5 merupakan pengembangan dari ID3. Beberapa perbedaannya antara lain :
1. Mampu  menangani atribut dengan tipe diskrit atau kontinu.
2. Mampu  menangani atribut yang kosong (missing value)
3. Bisa memangkas cabang.
Sedangkan untuk melihat hasil proses dari Weka dapat dilihat pada gambar di bawah ini:


TANAGRA
Tanagra merupakan salah satu software data mining yang didalamnya disediakan beberapa metoda data mining mulai dari mengekplorasi analisis data, pembelajaran statistik, pembelajaran mesin, dan database.
Tidak seperti software data mining kebanyakan, tanagra merupakan suatu software berbasis open source di mana semua orang dapat mengakses source codenya, dan menambahkan algoritma mereka sendiri, sejauh dia setuju dan menyesuaikan dengan lisensi pendistribusian softwarenya.
Tujuan Pembuatan Software Tanagra
Memberi peneliti dan mahasiswa suatu software data mining yang mudah digunakan, sesuai dengan aturan yang ada dari pengembangan software dan memperbolehkan menganalisa data real maupun sintetis.
Mengusulkan pada peneliti suatu arsitektur yang memperbolehkan mereka untuk secara mudah menambah metode data mining mereka sendiri, untuk membandingkan performannya. Tanagra bertindak lebih sebagai platform percobaan dalam hal memperbolehkan mereka menuju ke pekerjaan pokok mereka, menyalurkan mereka berhadapan dengan bagian yang tak menyenangkan dalam pemograman tool seperti ini: manajeman data.
Bertujuan untuk menyebarkan metodologi yang mungkin untuk membangun software seperti ini. Mereka harus mengambil keuntungan dalam hal akses bebas ke source code, melihat bagaimana software seperti ini dibangun, masalah untuk dihindari, langkah utama dari proyek, dan tools atau libraries yang mana yang harus digunakan dan untuk apa digunakan. Dalam hal ini, Tanagra dapat dianggap sebagai alat untuk mendidik untuk belajar teknik pemrograman.
Tanagra merupakan sebuah software yang biasanya digunakan untuk keperluan akademik dan riset. Sebagian besar pengguna Tanagra adalah peneliti dan mahasiswa.
Metode atau Teknik Pengolahan Data di Tanagra
A.    Metode Prediksi
Teknik Classification dan Regression
1)      Dalam Teknik Classification tanagra meggunakan Decision Tree dengan componets ID3 dan C4.5
2)      Dalam Teknik Regression tanagra menggunakan Tabs Regression yang sudah ada pada bagian Regression components.


B.     Metode Deskripsi
Teknik Clustering dan Association Rule Discovery
1)      Dalam Teknik Clustering  tanagra menggunakan Tabs Clustering yang sudah ada pada bagian Clustering components.
2)      Dalam Teknik Association Rule tanagra menggunakan Tabs Association Rule yang sudah ada pada bagian Association Rule components.
Kelebihan dan Kelamahan Tanagra
Dalam segi fitur Tanagra cukup baik karena selain memiliki beberapa pembelajaran terkontrol juga paradigma lain seperti clustering, analisis faktorial, statistik parametrik dan non parametrik, aturan asosiasi, feature selection, dan construction algorithms. Akan tetapi tanagra tidak memasukkan apa yang membuat semua kekuatan yang dimiliki software komersil dalam area ini, seperti set sumber data yang luas, akses langsung ke datawarehouses dan databases, data cleansing, dan interactive utilization.
Format Data pada Software Tanagra
Data Input dalam Software Tanagra
1)      Microssoft Excel
Kebanyakan data yang diolah oleh Tanagra bersumber dari data yang di tulis dari Microssoft Excel.
2)      TXT
Data yang di import menggunakan format TXT berupa data yang di buat dengan menggunakan Excel kemudian di exspor nya ke txt.
3)      ARFF
Data yang formatnya Arff (Attribute-Relation File Format) ini merupakan format yang digunakan oleh Weka dan Tanagra juga bisa menggunakan langsung.
Data Output dalam Software Tanagra
1)      Binary description of the stream diagram(*.bdm).
File yang berformat (*.bdm) ini hanya dapat di manfaatkan oleh Tanagra.
Keuntungan utama dari format ini adalah bahwa data yang di impornya sekali dan hanya sekali. Di sisi lain, ketidaknyamanan utama format ini adalah bahwa penyusunan analisis diagram yang definitif yang di definisikan atas data yang diimpor. Jadi jika data berubah, dengan menambahkan beberapa catatan misalnya, data harus diimpor lagi, maka diagram harus didefinisikan ulang. Jadi kesimpulan format ini adalah data yang di hasilkan tidak seharusnya ada perubahan lagi.
2)      Textual description of the stream diagram (*.TDM).
Format ini, berdasarkan format file INI Windows, menjelaskan dalam sebuah file teks analisis penyusunan diagram. Jadi file ini dapat dibuka dan diperiksa dengan editor teks apapun. Keuntungan format ini yaitu hanya ada referensi ke data dalam file yang disimpan,  jika data nya terjadi perubahanh, maka eksekusi berikutnya akan bekerja pada versi baru dari data, dan menghasilkan hasil yang diperbarui, file yang dihasilakan  menghormati spesifikasi INI, sehingga memungkinkan untuk mendefinisikan diagram baru, tanpa membuka Tanagra. Kekurangan  utama dari format penyimpanannya adalah jika kebutuhan untuk mengimpor data setiap kali maka Anda menjalankan diagram aliran.

Tampilan TANAGRA

Gambar 1 : GUI Tanagra

Gambar 2 : Input Data

Ganbar 3 : Tab Menu

Gambar 4 : Hasil


Comments