Resume Jurnal Data Mining (2)

2. Judul : ANALISIS SENTIMEN PADA DOKUMEN BERBAHASA INDONESIA DENGAN PENDEKATAN SUPPORT VECTOR MACHINE

Pembuat : Muhamad Yusuf Nur dan Diaz D. Santika

Resume :

Pertumbuhan media online mendorong munculnya informasi tekstual yang tidak terbatas, sehingga muncul kebutuhan penyajian tanpa mengurangi nilai dari informasi tersebut. Informasi tekstual dikategorikan menjadi dua: fakta dan opini. Fakta merupakan ekspresi obyektif mengenai suatu entitas, kejadian atau sifat, sedangkan opini adalah ekspresi subyektif yang menggambarkan sentimen orang, pendapat atau perasaan tentang sebuah entitas, kejadian, atau sifat.

Analisis sentimen yang merupakan bagian dari opinion mining, adalah proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi. Dilakukan untuk melihat pendapat terhadap sebuah masalah, atau dapat juga digunakan untuk identifikasi kecenderungan hal di pasar. Analisis sentimen dalam penelitian ini adalah proses klasifikasi dokumen tekstual ke dalam dua kelas, yaitu kelas sentimen positif dan negatif. Manfaat analisis sentimen dalam dunia usaha antara lain untuk melakukan pemantauan terhadap sebuah produk. Secara cepat dapat digunakan sebagai alat bantu untuk melihat respon masyarakat terhadap produk tersebut. Sehingga dapat segera diambil langkah-langkah strategis berikutnya.

Dalam pengumpulan data yang penulis gunakan adalah dari dari ssitus jejaring sosial Twitter dengan menambahkan proses deteksi bahasa. Untuk mendapatkan data sentimen dilakukan dengan menggunakan kata kunci berupa ikon emosi “:)” dan “:(“. Topik dibatasi hanya mengenai telepon selular sepertiandroid, apple, blackberrym ericson, ipad, iphon, nexian, nokia, samsung dan handphone.

 

Sementara itu dalam preprocessing penulis menggunakan 3 tahapan, yaitu :

1. Cleansing: membersihkan  dokumen dari kata yang tidak diperlukan untuk mengurangi noise seperti karakter HTML,, ikon emosi, hashtag, username, url dan email.

2. Case folding : penyeragaman bentuk huruf serta penghapusan angka dan tanda baca.

3. Parsing : proses memecah dokumen menjadi sebuah kata dengan fitur yang digunakan yaitu unigram.

 

Dalam tahap pemilihan dan ekstraksi fitur penulis menggunakan 2 cara untuk melakukan klasifikasi, yaitu :

1. Part of Speech Tagger : proses memberikan kelas pada kata(adjective, adverb, noun, verb), sesuai dengan penelitian Bing Liu yang menyatakan bahwa keempat jenis kata di atas merupakan jenis kata yang paling banyak mengandung sentimen dan penentuan kelas berdasarkan KBBI.

2.Stemming : megurangi variasi kata yang memiliki kata dasar yang sama

 

Dalam tahap pembobotan penulis menggunakan metode pembobotan unigram dimana tiap kata atau simbol dihitung sebagai satu fitur. Untuk mereduksi jumlah atribut digunakan minimal frekuensi kemunculan kata sebanyak tiga. Hal ini berdasarkan pada penelitian “Web Forum Sentiment Analysis based on Topics” , bahwa penggunaan minimal tiga kata tidak berpengaruh besar terhadap hasil klasifikasi.

 

Metode klasifikasi yang digunakan adalah metode pembelajaran supervised dengan algoritma SVM.

 

Proses validasi menggunakan k-fold cross-validation, dengan k=3, mengikuti penelitian Pang. Hal ini karena dataset yang digunakan cukup besar yaitu 6000 data. Sedangkan untuk menghitung tingkat kebenaran proses klasifikasi digunakan data confusion matrix.

 

Hasil Penelitian :

1. Pengumpulan data : dengan menggunakan aplikasi java sesuai dengan kata yang digunakan didapatkan data tweet sebanyak 34413.

2. Pemilihan dan Ekstraksi Fitur : tweet yang sudah terkumpul diekstraksi fitur masing-masing dataset.

3. Proses klasifikasi : dengan menggunakan tools Weka dan hasilnya  dari 6000 data yang digunakan masing-masing 3000 sentiment positif dan negatif.

4. Validasi dan Evaluasi : Proses klasifikasi dengan menggunakan 3-fold cross validation, dengan menghitung nilai rata -rata untuk tiap dataset dan pembobotan yang dilakukan.

 

 

Comments: 4

  1. lotto February 7, 2021 at 10:49 am Reply

    I was extremely pleased to discover this web site. I need
    to to thank you for your time for this particularly fantastic read!!

    I definitely appreciated every part of it and i also have you saved to fav to see new stuff on your web site.

  2. หวยออนไลน์ March 27, 2021 at 12:45 am Reply

    Thanks for sharing your info. I truly appreciate your efforts and I will
    be waiting for your further write ups thank you once again.

  3. houston junk car buyer June 23, 2021 at 9:56 pm Reply

    Right here is the perfect webpage for everyone who hopes to understand this
    topic. You know so much its almost tough to argue with
    you (not that I personally will need to…HaHa). You certainly put a fresh spin on a subject that has been written about
    for many years. Wonderful stuff, just excellent!

Leave a Reply to หวยออนไลน์ Cancel reply

Your email address will not be published. Required fields are marked *