Resume Jurnal Data Mining (6)

6. Judul : A Model for Mining Public Health Topics from Twitter

Penulis : Michael J. Paul and Mark Dredze

Resume :

Dalam jurnal ini penulis membahas topik Ailment Topic Aspect Model (ATAM), topik baru untuk Twitter yang menghubungkan gejala, pengobatan dan kata-kata umum yang berkaitan dengan penyakit. Penulis mengkaji 1,6 juta tweet baru ATAM yang membahas topik berbagai kesehatan. Atam mengisolasi lebih koheren seperti influenza, infeksi, obesitas dibandingkan dengan model standar.

1. Twitter dan Kesehatan Masyarakat

Di dalam kasus ini penulis meneliti tweet untuk memantau bebagai penyakit. Model kami menggunakan pengetahuan eksplisit gejala-gejala dan perawatan untuk memisahkan kelompok penyakit koheren dari topik yang lebih umum. Kami menunjukkan bahwa model kami menemukan sejumlah besar lebih koheren penyakit daripada LDA, menghasilkan informasi lebih rinci penyakit (gejala / pengobatan) dan
melacak tingkat penyakit konsisten dengan diterbitkan pemerintah  (influenza surveilans) meskipun kurangnya data pelatihan influenza diawasi.

2. A Twitter Health Corpus

Penulis mengumpulkan kurang lebih 2 milyar tweet yan berhubungan dengan kesehatan dari tahun 2009 hingga 2010. Tweet-tweet tersebut dibersihkan dengan cara menghapus URL, lalu menghapus tweet yang bersifat ambigu.

3. ATAM: A Model for Ailments in Twitter

Dalam langkah ini penulis membuat model yang dapat menemukan berbagai topik kesehatan yang dibahas di Twitter. Dengan model probabilistik seperti LDA, mengasosiasikan kata tokens dengan topik laten dan menemukan struktur laten dalam data.Percobaan awal dengan LDA menghasilkan beberapa topik berkaitan dengan penyakit, tetapi sebagian besar tidak jelas terindikasi penyakit tertentu.

Kesimpulan

Dengan informasi dari twitter penulis dapat mengelompokkan kata-kata ke dalam topik kesehatan yang terkait.

1 comment

  1. Notifbot June 20, 2021 at 11:51 pm Reply

    Notifbot – Cara Automatik Hantar Notifikasi WooCommerce ke Whatsapp

Leave a Reply

Your email address will not be published. Required fields are marked *