Peringkasan Tweet Berdasarkan Trending Topic Twitter Dengan Pembobotan TF-IDF dan Single Linkage Angglomerative Hierarchical Clustering
Corresponding Author(s) : Yuda Munarko
Kinetik: Game Technology, Information System, Computer Network, Computing, Electronics, and Control,
Vol 1, No 1, May-2016
Abstract
Fitur yang paling sering digunakan pada Twitter ialah Trending Topic. Trending Topic merupakan fitur yang menampilkan beberapa hashtag berisi topik yang sedang trend saat ini. Jika pengguna ingin mengetahui informasi mengenai suatu trending topic, pengguna bisa mengklik salah satu hashtag dan barulah muncul beberapa tweet terkait dengan hashtag tersebut. Agar menghemat waktu pengguna Twitter dalam membaca suatu trending topic tanpa perlu membaca beberapa tweet terlebih dahulu, maka dilakukanlah analisa dengan tujuan membuat text summarization untuk trending topic pada Twitter menggunakan algoritma TF-IDF dan Single Linkage Agglomerative Hierarchical Clustering. Penelitian ini menggunakan 100 trending topic untuk data tes pada sistem dan setiap trending topic terdiri atas 50 tweet berbahasa indonesia, sedangkan untuk pengujian digunakan 30 data trending topic diambil secara acak (data mewakili trending topic dengan sub tema minimal 2 dan maksimal 9 dari 100 data tes pada sistem). Dari 30 data pengujian, 1 data menghasilkan semua ringkasan sama persis dengan ahli, dan 29 data menghasilkan 1-4 ringkasan sama persis dengan ahli (terdiri atas 2-9 ringkasan untuk setiap trending topic).
Keywords
Download Citation
Endnote/Zotero/Mendeley (RIS)BibTeX
- Erkan, Günes, dan Dragomir R. Radev. "LexRank: Graph-based lexical centrality as salience in text summarization." Journal of Artificial Intelligence Research (2004): 457-479.
- Móro, Róbert, dan M. Bielikov. "Personalized text summarization based on important terms identification." Database and Expert Systems Applications (DEXA), 2012 23rd International Workshop on. IEEE, 2012.
- Berkhin, Pavel. “A survey of clustering data mining techniques.” Grouping multi dimensional data. Springer Berlin Heidelberg, 2006. 25-71.
- Hamzah, Amir, F.Soesianto, dan Jazi Eko Istiyanto . "Studi Kinerja Fungsi-Fungsi Jarak dan Similaritas dalam Clustering Dokumen Teks Berbahasa Indonesia." Seminar Nasional Informatika (SEMNASIF). Vol. 1. No. 1. 2015.
- Steinbach, Michael, George Karypis, dan Vipin Kumar. "A comparison of document clustering techniques." KDD workshop on text mining. Vol. 400. No. 1. 2000.
- LIN, C.Y. 2004. ROUGE: A Package for Automatic Evaluation of Summaries. Proceedings of Workshop on Text Summarization Brances Out.
- Santika, Putu Praba, and Gus Nanang Syaifuddin. "Semantic Clustering Dan Pemilihan Kalimat Representatif Untuk Peringkasan Multi Dokumen." Jurnal Teknologi Informasi dan Ilmu Komputer 1.2 (2015).
References
Erkan, Günes, dan Dragomir R. Radev. "LexRank: Graph-based lexical centrality as salience in text summarization." Journal of Artificial Intelligence Research (2004): 457-479.
Móro, Róbert, dan M. Bielikov. "Personalized text summarization based on important terms identification." Database and Expert Systems Applications (DEXA), 2012 23rd International Workshop on. IEEE, 2012.
Berkhin, Pavel. “A survey of clustering data mining techniques.” Grouping multi dimensional data. Springer Berlin Heidelberg, 2006. 25-71.
Hamzah, Amir, F.Soesianto, dan Jazi Eko Istiyanto . "Studi Kinerja Fungsi-Fungsi Jarak dan Similaritas dalam Clustering Dokumen Teks Berbahasa Indonesia." Seminar Nasional Informatika (SEMNASIF). Vol. 1. No. 1. 2015.
Steinbach, Michael, George Karypis, dan Vipin Kumar. "A comparison of document clustering techniques." KDD workshop on text mining. Vol. 400. No. 1. 2000.
LIN, C.Y. 2004. ROUGE: A Package for Automatic Evaluation of Summaries. Proceedings of Workshop on Text Summarization Brances Out.
Santika, Putu Praba, and Gus Nanang Syaifuddin. "Semantic Clustering Dan Pemilihan Kalimat Representatif Untuk Peringkasan Multi Dokumen." Jurnal Teknologi Informasi dan Ilmu Komputer 1.2 (2015).