dc.contributor.advisor |
Assist. Profesör Doktor Veysel Harun Şahin |
|
dc.date.accessioned |
2022-01-28T08:48:56Z |
|
dc.date.available |
2022-01-28T08:48:56Z |
|
dc.date.issued |
2021 |
|
dc.identifier.citation |
Barzenji, Hawar Sameen Ali. (2021). Sentiment analysis of twitter texts using machine learning algorithms. (Yayınlanmamış Yüksek Lisans Tezi). Sakarya Üniversitesi Institute of Science and Technology, Sakarya. |
|
dc.identifier.uri |
https://hdl.handle.net/20.500.12619/97177 |
|
dc.description |
06.03.2018 tarihli ve 30352 sayılı Resmi Gazetede yayımlanan “Yükseköğretim Kanunu İle Bazı Kanun Ve Kanun Hükmünde Kararnamelerde Değişiklik Yapılması Hakkında Kanun” ile 18.06.2018 tarihli “Lisansüstü Tezlerin Elektronik Ortamda Toplanması, Düzenlenmesi ve Erişime Açılmasına İlişkin Yönerge” gereğince tam metin erişime açılmıştır. |
|
dc.description.abstract |
Bu tezde, veri seti şeklinde kaydedilen Trump'ın tweet'leri kazınmış web sayfası üzerinde doğal dil işleme ve makine öğrenmesi sınıflandırıcılarının kullanımı olarak duygu analizi incelenmiştir. Veri hazırlandıktan sonra, ana bilgisayar veri setine en önemli duygu analizi prosedürleri uygulanmıştır. Ayrıca, metin vektörleştirmeye hazır olmak için veri kümesini temizlemek gibi diğer doğal dil işleme stratejileri de işlenmiştir. Metinsel verilerin temizlenmesinde, istenmeyen kelimelerin kaldırılması için stopwords kaldırma, kelime lemmatization, düzenli ifade ve tokenization gibi gerekli tüm teknikler kullanılmıştır. Daha az kapasite alma hedefi ile veri setindeki "içerik" özelliğinin boyutunu küçültmeyi başardık. Son yirmi yılda sosyal medya ağlarının gelişmesiyle birlikte nefret dolu faaliyetler bir fenomen haline geldi, bu, her birinin yayınlanan metninin öznel kutuplarını bilmek zorlu bir görev haline geldi; bu nedenle, her cümle, olumlu, olumsuz veya tarafsız olup olmadığı kutuplarına göre yargılanmıştır. Sonunda (Random Forest sınıflandırıcı, Gaussian Naive Bayes ve Support Vector Machine) gibi makine öğrenme algoritmaları kullanılarak temizlenen veriler eğitilmiş ve tahmin sonuçlarının doğruluğunu görmek için test edilmiştir, 88%, 72% ve her sınıflandırıcı için sırasıyla 89%. |
|
dc.description.abstract |
In this thesis, sentiment analysis as the use of natural language processing and machine learning classifiers have been studied on Trump's tweets scraped web page, which is saved in the form of dataset. After data preparation, the most important sentiment analysis procedures have been applied to the host dataset. Also, other natural language processing strategies have been processed, like cleaning the dataset in order to be ready for text vectorization. In cleaning the textual data, all the required techniques like removing stopwords, word lemmatization, regular expression, and tokenization have been used to remove undesired words. We succeeded in reducing the size of the "content" feature in the dataset with the target of taking fewer capacity. Since the two last decades with the development of social media networks, hateful activities have become a phenomenon, this became a challenging task to know the subjective polarities of each one's published text; therefore, each sentence has been judged-on regarding their polarities whether they are positive, negative or neutral. At the end, by using machine learning algorithms like (Random Forest classifier, Gaussian Naive Bayes, and Support Vector Machine), the cleaned data has been trained and tested to see the accuracy of the prediction results, the comparison shows 88%, 72%, and 89% respectively for each classifier. |
|
dc.format.extent |
xi, 63 yaprak : grafik, tablo ; 30 cm. |
|
dc.language |
İngilizce |
|
dc.language.iso |
eng |
|
dc.publisher |
Sakarya Üniversitesi |
|
dc.rights.uri |
http://creativecommons.org/licenses/by/4.0/ |
|
dc.rights.uri |
info:eu-repo/semantics/openAccess |
|
dc.subject |
Sentiment Analysis |
|
dc.subject |
Natural Language Processing |
|
dc.subject |
Machine Learning |
|
dc.subject |
Duygu Analizi |
|
dc.subject |
Doğal Dil İşleme |
|
dc.title |
Sentiment analysis of twitter texts using machine learning algorithms |
|
dc.type |
masterThesis |
|
dc.contributor.department |
Sakarya Üniversitesi Institute of Science and Technology, Computer and Information Engineering, |
|
dc.contributor.author |
Barzenji, Hawar Sameen Ali |
|
dc.relation.publicationcategory |
TEZ |
|