Teknolojinin son yıllardaki hızlı gelişimi ile birlikte insanlar sosyal medya platformlarını sosyalleşme aracı olarak kullanmaya başlamıştır. Sosyal medya platformlarında insanlar hem bilgi üreten hemde bilgi tüketen konumdadır. Bu bilgiler alınan ürün, hizmet, veya gündem hakkında olabilmektedir. Bireysel kullanıcıların yanı sıra ticari platformlar sosyal medyayı hedef kitlelerine ulaşmak ve marka algılarını yönetmek için kullanabilmektedir. Sosyal medya analitiği bu noktada devreye girer ve sosyal medyadaki yapılandırılmamış verilerin içerisindeki kalıpların analiz edilerek ticari ve bireysel fayda oluşturulmasını sağlar. Sosyal medya analitiğinin arka planında ise metin madenciliği işlemleri yer almaktadır. Sosyal medya verisi konuşma dili tabanlı olması dolayısıyla kısatlamalar ve emojiler gibi yapılar barındırır ve metin madenciliğine göre daha hassas bir süreç gerektirir. Bu çalışmada sosyal medya analizlerinde sıklıkla kullanılan Twitter platformu üzerinden, veri toplama, ön işleme ve analiz sürecinin yönlendirmeler ile yapılmasını sağlayan bir arayüzü üzerinde çalışılmıştır. Bu arayüz aracılığıyla bahsedilen sosyal medya analitiği süreci Twitter verisi üzerinden adım adım gerçekleştirilebilmektedir. Burada araştırmacılar istedikleri herhangi bir konu, ürün veya hizmet için atılan Tweet'leri istedikleri tarih aralığında, dilde ve sayıda çekerek analiz sürecini başlatabilmektedir. Araştırmacı elde edilmek istenilen verinin boyutu hakkında veri çekme işleminden önce bilgilendirilerek yönlendirilir. Veri ön işleme adımında verinin birimleştirilmesi, standartlaştırılması ve filtrelenmesi çeşitli yönlendirmeler ile gerçekleştirilebilir. Örneğin standartlaştırma aşamasında araştırmacıya verisinde bulunan özel karakterlerin sayısal dağılımı verilmektedir. Araştırmacı temizlemek istenilen karakterleri bu şekilde temizleyebilir yada emoji ve kısaltmalar gibi konuşma dilinde bulunan kalıpları dönüştürebilir. Analiz aşamasında ise duygu analizi ve topik modelleme seçenekleri bulunmaktadır. Duygu analiz süreci için Turkish-BERT modeli kullanılmıştır. Topik modellemede ise etiketli kategori verisi üzerinde makine öğrenmesi işlemleri gerçekleştirilerek en başarılı model seçilerek bu modelle sınıflandırma işlemi gerçekleştirilmektedir. Tüm analiz sürecinde gerçekleştirilen işlemler, analiz sonuçları ve veri detay bilgileri kaydedilerek gelecek çalışmalarda program arayüzünün makine öğrenmesi destekli hale getirilmesi hedeflenmektedir.
With the rapid development of technology in recent years, people have started to use social media platforms as a means of socialization. In social media platforms, people are both in the position of producing and consuming information. This information may be about the product, service, or agenda received. In addition to individual users, commercial platforms can use social media to reach their target audiences and manage their brand perceptions. Social media analytics comes into play at this point and enables the creation of commercial and individual benefits by analyzing the patterns in the unstructured data in social media. In the background of social media analytics, there are text mining processes. Since social media data is speech-based, it contains structures such as abbreviations and emojis and requires a more sensitive process than text mining. In this study, a program interface was studied on the Twitter platform, which is frequently used in social media analysis, that enables data collection, preprocessing and analysis processes to be carried out with instructions. Through this interface, the mentioned social media analytics process can be carried out step by step over Twitter data. Here, researchers can start the analysis process by shooting Tweets for any topic, product or service they want, in the date range, language and number they want. The researcher is guided by being informed about the size of the data desired to be obtained before the data extraction process. In the data preprocessing step, data unitization, standardization and filtering can be performed with various orientations. For example, in the standardization phase, the numerical distribution of the special characters in the data is given to the researcher. In this way, the researcher can clean the desired characters or transform phrases in the spoken language such as emoji and abbreviations. In the analysis phase, there are sentiment analysis and topical modeling options. The Turkish-BERT model was used for the sentiment analysis process. In topic modeling, machine learning processes are performed on the labeled category data, and the most successful model is selected and classification is carried out with this model. It is aimed to make the program interface supported by machine learning in future studies by recording the operations performed during the entire analysis process, analysis results and data detail information.