dc.contributor.advisor |
Doktor Öğretim Üyesi Tuğrul Taşçı |
|
dc.date.accessioned |
2022-12-14T14:09:37Z |
|
dc.date.available |
2022-12-14T14:09:37Z |
|
dc.date.issued |
2022 |
|
dc.identifier.citation |
Aydin Tuzcuay, Seda. (2022). Finans sektöründe doğal dil işleme (nlp) ile rapor kümelendirme ve talep bazlı rapor önerileri oluşturma = Reporting clustering and creating demand-based report recommendations with natural language processing (nlp) in financial industry. (Yayınlanmamış Yüksek Lisans Tezi). Sakarya Üniversitesi Fen Bilimleri Enstitüsü, Sakarya. |
|
dc.identifier.uri |
https://hdl.handle.net/20.500.12619/98832 |
|
dc.description |
06.03.2018 tarihli ve 30352 sayılı Resmi Gazetede yayımlanan “Yükseköğretim Kanunu İle Bazı Kanun Ve Kanun Hükmünde Kararnamelerde Değişiklik Yapılması Hakkında Kanun” ile 18.06.2018 tarihli “Lisansüstü Tezlerin Elektronik Ortamda Toplanması, Düzenlenmesi ve Erişime Açılmasına İlişkin Yönerge” gereğince tam metin erişime açılmıştır. |
|
dc.description.abstract |
Yapay zeka alanında yer alan teknolojilerin hızla gelişmesi ile hem akademinin hem de çeşitli sektörlerin ilgileri bu alana çevrilmiştir. Bu bağlamda müşteri ve ürün çeşitliliği fazla olan sektörlerde, yapay zeka teknolojileri arasında yer alan, doğal dil işleme ve makine öğrenmesi çalışmaları oldukça artmıştır. Doğal dil işleme, doküman sınıflandırma - kümeleme, adlandırılmış varlık tanıma, duygu analizi, yazım denetleme, sohbet botları, dil çeviri vb. çalışma konularına sahiptir. Bu çalışmada, finans sektöründe yer alan özel bir bankanın, rapor talep içerikleri kullanılarak derin öğrenme temelli doğal dil işleme ve makine öğrenmesi çalışması yapılmıştır. Çalışma kapsamında rapor talep içeriklerinin, TF-IDF, Word2vec ve Doc2vec kelime gömme yöntemleri ile temsilleri oluşturulmuş, makine öğrenmesi yöntemlerinden olan K-Means, K-Medoids ve Agglomerative kümeleme algoritmaları ile kümelenmiş ve aynı kümede yer alan birbirine en benzer rapor talep içerikleri adreslenmiştir. Çalışmada kümeleme başarıları Silhouette katsayısı, Calinski- Harabasz ve Davies-Bouldin indeksleri ile yorumlanmıştır. Çalışma ile yeni gelen bir rapor talebine benzeyen, daha önce yapılmış bir rapor talebi var ise bu talep & taleplerin adreslenmesi hedeflenmiştir. Çalışma sonucunda, üç kelime gömme yönteminde de en iyi kümeleme sonucu K- Means ile elde edilmiştir. Word2vec ve Doc2vec ile yapılan kümelemede, değerlendirme metriklerinin benzer sonuçlar verdiği, benzerlik çalışmasında ise 3 kelime gömme yöntemi ile elde edilen sonuçların benzer olduğu görülmüştür. |
|
dc.description.abstract |
With the rapid development of technologies in the field of artificial intelligence, the interests of both academia and various sectors have been turned to this field. In this context, natural language processing and machine learning studies, which are among the artificial intelligence technologies, have increased considerably in sectors with a wide variety of customers and products. Natural language processing, document classification - clustering, named entity recognition, sentiment analysis, spell checker, chatbots, language translation, etc. has study subjects. In this study, a deep learning-based natural language processing and machine learning study was carried out by using the report request contents of a private bank in the financial sector. Within the scope of the study, the representations of the report request contents were created with TF-IDF, Word2vec and Doc2vec. K-Means, K-Medoids and Agglomerative machine learning clustering algorithms were clustered and report requests in the same cluster were listed. In the study, clustering successes were interpreted with Silhouette coefficient, Calinski-Harabasz and Davies-Bouldin indices. With the study, if there is a report request made similar to a new report request, it is aimed to list this report request or report requests. As a result of the study, the best clustering result was obtained with K-Means in all word embedding methods. In the clustering with Word2vec and Doc2vec, it was seen that the evaluation metrics gave similar results, and in the similarity study, the results obtained with the three word embeddings method were similar. |
|
dc.format.extent |
x, 80 yaprak : şekil, tablo ; 30 cm. |
|
dc.language |
Türkçe |
|
dc.language.iso |
tur |
|
dc.publisher |
Sakarya Üniversitesi |
|
dc.rights.uri |
http://creativecommons.org/licenses/by/4.0/ |
|
dc.rights.uri |
info:eu-repo/semantics/openAccess |
|
dc.subject |
Doğal dil işleme, |
|
dc.subject |
TF-IDF, |
|
dc.subject |
Word2vec, |
|
dc.subject |
Doc2vec, |
|
dc.subject |
kelime gömme, |
|
dc.subject |
boyut indirgeme, |
|
dc.title |
Finans sektöründe doğal dil işleme (nlp) ile rapor kümelendirme ve talep bazlı rapor önerileri oluşturma = Reporting clustering and creating demand-based report recommendations with natural language processing (nlp) in financial industry |
|
dc.contributor.department |
Sakarya Üniversitesi Fen Bilimleri Enstitüsü, Bilişim Sistemleri Mühendisliği Anabilim Dalı, |
|
dc.contributor.author |
Aydin Tuzcuay, Seda |
|
dc.relation.publicationcategory |
Yüksek Lisans |
|