ÖZET Anahtar Kelimeler: Veri Madenciliği, Veritabanlarında Bilgi Keşfi, Kümeleme, Karınca Koloni Optimizasyonu Bilgisayar sistemleri her geçen gün hem daha ucuzlamakta, hem de güçleri artmaktadır. İşlemciler gittikçe hızlanmakta, disklerin kapasiteleri artmaktadır. Artık bilgisayarlar tarafından daha büyük miktardaki veriler saklanmakta ve saklanan bu veriler daha kısa sürede işlenmektedir. Tüm bu teknolojik gelişmeler sonucunda günümüzde veri doğrudan sayısal olarak toplanmakta ve saklanmaktadır. Ancak, verinin saklanmasının amacı artık sadece veriye ulaşmak değildir. Bu sistemler, aynı zamanda, veriyi toplayan, değerlendiren ve bunlara yönelik kararlar alan sistemlere dönüşmüştür. Bu dönüşüm veritabanlarında bilgi keşfi ve bu kavramın en önemli adımı olan ve çoğu zaman da eş anlamlı olarak kullanılan veri madenciliği kavramlarını da beraberinde getirmiştir. Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı verinin çıkarılmasıdır. Veri madenciliğinde amaç çok büyük miktardaki ham veriden değerli bilginin çıkarılmasıdır. Bu tez çalışmasında, veritabanlarında bilgi keşfi kavramı açıklanmış, bu kavramın en önemli adımı olan veri madenciliği detaylı olarak anlatılmış, veri madenciliği teknikleri ve algoritmaları anlatılmış, hangi problemin çözümünde hangi teknik ve algoritmanın kullanılabileceğine değinilmiştir. Bu çalışmada uygulama olarak veri madenciliğinde kullanılmaya başlanan ve gerçek karıncaların yuvaları ile yem kaynağı arasındaki en kısa yolu bulma tekniğinin model alınması sonucu geliştirilmiş karınca koloni optimizasyonu algoritması kümeleme problemine uygulanmıştır. Çalışmada, kümeleme uygulaması için kullanılan karınca koloni optimizasyonu algoritmasının başarısını arttırmak için iki yeni teknik önerilmiş ve geliştirilen uygulamada önerilen tekniklerin algoritmanın başarısını önemli ölçüde arttırdığı gösterilmiştir.
DATA MINING AND CLUSTERING WITH ANT COLONY OPTIMIZATION SUMMARY Keywords: Data Mining, Knowledge Discovery in Databases, Clustering, Ant Colony Optimization Computer systems both cheapen and increase their capacity day by day. Performance of processors speeds up and capacity of discs increases. Today, more amounts of data are stored by computers and these stored data is processed in less time. With all these technological developments, nowadays data is collected and stored directly in digital. But, aim of storing data is not only to reach data, these systems, also, transformed into systems that collect, evaluate data and making decisions intended to those data. This transformation brought knowledge discovery in databases concept and data mining concept as the most important step of this concept and is mostly used as the synonym of it. Data mining is detecting crypto, not very net, not known before, but potentially useful data from available data. The aim of data mining is to detect valuable information from big amounts of raw data. In this thesis, knowledge discovery in databases concept is described, data mining, the most important step of this concept, is explained in detail, data mining techniques and algorithms are denoted and mentioned in solution of which problem, which technique and algorithm can be used. In this thesis as application, an ant colony optimization algorithm which is used newly in data mining and developed from imitating the technique of real ants finding the shortest way from their nests and the food is applied in clustering problem. In thesis, to increase the working performance of ant colony optimization algorithm used in clustering, two new techniques are proposed and in application it is showed that the suggested techniques increases the performance of the algorithm. XI