Canlıların vücudunda bulunan proteaz enzimleri, pek çok yararlı biyolojik işlevi yerine getirirler. Bununla beraber, virüsler, parazitler gibi pek çok bulaşıcı mikroorganizmalar, proteazları enfekte olabilmek için kullanırlar. Proteazların temel görevi yeni sentezlenmiş çoklu proteinleri uygun yerlerinden keserek yapısal hale gelmelerini sağlamaktır. Böylece, ait oldukları mikroorganizmanın olgunlaşması ve çoğalmasında rol alırlar. Bu nedenle proteazların özgünlüklerini çözmek ilaç ve aşı geliştimek için çok önemlidir. Bununla beraber, proteaz enzimlerinin özgünlükleri konusunda yetersiz bilgi bulunmaktadır. Bu nedenle laboratuvar ortamlarında, proteaz verileri elde etmek ve proteazların özgünlüklerini karakterize etmek için uygun biyobilişim öznitelik kodlama yöntemleri ve algoritmaları geliştirmek hayati derecede önemlidir. Bu tezde, Human Immunodeficiency Virüs Tip 1 (HIV-1) proteazının proteinleri kesme konumlarının tespiti üzerine çalışılmıştır.Proteinlerle çalışırken göz önününde bulundurulması gereken iki temel bilgi bulunmaktadır: kalıntıların birbirleri ile olan fizikokimyasal etkileşimleri ve protein dizilimi içindeki konumları. Bu iki temel bilgi, proteinin işlevini anlamada nirengi noktalarıdır ve HIV-1 proteazının çoklu proteinleri nereden keseceğinin tahmin edilmesinde kullanılabilir. Bu varsayımdan yola çıkarak, HIV-1 proteaz enzimi özgünlüğünün modellenmesinde Fizikokimyasal Tabanlı Kodlama Yöntemi (FTKY), Birimdik Taylor Venn Diyagramı (BirTVD ) ve Birimdik BOOL (BirBOOL) olarak isimledirilen üç öznitelik kodlama yöntemi geliştirilmiştir.HIV-1 proteazın kesme konumlarını tespit etmek için güncel iki HIV-1 proteaz veri setlerine ait peptit örüntüleri, öznitelik çıkarım yöntemleri ile kodlanmıştır. Bu kodlanan örneklerin öznitelikleri Temel Bileşenler Analizi (TBA) ve Doğrusal Ayırıcı Analiz (DAA) ile çıkarılmıştır. Ardından doğrusal Destek Vektör Makineleri (DVM) algoritması ile sınıflandırılmıştır. Elde edilen deneysel sonuçlara göre; BirTVD ve BirBOOL öznitelik çıkarım kodlama yöntemlerinde, başarım mevcut yöntemlere göre daha yüksek elde edilmiştir.
Protease enzymes which are inside the living organisms, implement many useful biological functions. However, many infectious microorganisms such as viruses and parasites use proteases to be infected as virulence factors. The main task of proteases is to cleave the polyproteins synthesized newly at the appropriate places to make them structural components. In this way, virulent proteases take role in maturation and replication of microorganisms. Hence, unravelling the specificities of proteases is of great importance to develop drugs and vaccines. However, little is known about the cleavage specificities of these proteases. It is therefore, an important challenge to collect experimental protease data and to develop appropriate bioinformatics feature encoding schemes, algorithms to characterize the specificities for all proteases. In this thesis, human immunodeficiency virus type 1 (HIV-1) protease site prediction has been studied.When studying on proteins, there are two basic points considered: physicochemical relationships and the positions of the residues in protein sequnces. These two references are the keys to understand the functions of the proteins and can be used to predict where HIV-1 protease cleave the polyproteins. This hypothesis leads us to develop three feature encoding schemes namely FTKY, BirTVD and BirBOOL to model specificity of HIV-1 protease.For the prediction of HIV-1 protease cleavage sites, peptide samples of two up-to-date HIV-1 protease datasets have been encoded with feature encoding techniques and extracted their features with Principal Components Analysis and Linear Discriminant Anaysis. Subsequently, they have been classified by Linear Support Vector Machines algorithm. According to empirical results obtained, BirTVD and BirBOOL methods have achieved better performance compared to hitherto methods.