Bu tez çalışmasında amaçı endüstri 4.0'ın temel konularından olan gömülü sistem yazılım ve donanımlarını kullanarak elde edilen sensör verilerini makine öğrenmesi algoritmaları ile sınıflandırmak ve sürdürülebilir üretim için gerekli otomasyonun sağlanması için alt yapı oluşturmaktır. Günümüzde endüstride kullanılan tüm aygıtlar akıllı hale geliyor ve üretim sürecinin tüm seviyelerinde üretilen dijital veriler ürün kalitesini, esnekliğini ve fonksiyonelliğini artırmak için kullanılmaktadır. Üretim tesislerinden gelen veri sensörlerle toplanmaktadır. Büyük veri tifadesi ile bahsedilen bu verilerin insan kullanıcıların değerlendire bilmesi mümkün değildir. Bu veriyi makine öğrenmesi algoritmaları ile değerlendirmek, anlamlandırmak ve sürdürülebilir üretim için kullanmak ancak mümkün olabilir. Bu çalışmada endüstride gerek insan hayatını doğrudan etkilemesi ile gerek ise birçok ürünün üretiminde ortaya çıkması veya kullanmasından dolayı gazlar ın algılanması ve sınıflandırılması üzerinde durulmuştur. Gaz sensörleri, insan sağlığını ve özelliklerini tehdit eden yanıcı, yakıcı ve toksik gazları tespit etmek için endüstride ve yangınla mücadelede yaygın olarak kullanılmaktadır. Önce ardunia ile b gaz verilerini toplama ve makine öğrenmesi ile sınıflandırılması üzerine çalışılmıştır. Gazlar ile ilgili yeterince veri elde edilemediği için altı farklı uçucu organik gaz için bir veri kümesi veri seti indirilerek onun üzerinde çalışmalar yapılmıştır. Bu veri setinde; Amonyak, Asetaldehit, Aseton, Etilen, Etanol ve Toluen gazları bulunmaktadır.Üç yıllık bir süre boyunca, 16 metal oksit gaz sensörü kullanılarak elde edilmiştir. Bu veriler 13910 ölçüm ve 129 özellik içerir.Çalışmamızda bu verileri sınıflandırmak için çok sayıda makine öğrenmesi algoritmaları kullanılmıştır. Bunlar; k-en yakın komşular, Destek vektör makinesi, Rastgele orman ve Lojistik regresyon dur. Verileri sınıflandırmak için bu makine öğrenme algoritmaları Weka programında gerçekleştirilmiştir. Yapılan çalışmalar sonucunda k-en yakın komşular algoritmasının en iyi sonucu verdiğini ve sınıflandırma başarısı% 99,48dır.
In this thesis, the purpose of this study is to classify the sensor data obtained by using embedded system software and hardware, which is one of the fundamental issues of industry 4.0, with machine learning algorithms and to create the infrastructure for the necessary automation for sustainable production. Today, all devices used in the industry become smart and digital data produced at all levels of the production process is used to increase product quality, flexibility and functionality. Data from production facilities are collected with sensors. It is not possible for human data to be evaluated by these data, which are mentioned with the definition of big data. It is only possible to evaluate this data with machine learning algorithms, to make sense of it and to use it for sustainable production. In this study, the perception and classification of gases are emphasized in the industry both because it directly affects the human life and because it occurs or uses many products. Gas sensors are widely used in industry and fire fighting to detect flammable, combustible and toxic gases that threaten human health and properties. Firstly, it was studied on collecting b gas data with Ardunia and classifying it with machine learning. Since sufficient data about gases could not be obtained, a dataset dataset was downloaded for six different volatile organic gases and studies were carried out on it. In this dataset; There are ammonia, acetaldehyde, acetone, ethylene, ethanol and toluene gases. It was obtained over a three-year period using 16 metal oxide gas sensors. These data contain 13910 measurements and 129 features. In our study, many machine learning algorithms were used to classify this data. These; k-nearest neighbors, Support vector machine, Random forest and Logistic regression stop. These machine learning algorithms were implemented in the Weka program to classify the data. As a result of the studies, the k-nearest neighbors algorithm gives the best result and the classification success is 99,48%.