Leo Breiman’ın rastgele orman denetimli makine öğrenimi yönteminin bir uyarlamasını kullanarak modeller oluşturur ve tahminler üretir. Tahminler hem kategorik değişkenler (sınıflandırma) hem de sürekli değişkenler (regresyon) için yapılabilir. Açıklayıcı değişkenler, eğitim detaylarının öznitelik tablosunda bulunan alanlardır. Bu araç, performansı değerlendirmek için bir model oluşturmak ya da bir model oluşturarak başka veri kümeleri için sonuçlar tahmin etmek için çalıştırılabilir.
Aracın işlem modunu belirtir. Araç, bir modeli yalnızca performansı değerlendirmek için eğitmek veya bir modeli eğiterek detayları tahmin etmek için çalıştırılabilir. Tahmin türleri aşağıdaki gibidir:
Bir model uydurmak istiyorsanız bu modu kullanın ve uygunluğunu araştırın.
Bu seçim ile model bir girdi katmanı kullanılarak eğitilecektir. Yeni bir veri kümesinde tahminler oluşturmadan önce modelinizin doğruluğunu değerlendirmek için bu seçeneği kullanın. Bu seçenek, model teşhisi çıktısını mesaj penceresinde verir ve modeli eğitim verilerinize uygular.
Bir model uydurmak istiyorsanız bu modu kullanın ve bu modeli tahminler oluşturmak için veri kümesine uygulayın.
Detaylar için tahminler veya sınıflandırmalar oluşturulur. Bu seçeneğin çıktısı bir detay servisi, model teşhisi ve değişken önemini gösteren isteğe bağlı bir tablo olacaktır.
Tahmin edilecek değişkeni ve tahmin üretmek için kullanılacak alanları içeren detay katmanı.
Haritanızdan bir katman seçebileceğiniz gibi, açılan listenin en altından Analiz Katmanını Seç ögesini belirleyerek büyük veri dosya paylaşımı veri kümesi veya detay katmanı içeriğinize göz atabilirsiniz.
Tahminlerin yapılacağı konumları temsil eden bir detay katmanı. Bu detay katmanı, eğitim detaylarında kullanılanlara karşılık gelen alanlar olarak sağlanan açıklayıcı değişkenleri de içermelidir.
Haritanızdan bir katman seçebileceğiniz gibi, açılan listenin en altından Analiz Katmanını Seç ögesini belirleyerek büyük veri dosya paylaşımı veri kümesi veya detay katmanı içeriğinize göz atabilirsiniz.
Modeli eğitmek için kullanılacak değerleri içeren, eğitim detaylarından gelen alan. Bu alan, bilinmeyen konumlarda tahmin yapmak için kullanılacak değişkenin bilinen (eğitim) değerlerini içerir. Değerler kategorikse (ör., Akçaağaç, Çam Ağacı, Meşe Ağacı) Kategorik onay kutusunu işaretleyin.
Tahmin edilecek değişkenin değerini veya kategorisini tahmin etmeye yardımcı olan açıklayıcı değişkenleri temsil eden bir veya daha fazla alan (alanlar). Sınıfları veya kategorileri (arazi örtüsü ya da varlık veya yokluk gibi) temsil eden değişkenler için kategorik onay kutusunu kullanın. Değişken arazi örtüsü ya da varlık veya yokluk gibi sınıfları veya kategorileri temsil ediyorsa değişkeni doğru (true) olarak, değişken sürekli ise yanlış (false) olarak belirtin.
Modeli oluşturmak için kullanılacak ağaç sayısı. Daha fazla ağaç genellikle daha doğru model tahmini sağlar, ancak modelin hesaplanması daha uzun sürecektir. Varsayılan ağaç sayısı 100'dür.
Bir yaprağın (bu bir ağaç üzerindeki daha fazla bölünmeyen terminal düğümdür) tutulması için gereken minimum gözlem sayısı. Regresyon için varsayılan minimum 5, sınıflandırma için varsayılan ise 1'dir. Çok büyük veriler için, bu sayıları artırmak, aracın çalışma süresini kısaltır.
Bir ağaçtan yapılabilecek maksimum bölme sayısı. Büyük bir maksimum derinlik kullanmak, daha fazla bölme oluşturur, bu da modele fazla uygunluk şansını artırabilir. Varsayılan veri odaklıdır ve oluşturulan ağaç sayısına ve dahil edilen değişken sayısına bağlıdır.
Her karar ağacı için kullanılan eğitim katmanındaki detayların yüzdesini belirtir. Varsayılan verinin yüzde 100’üdür. Her bir ağaç için örnekler, belirtilen verilerin üçte ikisinden rastgele alınır.
Ormandaki her karar ağacı, mevcut eğitim verilerinin rastgele bir örneği veya alt kümesi (yaklaşık üçte ikisi) kullanılarak oluşturulur. Her karar ağacı için girdi verilerinin daha düşük bir yüzdesini kullanmak, çok büyük veri kümeleri için aracın hızını artırır.
Her karar ağacını oluşturmak için kullanılan açıklayıcı değişkenlerin sayısını belirtir.
Ormandaki karar ağaçlarının her biri, belirtilen açıklayıcı değişkenlerin rastgele bir alt kümesi kullanılarak oluşturulur. Her karar ağacında kullanılan değişkenlerin sayısının artırılması, özellikle bir veya birkaç baskın değişken varsa, modelinize fazla uygunluk şansını artıracaktır. Yaygın olarak kullanılan bir uygulama, tahmin edilecek değişkenin sayısal olması durumunda toplam açıklayıcı değişken sayısının karekökünü almak veya tahmin edilecek değişken kategorikse toplam açıklayıcı değişken sayısını 3'e bölmektir.
Eğitim katmanındaki ilgili değişkenlerin tahmin katmanındaki değişkenlerle nasıl eşleşeceği. Sadece eğitimde kullanılan değişkenler tabloya dahil edilecektir.
Doğrulama için test veri kümesi olarak ayrılacak eğitim katmanındaki detayların yüzdesini (yüzde 0 ile yüzde 50 arasında) belirtir. Model, bu rastgele veri alt kümesi olmadan eğitilir ve bu detaylar için gözlenen değerler, tahmin edilen değerlerle karşılaştırılır. Varsayılan yüzde 10’dur.
Bu, İçeriğim'de oluşturulacak ve haritaya eklenecek katmanın adıdır. Varsayılan ad, araç adına ve girdi katmanı adına dayanır. Katman zaten mevcutsa, başka bir ad sağlamanız istenir.
Getirilen sonuçlar analiz türüne bağlı olacaktır. Model uyumunu değerlendirmek için eğitiyorsanız, sonuçlar modele uygun bir eğitim verileri katmanı ve model uyumunu değerlendiren sonuç bilgilerini içerir. Tahmin etme için eğitiyorsanız, sonuçlar modele uygun bir eğitim verileri katmanı, tahmin edilen sonuçların olduğu bir katman ve model uyumunu değerlendiren sonuç bilgilerini içerir.
Sonuçları kaydet açılır kutusunu kullanarak İçeriğim alanında sonucun kaydedileceği klasör adını belirleyebilirsiniz.