Veri Çerçevesi nedir?
Bir veri çerçevesi aynı uzunlukta vektörlerinin bir listesidir. Bir matris yalnızca bir tür veri içerirken, bir veri çerçevesi farklı veri türlerini (sayısal, karakter, faktör vb.) Kabul eder.
Bu eğitimde öğreneceksiniz-
- Veri Çerçevesi nedir?
- Veri Çerçevesi Nasıl Oluşturulur
- Veri Çerçevesine Sütun Ekleme
- Bir Veri Çerçevesinin Sütununu Seçin
- Bir Veri Çerçevesini Alt Küme
Veri Çerçevesi Nasıl Oluşturulur
A, b, c, d değişkenini data.frame () fonksiyonuna geçirerek R'de bir dataframe oluşturabiliriz. Veri çerçevesi oluşturabilir ve sütunları name () ile adlandırabilir ve değişkenlerin adını basitçe belirtebiliriz.
data.frame(df, stringsAsFactors = TRUE)
Bağımsız değişkenler :
- df : Bir veri çerçevesi olarak dönüştürülecek bir matris veya birleştirilecek bir değişkenler koleksiyonu olabilir
- stringsAsFactors : Dizeyi varsayılan olarak çarpanlara dönüştür
Aynı uzunluktaki dört değişkeni birleştirerek ilk veri setimiz için R'de bir veri çerçevesi oluşturabiliriz.
# Create a, b, c, d variablesa <- c(10,20,30,40)b <- c('book', 'pen', 'textbook', 'pencil_case')c <- c(TRUE,FALSE,TRUE,FALSE)d <- c(2.5, 8, 10, 7)# Join the variables to create a data framedf <- data.frame(a,b,c,d)df
Çıktı:
## a b c d## 1 1 book TRUE 2.5## 2 2 pen TRUE 8.0## 3 3 textbook TRUE 10.0## 4 4 pencil_case FALSE 7.0
Sütun başlıklarının değişkenlerle aynı ada sahip olduğunu görebiliriz. R'deki sütun ismini fonksiyon isimleri () ile değiştirebiliriz. Aşağıdaki R veri çerçevesi oluşturma örneğini kontrol edin:
# Name the data framenames(df) <- c('ID', 'items', 'store', 'price')df
Çıktı:
## ID items store price## 1 10 book TRUE 2.5## 2 20 pen FALSE 8.0## 3 30 textbook TRUE 10.0## 4 40 pencil_case FALSE 7.0
# Print the structurestr(df)
Çıktı:
## 'data.frame': 4 obs. of 4 variables:## $ ID : num 10 20 30 40## $ items: Factor w/ 4 levels "book","pen","pencil_case",… : 1 2 4 3## $ store: logi TRUE FALSE TRUE FALSE## $ price: num 2.5 8 10 7
Varsayılan olarak, veri çerçevesi dize değişkenlerini faktör olarak döndürür.
Veri Çerçevesini Dilimle
Bir Veri Çerçevesinin SLICE değerlerini elde etmek mümkündür. Veri çerçevesinin adından önce köşeli parantez içine dönecek satırları ve sütunları seçiyoruz.
Bir veri çerçevesi satırlar ve sütunlardan oluşur, df [A, B]. A satırları ve B sütunları temsil eder. Satırları ve / veya sütunları belirleyerek dilimleyebiliriz.
Resim 1'den, sol kısım satırları ve sağ kısım sütunları temsil etmektedir . : Sembolünün anlamına geldiğine dikkat edin . Örneğin, 1: 3, 1 değerlerini seçmek niyetinde için 3.
Aşağıdaki şemada, farklı veri çerçevesi seçimlerine nasıl erişileceğini gösteriyoruz:
- Sarı ok, 2. sütundaki 1. satırı seçer
- Yeşil ok 1'den 2'ye kadar olan satırları seçer
- Kırmızı ok 1. sütunu seçer
- Mavi ok 1'den 3'e kadar olan satırları ve 3'ten 4'e kadar olan sütunları seçer
Sol kısmı boş bırakırsak, R'nin tüm satırları seçeceğini unutmayın . Benzetme yapmak gerekirse, doğru kısmı boş bırakırsak, R tüm sütunları seçecektir .
Kodu konsolda çalıştırabiliriz:
## Select row 1 in column 2df[1,2]
Çıktı:
## [1] book## Levels: book pen pencil_case textbook
## Select Rows 1 to 2df[1:2,]
Çıktı:
## ID items store price## 1 10 book TRUE 2.5## 2 20 pen FALSE 8.0
## Select Columns 1df[,1]
Çıktı:
## [1] 10 20 30 40
## Select Rows 1 to 3 and columns 3 to 4df[1:3, 3:4]
Çıktı:
## store price## 1 TRUE 2.5## 2 FALSE 8.0## 3 TRUE 10.0
Sütunları isimleriyle seçmek de mümkündür. Örneğin, aşağıdaki kod iki sütun çıkarır: Kimlik ve mağaza.
# Slice with columns namedf[, c('ID', 'store')]
Çıktı:
## ID store## 1 10 TRUE## 2 20 FALSE## 3 30 TRUE## 4 40 FALSE
Veri Çerçevesine Sütun Ekleme
Veri Çerçevesine bir sütun da ekleyebilirsiniz. Dataframe R değişkenini eklemek için $ sembolünü kullanmanız ve R'deki bir dataframe'e bir sütun eklemeniz gerekir.
# Create a new vectorquantity <- c(10, 35, 40, 5)# Add `quantity` to the `df` data framedf$quantity <- quantitydf
Çıktı:
## ID items store price quantity## 1 10 book TRUE 2.5 10## 2 20 pen FALSE 8.0 35## 3 30 textbook TRUE 10.0 40## 4 40 pencil_case FALSE 7.0 5
Not: Vektördeki öğe sayısı, veri çerçevesindeki öğe sayısına eşit olmalıdır. Dataframe R'ye sütun eklemek için aşağıdaki ifadenin yürütülmesi
quantity <- c(10, 35, 40)# Add `quantity` to the `df` data framedf$quantity <- quantity
Hata verir:
Error in `$<-.data.frame`(`*tmp*`, quantity, value = c(10, 35, 40))replacement has 3 rows, data has 4
Bir Veri Çerçevesinin Sütununu Seçin
Bazen, ileride kullanmak için bir veri çerçevesi sütununu saklamamız veya bir sütunda işlem yapmamız gerekir. Bir veri çerçevesinden sütunu seçmek için $ işaretini kullanabiliriz.
# Select the column IDdf$ID
Çıktı:
## [1] 1 2 3 4
Bir Veri Çerçevesini Alt Küme
Önceki bölümde, koşulsuz bir sütunun tamamını seçtik. Belirli bir koşulun doğru olup olmadığına göre alt küme yapmak mümkündür .
Subset () işlevini kullanıyoruz.
subset(x, condition)arguments:- x: data frame used to perform the subset- condition: define the conditional statement
Sadece fiyatı 10'un üzerinde olan ürünleri iade etmek istiyoruz, şunları yapabiliriz:
# Select price above 5subset(df, subset = price > 5)
Çıktı:
ID items store price2 20 pen FALSE 83 30 textbook TRUE 104 40 pencil_case FALSE 7