Yığındaki Tablo Oluşturma, Değiştirme ve Bırakma gibi Tablo İşlemleri bu öğreticide görülebilir.
Aşağıdaki ekran görüntüsünde, sütunlu bir tablo oluşturup tablo adını değiştiriyoruz.
1. "empid" ve "empname" gibi iki sütun adıyla table guru_sample oluşturma
2. guru99 veritabanında bulunan tabloları görüntüleme
3. Guru_sample tabloların altında görüntüleniyor
4. "guru_sample" tablosunu "guru_sampleNew" olarak değiştirme
5. Yine "göster" komutunu çalıştırdığınızda, yeni Guru_sampleNew adını gösterecektir.
Dropping table guru_sampleNew:
Tablo çeşitleri ve Kullanımı:
Geliyor Tablolar sadece geleneksel İlişkisel Veritabanları oluşturduğunuz bu şekilde gibi. Filtreleme, birleştirme gibi işlevler tablolar üzerinde gerçekleştirilebilir.
Hive , Hive'daki şemanın yüklenmesine ve tasarımına bağlı olarak İç ve Dış tablolar gibi iki tür tablo yapısı ile ilgilenir .
Dahili tablolar
- İç Tablo, doğası gereği sıkıca bağlanmıştır.Bu tür bir tabloda, önce tablo oluşturmalı ve verileri yüklemeliyiz.
- Buna şema verileri diyebiliriz .
- Bu tablonun bırakılmasıyla hem veriler hem de şema kaldırılacaktır.
- Bu tablonun depolanan konumu / user / hive / warehouse konumunda olacaktır.
Dahili Tablo Ne Zaman Seçilmeli:
- İşleme verileri yerel dosya sisteminde mevcutsa
- Hive'ın silme dahil olmak üzere verilerin tüm yaşam döngüsünü yönetmesini istiyorsak
Dahili Tablo için örnek kod Snippet'i
1. Dahili tabloyu oluşturmak için
Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';
2. Verileri dahili tabloya yükleyin
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;
3. Tablonun içeriğini görüntüleyin
Hive>select * from guruhive_internaltable;
4. Dahili tabloyu düşürmek için
Hive>DROP TABLE guruhive_internaltable;
Guruhive_internaltable'ı bıraktıysanız, meta verileri dahil ve verileri Hive'dan silinecektir.
Aşağıdaki ekran görüntüsünden çıktıyı gözlemleyebiliriz
Yukarıdaki kodda ve ekran görüntüsünden aşağıdakileri yapıyoruz:
- Dahili tabloyu oluşturun
- Verileri dahili tabloya yükleyin
- Tablonun içeriğini görüntüleyin
- Dahili tabloyu düşürmek için
Dış tablolar
- Dış Masa, doğada gevşek bir şekilde birleştirilmiştir. Veriler HDFS olarak sunulacak. Tablo, HDFS verileri üzerinde oluşturulacak.
- Başka bir şekilde veri üzerinde şema oluşturması gibi diyebiliriz .
- Tabloyu bırakma anında sadece şemayı bırakır, veriler daha önce olduğu gibi HDFS'de hala mevcut olacaktır.
- Harici tablolar, şema her güncellendiğinde verileri her seferinde silmek yerine HDFS'de depolanan veriler için birden fazla şema oluşturma seçeneği sunar
Dış Tablo Ne Zaman Seçilmeli:
- HDFS'de mevcut veri işleniyorsa
- Dosyalar Hive dışında kullanıldığında kullanışlıdır
Harici Tablo için Örnek Kod Parçacığı
1. Harici tablo oluşturun
Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;
2. Tablo oluşturma sırasında konumu belirtmiyorsak, verileri manuel olarak yükleyebiliriz
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;
3. Tablonun içeriğini görüntüleyin
Hive>select * from guruhive_external;
4. Dahili tabloyu düşürmek için
Hive>DROP TABLE guruhive_external;
Aşağıdaki ekran görüntüsünden çıktıyı gözlemleyebiliriz
Yukarıdaki kodda, aşağıdaki şeyleri yapıyoruz
- Harici tabloyu oluşturun
- Verileri Harici tabloya yükleyin
- Tablonun içeriğini görüntüleyin
- Dış tabloyu düşürme
Dahili Vs Harici tablolar arasındaki fark
Özellik | İç | Harici |
---|---|---|
Şema | Şema Üzerindeki Veriler | Veri Şeması |
Depolama yeri | / usr / hive / warehouse | HDFS konumu |
Veri kullanılabilirliği | Yerel dosya sistemi içinde | HDFS içinde |