İlk 25 ETL Testi Görüşme Sorusu ve amp; Yanıtlar

Anonim

Aşağıda, deneyimli ETL testçisi ve geliştiricisinin yanı sıra yeni başlayanlar için yapılan görüşmelerde sık sorulan sorular bulunmaktadır.

1) ETL nedir?

Veri ambarı mimarisinde ETL, herhangi bir iş süreci için verileri yöneten önemli bir bileşendir. ETL, Ayıkla, Dönüştür ve Yükle anlamına gelir . Extract, bir veritabanından veri okuma işlemini yapar. Dönüşüm, verilerin raporlama ve analiz için uygun olabilecek bir biçime dönüştürülmesini sağlar. Load, verileri hedef veritabanına yazma işlemini gerçekleştirir.

2) ETL test operasyonlarının neler içerdiğini açıklayın?

ETL testi şunları içerir:

  • Verilerin iş gereksinimlerine göre doğru şekilde dönüştürülüp dönüştürülmediğini doğrulayın
  • Öngörülen verilerin herhangi bir kesinti ve veri kaybı olmadan veri ambarına yüklendiğini doğrulayın
  • ETL uygulamasının geçersiz veriler bildirdiğinden ve varsayılan değerlerle değiştirdiğinden emin olun
  • Ölçeklenebilirliği ve performansı iyileştirmek için verilerin beklenen zaman diliminde yüklendiğinden emin olun

3) Veri ambarı uygulamalarının türleri nelerdir ve veri madenciliği ile veri ambarı arasındaki fark nedir?

Veri ambarı uygulamalarının türleri

  • Bilgi İşleme
  • Analitik İşleme
  • Veri madenciliği

Veri madenciliği, büyük veri tabanlarından gizli öngörücü bilgilerin çıkarılması ve verilerin yorumlanması süreci olarak tanımlanabilirken, veri ambarlama, verilerin daha hızlı bir şekilde analitik olarak işlenmesi için bir veri madenini kullanabilir. Veri ambarı, birden çok kaynaktan gelen verileri tek bir ortak havuzda toplama işlemidir.

4) ETL'de kullanılan çeşitli araçlar nelerdir?

  • Cognos Karar Akışı
  • Oracle Warehouse Builder
  • İş Nesneleri XI
  • SAS işletme deposu
  • SAS Kurumsal ETL sunucusu

5) Gerçek nedir? Gerçek türleri nelerdir?

Analiz edilecek ölçüleri içeren çok boyutlu bir modelin merkezi bir bileşenidir. Gerçekler boyutlarla ilgilidir.

Gerçek türleri

  • Katkı Gerçekleri
  • Yarı Katkı Gerçekler
  • Katkı Maddesi Olmayan Gerçekler

6) Küpler ve OLAP Küpleri nedir?

Küpler, veri ambarından alınan bilgi tablolarından ve boyutlardan oluşan veri işleme birimleridir. Çok boyutlu analiz sağlar.

OLAP, Çevrimiçi Analitik İşleme anlamına gelir ve OLAP küpü, raporlama amacıyla büyük verileri çok boyutlu biçimde depolar. Boyutlara göre kategorize edilmiş ölçüler olarak adlandırılan gerçeklerden oluşur.

7) İzleme seviyesi nedir ve türleri nelerdir?

İzleme seviyesi, günlük dosyalarında depolanan veri miktarıdır. İzleme seviyesi Normal ve Ayrıntılı olarak sınıflandırılabilir. Normal seviye izleme seviyesini ayrıntılı bir şekilde açıklarken, ayrıntılı her satırdaki izleme seviyelerini açıklar.

8) Grain of Fact nedir?

Tahıl olgusu, olgu bilgisinin saklandığı düzey olarak tanımlanabilir. Aynı zamanda Gerçek Ayrıntı Düzeyi olarak da bilinir

9) Gerçeğe dayalı olmayan gerçekler şemasının ne olduğunu ve Önlemler nedir?

Ölçüsüz bir olgu tablosu, Kesin olgu tablosu olarak bilinir. Meydana gelen olayların sayısını görüntüleyebilir. Örneğin, bir şirketteki çalışan sayısı gibi bir olayı kaydetmek için kullanılır.

Olgu tablosundaki sütunlara dayalı sayısal veriler, Ölçüler olarak bilinir.

10) Dönüşümün ne olduğunu açıklayın?

Dönüşüm, verileri üreten, değiştiren veya ileten bir havuz nesnesidir. Dönüşüm, Aktif ve Pasif olmak üzere iki türdendir

11) Arama Dönüşümünün kullanımını açıklar mısınız?

Arama Dönüşümü aşağıdakiler için yararlıdır:

  • Bir sütun değeri kullanarak bir tablodan ilgili bir değeri almak
  • Yavaş değişen boyut tablosunu güncelleyin
  • Tabloda kayıtların mevcut olup olmadığını doğrulayın

12) Bölümleme, hash bölümleme ve round robin bölümlemenin ne olduğunu açıklayın?

Performansı artırmak için işlemler alt bölümlere ayrılır, buna Bölümleme denir. Bölümleme, Informatica Sunucusunun çeşitli kaynaklarla çoklu bağlantı oluşturmasını sağlar

Bölüm türleri

Round-Robin Bölümleme:

  • Informatica ile veriler tüm bölümler arasında eşit olarak dağıtılır
  • İşlenecek satır sayısının yaklaşık olarak aynı olduğu her bölümde bu bölümleme uygulanabilir

Karma Bölümleme:

  • Verileri bölümler arasında gruplamak için anahtarları bölümlemek amacıyla Informatica sunucusu bir karma işlevi uygular
  • Aynı bölümde aynı bölümleme anahtarına sahip satır gruplarının işlemlerinin sağlanması gerektiğinde kullanılır.

13) DataReader Hedef Bağdaştırıcısı kullanmanın avantajı nedir?

DataReader Hedef Bağdaştırıcısını kullanmanın avantajı, bellekte bir ADO kayıt kümesini (kayıtlar ve sütunlardan oluşur) doldurması ve DataReader arabirimini uygulayarak DataFlow görevindeki verileri ortaya çıkarmasıdır, böylece diğer uygulamalar verileri kullanabilir.

14) SSIS (SQL Server Entegrasyon Hizmeti) kullanarak tabloyu güncellemenin olası yolları nelerdir?

Tabloyu SSIS kullanarak güncellemek için olası yollar şunlardır:

  • Bir SQL komutu kullanın
  • Aşama tablosu kullanın
  • Önbelleği Kullan
  • Komut Dosyası Görevini Kullanın
  • MSSQL kullanılıyorsa güncelleme için tam veritabanı adını kullanın

15) Arama için OLEDB olmayan (Nesne Bağlama ve Gömme Veritabanı) kaynağınız varsa ne yapardınız?

Arama için OLEBD olmayan bir kaynağınız varsa, verileri yüklemek ve kaynak olarak kullanmak için Önbellek kullanmanız gerekir.

16) Hangi durumda bağlı ve bağlantısız dönüşümlerde dinamik önbellek ve statik önbellek kullanıyorsunuz?

  • Dinamik önbellek, ana tabloyu güncellemeniz gerektiğinde ve boyutları (SCD) tip 1 yavaşça değiştirdiğinizde kullanılır
  • Düz dosyalar için Statik önbellek kullanılır

17) Bağlantısız ve Bağlı arama arasındaki farkları açıklayın.

Bağlı Arama

Bağlantısız Arama

  • Bağlı arama, eşlemeye katılır

- Haritalama sırasında ifade dönüşümü yerine arama fonksiyonu kullanıldığında kullanılır.

  • Birden çok değer döndürülebilir

- Yalnızca bir çıkış portu döndürür

  • Başka dönüşümlere bağlanabilir ve bir değer döndürür
  • Başka bir dönüşüm bağlanamaz
  • Bağlı Arama için statik veya dinamik önbellek kullanılabilir
  • Yalnızca statik önbellek olarak bağlı değil
  • Bağlı arama, kullanıcı tanımlı varsayılan değerleri destekler
  • Bağlantısız arama, kullanıcı tanımlı varsayılan değerleri desteklemez
  • Bağlı Arama'da birden çok sütun aynı satırdan döndürülebilir veya dinamik arama önbelleğine eklenebilir
  • Bağlantısız arama, bir dönüş bağlantı noktası belirler ve her satırdan bir sütun döndürür

18) Veri kaynağı görünümü nedir?

Bir veri kaynağı görünümü, analiz hizmetleri veri tabanlarında kullanılacak ilişkisel şemayı tanımlamaya izin verir. Doğrudan veri kaynağı nesnelerinden ziyade, boyutlar ve küpler veri kaynağı görünümlerinden oluşturulur.

19) OLAP araçları ile ETL araçları arasındaki farkın ne olduğunu açıklayın?

ETL ve OLAP aracı arasındaki fark şudur:

ETL aracı, eski sistemlerden verilerin çıkarılması ve bazı veri temizleme işlemleriyle birlikte belirtilen veri tabanına yüklenmesi için tasarlanmıştır.

Örnek: Veri aşaması, Informatica vb.

OLAP, çok yönlü modelde bulunan OLAP verilerinde raporlama amaçlıdır.

Örnek: İş Nesneleri, Cognos vb.

20) Informatica'yı kullanarak SAP verilerini nasıl elde edebilirsiniz?

  • Güç bağlantısı seçeneğiyle, informatica kullanarak SAP verilerini alırsınız
  • PowerConnect aracını kurun ve yapılandırın
  • Kaynağı Source Analyzer'a aktarın. Informatica ve SAP Powerconnect arasında bir geçit görevi görür. Bir sonraki adım, eşleme için ABAP kodunu oluşturmaktır, ardından yalnızca informatica SAP'den veri çekebilir
  • Harici sistemlerden kaynakları bağlamak ve içe aktarmak için Power Connect kullanılır

21) Power Mart ve Power Center arasındaki fark nedir?

Güç merkezi

Power Mart

  • Büyük hacimli verileri işlediğinizi varsayalım
  • Düşük hacimli verileri işlediğinizi varsayalım
  • SAP, people soft vb. ERP kaynaklarını destekler.
  • ERP kaynaklarını desteklemiyor
  • Yerel ve küresel depoyu destekler
  • Yerel depoyu destekler
  • Lokali global depoya dönüştürür
  • Lokali global depoya dönüştürmek için herhangi bir özelliği yoktur.

22) Evreleme alanının ne olduğunu ve evreleme alanının amacının ne olduğunu açıklayın.

Veri aşamalandırma, verileri veri ambarı sunucusunda geçici olarak tuttuğunuz bir alandır. Veri evreleme aşağıdaki adımları içerir

  • Kaynak veri çıkarma ve veri dönüştürme (yeniden yapılandırma)
  • Veri dönüşümü (veri temizleme, değer dönüşümü)
  • Vekil anahtar atamaları

23) Otobüs Şeması nedir?

Ortak boyutları tanımlamak için çeşitli iş süreçleri için BUS şeması kullanılır. Standartlaştırılmış bir bilgi tanımının yanı sıra uyumlu bir boyutla birlikte gelir

24) Veri temizlemenin ne olduğunu açıklayın?

Veri temizleme, veri ambarından veri silme işlemidir. Önemsiz verilerin null değerlere veya fazladan boşluklara sahip benzer satırlarını siler.

25) Şema Nesnelerinin ne olduğunu açıklayın?

Şema nesneleri, doğrudan veritabanı verilerine başvuran mantıksal yapıdır. Şema nesneleri; tablolar, görünümler, sekans eş anlamlıları, dizinler, kümeler, işlev paketleri ve veritabanı bağlantılarını içerir

26) Oturum, Çalışma, Mapplet ve İş Akışı terimlerini açıklayın.

  • Mapplet: Dönüşüm setleri düzenler veya oluşturur
  • Worklet: Verilen belirli bir görev dizisini temsil eder.
  • İş akışı: Sunucuya görevleri nasıl yürüteceğini söyleyen bir dizi talimattır.
  • Oturum: Sunucuya, verileri kaynaklardan hedefe nasıl taşıyacağını söyleyen bir dizi parametredir.

Ücretsiz PDF İndir: ETL Testi Röportaj Soruları ve Cevapları