88 najpopularniejszych pytań i odpowiedzi do rozmów kwalifikacyjnych dotyczących modelowania danych (2024)
Pytania i odpowiedzi dotyczące wywiadu dotyczącego modelowania danych dla nowicjuszy
1) Co to jest modelowanie danych?
Modelowanie danych to proces tworzenia modelu danych do przechowywania w bazie danych. Jest to koncepcyjna reprezentacja obiektów danych, powiązań między różnymi obiektami danych i reguł.
2) Wyjaśnić różne typy modeli danych
Istnieją głównie trzy różne typy modeli danych:
Konceptualistyczny: Konceptualny model danych definiuje, co powinien zawierać system. Ten model jest zazwyczaj tworzony przez interesariuszy biznesowych i architektów danych. Celem jest organizacja, zakres i zdefiniowanie koncepcji i reguł biznesowych.
Logiczny: Określa, w jaki sposób system powinien zostać wdrożony niezależnie od DBMS. Ten model jest zazwyczaj tworzony przez architektów danych i analityków biznesowych. Celem jest opracowanie technicznej mapy reguł i struktur danych.
Fizyczne: Ten model danych opisuje, w jaki sposób system zostanie zaimplementowany przy użyciu konkretnego systemu DBMS. Model ten jest zwykle tworzony przez administratora baz danych i programistów. Celem jest faktyczna implementacja bazy danych.
3) Wyjaśnij fakt i tabelę faktów
Fakt reprezentuje dane ilościowe. Na przykład kwota netto, która jest należna. Tabela faktów zawiera dane liczbowe oraz klucze obce z tabel wymiarowych.
4) Wymień różne schematy projektowe w modelowaniu danych
Istnieją dwa różne typy schematów schematów modelowania danych: 1) schemat gwiazdy i 2) schemat płatka śniegu
5) Kiedy należy rozważyć denormalizację?
Denormalizację stosuje się, gdy podczas pobierania danych występuje duże zaangażowanie tabeli. Służy do budowy hurtowni danych.
6) Wyjaśnij wymiar i atrybut
Wymiary reprezentują dane jakościowe. Na przykład produkt, klasa, plan itp. Tabela wymiarów ma atrybuty tekstowe lub opisowe. Na przykład kategoria produktu i nazwa produktu to dwa atrybuty tabeli wymiarów produktu.
7) Czym jest fakt mniej fakt?
Fakt mniej faktów to tabela, w której nie ma pomiaru faktów. Zawiera tylko klucze wymiarów.
8) Co to jest analiza w pamięci?
Analiza w pamięci to proces buforowania bazy danych w pamięci RAM.
9) Jaka jest różnica między OLTP i OLAP?
Poniżej znajduje się różnica między OLAP i OLTP:
OLTP | OLAP |
---|---|
OLTP to internetowy system transakcyjny. | OLAP to proces analizy i odzyskiwania danych online. |
Charakteryzuje się dużą liczbą krótkich transakcji online. | Charakteryzuje się dużą ilością danych. |
OLTP wykorzystuje tradycyjny system DBMS. | OLAP korzysta z hurtowni danych. |
Tabele w bazie danych OLTP są znormalizowane. | Tabele w OLAP nie są znormalizowane. |
Czas reakcji wynosi milisekundę. | Czas reakcji wynosi sekundy do minut. |
OLTP jest przeznaczony do operacji biznesowych w czasie rzeczywistym. | OLAP przeznaczony jest do analizy miar biznesowych według kategorii i atrybutów. |
10) Co to jest stół?
Zbiór wierszy i kolumn nazywa się tabelą. Każda kolumna ma typ danych. Tabela zawiera powiązane dane w formie tabelarycznej.
11) Co to jest kolumna?
Kolumna lub pole to pionowy układ danych zawierających powiązane informacje.
12) Zdefiniuj rzadkość danych
Rzadkość danych to termin używany do określenia ilości danych dla jednostki/wymiaru modelu.
13) Co to jest złożony klucz podstawowy?
Złożony klucz podstawowy odnosi się do przypadku, w którym więcej niż jedna kolumna tabeli jest używana jako część klucza podstawowego.
14) Co to jest klucz podstawowy?
Główny klucz to kolumna lub grupa kolumn, które w nierówny sposób identyfikują każdy wiersz w tabeli. Wartość klucza podstawowego nie może mieć wartości null. Każda tabela musi zawierać jeden klucz podstawowy.
15) Wyjaśnij klucz obcy
Klucz obcy to grupa atrybutów używana do łączenia tabeli nadrzędnej i podrzędnej. Wartość kolumny klucza obcego, która jest dostępna w tabeli podrzędnej, odnoszona jest do wartości klucza podstawowego w tabeli nadrzędnej.
16) Co to są metadane?
Metadane opisują dane o danych. Pokazuje, jaki typ danych faktycznie jest przechowywany w systemie bazodanowym.
17) Co to jest hurtownia danych?
A Data Mart to skrócona wersja hurtowni danych, przeznaczona do użytku przez konkretny dział, jednostkę lub grupę użytkowników w organizacji. Np. sprzedaż marketingowa, HR lub finanse.
18) Co to jest OLTP?
Przetwarzanie transakcji online, zwane w skrócie OLTP, obsługuje aplikacje zorientowane transakcyjnie w architekturze 3-warstwowej. OLTP administruje codziennymi transakcjami firmy lub organizacji.
19) Jakie są przykłady systemu OLTP?
Przykładami systemów OLTP są:
- Wysyłanie wiadomości tekstowej
- Dodaj książkę do koszyka
- Rezerwacja biletów lotniczych online
- Bankowość internetowa
- Wprowadzanie zamówień
20) Co to jest ograniczenie kontrolne?
Ograniczenie sprawdzające służy do weryfikowania zakresu wartości w kolumnie.
21) Wymień rodzaje normalizacji?
Rodzaje normalizacji to: 1) pierwsza postać normalna, 2) druga postać normalna, 3) trzecia postać normalna, 4) czwarta postać Boyce'a-Codda i 5) piąta postać normalna.
22) Czym jest przyszłościowa inżynieria danych?
Inżynieria przyszłości to termin techniczny używany do opisania procesu automatycznego przekładania modelu logicznego na fizyczne narzędzie.
23) Co to jest PDAP?
Jest to kostka danych przechowująca dane w formie podsumowania. Pomaga użytkownikowi szybko analizować dane. Dane w PDAP są przechowywane w sposób umożliwiający łatwe raportowanie.
24) Wyjaśnij projekt bazy danych schematów płatków śniegu
Schemat płatka śniegu to układ tabeli wymiarów i tabeli faktów. Ogólnie rzecz biorąc, obie tabele są dalej podzielone na tabele z większą liczbą wymiarów.
25) Wyjaśnij usługę analizy
Usługa analityczna zapewnia łączny widok danych wykorzystywanych w eksploracji danych lub OLAP.
26) Czym jest algorytm klasteryzacji sekwencji?
Algorytm klasteryzacji sekwencji zbiera ścieżki, które są podobne lub powiązane ze sobą, a także sekwencje danych zawierające zdarzenia.
27) Co to są dane dyskretne i ciągłe?
Dane dyskretne to dane skończone lub zdefiniowane. Np. płeć, numery telefonów. Dane ciągłe to dane, które zmieniają się w sposób ciągły i uporządkowany. Np. wiek.
28) Jaki jest algorytm szeregów czasowych?
Algorytm szeregów czasowych to metoda przewidywania ciągłych wartości danych w tabeli. Np. Wydajność, jeden pracownik może przewidzieć zysk lub wpływ.
29) Czym jest inteligencja biznesowa?
BI (Business Intelligence) to zestaw procesów, architektur i technologii, które przekształcają surowe dane w znaczące informacje, które napędzają dochodowe działania biznesowe. Jest to zestaw oprogramowania i usług, które przekształcają dane w użyteczne informacje i wiedzę.
30) Co to jest indeks bitmapowy?
Indeksy bitmapowe to specjalny typ indeksu bazy danych, który wykorzystuje mapy bitowe (tablice bitów) do odpowiadania na zapytania poprzez wykonywanie operacji bitowych.
Pytania i odpowiedzi dotyczące wywiadu dotyczącego modelowania danych dla doświadczonych
31) Szczegółowo wyjaśnij hurtownię danych
Magazynowanie danych to proces gromadzenia i zarządzania danymi z różnych źródeł. Dostarcza istotnych spostrzeżeń biznesowych. Magazynowanie danych jest zazwyczaj używane do łączenia i analizowania danych z heterogenicznych źródeł. Jest rdzeniem systemu BI, który jest zbudowany do analizy danych i raportowania.
32) Co to jest wymiar śmieciowy?
Wymiar śmieciowy łączy dwie lub więcej powiązanych kardynalności w jeden wymiar. Zwykle są to wartości logiczne lub flagi.
33) Wyjaśnij schemat danych
Schemat danych to schematyczna reprezentacja ilustrująca relacje i struktury danych.
34) Wyjaśnij częstotliwość gromadzenia danych
Częstotliwość gromadzenia danych to szybkość gromadzenia danych. Przechodzi także przez różne etapy. Etapy te to: 1) wydobywanie z różnych źródeł, 3) przekształcanie, 4) oczyszczanie i 5) przechowywanie.
35) Co to jest liczność bazy danych?
Liczność jest liczbowym atrybutem relacji pomiędzy dwoma bytami lub zbiorami bytów.
36) Jakie są różne rodzaje relacji kardynalnych?
Różne typy kluczowych relacji kardynalnych to:
- Relacje jeden na jeden
- Relacje jeden do wielu
- Relacje wiele do jednego
- Relacje wiele do wielu
37) Zdefiniuj krytyczny czynnik sukcesu i wymień jego cztery typy
Krytyczny współczynnik sukcesu to korzystny wynik wszelkich działań niezbędnych, aby organizacja osiągnęła swój cel.
Cztery typy krytycznych czynników sukcesu to:
- Przemysłowe CSF
- Strategia CSF
- Środowiskowe CSF
- Tymczasowe CSF
38) Co to jest eksploracja danych?
Eksploracja danych to multidyscyplinarna umiejętność wykorzystująca uczenie maszynowe, statystyki, sztuczną inteligencję i technologię baz danych. Wszystko polega na odkryciu nieoczekiwanych/wcześniej nieznanych powiązań między danymi.
39) Jaka jest różnica między schematem gwiazdy a schematem płatka śniegu?
Poniżej przedstawiono kluczową różnicę między Schemat gwiazdy a schemat płatka śniegu:
Schemat gwiazdy | Schemat płatka śniegu |
---|---|
Hierarchie wymiarów przechowywane są w tabeli wymiarów. | Hierarchie są podzielone na oddzielne tabele. |
Zawiera tabelę faktów otoczoną tabelami wymiarów. | Jedna tabela faktów otoczona tabelą wymiarów, która z kolei jest otoczona tabelą wymiarów |
W schemacie gwiazdy tylko jedno złączenie tworzy relację między tabelą faktów a dowolnymi tabelami wymiarów. | Schemat płatka śniegu wymaga wielu złączeń w celu pobrania danych. |
Ma prosty projekt bazy danych | Posiada skomplikowaną konstrukcję bazy danych |
Zdenormalizowana struktura danych i zapytania również działają szybciej. | Znormalizowana struktura danych. |
Wysoki poziom redundancji danych | Redundancja danych na bardzo niskim poziomie |
Oferuje wydajniejsze zapytania dzięki optymalizacji zapytań Star Join. Tabele można łączyć wieloma wymiarami. | Schemat płatka śniegu jest reprezentowany przez scentralizowaną tabelę faktów, która prawdopodobnie nie jest powiązana z wieloma wymiarami. |
40) Co to jest relacja identyfikująca?
Identyfikowanie relacji encji w systemach DBMS służy do identyfikowania relacji pomiędzy dwoma encjami: 1) silną encją i 2) słabą encją.
41) Co to jest relacja samorekurencyjna?
Relacja rekurencyjna to samodzielna kolumna w tabeli połączona z kluczem podstawowym tej samej tabeli.
42) Wyjaśnić relacyjne modelowanie danych
Relacyjne modelowanie danych to reprezentacja obiektów w relacyjnej bazie danych, która jest zwykle znormalizowana.
43) Co to jest analiza modeli predykcyjnych?
Proces walidacji lub testowania modelu, który służy do przewidywania testowania i walidacji wyników. Można go wykorzystać do uczenia maszynowego, sztucznej inteligencji, a także statystyki.
44) Jaka jest różnica między logicznym modelem danych a fizycznym modelem danych?
Logiczny model danych | Fizyczny model danych |
---|---|
Logiczny model danych może logicznie zaprojektować wymagania biznesowe. | Fizyczny model danych dostarcza informacji o docelowym źródle bazy danych i jego właściwościach. |
Odpowiada za faktyczną implementację danych przechowywanych w bazie danych. | Fizyczny model danych pomaga utworzyć nowy model bazy danych na podstawie istniejącego i zastosować ograniczenie integralności referencyjnej. |
Zawiera jednostkę, atrybuty klucza podstawowego, klucze inwersji, klucz alternatywny, regułę, relację biznesową, definicję itp. | Fizyczny model danych zawiera tabelę, ograniczenia kluczowe, klucz unikalny, kolumny, klucz obcy, indeksy, wartości domyślne itp. |
45) Jakie są różne rodzaje ograniczeń?
Innym typem ograniczenia może być unikatowość, wartości null, klucze obce, klucz złożony lub ograniczenie sprawdzające itp.
46) Co to jest narzędzie do modelowania danych?
Narzędzie do modelowania danych to oprogramowanie pomagające w konstruowaniu przepływu danych i relacji pomiędzy danymi. Przykładami takich narzędzi są Borland Together, Altova Database Spy, casewise, Case Studio 2, itp.
47) Czym jest hierarchiczny system zarządzania bazami danych?
W hierarchicznej bazie danych dane modelu są zorganizowane w strukturze przypominającej drzewo. Dane są przechowywane w formacie hierarchicznym. Dane są reprezentowane za pomocą relacji rodzic-dziecko. W hierarchicznym DBMS rodzic może mieć wiele dzieci, dzieci mają tylko jednego rodzica.
48) Jakie są wady hierarchicznego modelu danych?
Wadami hierarchicznego modelu danych są:
- Nie jest elastyczny, ponieważ dostosowanie się do zmieniających się potrzeb firmy wymaga czasu.
- Struktura stwarza problem w komunikacji międzywydziałowej, komunikacji pionowej, a także komunikacji międzyagencyjnej.
- Hierarchiczny model danych może powodować problemy braku jedności.
49) Wyjaśnić podejście do modelowania danych oparte na procesie
Podejście procesowe stosowane w modelowaniu danych opiera się na metodzie krok po kroku dotyczącej relacji między modelem relacji jednostka a procesem organizacyjnym.
50) Jakie są zalety stosowania modelowania danych?
Zalety stosowania modelowania danych w hurtowniach danych to:
- Pomaga zarządzać danymi biznesowymi poprzez ich normalizację i zdefiniowanie ich atrybutów.
- Modelowanie danych integruje dane z różnych systemów, aby zmniejszyć nadmiarowość danych.
- Umożliwia tworzenie efektywnego projektu bazy danych.
- Modelowanie danych pomaga działowi organizacji funkcjonować jako zespół.
- Ułatwia łatwy dostęp do danych.
51) Jakie są wady stosowania modelowania danych?
Wadami stosowania modelowania danych są:
- Ma mniejszą niezależność strukturalną
- To może skomplikować system.
52) Co to jest indeks?
Indeks służy do kolumny lub grupy kolumn w celu szybkiego pobierania danych.
53) Jakie są cechy logicznego modelu danych?
Charakterystyka logicznego modelu danych to:
- Opisuje potrzeby danych dla pojedynczego projektu, ale może zostać zintegrowany z innymi logicznymi modelami danych w zależności od zakresu projektu.
- Zaprojektowany i opracowany niezależnie od DBMS.
- Atrybuty danych będą miały typy danych z dokładną precyzją i długością.
- Procesy normalizacyjne do modelu, które powszechnie stosuje się typowo do 3NF.
54) Jakie są cechy fizycznego modelu danych?
Charakterystyka fizycznego modelu danych to:
- Fizyczny model danych opisuje zapotrzebowanie na dane dla pojedynczego projektu lub aplikacji. Można go zintegrować z innymi fizycznymi modelami danych w zależności od zakresu projektu.
- Model danych zawiera relacje między tabelami, które dotyczą liczności i dopuszczalności wartości null relacji.
- Opracowane dla konkretnej wersji systemu DBMS, lokalizacji, przechowywania danych lub technologii, która ma zostać wykorzystana w projekcie.
- Kolumny powinny mieć dokładnie przypisane typy danych, długości i wartości domyślne.
- Definiowane są klucze podstawowe i obce, widoki, indeksy, profile dostępu, uprawnienia itp.
55) Jakie są dwa rodzaje technik modelowania danych?
Dwa typy technik modelowania danych to: 1) model relacji między jednostkami (ER) oraz 2) UML (Ujednolicony język modelowania).
56) Co to jest UML?
UML (Unified Modeling Language) to język ogólnego przeznaczenia do tworzenia baz danych i modelowania w dziedzinie inżynierii oprogramowania. Głównym zamierzeniem jest zapewnienie uogólnionego sposobu wizualizacji projektu systemu.
57) Wyjaśnić obiektowy model bazy danych
Obiektowy model bazy danych jest zbiorem obiektów. Obiekty te mogą mieć powiązane funkcje, a także metody.
58) Co to jest model sieciowy?
Jest to model zbudowany na modelu hierarchicznym. Umożliwia on więcej niż jedną relację do łączenia rekordów, co oznacza, że ma wiele rekordów. Możliwe jest skonstruowanie zestawu rekordów nadrzędnych i podrzędnych. Każdy rekord może należeć do wielu zestawów, co umożliwia wykonywanie złożonych relacji tabel.
59) Co to jest haszowanie?
Haszowanie to technika używana do przeszukiwania całej wartości indeksu i pobierania żądanych danych. Pomaga obliczyć bezpośrednią lokalizację danych, które są zapisywane na dysku bez wykorzystania struktury indeksu.
60) Co to są klucze biznesowe lub naturalne?
klucze biznesowe lub naturalne to pole, które jednoznacznie identyfikuje jednostkę. Na przykład identyfikator klienta, numer pracownika, adres e-mail itp.
61) Co to jest klucz złożony?
Jeśli do reprezentowania klucza używane jest więcej niż jedno pole, nazywa się to kluczem złożonym.
62) Jaka jest pierwsza postać normalna?
Pierwsza postać normalna lub 1NF jest właściwością relacji dostępnej w systemie zarządzania relacyjną bazą danych. Każda relacja jest nazywana pierwszą postacią normalną, jeśli dziedzina każdego atrybutu zawiera wartości, które są atomowe. Zawiera jedną wartość z tej dziedziny.
63) Jaka jest różnica między kluczem podstawowym a kluczem obcym?
Główny klucz | Klucz obcy |
---|---|
Klucz podstawowy pomaga jednoznacznie zidentyfikować rekord w tabeli. | Klucz obcy to pole w tabeli będące kluczem podstawowym innej tabeli. |
Klucz podstawowy nigdy nie akceptuje wartości null. | Klucz obcy może akceptować wiele wartości null. |
Klucz podstawowy jest indeksem klastrowym, a dane w tabeli DBMS są fizycznie zorganizowane w kolejności zgodnej z indeksem klastrowym. | Klucz obcy nie może automatycznie utworzyć indeksu, klastrowanego lub nieklastrowanego. Można jednak ręcznie utworzyć indeks na kluczu obcym. |
W tabeli możesz mieć pojedynczy klucz podstawowy. | W tabeli możesz mieć wiele kluczy obcych. |
64) Jakie są wymagania drugiej postaci normalnej?
Wymagania drugiej postaci normalnej są następujące:
- Powinien być w pierwszej normalnej postaci.
- Nie zawiera żadnego atrybutu innego niż pierwszy, który jest funkcjonalnie zależny od dowolnego podzbioru klucza kandydującego relacji tabelowej.
65) Jakie są zasady dotyczące trzeciej postaci normalnej?
Zasady dla trzeciej postaci normalnej to:
- Powinien być w drugiej normalnej postaci
- Nie ma przechodnich zależności funkcjonalnych.
66) Jakie znaczenie ma używanie kluczy?
- Klucze pomagają zidentyfikować dowolny wiersz danych w tabeli. W rzeczywistej aplikacji tabela może zawierać tysiące rekordów.
- Klucze zapewniają jednoznaczną identyfikację rekordu tabeli pomimo tych wyzwań.
- Umożliwia ustanowienie relacji i identyfikację relacji między tabelami
- Pomóż Ci wyegzekwować tożsamość i integralność w związku.
67) Co to jest klucz zastępczy?
Sztuczny klucz, którego celem jest jednoznaczna identyfikacja każdego rekordu, nazywany jest kluczem zastępczym. Tego rodzaju klucze są unikalne, ponieważ są tworzone, gdy nie masz żadnego naturalnego klucza podstawowego. Nie nadają one żadnego znaczenia danym w tabeli. Klucz zastępczy jest zwykle liczbą całkowitą.
68) Wyjaśnij szczegółowo klucz alternatywny
Klucz alternatywny to kolumna lub grupa kolumn w tabeli, która jednoznacznie identyfikuje każdy wiersz w tej tabeli. Tabela może mieć wiele możliwości wyboru klucza podstawowego, ale tylko jeden może być ustawiony jako klucz podstawowy. Wszystkie klucze, które nie są kluczem podstawowym, nazywane są kluczem alternatywnym.
69) Jaka jest czwarta postać normalna w DBMS?
Czwarta postać normalna to poziom normalizacji bazy danych, w którym nie może występować nietrywialna zależność inna niż klucz kandydujący.
70) Co to jest system zarządzania bazami danych?
System zarządzania bazą danych lub DBMS to oprogramowanie do przechowywania i odzyskiwania danych użytkownika. Składa się z grupy programów manipulujących bazą danych.
71) Jaka jest zasada piątej postaci normalnej?
Stół jest w 5th postać normalna tylko wtedy, gdy jest w 4th normalnej postaci i nie można go rozłożyć na dowolną liczbę mniejszych tabel bez utraty danych.
72) Czym jest normalizacja?
Normalizacja to technika projektowania baz danych, która organizuje tabele w sposób ograniczający redundancję i zależność danych. Dzieli większe tabele na mniejsze i łączy je za pomocą relacji.
73) Wyjaśnić cechy systemu zarządzania bazami danych
- Zapewnia bezpieczeństwo i eliminuje nadmiarowość
- Samoopisujący charakter systemu bazodanowego
- Izolacja między programami a abstrakcją danych
- Obsługa wielu widoków danych.
- Udostępnianie danych i przetwarzanie transakcji dla wielu użytkowników
- DBMS pozwala podmiotom i relacjom między nimi tworzyć tabele.
- Jest zgodny z koncepcją ACID (AtomIstotność, Konsystencja, Izolacja i Trwałość).
- DBMS obsługuje środowisko wielu użytkowników, które umożliwia użytkownikom równoległy dostęp do danych i manipulowanie nimi.
74) Wymień popularne oprogramowanie DBMS
Popularny oprogramowanie DBMS jest:
- MySQL
- Microsoft Wejdź
- Oracle
- PostgreSQL
- baza danych
- FoxPro
- SQLite
- IBM DB2
- Microsoft SQL Server.
75) Wyjaśnij koncepcję RDBMS
System zarządzania relacyjną bazą danych to oprogramowanie służące do przechowywania danych w formie tabel. W tego rodzaju systemie dane są zarządzane i przechowywane w wierszach i kolumnach, co jest znane jako krotki i atrybuty. RDBMS to potężny system zarządzania danymi, szeroko stosowany na całym świecie.
76) Jakie są zalety modelu danych?
Zalety modelu danych to:
- Głównym celem projektowania modelu danych jest zapewnienie dokładnej reprezentacji obiektów danych oferowanych przez zespół funkcjonalny.
- Model danych powinien być wystarczająco szczegółowy, aby można go było wykorzystać do zbudowania fizycznej bazy danych.
- Informacje zawarte w modelu danych można wykorzystać do zdefiniowania relacji między tabelami, kluczami podstawowymi i obcymi oraz procedurami przechowywanymi.
- Model danych pomaga firmom komunikować się wewnątrz organizacji i pomiędzy nimi.
- Model danych pomaga dokumentować mapowania danych w procesie ETL
- Pomóż rozpoznać właściwe źródła danych do wypełnienia modelu
77) Jakie są wady modelu danych?
Wady modelu danych to:
- Aby opracować model danych, należy znać cechy fizyczne przechowywanych danych.
- Jest to system nawigacyjny, który produkuje złożone aplikacje, zarządzanie. Dlatego wymaga znajomości prawdy biograficznej.
- Nawet mniejsze zmiany w strukturze wymagają modyfikacji w całej aplikacji.
- W systemie DBMS nie ma zestawu języków manipulacji danymi.
78) Wyjaśnij różne typy tabel faktów
Istnieją trzy typy tabel faktów:
- dodatki: Jest to miara dodana do dowolnego wymiaru.
- Bez dodatku: Jest to miara, której nie da się dodać do żadnego wymiaru.
- Póładdytywne: Jest to miara, którą można dodać do kilku wymiarów.
79) Co to jest tabela zbiorcza?
Tabela zagregowana zawiera zagregowane dane, które można obliczyć za pomocą takich funkcji, jak: 1) Średnia 2) MAX, 3) Liczba, 4) SUMA, 5) SUMA i 6) MIN.
80) Co to jest potwierdzony wymiar?
Wymiar zgodny to wymiar zaprojektowany w taki sposób, że można go używać w wielu tabelach faktów w różnych obszarach hurtowni danych.
81) Wymień typy hierarchii w modelowaniu danych
Istnieją dwa rodzaje hierarchii: 1) hierarchie oparte na poziomach i 2) hierarchie nadrzędny-podrzędny.
82) Jaka jest różnica między hurtownią danych a hurtownią danych?
Oto główne różnica między Data Mart a hurtownią danych:
Magazyn danych | Hurtownia danych |
---|---|
Data Mart koncentruje się na jednym obszarze tematycznym działalności. | Hurtownia danych koncentruje się na wielu obszarach biznesu. |
Służy do podejmowania taktycznych decyzji dotyczących rozwoju biznesu. | Pomaga właścicielom firm w podjęciu strategicznej decyzji |
Data Mart działa zgodnie z modelem oddolnym | Hurtownia danych działa według modelu odgórnego |
Źródło danych pochodzi z jednego źródła danych | Źródło danych pochodzi z więcej niż jednego heterogenicznego źródła danych. |
83) Co to jest XMLA?
XMLA to analiza XML uważana za standard w zakresie dostępu do danych w Przetwarzanie analityczne online (OLAP).
84) Wyjaśnij wymiar śmieci
Wymiar śmieci pomaga przechowywać dane. Stosuje się go, gdy dane nie nadają się do przechowywania w schemacie.
85) Wyjaśnij łańcuchową replikację danych
Sytuację, gdy węzeł dodatkowy wybiera cel za pomocą czasu ping lub gdy najbliższy węzeł jest węzłem dodatkowym, nazywa się replikacją łańcuchową danych.
86) Wyjaśnij wirtualne hurtownie danych
Wirtualna hurtownia danych daje zbiorczy obraz skompletowanych danych. Wirtualna hurtownia danych nie posiada danych historycznych. Uważa się go za logiczny model danych posiadający metadane.
87) Wyjaśnij migawkę hurtowni danych
Migawka to pełna wizualizacja danych w momencie rozpoczęcia procesu ekstrakcji danych.
88) Co to jest ekstrakt dwukierunkowy?
Zdolność systemu do wyodrębniania, oczyszczania i przesyłania danych w dwóch kierunkach nazywana jest ekstraktem kierunkowym.
Te pytania podczas rozmowy kwalifikacyjnej pomogą również w Twoim życiu (ustach)