Topp 88 datamodelleringsintervjufrågor och svar (2024)
Datamodellering intervjufrågor och svar för nybörjare
1) Vad är datamodellering?
Datamodellering är processen att skapa en modell för data att lagra i en databas. Det är en konceptuell representation av dataobjekt, associationen mellan olika dataobjekt och reglerna.
2) Förklara olika typer av datamodeller
Det finns huvudsakligen tre olika typer av datamodeller:
Konceptuell: Konceptuell datamodell definierar vad systemet ska innehålla. Denna modell skapas vanligtvis av affärsintressenter och dataarkitekter. Syftet är att organisera, avgränsa och definiera affärskoncept och regler.
Logisk: Definierar hur systemet ska implementeras oavsett DBMS. Denna modell skapas vanligtvis av dataarkitekter och affärsanalytiker. Syftet är att ta fram en teknisk karta över regler och datastrukturer.
Fysisk: Denna datamodell beskriver hur systemet kommer att implementeras med ett specifikt DBMS-system. Denna modell skapas vanligtvis av DBA och utvecklare. Syftet är själva implementeringen av databasen.
3) Förklara fakta- och faktatabellen
Faktum representerar kvantitativ data. Till exempel nettobeloppet som ska betalas. En faktatabell innehåller numeriska data samt främmande nycklar från dimensionstabeller.
4) Lista ut olika designscheman i datamodellering
Det finns två olika typer av datamodelleringsscheman: 1) Star Schema och 2) Snowflake Schema
5) När bör du överväga denormalisering?
Denormalisering används när det är mycket involvering av tabellen när data hämtas. Det används för att bygga ett datalager.
6) Förklara dimension och attribut
Dimensioner representerar kvalitativa data. Till exempel produkt, klass, plan, etc. En dimensionstabell har textuella eller beskrivande attribut. Till exempel är produktkategorin och produktnamnet två attribut i produktdimensionstabellen.
7) Vad är det mindre faktum?
Fakta mindre fakta är en tabell utan faktamätning. Den innehåller bara dimensionsnycklarna.
8) Vad är in-memory analytics?
In-memory analytics är en process för att cachelagra databasen i RAM.
9) Vad är skillnaden mellan OLTP och OLAP?
Nedan är skillnaden mellan OLAP och OLTP:
OLTP | OLAP |
---|---|
OLTP är ett transaktionssystem online. | OLAP är en onlineprocess för analys och datahämtning. |
Det kännetecknas av ett stort antal korta onlinetransaktioner. | Det kännetecknas av en stor mängd data. |
OLTP använder traditionell DBMS. | OLAP använder ett datalager. |
Tabeller i OLTP-databasen är normaliserade. | Tabellerna i OLAP är inte normaliserade. |
Dess svarstid är på en millisekund. | Dess svarstid är i sekunder till minuter. |
OLTP är designat för affärsverksamhet i realtid. | OLAP är designat för analys av affärsmått efter kategori och attribut. |
10) Vad är bord?
Samlingen av rader och kolumner kallas tabell. Varje kolumn har en datatyp. Tabellen innehåller relaterade data i tabellformat.
11) Vad är kolumn?
Kolumn eller fält är ett vertikalt arrangemang av data som innehåller relaterad information.
12) Definiera data sparsitet
Datasparsitet är en term som används för hur mycket data du har för enheten/dimensionen av modellen.
13) Vad är sammansatt primärnyckel?
Sammansatt primärnyckel refereras till det fall där mer än en tabellkolumn används som en del av primärnyckeln.
14) Vad är primärnyckeln?
Primärnyckel är en kolumn eller grupp av kolumner som på olika sätt identifierar varje rad i tabellen. Värdet på primärnyckeln får inte vara null. Varje tabell måste innehålla en primärnyckel.
15) Förklara främmande nyckel
Främmande nyckel är en grupp av attribut som används för att länka överordnade och underordnade tabeller. Värdet på kolumnen för främmande nyckel, som är tillgänglig i den underordnade tabellen, hänvisas till värdet på primärnyckeln i den överordnade tabellen.
16) Vad är metadata?
Metadata beskriver data om data. Den visar vilken typ av data som faktiskt lagras i databassystemet.
17) Vad är datamart?
A data mart är en komprimerad version av ett datalager och är designad för användning av en specifik avdelning, enhet eller uppsättning användare i en organisation. T.ex. marknadsföringsförsäljning, HR eller ekonomi.
18) Vad är OLTP?
Online transaktionsbearbetning, kort känd som OLTP, stöder transaktionsorienterad applikation i 3-skiktsarkitektur. OLTP administrerar den dagliga transaktionen för företag eller organisation.
19) Vilka är exemplen på OLTP-systemet?
Exempel på OLTP-system är:
- Skickar ett textmeddelande
- Lägg till en bok i kundvagnen
- Online bokning av flygbiljetter
- Onlinebank
- Orderläggning
20) Vad är kontrollbegränsning?
Kontrollbegränsning används för att verifiera ett värdeintervall i en kolumn.
21) Lista över typerna av normalisering?
Typer av normaliseringar är: 1) första normalformen, 2) andra normalformen, 3) tredje normalformen, 4) boyce-codd fjärde och 5) femte normalformen.
22) Vad är framåtriktad datateknik?
Forward engineering är en teknisk term som används för att beskriva processen att automatiskt översätta en logisk modell till ett fysiskt redskap.
23) Vad är PDAP?
Det är en datakub som lagrar data som en sammanfattning. Det hjälper användaren att snabbt analysera data. Uppgifterna i PDAP lagras på ett sätt så att rapportering kan göras med lätthet.
24) Förklara databasdesign för snöflingaschema
Ett snöflingaschema är ett arrangemang av en dimensionstabell och faktatabell. I allmänhet är båda tabellerna ytterligare uppdelade i fler dimensionstabeller.
25) Förklara analystjänst
Analystjänst ger en kombinerad bild av de data som används i datautvinning eller OLAP.
26) Vad är sekvensklustringsalgoritm?
Sekvensklustringsalgoritmen samlar in vägar som liknar eller är relaterade till varandra och sekvenser av data som har händelser.
27) Vad är diskret och kontinuerlig data?
Diskret data är en ändlig data eller definierad data. T.ex. kön, telefonnummer. Kontinuerlig data är data som förändras på ett kontinuerligt och ordnat sätt. Till exempel ålder.
28) Vad är tidsseriealgoritmen?
Tidsseriealgoritm är en metod för att förutsäga kontinuerliga värden på data i tabeller. Exempelvis prestation en anställd kan prognostisera vinsten eller inflytandet.
29) Vad är Business Intelligence?
BI (Business Intelligence) är en uppsättning processer, arkitekturer och teknologier som omvandlar rådata till meningsfull information som driver lönsamma affärsåtgärder. Det är en uppsättning mjukvara och tjänster för att omvandla data till handlingsbar intelligens och kunskap.
30) Vad är bitmappat index?
Bitmappsindex är en speciell typ av databasindex som använder bitmappar (bitmatriser) för att svara på frågor genom att utföra bitvisa operationer.
Datamodellering intervjufrågor och svar för erfarna
31) Förklara datalager i detalj
Data warehousing är en process för att samla in och hantera data från olika källor. Det ger meningsfulla företagsinsikter. Data warehousing används vanligtvis för att koppla ihop och analysera data från heterogena källor. Det är kärnan i BI-systemet, som är byggt för dataanalys och rapportering.
32) Vad är skräpdimension?
Skräpdimension kombinerar två eller flera relaterade kardinaliteter till en dimension. Det är vanligtvis booleska eller flaggvärden.
33) Förklara dataschema
Data Scheme är en schematisk representation som illustrerar datarelationer och strukturer.
34) Förklara datainsamlingsfrekvensen
Datainsamlingsfrekvens är hastigheten för att samla in data. Den går också igenom olika stadier. Dessa stadier är: 1) extrahering från olika källor, 3) transformering, 4) rengöring och 5) lagring.
35) Vad är databaskardinalitet?
Kardinalitet är ett numeriskt attribut för förhållandet mellan två entiteter eller entitetsuppsättningar.
36) Vilka är de olika typerna av kardinalrelationer?
Olika typer av nyckelkardinalrelationer är:
- En-till-en-relationer
- En-till-många-relationer
- Många-till-en-relationer
- Många-till-många relationer
37) Definiera kritisk framgångsfaktor och lista dess fyra typer
Kritisk framgångsfaktor är ett gynnsamt resultat av alla aktiviteter som behövs för att organisationen ska nå sitt mål.
Fyra typer av kritiska framgångsfaktorer är:
- CSF:er för industrin
- Strategiska CSF:er
- Miljö-CSF
- Temporala CSFs
38) Vad är datautvinning?
Data mining är en multidisciplinär färdighet som använder maskininlärning, statistik, AI och databasteknik. Det handlar om att upptäcka oanade / tidigare okända samband mellan data.
39) Vad är skillnaden mellan Star-schema och Snowflake-schema?
Följande är en viktig skillnad mellan Stjärnschema vs Snowflake-schema:
Stjärnskema | Snöflingaschema |
---|---|
Hierarkier för dimensionerna lagras i dimensionstabellen. | Hierarkier är indelade i separata tabeller. |
Den innehåller en faktatabell omgiven av dimensionstabeller. | En faktatabell omgiven av dimensionstabell som i sin tur är omgiven av dimensionstabell |
I ett stjärnschema skapar endast en enstaka koppling relationen mellan faktatabellen och eventuella dimensionstabeller. | Ett snöflingaschema kräver många kopplingar för att hämta data. |
Den har en enkel databasdesign | Den har en komplex databasdesign |
Denormaliserad datastruktur och fråga går också snabbare. | Normaliserad datastruktur. |
Hög nivå av dataredundans | Dataredundans på mycket låg nivå |
Erbjuder bättre resultat med hjälp av Star Join Query Optimization. Bord kan kopplas ihop med flera dimensioner. | Snöflingans schema representeras av en centraliserad faktatabell som osannolikt har samband med flera dimensioner. |
40) Vad är identifierande relation?
Att identifiera entitetsrelationer i DBMS används för att identifiera en relation mellan två enheter: 1) stark enhet och 2) svag enhet.
41) Vad är ett självrekursivt förhållande?
Rekursiv relation är en fristående kolumn i en tabell som är kopplad till primärnyckeln i samma tabell.
42) Förklara relationsdatamodellering
Relationell datamodellering är representation av objekt i en relationsdatabas, vilket vanligtvis är normaliserat.
43) Vad är prediktiv modelleringsanalys?
Processen att validera eller testa en modell som skulle användas för att förutsäga testning och validera resultat. Den kan användas för maskininlärning, artificiell intelligens och statistik.
44) Vad är skillnaden mellan logisk datamodell och fysisk datamodell?
Logisk datamodell | Fysisk datamodell |
---|---|
En logisk datamodell kan utforma kravet på verksamheten logiskt. | En fysisk datamodell ger information om måldatabaskällan och dess egenskaper. |
Den ansvarar för själva implementeringen av data som lagras i databasen. | En fysisk datamodell hjälper dig att skapa en ny databasmodell från befintliga och tillämpa referensintegritetsbegränsningen. |
Den innehåller en enhet, primära nyckelattribut, inversionsnycklar, alternativ nyckel, regel, affärsrelation, definition, etc. | En fysisk datamodell innehåller en tabell, nyckelbegränsningar, unik nyckel, kolumner, främmande nyckel, index, standardvärden, etc. |
45) Vilka är de olika typerna av begränsningar?
En annan typ av begränsning kan vara unik, nollvärden, främmande nycklar, sammansatt nyckel eller kontrollbegränsning, etc.
46) Vad är ett datamodelleringsverktyg?
Datamodelleringsverktyg är en programvara som hjälper till att konstruera dataflödet och relationen mellan data. Exempel på sådana verktyg är Borland Together, Altova Databasspion, casewise, Case Studio 2, etc.
47) Vad är hierarkiskt DBMS?
I den hierarkiska databasen är modelldata organiserade i en trädliknande struktur. Data lagras i ett hierarkiskt format. Data representeras med hjälp av en förälder-barn-relation. I hierarkiska DBMS kan förälder ha många barn, barn har bara en förälder.
48) Vilka är nackdelarna med den hierarkiska datamodellen?
Nackdelarna med den hierarkiska datamodellen är:
- Det är inte flexibelt då det tar tid att anpassa sig till verksamhetens förändrade behov.
- Strukturen ställer frågan inom kommunikation mellan avdelningar, vertikal kommunikation samt kommunikation mellan myndigheter.
- Hierarkisk datamodell kan skapa problem med oenighet.
49) Förklara det processdrivna tillvägagångssättet för datamodellering
Processdrivet tillvägagångssätt som används i datamodellering följer en steg-för-steg-metod om förhållandet mellan entitetsrelationsmodellen och organisationsprocessen.
50) Vilka är fördelarna med att använda datamodellering?
Fördelarna med att använda datamodellering i datalager är:
- Det hjälper dig att hantera affärsdata genom att normalisera den och definiera dess attribut.
- Datamodellering integrerar data från olika system för att minska dataredundans.
- Det gör det möjligt att skapa effektiv databasdesign.
- Datamodellering hjälper organisationsavdelningen att fungera som ett team.
- Det underlättar att komma åt data med lätthet.
51) Vilka är nackdelarna med att använda datamodellering?
Nackdelarna med att använda datamodellering är:
- Det har mindre strukturellt oberoende
- Det kan göra systemet komplext.
52) Vad är index?
Index används för en kolumn eller grupp av kolumner för att snabbt hämta data.
53) Vad kännetecknar en logisk datamodell?
Kännetecken för logisk datamodell är:
- Beskriver databehov för ett enskilt projekt men skulle kunna integreras med andra logiska datamodeller baserat på projektets omfattning.
- Designad och utvecklad oberoende av DBMS.
- Dataattribut kommer att ha datatyper med exakt precision och längd.
- Normaliseringsprocesser till modellen, som vanligtvis tillämpas till 3NF.
54) Vilka egenskaper kännetecknar den fysiska datamodellen?
Egenskaper för fysisk datamodell är:
- Den fysiska datamodellen beskriver databehov för ett enskilt projekt eller applikation. Den kan integreras med andra fysiska datamodeller baserat på projektets omfattning.
- Datamodellen innehåller relationer mellan tabeller som adresserar kardinalitet och nullbarhet av relationerna.
- Utvecklad för en specifik version av ett DBMS, plats, datalagring eller teknik som ska användas i projektet.
- Kolumner bör ha exakta datatyper, tilldelade längder och standardvärden.
- Primära och främmande nycklar, vyer, index, åtkomstprofiler och behörigheter etc. definieras.
55) Vilka är de två typerna av datamodelleringstekniker?
Två typer av datamodelleringstekniker är: 1) modell för entitetsrelationer (ER) och 2) UML (Unified Modeling Language).
56) Vad är UML?
UML (Unified Modeling Language) är ett generellt, databasutvecklings- och modelleringsspråk inom området mjukvaruteknik. Huvudavsikten är att tillhandahålla ett generaliserat sätt att visualisera systemdesign.
57) Förklara objektorienterad databasmodell
Den objektorienterade databasmodellen är en samling objekt. Dessa objekt kan ha associerade funktioner såväl som metoder.
58) Vad är en nätverksmodell?
Det är en modell som bygger på hierarkisk modell. Det tillåter mer än en relation att länka poster, vilket indikerar att den har flera poster. Det är möjligt att konstruera en uppsättning överordnade poster och underordnade poster. Varje post kan tillhöra flera uppsättningar som gör att du kan utföra komplexa tabellrelationer.
59) Vad är hashing?
Hashing är en teknik som används för att söka igenom alla indexvärden och hämta önskad data. Det hjälper till att beräkna den direkta platsen för data, som spelas in på disk utan att använda indexstrukturen.
60) Vad är affärsnycklar eller naturliga nycklar?
affärsnycklar eller naturliga nycklar är ett fält som unikt identifierar en enhet. Till exempel kund-ID, anställdsnummer, e-post etc.
61) Vad är sammansatt nyckel?
När mer än ett fält används för att representera en nyckel, kallas det en sammansatt nyckel.
62) Vad är första normalformen?
Första normalformen eller 1NF är en egenskap hos en relation som är tillgänglig i ett relationsdatabashanteringssystem. Varje relation kallas första normalform om domänen för varje attribut innehåller värden som är atomära. Den innehåller ett värde från den domänen.
63) Vad är skillnaden mellan primärnyckel och främmande nyckel?
Primärnyckel | Främmande nyckel |
---|---|
Primär nyckel hjälper dig att unikt identifiera en post i tabellen. | Främmande nyckel är ett fält i tabellen som är primärnyckeln för en annan tabell. |
Primärnyckel accepterar aldrig nollvärden. | En främmande nyckel kan acceptera flera nollvärden. |
Primärnyckeln är ett klustrat index, och data i DBMS-tabellen är fysiskt organiserade i sekvensen av det klustrade indexet. | En främmande nyckel kan inte automatiskt skapa ett index, klustrade eller icke-klustrade. Du kan dock manuellt skapa ett index på den främmande nyckeln. |
Du kan ha den enda primära nyckeln i en tabell. | Du kan ha flera främmande nycklar i en tabell. |
64) Vilka är kraven för den andra normalformen?
Kraven för andra normalformen är:
- Det bör vara i första normala form.
- Den innehåller inte något icke-primärt attribut, vilket är funktionellt beroende av någon delmängd av kandidatnyckeln i tabellrelationen.
65) Vilka är reglerna för tredje normalformen?
Regler för tredje normala former är:
- Det ska vara i andra normala form
- Den har inga transitiva funktionella beroenden.
66) Vilken betydelse är det med att använda nycklar?
- Nycklar hjälper dig att identifiera valfri rad med data i en tabell. I en verklig applikation kan en tabell innehålla tusentals poster.
- Nycklar säkerställer att du unikt kan identifiera en tabellpost trots dessa utmaningar.
- Låter dig upprätta en relation mellan och identifiera relationen mellan tabeller
- Hjälp dig att upprätthålla identitet och integritet i relationen.
67) Vad är en surrogatnyckel?
En konstgjord nyckel som syftar till att unikt identifiera varje post kallas en surrogatnyckel. Dessa typer av nycklar är unika eftersom de skapas när du inte har någon naturlig primärnyckel. De ger ingen mening åt uppgifterna i tabellen. Surrogatnyckel är vanligtvis ett heltal.
68) Förklara alternativ nyckel i detalj
Alternativ nyckel är en kolumn eller grupp av kolumner i en tabell som unikt identifierar varje rad i den tabellen. En tabell kan ha flera val för en primärnyckel, men endast en kan ställas in som primärnyckel. Alla nycklar som inte är primärnyckel kallas en alternativ nyckel.
69) Vilken är fjärde normalformen i DBMS?
Fjärde normalformen är en nivå av databasnormalisering där det inte får ha något icke trivialt beroende annat än kandidatnyckeln.
70) Vad är ett databashanteringssystem?
Databashanteringssystem eller DBMS är en programvara för att lagra och hämta användardata. Den består av en grupp program som manipulerar databasen.
71) Vad är regeln för femte normalformen?
En tabell är i 5th normal form endast om den är i 4th normal form, och det kan inte dekomponeras i ett antal mindre tabeller utan förlust av data.
72) Vad är normalisering?
Normalisering är en databasdesignteknik som organiserar tabeller på ett sätt som minskar redundans och databeroende. Den delar upp större tabeller i mindre tabeller och länkar dem med hjälp av relationer.
73) Förklara egenskaperna hos ett databashanteringssystem
- Ger säkerhet och tar bort redundans
- Databassystemets självbeskrivande karaktär
- Isolering mellan program och dataabstraktion
- Stöd för flera vyer av data.
- Deling av data och fleranvändartransaktionsbehandling
- DBMS tillåter entiteter och relationer mellan dem att bilda tabeller.
- Den följer ACID-konceptet (Atomicity, konsistens, isolering och hållbarhet).
- DBMS stöder en fleranvändarmiljö som tillåter användare att komma åt och komma åt och manipulera data parallellt.
74) Lista över populära DBMS-programvara
Populära DBMS programvara är:
- MySQL
- Microsoft Tillgång
- Oracle
- PostgreSQL
- dbase
- FoxPro
- SQLite
- IBM DB2
- Microsoft SQL Server.
75) Förklara begreppet RDBMS
Relationsdatabashanteringssystem är en programvara som används för att lagra data i form av tabeller. I den här typen av system hanteras och lagras data i rader och kolumner, vilket är känt som tupler och attribut. RDBMS är ett kraftfullt datahanteringssystem och används flitigt över hela världen.
76) Vilka är fördelarna med datamodell?
Fördelarna med datamodellen är:
- Huvudmålet med en designande datamodell är att se till att dataobjekt som erbjuds av det funktionella teamet representeras korrekt.
- Datamodellen bör vara tillräckligt detaljerad för att kunna användas för att bygga den fysiska databasen.
- Informationen i datamodellen kan användas för att definiera relationen mellan tabeller, primära och främmande nycklar och lagrade procedurer.
- Data Model hjälper företag att kommunicera inom och mellan organisationer.
- Datamodell hjälper till att dokumentera datamappningar i ETL-processen
- Hjälp till att känna igen korrekta datakällor för att fylla modellen
77) Vilka är nackdelarna med Data Model?
Nackdelarna med datamodellen är:
- För att utveckla datamodellen bör man känna till fysiska data lagrade egenskaper.
- Detta är ett navigationssystem som producerar komplex applikationsutveckling, hantering. Det kräver alltså kunskap om den biografiska sanningen.
- Även mindre förändringar i strukturen kräver modifiering i hela applikationen.
- Det finns ingen uppsättning datamanipuleringsspråk i DBMS.
78) Förklara olika typer av faktatabeller
Det finns tre typer av faktatabeller:
- Tillsats: Det är ett mått som läggs till vilken dimension som helst.
- Icke-tillsats: Det är ett mått som inte kan läggas till någon dimension.
- Semi-additiv: Det är ett mått som kan läggas till några dimensioner.
79) Vad är aggregerad tabell?
Den aggregerade tabellen innehåller aggregerade data som kan beräknas med funktioner som: 1) Genomsnitt 2) MAX, 3) Antal, 4) SUMMA, 5) SUMMA och 6) MIN.
80) Vad är Bekräftad dimension?
En anpassad dimension är en dimension som är utformad på ett sätt som kan användas över många faktatabeller i olika delar av ett datalager.
81) Lista typer av hierarkier i datamodellering
Det finns två typer av hierarkier: 1) Nivåbaserade hierarkier och 2) Förälder-barn-hierarkier.
82) Vad är skillnaden mellan en datamart och datalager?
Här är det viktigaste skillnaden mellan Data Mart och Data Warehouse:
Datamart | Datalager |
---|---|
Datamart fokuserar på ett enda ämnesområde. | Data warehouse fokuserar på flera affärsområden. |
Det används för att fatta taktiska beslut för affärstillväxt. | Det hjälper företagare att fatta ett strategiskt beslut |
Datamart följer bottom-up-modellen | Data warehouse följer en top-down modell |
Datakällan kommer från en datakälla | Datakällan kommer från mer än en heterogen datakälla. |
83) Vad är XMLA?
XMLA är en XML-analys som anses vara standard för att komma åt data i Online analytisk bearbetning (OLAP).
84) Förklara skräpdimension
Skräpdimensionen hjälper till att lagra data. Det används när data inte är lämpliga att lagra i schemat.
85) Förklara kedjad datareplikering
Situationen när en sekundär nod väljer mål med hjälp av pingtid eller när den närmaste noden är en sekundär, kallas det kedjad datareplikering.
86) Förklara Virtual Data Warehousing
Ett virtuellt datalager ger en samlad bild av den färdiga datan. Ett virtuellt datalager har inga historiska data. Det betraktas som en logisk datamodell med metadata.
87) Förklara ögonblicksbild av datalager
Snapshot är en komplett visualisering av data vid den tidpunkt då datautvinningsprocessen börjar.
88) Vad är ett dubbelriktat extrakt?
Systemets förmåga att extrahera, rengöra och överföra data i två riktningar kallas ett riktat extrakt.
Dessa intervjufrågor kommer också att hjälpa dig i din viva (orals)