データ モデリングに関するインタビューのトップ 88 の質問と回答 (2024)
新人向けのデータモデリング面接の質問と回答
1) データモデリングとは何ですか?
データ モデリングは、データベースに保存するデータのモデルを作成するプロセスです。 これは、データ オブジェクト、異なるデータ オブジェクト間の関連付け、およびルールを概念的に表現したものです。
2) 各種データモデルの説明
データ モデルには主に XNUMX つの異なるタイプがあります。
概念: 概念データ モデルは、システムに何が含まれるべきかを定義します。このモデルは通常、ビジネス関係者とデータ アーキテクトによって作成されます。その目的は、ビジネスの概念とルールを整理、範囲設定、定義することです。
論理的: に関係なくシステムを実装する方法を定義します。 DBMSこのモデルは通常、データ アーキテクトとビジネス アナリストによって作成されます。目的は、ルールとデータ構造の技術マップを作成することです。
物理: このデータ モデルは、特定の DBMS システムを使用してシステムがどのように実装されるかを記述します。 このモデルは通常、DBA と開発者によって作成されます。 目的はデータベースを実際に実装することです。
3) ファクトとファクトテーブルを説明する
事実は定量的なデータを表します。 たとえば、未払いの正味金額などです。 ファクト テーブルには、数値データとディメンション テーブルの外部キーが含まれます。
4) データモデリングにおけるさまざまな設計スキーマをリストアップする
データ モデリング スキーマには 1 つの異なるタイプがあります: 2) スター スキーマ、および XNUMX) スノーフレーク スキーマ
5) 非正規化を考慮する必要があるのはどのような場合ですか?
非正規化は、データの取得中にテーブルが多く関与する場合に使用されます。 データウェアハウスを構築するために使用されます。
6) 次元と属性の説明
ディメンションは定性的なデータを表します。 たとえば、製品、クラス、プランなどです。ディメンション テーブルにはテキストまたは説明的な属性があります。 たとえば、製品カテゴリと製品名は、製品ディメンション テーブルの XNUMX つの属性です。
7) 事実ではない事実とは何ですか?
ファクトレスファクトとは、ファクト測定を持たないテーブルです。 これにはディメンション キーのみが含まれます。
8) インメモリ分析とは何ですか?
インメモリ分析は、データベースを RAM にキャッシュするプロセスです。
9) OLTP と OLAP の違いは何ですか?
以下は OLAPとOLTPの違い:
OLTP | OLAP |
---|---|
OLTP はオンライン トランザクション システムです。 | OLAP は、オンライン分析およびデータ取得プロセスです。 |
短時間のオンライン取引が多いのが特徴です。 | データ量が多いのが特徴です。 |
OLTP は従来の DBMS を使用します。 | OLAP はデータ ウェアハウスを使用します。 |
OLTP データベースのテーブルは正規化されています。 | OLAP のテーブルは正規化されていません。 |
応答時間はミリ秒単位です。 | 応答時間は数秒から数分です。 |
OLTP はリアルタイムのビジネス オペレーション向けに設計されています。 | OLAP は、カテゴリおよび属性ごとにビジネス指標を分析するために設計されています。 |
10) テーブルとは何ですか?
行と列の集合をテーブルと呼びます。 すべての列にはデータ型があります。 テーブルには、関連データが表形式で含まれています。
11) コラムとは何ですか?
列またはフィールドは、関連情報を含むデータを垂直に配置したものです。
12) データの疎性を定義する
データ スパース性は、モデルのエンティティ/ディメンションに対してどれだけのデータがあるかを表すために使用される用語です。
13) 複合主キーとは何ですか?
複合主キーは、複数のテーブル列が主キーの一部として使用される場合を指します。
14) 主キーとは何ですか?
主キー テーブル内の各行を不均等に識別する列または列のグループです。 主キーの値は null であってはなりません。 すべてのテーブルには XNUMX つの主キーが含まれている必要があります。
15) 外部キーの説明
外部キー 親テーブルと子テーブルをリンクするために使用される属性のグループです。 子テーブルで使用可能な外部キー列の値は、親テーブルの主キーの値を参照します。
16) メタデータとは何ですか?
メタデータはデータに関するデータを説明します。 実際にデータベース システムにどのような種類のデータが保存されているかを示します。
17) データマートとは何ですか?
A データマート データ ウェアハウスの圧縮バージョンであり、組織内の特定の部門、部門、または一連のユーザーが使用するように設計されています。 たとえば、マーケティング販売、人事、財務などです。
18) OLTPとは何ですか?
オンライン トランザクション処理、略して知られています OLTP3 層アーキテクチャでトランザクション指向アプリケーションをサポートします。OLTP は、企業または組織の日常的なトランザクションを管理します。
19) OLTP システムの例は何ですか?
OLTP システムの例は次のとおりです。
- テキストメッセージの送信
- 本をショッピング カートに追加する
- オンライン航空券予約
- オンラインバンキング
- 注文入力
20) チェック制約とは何ですか?
チェック制約は、列内の値の範囲を検証するために使用されます。
21) 正規化の種類を列挙してください。
正規化のタイプは次のとおりです: 1) 第一正規形、2) 第二正規形、3) 第三正規形、4) ボイス・コッド第四正規形、および 5) 第五正規形。
22) フォワードデータエンジニアリングとは何ですか?
フォワード エンジニアリングは、論理モデルを物理的な実装に自動的に変換するプロセスを説明するために使用される技術用語です。
23) PDAPとは何ですか?
データをサマリーとして保存するデータ キューブです。 ユーザーがデータを迅速に分析するのに役立ちます。 PDAP のデータは、レポートを簡単に実行できる方法で保存されます。
24) スノーフレークスキーマデータベース設計の説明
スノーフレーク スキーマは、ディメンション テーブルとファクト テーブルを組み合わせたものです。 一般に、両方のテーブルはさらに多くのディメンション テーブルに分割されます。
25) 分析サービスについて説明する
分析サービスは、データ マイニングまたは OLAP で使用されるデータを組み合わせたビューを提供します。
26) シーケンスクラスタリングアルゴリズムとは何ですか?
シーケンス クラスタリング アルゴリズムは、類似または相互に関連するパスと、イベントを持つデータのシーケンスを収集します。
27) 離散データと連続データとは何ですか?
離散データは有限データまたは定義されたデータです。例: 性別、電話番号。連続データは連続的かつ順序付けられた方法で変化するデータです。例: 年齢。
28) 時系列アルゴリズムとは何ですか?
時系列アルゴリズムは、テーブル内のデータの連続値を予測する手法です。 たとえば、従業員のパフォーマンスによって利益や影響力を予測できます。
29) ビジネスインテリジェンスとは何ですか?
BI (ビジネス インテリジェンス) は、生データを有益なビジネス アクションを促進する意味のある情報に変換する一連のプロセス、アーキテクチャ、テクノロジです。データを実用的なインテリジェンスと知識に変換するためのソフトウェアとサービスのスイートです。
30) ビットマップインデックスとは何ですか?
ビットマップ インデックスは、ビットマップ (ビット配列) を使用してビット単位の演算を実行し、クエリに応答する特殊なタイプのデータベース インデックスです。
経験者向けのデータモデリング面接の質問と回答
31) データウェアハウスについて詳しく説明する
データ ウェアハウスは、さまざまなソースからデータを収集して管理するプロセスです。これにより、ビジネス エンタープライズに有意義な洞察がもたらされます。データ ウェアハウスは通常、異種ソースからのデータを接続して分析するために使用されます。これは、データ分析とレポート作成用に構築された BI システムの中核です。
32) ジャンク次元とは何ですか?
ジャンク ディメンションは、XNUMX つ以上の関連するカーディナリティを XNUMX つのディメンションに結合します。 通常、これはブール値またはフラグ値です。
33) データスキームの説明
データ スキームは、データの関係と構造を示す図表現です。
34) データ収集頻度の説明
データ収集頻度は、データを収集する速度です。 また、さまざまな段階を経ます。 これらの段階は、1) さまざまなソースからの抽出、3) 変換、4) 浄化、5) 保存です。
35) データベースのカーディナリティとは何ですか?
カーディナリティは、XNUMX つのエンティティまたはエンティティ セット間の関係の数値属性です。
36) 基数関係にはどのような種類がありますか?
さまざまな種類の主要な基数関係は次のとおりです。
- XNUMX対XNUMXの関係
- XNUMX対多の関係
- 多対 XNUMX の関係
- 多対多の関係
37) 重要な成功要因を定義し、その XNUMX つのタイプをリストする
重要な成功要因は、組織が目標を達成するために必要なあらゆる活動の好ましい結果です。
重要な成功要因には次の XNUMX つのタイプがあります。
- 業界の CSF
- 戦略 CSF
- 環境CSF
- 側頭脳脊髄液
38) データマイニングとは何ですか?
データ マイニングは、機械学習、統計、AI、データベース テクノロジを使用する学際的なスキルです。 それはすべて、データ間の予期せぬ/これまで知られていなかった関係を発見することです。
39) スター スキーマとスノーフレーク スキーマの違いは何ですか?
以下は、 スター スキーマとスノーフレーク スキーマ:
スタースキーマ | スノーフレークスキーマ |
---|---|
ディメンションの階層はディメンション テーブルに保存されます。 | 階層は個別のテーブルに分割されます。 |
これには、ディメンション テーブルで囲まれたファクト テーブルが含まれています。 | ディメンション テーブルで囲まれた XNUMX つのファクト テーブル、さらにディメンション テーブルで囲まれたファクト テーブル |
スター スキーマでは、単一の結合だけでファクト テーブルとディメンション テーブル間の関係が作成されます。 | スノーフレーク スキーマでは、データをフェッチするために多くの結合が必要です。 |
シンプルなデータベース設計です | 複雑なデータベース設計である |
非正規化されたデータ構造とクエリも高速に実行されます。 | 正規化されたデータ構造。 |
高レベルのデータ冗長性 | 非常に低レベルのデータ冗長性 |
スター結合クエリ最適化を使用して、よりパフォーマンスの高いクエリを提供します。 テーブルは複数のディメンションに接続できます。 | スノー フレーク スキーマは、複数のディメンションに接続される可能性が低い集中ファクト テーブルによって表されます。 |
40) 同一化関係とは何ですか?
DBMS でのエンティティ リレーションシップの識別は、1) 強いエンティティと 2) 弱いエンティティという XNUMX つのエンティティ間のリレーションシップを識別するために使用されます。
41) 自己再帰的関係とは何ですか?
再帰リレーションシップは、同じテーブルの主キーに接続されているテーブル内のスタンドアロン列です。
42) リレーショナル データ モデリングについて説明する
リレーショナル データ モデリングは、リレーショナル データベース内のオブジェクトの表現であり、通常は正規化されます。
43) 予測モデリング分析とは何ですか?
テストと結果の検証を予測するために使用されるモデルを検証またはテストするプロセス。 機械学習、人工知能、統計にも使用できます。
44) 論理データモデルと物理データモデルの違いは何ですか?
論理データモデル | 物理データモデル |
---|---|
論理データ モデルは、ビジネスの要件を論理的に設計できます。 | 物理データ モデルは、ターゲット データベース ソースとそのプロパティに関する情報を提供します。 |
データベースに保存されているデータの実際の実装を担当します。 | 物理データ モデルは、既存のデータベース モデルから新しいデータベース モデルを作成し、参照整合性制約を適用するのに役立ちます。 |
これには、エンティティ、主キー属性、反転キー、代替キー、ルール、ビジネス関係、定義などが含まれます。 | 物理データ モデルには、テーブル、キー制約、一意キー、列、外部キー、インデックス、デフォルト値などが含まれます。 |
45) さまざまなタイプの制約には何がありますか?
別のタイプの制約としては、一意、NULL 値、外部キー、複合キー、チェック制約などが考えられます。
46) データモデリングツールとは何ですか?
データモデリングツール データフローとデータ間の関係の構築を支援するソフトウェアです。このようなツールの例としては、Borland Together、 Altova Database Spy、casewise、Case Studio 2 など。
47) 階層型 DBMS とは何ですか?
階層型データベースでは、モデル データはツリーのような構造に編成されます。データは階層形式で保存されます。データは親子関係を使用して表されます。階層型 DBMS では、親には多数の子が存在する場合がありますが、子には 1 つの親しか存在しません。
48) 階層型データ モデルの欠点は何ですか?
階層型データ モデルの欠点は次のとおりです。
- ビジネスのニーズの変化に適応するには時間がかかるため、柔軟性がありません。
- この構造では、省庁間のコミュニケーションだけでなく、部門間のコミュニケーション、縦のコミュニケーションにも問題が生じます。
- 階層型データ モデルでは、不統一の問題が発生する可能性があります。
49) データモデリングのプロセス駆動型アプローチを説明する
データ モデリングで使用されるプロセス駆動型のアプローチは、エンティティ関係モデルと組織プロセスの間の関係に関する段階的な方法に従います。
50) データモデリングを使用する利点は何ですか?
データ ウェアハウジングでデータ モデリングを使用する利点は次のとおりです。
- ビジネス データを正規化し、その属性を定義することで、ビジネス データの管理に役立ちます。
- データ モデリングは、さまざまなシステムのデータを統合して、データの冗長性を削減します。
- 効率的なデータベース設計が可能になります。
- データ モデリングは、組織部門がチームとして機能するのに役立ちます。
- データに簡単にアクセスできるようになります。
51) データモデリングを使用するデメリットは何ですか?
データ モデリングを使用する場合の欠点は次のとおりです。
- 構造的な独立性が低い
- システムが複雑になる可能性があります。
52) インデックスとは何ですか?
インデックスは、データを高速に取得するために列または列のグループに使用されます。
53) 論理データモデルの特徴は何ですか?
論理データ モデルの特徴は次のとおりです。
- 単一プロジェクトのデータ ニーズについて説明しますが、プロジェクトの範囲に基づいて他の論理データ モデルと統合できます。
- DBMS から独立して設計および開発されました。
- データ属性には、正確な精度と長さのデータ型があります。
- モデルに対する正規化プロセスは、一般に 3NF まで適用されます。
54) 物理データモデルの特徴は何ですか?
物理データ モデルの特徴は次のとおりです。
- 物理データ モデルは、単一のプロジェクトまたはアプリケーションに必要なデータを記述します。 プロジェクトの範囲に基づいて、他の物理データ モデルと統合される場合があります。
- データ モデルには、関係のカーディナリティと NULL 可能性を扱うテーブル間の関係が含まれています。
- プロジェクトで使用される DBMS、場所、データ ストレージ、またはテクノロジの特定のバージョン用に開発されました。
- 列には正確なデータ型、割り当てられた長さ、およびデフォルト値が必要です。
- 主キーと外部キー、ビュー、インデックス、アクセス プロファイル、承認などが定義されます。
55) XNUMX 種類のデータ モデリング手法とは何ですか?
データ モデリング手法には 1 種類あります。2) エンティティ関係 (ER) モデルと XNUMX) UML (統一モデリング言語).
56) UMLとは何ですか?
UML (統一モデリング言語) は、ソフトウェア エンジニアリングの分野における汎用のデータベース開発モデリング言語です。 主な目的は、システム設計を視覚化する一般化された方法を提供することです。
57) オブジェクト指向データベースモデルの説明
オブジェクト指向データベース モデルはオブジェクトのコレクションです。 これらのオブジェクトには、メソッドだけでなく関連する機能も含めることができます。
58) ネットワークモデルとは何ですか?
これは階層モデルに基づいて構築されたモデルです。複数の関係でレコードをリンクすることができ、複数のレコードがあることを示します。親レコードと子レコードのセットを構築できます。各レコードは複数のセットに属することができ、複雑なテーブル関係を実行できます。
59) ハッシュとは何ですか?
ハッシュ化は、すべてのインデックス値を検索し、必要なデータを取得するために使用される手法です。 これは、インデックスの構造を使用せずに、ディスクに記録されるデータの直接の場所を計算するのに役立ちます。
60) ビジネスキーまたはナチュラルキーとは何ですか?
ビジネス キーまたは自然キーは、エンティティを一意に識別するフィールドです。たとえば、クライアント ID、従業員番号、電子メールなどです。
61) 複合キーとは何ですか?
複数のフィールドを使用してキーを表す場合、そのフィールドは複合キーと呼ばれます。
62) 第一正規形とは何ですか?
第 1 正規形または XNUMXNF は、リレーショナル データベース管理システムで使用できる関係のプロパティです。すべての属性のドメインにアトミックな値が含まれている場合、その関係は第 XNUMX 正規形と呼ばれます。そのドメインから XNUMX つの値が含まれます。
63) 主キーと外部キーの違いは何ですか?
主キー | 外部キー |
---|---|
主キーは、テーブル内のレコードを一意に識別するのに役立ちます。 | 外部キーは、別のテーブルの主キーとなるテーブル内のフィールドです。 |
主キーは決して null 値を受け入れません。 | 外部キーは複数の null 値を受け入れることができます。 |
主キーはクラスター化インデックスであり、DBMS テーブル内のデータはクラスター化インデックスの順序で物理的に編成されます。 | 外部キーでは、クラスター化インデックスまたは非クラスター化インデックスを自動的に作成することはできません。ただし、外部キーに手動でインデックスを作成することはできます。 |
テーブルには XNUMX つの主キーを含めることができます。 | テーブルには複数の外部キーを含めることができます。 |
64) 第 XNUMX 正規形の要件は何ですか?
第 XNUMX 正規形の要件は次のとおりです。
- 第一正規形である必要があります。
- これには、テーブル リレーションの候補キーのサブセットに機能的に依存する非プライム属性は含まれません。
65) 第 XNUMX 正規形の規則は何ですか?
第 XNUMX 正規形のルールは次のとおりです。
- 第 XNUMX 正規形である必要があります
- 推移的な関数の依存関係はありません。
66) キーを使用することの重要性は何ですか?
- キーは、テーブル内のデータ行を識別するのに役立ちます。 実際のアプリケーションでは、テーブルに数千のレコードが含まれる可能性があります。
- キーを使用すると、これらの課題にもかかわらず、テーブル レコードを一意に識別できるようになります。
- テーブル間の関係を確立し、テーブル間の関係を識別できます。
- 関係におけるアイデンティティと整合性を強化するのに役立ちます。
67) 代理キーとは何ですか?
各レコードを一意に識別することを目的とした人工キーは、代理キーと呼ばれます。 これらの種類のキーは、自然な主キーがない場合に作成されるため、一意です。 これらはテーブル内のデータに何の意味も与えません。 通常、代理キーは整数です。
68) 代替キーを詳しく説明する
代替キーは、テーブル内のすべての行を一意に識別するテーブル内の列または列のグループです。 テーブルには主キーとして複数の選択肢がありますが、主キーとして設定できるのは XNUMX つだけです。 主キーではないすべてのキーは代替キーと呼ばれます。
69) DBMS の第 XNUMX 正規形とは何ですか?
第 XNUMX 正規形は、候補キー以外に自明でない依存関係があってはいけないデータベース正規化のレベルです。
70) データベース管理システムとは何ですか?
データベース管理システム DBMS は、ユーザー データを保存および取得するためのソフトウェアです。 データベースを操作するプログラム群で構成されます。
71) 第 XNUMX 正規形の法則とは何ですか?
テーブルは5つにありますth 4の場合のみ正規形th これは標準形式であり、データを損失せずに任意の数の小さなテーブルに分解することはできません。
72) 正規化とは何ですか?
正規化 は、データの冗長性と依存性を軽減する方法でテーブルを編成するデータベース設計手法です。 大きなテーブルを小さなテーブルに分割し、リレーションシップを使用してテーブルをリンクします。
73) データベース管理システムの特徴を説明できる
- セキュリティを提供し、冗長性を排除します
- データベース システムの自己記述的性質
- プログラム間の絶縁とデータの抽象化
- データの複数のビューのサポート。
- データの共有とマルチユーザートランザクション処理
- DBMS を使用すると、エンティティとエンティティ間の関係がテーブルを形成できます。
- これは ACID の概念 (Atom氷性、一貫性、分離性、耐久性)。
- DBMS は、ユーザーがデータに並行してアクセスし、データにアクセスして操作できるようにするマルチユーザー環境をサポートします。
74) 人気のある DBMS ソフトウェアをリストアップする
人気 DBMSソフトウェア 次のとおりです。
- MySQL
- Microsoft アクセス
- Oracle
- PostgreSQL
- データベース
- FoxPro
- SQLite
- IBM DB2
- Microsoft SQL Server.
75) RDBMSの概念を説明する
リレーショナルデータベース管理システム データをテーブル形式で保存するために使用されるソフトウェアです。 この種のシステムでは、データはタプルや属性と呼ばれる行と列で管理および格納されます。 RDBMS は強力なデータ管理システムであり、世界中で広く使用されています。
76) データモデルの利点は何ですか?
データ モデルの利点は次のとおりです。
- データ モデルの設計の主な目標は、機能チームが提供するデータ オブジェクトが正確に表現されていることを確認することです。
- データ モデルは、物理データベースの構築に使用できるほど詳細なものである必要があります。
- データ モデル内の情報は、テーブル、主キーと外部キー、ストアド プロシージャの間の関係を定義するために使用できます。
- データ モデルは、企業が組織内および組織間のコミュニケーションを行うのに役立ちます。
- データ モデルは、ETL プロセスにおけるデータ マッピングの文書化に役立ちます
- モデルに入力するための正しいデータ ソースを認識するのに役立ちます。
77) データモデルの欠点は何ですか?
データ モデルの欠点は次のとおりです。
- データ モデルを開発するには、物理データに保存されている特性を知る必要があります。
- これは、複雑なアプリケーション開発、管理を生み出すナビゲーション システムであり、伝記の真実に関する知識を必要とします。
- 構造に小さな変更を加えた場合でも、アプリケーション全体の変更が必要になります。
- DBMS にはデータ操作言語のセットはありません。
78) さまざまなタイプのファクトテーブルについて説明する
ファクト テーブルには XNUMX つのタイプがあります。
- 添加物: これは、任意のディメンションに追加されるメジャーです。
- 無添加: これは、どのディメンションにも追加できないメジャーです。
- 半添加剤: これは、いくつかの次元に追加できるメジャーです。
79) 集計テーブルとは何ですか?
集計テーブルには、1) 平均、2) MAX、3) カウント、4) SUM、5) SUM、6) MIN などの関数を使用して計算できる集計データが含まれています。
80) 確認寸法とは何ですか?
適合ディメンションは、データ ウェアハウスのさまざまな領域にある多くのファクト テーブルにわたって使用できる方法で設計されたディメンションです。
81) データモデリングにおける階層の種類を一覧表示する
階層には、1) レベルベースの階層と 2) 親子階層の XNUMX 種類があります。
82) データマートとデータウェアハウスの違いは何ですか?
ここがメインです データマートとデータウェアハウスの違い:
データ市場 | データウェアハウス |
---|---|
データ マートは、ビジネスの単一の主題領域に焦点を当てています。 | データ ウェアハウスは複数のビジネス分野に焦点を当てています。 |
ビジネスの成長のための戦術的な決定を行うために使用されます。 | ビジネスオーナーが戦略的な決定を下すのに役立ちます |
データ マートはボトムアップ モデルに従います | データ ウェアハウスはトップダウン モデルに従います |
データ ソースは XNUMX つのデータ ソースから取得されます | データ ソースは、複数の異種データ ソースから取得されます。 |
83) XMLAとは何ですか?
XMLA は、データにアクセスするための標準とみなされている XML 分析です。 オンライン分析処理(OLAP).
84) ジャンク次元について説明する
ジャンク ディメンションはデータの保存に役立ちます。 データをスキーマに保存するのが適切でない場合に使用されます。
85) 連鎖データレプリケーションについて説明する
セカンダリ ノードが ping 時間を使用してターゲットを選択する場合、または最も近いノードがセカンダリである場合、これは連鎖データ レプリケーションと呼ばれます。
86) 仮想データウェアハウスについて説明する
仮想データ ウェアハウスは、完成したデータをまとめて表示します。 仮想データ ウェアハウスには履歴データがありません。 メタデータを持った論理的なデータモデルと考えられます。
87) データウェアハウスのスナップショットについて説明する
スナップショットは、データ抽出プロセスが開始された時点のデータを完全に視覚化したものです。
88) 双方向抽出とは何ですか?
データを双方向に抽出、クレンジング、転送するシステムの機能は、方向抽出と呼ばれます。
これらの面接の質問は、あなたの活力(口頭)にも役立ちます