SSAS-zelfstudie: Wat is SSAS Cube, Architectuur en typen

Wat is SSAS?

SQL Server-analyseservices (SSAS) is een multidimensionale OLAP-server en een analyse-engine waarmee u grote hoeveelheden gegevens kunt opsplitsen. Het maakt deel uit van Microsoft SQL Server en helpt bij het uitvoeren van analyses met behulp van verschillende dimensies. Het heeft 2 varianten Multidimensionaal en Tabelvormig. De volledige SSAS-vorm is SQL Server Analysis Services.

Archistructuur van SSAS

In deze SSAS-zelfstudie gaan we eerst dieper in op de SSAS-architectuur:

Archistructuur van SSAS

De architectuurweergave van SQL Server-analyseservices is gebaseerd op een architectuur met drie lagen, die bestaat uit:

  1. RDBMS: De gegevens uit verschillende bronnen zoals Excel, Database, Tekst en andere kunnen met behulp van worden opgehaald ETL-tool in het RDBMS.
  2. SSAS: Geaggregeerde gegevens van RDBMS worden in SSAS-kubussen gepusht met behulp van analyseserviceprojecten. De SSAS-kubussen vormen een analysedatabase en zodra de analysedatabase gereed is, kan deze voor vele doeleinden worden gebruikt.
  3. Klant: Klanten hebben toegang tot gegevens via dashboards, scorekaarten, portalen enz.

Geschiedenis van SSAS

In deze SSAS-tutorial gaan we nu door de geschiedenis van SSAS:

  • De MSOLAP-functie werd voor het eerst opgenomen in SQL Server 7.0. Deze technologie werd later gekocht van een Israëlisch bedrijf genaamd Panorama.
  • Al snel worden het de meest gebruikte OLAP-engines omdat het deel uitmaakte van SQL Server.
  • SSAS is geheel gerenoveerd met de release van MS-SQL-server 2005
  • Deze nieuwste versie biedt ook een functie voor “subcubes” met de Scope-instructie. Dit heeft de functionaliteit van SSAS-kubussen vergroot.
  • SSAS 2008R2- en 2012-versies houden zich voornamelijk bezig met queryprestaties en schaalbaarheid
  • In Microsoft Excel 2010 kwam met een invoegtoepassing genaamd PowerPivot, die een lokaal exemplaar van de Analysis-service gebruikt met de nieuwe XVelocity-engine die de queryprestaties verbetert

Belangrijke SSAS-terminologie

In deze zelfstudie over het SSAS-tabelmodel leren we enkele belangrijke terminologieën van SSAS:

  • Databron
  • Gegevensbronweergave
  • Kubus
  • Maattabel
  • Afmeting
  • Niveau
  • Feitentabel
  • Maatregel
  • Schema

Databron

Gegevensbron is een soort verbindingsreeks. Het brengt een verbinding tot stand tussen de analysedatabase en RDBMS.

Gegevensbronweergave

De gegevensbronweergave is een logisch model van Database

Kubus

Een kubus is een basisopslageenheid. Het is een verzameling gegevens die is samengevoegd zodat zoekopdrachten snel gegevens kunnen retourneren.

MOLAP

De MOLAP bestaat uit een datakubus die metingen en dimensies bevat. Het omvat alle leden die in een hiërarchische relatie kunnen staan.

Het is een specifieke set regels waarmee u kunt bepalen hoe bepaalde cellen in een sparse cube worden berekend en waarmee u waarden kunt meten die binnen die hiërarchie zijn samengevoegd.

Maattabel

  • Een dimensietabel bevat dimensies van een feit.
  • Ze worden met behulp van een externe sleutel aan de feitentabel gekoppeld.
  • Dimensietabellen zijn gedenormaliseerde tabellen.
  • Dimensies bieden kenmerken van de feiten met behulp van hun attributen.
  • Not biedt een limiet voor een bepaald aantal dimensies
  • De dimensie bevat één of meer hiërarchische relaties.

Afmeting

Dimension biedt de context rondom een ​​bedrijfsprocesgebeurtenis. In eenvoudige bewoordingen geven ze wie, wat, waar een feit weer. In het bedrijfsproces Verkoop zouden de dimensies voor het feit verkoopnummer zijn wie de klant noemt.

  • Waar – Locatie
  • Wat – Productnaam
  • Met andere woorden, je kunt zeggen dat een dimensie een venster is waarin je de informatie in de feiten kunt bekijken.

Niveau

Elk type samenvatting dat uit de enkele dimensie kan worden opgehaald, wordt label genoemd.

Feitentabel

Een feitentabel is de belangrijkste tabel in een dimensionaal model. Een feitentabel bevat metingen/feiten en Vreemde sleutel naar de dimensietabel. Bijvoorbeeld salarisadministratie.

Maatregel

Elke feitentabel bevat een of meer tabellen die moeten worden geanalyseerd. Een boek verkoopt bijvoorbeeld een informatietabel. Het kan winst of verlies zijn voor het aantal verkochte boeken.

Schema

De databank schema van een databasesysteem en de structuur ervan beschreven in een formele taal. Het ondersteunt het databasebeheersysteem. De term 'schema' betekent de organisatie van gegevens als een blauwdruk van de manier waarop de database is opgebouwd.

Type modellen in SSAS

Nu zullen we soorten modellen in SSAS leren in deze SSAS-kubus-tutorial:

Multidimensionaal gegevensmodel

De Multidimensionaal gegevensmodel, die bestaat uit een datakubus. Het is een groep bewerkingen waarmee u de waarde van cellen kunt opvragen door kubus- en dimensieleden als coördinaten te gebruiken.

Het definieert regels die bepalen hoe meetwaarden worden samengevoegd binnen hiërarchieën of hoe specifieke waarden worden berekend in een sparse cube.

Tabellarische modellering

Bij tabellarische modellering worden gegevens in gerelateerde tabellen georganiseerd. De tabel duidt niet aan als “dimensies” of “feiten” en de ontwikkelingstijd is korter bij tabelvorm, omdat alle gerelateerde tabellen beide rollen kunnen vervullen.

Tabelvormig versus multidimensionaal model

parameters tabellarisch veelzijdig
Geheugen In geheugencache Op bestanden gebaseerde opslag
Structuur losse structuur Stijve structuur
Beste eigenschap Gegevens hoeven niet van de bron te worden verplaatst Het is het beste als gegevens in een sterrenschema worden geplaatst.
Modeltype Relationeel model Dimensionaal model
DAX MDX
Ingewikkeldheid Eenvoudig Complex
Maat: Kleinere Grotere

Belangrijkste kenmerken van SSAS

Essentiële kenmerken van SSAS zijn:

  • Het biedt achterwaartse compatibiliteit op API-niveau.
  • U kunt OLEDB voor OLAP gebruiken voor de clienttoegang-API en MDX als querytaal.
  • SSAS helpt u bij het bouwen van MOLAP-, HOLAP- en ROLAP-architecturen
  • Hiermee kunt u werken in de client-servermodus of offlinemodus.
  • U kunt de SSAS-tool gebruiken met verschillende wizards en ontwerpers.
  • Het maken en beheren van datamodellen is flexibel.
  • Pas de applicatie aan met uitgebreide ondersteuning
  • Biedt dynamische structuur, ad-hocrapport, gedeelde metadata en beveiligingsfuncties

SSAS versus PowerPivot

Parameter SSAS powerpivot
Wat is SSAS Multidimensionaal is “Corporate BI” Microsoft PowerPivot is een “Self-Service BI
Deployment Implementeren in SSAS Het is geïmplementeerd op SharePoint
Gebruik voor Visual Studio-project Excel
Maat: Grootte beperkt tot geheugen Capaciteit beperkt tot 2 GB.
Ondersteuning voor partities Ondersteunt partitionering Geen partities
Querytype DirectQuery en
Vertipaq
Staat alleen Vertipaq toe
Queries
Beheerprogramma's Hulpmiddelen voor serverbeheer (bijv. SSMS) Excel en SharePoint “Beheerder”
Beveiliging Rijniveau en dynamische beveiliging Beveiliging van werkmappen

Voordelen van SSAS

Voordelen/voordelen van SSAS zijn:

  • Helpt u om bronconflicten met het bronsysteem te voorkomen
  • Het is een ideaal hulpmiddel voor numerieke analyse.
  • SSAS maakt het mogelijk datapatronen te ontdekken die misschien niet meteen duidelijk zijn, met behulp van de dataminingfuncties die in het product zijn ingebouwd.
  • Het biedt een uniform en geïntegreerd overzicht van al uw bedrijfsgegevens. Rapportage, analyse van Key Performance Indicator (KPI)-scorekaarten. Datamining.
  • SSAS biedt online analytische verwerking (OLAP) van gegevens uit verschillende gegevensbronnen.
  • Hiermee kunnen gebruikers gegevens analyseren met een groot aantal tools, waaronder SSRS en Excel.

Nadelen van het gebruik van SSAS

  • Zodra u een pad (tabelvormig of multidimensionaal) selecteert, kunt u niet naar de andere versie migreren zonder opnieuw te beginnen
  • Het is niet toegestaan ​​om gegevens tussen tabellarische en multidimensionale kubussen te ‘samenvoegen’
  • Tabular blijkt riskant te zijn als de vereisten halverwege het project veranderen

Best practices voor het gebruik van SSAS

  • Optimaliseer het ontwerp van kubussen en meetgroepen
  • U moet nuttige aggregaties definiëren
  • Gebruik de partitiemethode
  • Schrijf efficiënte MDX
  • Gebruik de cache van de query-engine efficiënt
  • Schaal uit wanneer u niet langer kunt opschalen