SSAS-zelfstudie: Wat is SSAS Cube, Architectuur en typen
Wat is SSAS?
SQL Server-analyseservices (SSAS) is een multidimensionale OLAP-server en een analyse-engine waarmee u grote hoeveelheden gegevens kunt opsplitsen. Het maakt deel uit van Microsoft SQL Server en helpt bij het uitvoeren van analyses met behulp van verschillende dimensies. Het heeft 2 varianten Multidimensionaal en Tabelvormig. De volledige SSAS-vorm is SQL Server Analysis Services.
Archistructuur van SSAS
In deze SSAS-zelfstudie gaan we eerst dieper in op de SSAS-architectuur:
De architectuurweergave van SQL Server-analyseservices is gebaseerd op een architectuur met drie lagen, die bestaat uit:
- RDBMS: De gegevens uit verschillende bronnen zoals Excel, Database, Tekst en andere kunnen met behulp van worden opgehaald ETL-tool in het RDBMS.
- SSAS: Geaggregeerde gegevens van RDBMS worden in SSAS-kubussen gepusht met behulp van analyseserviceprojecten. De SSAS-kubussen vormen een analysedatabase en zodra de analysedatabase gereed is, kan deze voor vele doeleinden worden gebruikt.
- Klant: Klanten hebben toegang tot gegevens via dashboards, scorekaarten, portalen enz.
Geschiedenis van SSAS
In deze SSAS-tutorial gaan we nu door de geschiedenis van SSAS:
- De MSOLAP-functie werd voor het eerst opgenomen in SQL Server 7.0. Deze technologie werd later gekocht van een Israëlisch bedrijf genaamd Panorama.
- Al snel worden het de meest gebruikte OLAP-engines omdat het deel uitmaakte van SQL Server.
- SSAS is geheel gerenoveerd met de release van MS-SQL-server 2005
- Deze nieuwste versie biedt ook een functie voor “subcubes” met de Scope-instructie. Dit heeft de functionaliteit van SSAS-kubussen vergroot.
- SSAS 2008R2- en 2012-versies houden zich voornamelijk bezig met queryprestaties en schaalbaarheid
- In Microsoft Excel 2010 kwam met een invoegtoepassing genaamd PowerPivot, die een lokaal exemplaar van de Analysis-service gebruikt met de nieuwe XVelocity-engine die de queryprestaties verbetert
Belangrijke SSAS-terminologie
In deze zelfstudie over het SSAS-tabelmodel leren we enkele belangrijke terminologieën van SSAS:
- Databron
- Gegevensbronweergave
- Kubus
- Maattabel
- Afmeting
- Niveau
- Feitentabel
- Maatregel
- Schema
Databron
Gegevensbron is een soort verbindingsreeks. Het brengt een verbinding tot stand tussen de analysedatabase en RDBMS.
Gegevensbronweergave
De gegevensbronweergave is een logisch model van Database
Kubus
Een kubus is een basisopslageenheid. Het is een verzameling gegevens die is samengevoegd zodat zoekopdrachten snel gegevens kunnen retourneren.
MOLAP
De MOLAP bestaat uit een datakubus die metingen en dimensies bevat. Het omvat alle leden die in een hiërarchische relatie kunnen staan.
Het is een specifieke set regels waarmee u kunt bepalen hoe bepaalde cellen in een sparse cube worden berekend en waarmee u waarden kunt meten die binnen die hiërarchie zijn samengevoegd.
Maattabel
- Een dimensietabel bevat dimensies van een feit.
- Ze worden met behulp van een externe sleutel aan de feitentabel gekoppeld.
- Dimensietabellen zijn gedenormaliseerde tabellen.
- Dimensies bieden kenmerken van de feiten met behulp van hun attributen.
- Not biedt een limiet voor een bepaald aantal dimensies
- De dimensie bevat één of meer hiërarchische relaties.
Afmeting
Dimension biedt de context rondom een bedrijfsprocesgebeurtenis. In eenvoudige bewoordingen geven ze wie, wat, waar een feit weer. In het bedrijfsproces Verkoop zouden de dimensies voor het feit verkoopnummer zijn wie de klant noemt.
- Waar – Locatie
- Wat – Productnaam
- Met andere woorden, je kunt zeggen dat een dimensie een venster is waarin je de informatie in de feiten kunt bekijken.
Niveau
Elk type samenvatting dat uit de enkele dimensie kan worden opgehaald, wordt label genoemd.
Feitentabel
Een feitentabel is de belangrijkste tabel in een dimensionaal model. Een feitentabel bevat metingen/feiten en Vreemde sleutel naar de dimensietabel. Bijvoorbeeld salarisadministratie.
Maatregel
Elke feitentabel bevat een of meer tabellen die moeten worden geanalyseerd. Een boek verkoopt bijvoorbeeld een informatietabel. Het kan winst of verlies zijn voor het aantal verkochte boeken.
Schema
De databank schema van een databasesysteem en de structuur ervan beschreven in een formele taal. Het ondersteunt het databasebeheersysteem. De term 'schema' betekent de organisatie van gegevens als een blauwdruk van de manier waarop de database is opgebouwd.
Type modellen in SSAS
Nu zullen we soorten modellen in SSAS leren in deze SSAS-kubus-tutorial:
Multidimensionaal gegevensmodel
De Multidimensionaal gegevensmodel, die bestaat uit een datakubus. Het is een groep bewerkingen waarmee u de waarde van cellen kunt opvragen door kubus- en dimensieleden als coördinaten te gebruiken.
Het definieert regels die bepalen hoe meetwaarden worden samengevoegd binnen hiërarchieën of hoe specifieke waarden worden berekend in een sparse cube.
Tabellarische modellering
Bij tabellarische modellering worden gegevens in gerelateerde tabellen georganiseerd. De tabel duidt niet aan als “dimensies” of “feiten” en de ontwikkelingstijd is korter bij tabelvorm, omdat alle gerelateerde tabellen beide rollen kunnen vervullen.
Tabelvormig versus multidimensionaal model
parameters | tabellarisch | veelzijdig |
---|---|---|
Geheugen | In geheugencache | Op bestanden gebaseerde opslag |
Structuur | losse structuur | Stijve structuur |
Beste eigenschap | Gegevens hoeven niet van de bron te worden verplaatst | Het is het beste als gegevens in een sterrenschema worden geplaatst. |
Modeltype | Relationeel model | Dimensionaal model |
DAX | MDX | |
Ingewikkeldheid | Eenvoudig | Complex |
Maat: | Kleinere | Grotere |
Belangrijkste kenmerken van SSAS
Essentiële kenmerken van SSAS zijn:
- Het biedt achterwaartse compatibiliteit op API-niveau.
- U kunt OLEDB voor OLAP gebruiken voor de clienttoegang-API en MDX als querytaal.
- SSAS helpt u bij het bouwen van MOLAP-, HOLAP- en ROLAP-architecturen
- Hiermee kunt u werken in de client-servermodus of offlinemodus.
- U kunt de SSAS-tool gebruiken met verschillende wizards en ontwerpers.
- Het maken en beheren van datamodellen is flexibel.
- Pas de applicatie aan met uitgebreide ondersteuning
- Biedt dynamische structuur, ad-hocrapport, gedeelde metadata en beveiligingsfuncties
SSAS versus PowerPivot
Parameter | SSAS | powerpivot |
---|---|---|
Wat is | SSAS Multidimensionaal is “Corporate BI” | Microsoft PowerPivot is een “Self-Service BI |
Deployment | Implementeren in SSAS | Het is geïmplementeerd op SharePoint |
Gebruik voor | Visual Studio-project | Excel |
Maat: | Grootte beperkt tot geheugen | Capaciteit beperkt tot 2 GB. |
Ondersteuning voor partities | Ondersteunt partitionering | Geen partities |
Querytype | DirectQuery en Vertipaq |
Staat alleen Vertipaq toe Queries |
Beheerprogramma's | Hulpmiddelen voor serverbeheer (bijv. SSMS) | Excel en SharePoint “Beheerder” |
Beveiliging | Rijniveau en dynamische beveiliging | Beveiliging van werkmappen |
Voordelen van SSAS
Voordelen/voordelen van SSAS zijn:
- Helpt u om bronconflicten met het bronsysteem te voorkomen
- Het is een ideaal hulpmiddel voor numerieke analyse.
- SSAS maakt het mogelijk datapatronen te ontdekken die misschien niet meteen duidelijk zijn, met behulp van de dataminingfuncties die in het product zijn ingebouwd.
- Het biedt een uniform en geïntegreerd overzicht van al uw bedrijfsgegevens. Rapportage, analyse van Key Performance Indicator (KPI)-scorekaarten. Datamining.
- SSAS biedt online analytische verwerking (OLAP) van gegevens uit verschillende gegevensbronnen.
- Hiermee kunnen gebruikers gegevens analyseren met een groot aantal tools, waaronder SSRS en Excel.
Nadelen van het gebruik van SSAS
- Zodra u een pad (tabelvormig of multidimensionaal) selecteert, kunt u niet naar de andere versie migreren zonder opnieuw te beginnen
- Het is niet toegestaan om gegevens tussen tabellarische en multidimensionale kubussen te ‘samenvoegen’
- Tabular blijkt riskant te zijn als de vereisten halverwege het project veranderen
Best practices voor het gebruik van SSAS
- Optimaliseer het ontwerp van kubussen en meetgroepen
- U moet nuttige aggregaties definiëren
- Gebruik de partitiemethode
- Schrijf efficiënte MDX
- Gebruik de cache van de query-engine efficiënt
- Schaal uit wanneer u niet langer kunt opschalen