Teradata 튜토리얼: Teradata SQL이란 무엇입니까? 데이터 베이스 Archi강의
테라데이타란?
테라 데이타 대규모 데이터웨어하우징 애플리케이션을 개발하기 위한 오픈소스 데이터베이스 관리 시스템입니다. 이 도구는 병렬성 개념을 사용하여 여러 데이터웨어하우스 작업을 동시에 지원합니다. Teradata는 Unix/Linux/Windows 서버 플랫폼.
테라데이타 소프트웨어는 미국의 IT 기업인 테라데이타 코퍼레이션(Teradata Corporation)에서 개발했습니다. 분석 데이터 플랫폼, 애플리케이션 및 기타 관련 서비스를 제공하는 공급업체입니다. 이 회사는 다양한 소스의 데이터를 통합하고 분석에 사용할 수 있는 제품을 개발합니다.
테라데이타의 역사
Teradata는 NCR Corporation의 사업부였습니다. 1979년에 법인을 설립했지만 2007년 XNUMX월 NCR에서 분리되었습니다. Michael Koehler가 Teradata의 첫 번째 CEO가 되었습니다.
Teradata Corporation의 이정표:
- 1979 – 테라데이타 법인 설립
- 1984 – 최초의 데이터베이스 컴퓨터 DBC/1012 출시
- 1986 – Fortune지는 Teradata를 '올해의 제품'으로 선정했습니다.
- 1999 – 130테라바이트의 Teradata를 사용하여 구축된 최대 규모의 데이터베이스
- 2002 – 압축 및 기본 파티션이 포함된 Teradata V2R5 버전 출시
- 2006 – Teradata 마스터 데이터 관리 솔루션 출시
- 2008 – Active Data Warehousing과 함께 Teradata 13.0 출시
- 2011 – Teradata Aster를 인수하고 고급 분석 분야로 뛰어들었습니다.
- 2012 – Teradata 14.0 출시
- 2014 – Teradata 15.0 출시
- 2015 - Teradata, 앱 마케팅 플랫폼 Appoxee 인수
- 2016년 - 테라다, 빅데이터와 손잡다
- 2017- Teradata, 샌디에이고의 StackIQ 인수
왜 테라데이타인가?
- Teradata는 다음에 초점을 맞춘 완전한 서비스 제품군을 제공합니다. 데이터웨어 하우징
- 이 시스템은 개방형 아키텍처에 기반을 두고 있습니다. 따라서 더 빠른 장치가 출시될 때마다 이미 구축된 아키텍처에 통합할 수 있습니다.
- Teradata는 50페타바이트 이상의 데이터를 지원합니다.
- Service Workstation을 사용한 대규모 Teradata 다중 노드 시스템에 대한 단일 작업 보기
- 다양한 제품과 호환 가능 BI 도구 데이터를 가져옵니다.
- 이는 DBA가 관리하는 단일 제어 지점 역할을 할 수 있습니다. 데이터베이스.
- 고성능, 다양한 쿼리, 데이터베이스 내 분석 및 정교한 워크로드 관리
- Teradata를 사용하면 여러 배포 옵션에서 동일한 데이터를 얻을 수 있습니다
다음으로 이 Teradata 튜토리얼에서는 Teradata의 기능에 대해 알아봅니다.
테라데이타 SQL의 특징
Teradata는 다음과 같은 강력한 기능을 제공합니다.
- 선형 확장성: 시스템 성능을 높이기 위해 노드를 추가하여 대용량 데이터 처리 시 선형 확장성을 제공합니다.
- 무제한 병렬성: 테라데이타는 MPP(대규모 병렬 처리)를 기반으로 합니다. Archi강의). 그래서 처음부터 병렬로 설계되어 있습니다. 큰 작업을 작은 작업으로 나누어 병렬로 실행할 수 있습니다.
- 성숙한 최적화 도구: Teradata Optimizer는 쿼리에서 최대 64개의 조인을 처리할 수 있습니다.
- 낮은 TCO: 테라데이터는 총 소유 비용이 낮습니다. 설정, 유지, 관리가 쉽습니다.
- 로드 및 언로드 유틸리티: Teradata는 Teradata System으로/에서 데이터를 이동하기 위한 로드 및 언로드 유틸리티를 제공합니다.
- 연결성 : 이 MPP 시스템은 메인프레임이나 네트워크 연결 시스템과 같은 채널 연결 시스템에 연결할 수 있습니다.
- SQL : 테라데이타가 지원하는 SQL 테이블에 저장된 데이터와 상호 작용합니다. 확장 기능을 제공합니다.
- 강력한 유틸리티: Teradata는 FastExport, FastLoad, MultiLoad 및 TPT와 같은 Teradata 시스템에서 데이터를 가져오거나 내보낼 수 있는 강력한 유틸리티를 제공합니다.
- 자동 배포: 테라 데이타 수동 개입 없이 자동으로 데이터를 디스크에 배포할 수 있습니다.
다음으로 Teradata SQL 튜토리얼에서는 Teradata에 대해 알아 보겠습니다. Archi강의.
테라 데이타 Archi강의
Teradata 아키텍처는 대규모 병렬 처리입니다. Archi강의.
Teradata의 세 가지 중요한 구성 요소는 다음과 같습니다.
- 파싱 엔진
- 바이넷
- 액세스 모듈 프로세서(AMP)
테라데이타 스토리지 Archi강의 데이터베이스 Archi강의 다이어그램:
테라데이타 스토리지 Archi강의
구문 분석 엔진:
파싱 엔진은 쿼리를 파싱하고 실행 계획을 준비합니다. 사용자의 세션을 관리합니다. 최적화하고 사용자에게 요청을 보냅니다.
따라서 클라이언트가 레코드 삽입을 위한 쿼리를 실행하면 구문 분석 엔진은 해당 레코드를 메시지 전달 계층으로 보냅니다. 메시지 전달 계층 또는 BYNET은 소프트웨어 및 하드웨어 구성 요소입니다. 네트워킹 기능을 제공합니다. 또한 레코드를 검색하고 해당 행을 대상 AMP로 보냅니다.
AMP :
AMP는 Access Module Processor의 약자입니다. 이 디스크에 레코드를 저장합니다. AMP는 다음 활동을 수행합니다.
- 데이터베이스의 일부를 관리합니다.
- 각 테이블의 일부를 관리합니다.
- 정렬, 집계, 조인 등 결과 집합 생성과 관련된 모든 작업을 수행합니다.
- 잠금 및 공간 관리 수행
테라데이터 검색 Archi강의
클라이언트가 레코드를 검색하기 위해 쿼리를 실행하면 구문 분석 엔진이 BYNET에 요청을 보냅니다. 그런 다음 BYNET은 적절한 AMP에 검색 요청을 보냅니다.
AMP는 자신의 디스크를 병렬로 검색하고 필요한 레코드를 인식하여 BYNET으로 보냅니다. BYNET은 레코드를 Parsing Engine으로 보내고, Parsing Engine은 다시 클라이언트로 전송됩니다.
다음으로 Teradata Database 튜토리얼에서는 Teradata SQL 명령에 대해 알아봅니다.
Teradata SQL 명령 유형
Teradata Database는 다음과 같은 기본 SQL 명령을 지원합니다.
- 데이터 정의 언어(DDL) 명령
- DCL(데이터 제어 언어) 명령
- DML(데이터 조작 언어) 명령
데이터 정의 언어 명령
COMMAND | 상품 설명 |
---|---|
몹시 떠들어 대다 | 새로운 데이터베이스, 테이블, 사용자 등을 생성합니다. |
DROP | 새 데이터베이스, 테이블, 사용자 등을 제거합니다. |
바꾸다 | 테이블, 열, 트리거 등을 변경합니다. |
수정 | 데이터베이스 또는 사용자 정의를 변경합니다. |
이름 바꾸기 | 테이블, 뷰, 매크로 등의 이름을 변경합니다. |
데이터 제어 언어 명령
COMMAND | 상품 설명 |
---|---|
부여/취소 | 객체에 대한 사용자의 권한을 제어하는 데 사용됩니다. |
로그온 부여/로그온 취소 | 호스트 또는 호스트 그룹에 대한 로그온 권한을 제어하는 데 사용됩니다. |
주기 | 데이터베이스 개체를 다른 데이터베이스 개체에 제공하는 데 사용됩니다. |
Teradata Database SQL 데이터 조작 언어 명령
COMMAND | 상품 설명 |
---|---|
삭제 | 테이블에서 행을 제거합니다. |
ECHO | 클라이언트에 문자열이나 명령을 에코하는 데 사용됩니다. |
검문소 | 나중에 테이블 내용을 복원하는 데 사용할 수 있는 저널의 복구 지점을 정의합니다. |
SELECT | 특정 행의 데이터를 테이블 형식으로 반환하는 데 사용됩니다. |
UPDATE | 테이블의 하나 이상의 행에 있는 데이터를 수정합니다. |
테라데이타 데이터베이스의 응용
인기 있는 Teradata 애플리케이션은 다음과 같습니다.
- 고객 데이터 관리: 고객과의 지속적인 관계를 유지하는 데 도움이 됩니다.
- 마스터 데이터 관리 : 마스터 데이터를 사용하고, 동기화하고, 저장할 수 있는 환경을 개발하는 데 도움이 됩니다.
- 재무 및 성과 관리: 조직이 재무 보고의 속도와 품질을 개선하는 데 도움이 됩니다. 금융 인프라 비용을 절감하고 기업 성과를 사전에 관리합니다.
- 공급망 관리: 공급망 운영을 개선하면 고객 서비스가 향상되고, 작업 주기가 단축되고, 재고가 줄어듭니다.
- 수요망 관리: 고객 서비스 수준과 매출을 높이는 데 도움이 됩니다. 또한 기업이 매장 품목에 대한 수요를 정확하게 예측하는 데 도움이 됩니다.
다음으로 초보자를 위한 Teradata 튜토리얼에서는 Teradata와 다른 제품 간의 차이점에 대해 알아봅니다. RDBMS.
Teradata와 다른 RDBMS의 차이점
매개 변수 | 테라데이타 | RDBMS |
---|---|---|
Archi강의 | 공유된 내용이 없음을 팔로우함 Archi강의. | 모든 것을 공유하고 리소스 경합을 허용합니다. |
프로세스 | MIPS [수백만 개의 명령/초] | KIPS [수천개 기관/초] |
색인 | 더 나은 배포 및 검색 | FASI 검색만 제공 |
병행 | 무조건 병렬성을 지원합니다. | 병렬성은 조건부이며 예측할 수 없습니다. |
대량 로드 | Teradata는 대량 로드를 허용합니다. | 제한된 대량 로드만 허용합니다. |
확장성 | 기울기가 XNUMX인 선형 확장성 | 수익이 감소하는 확장성 |
데이터베이스 버퍼 | 모든 UoP에서 사용하는 단일 데이터베이스 버퍼(병렬성의 단위). 모든 UoP에서 액세스하는 단일 데이터 저장소 | 쿼리 컨트롤러는 데이터를 소유한 UoP에 기능을 전달합니다. |
판매처 | TERA BYTES[를 저장합니다.Bill행의 이온] | GIGA BYTES[수백만 행] |
MPP 대 SMP
MPP | SMP |
---|---|
MPP – 대규모 병렬 처리. 병렬로 실행되는 많은 독립적인 산술 장치 또는 전체 마이크로프로세서에 부착된 컴퓨터 시스템입니다. | 대칭 다중 처리. SMP 처리 시스템에서 CPU는 동일한 메모리를 공유하므로 한 시스템에서 실행되는 코드는 다른 시스템에서 사용되는 메모리에 영향을 줄 수 있습니다. |
새 CPU를 추가하여 데이터베이스를 확장할 수 있습니다. | SMP 데이터베이스는 일반적으로 하나의 CPU를 사용하여 데이터베이스 검색을 수행합니다. |
MPP 환경에서는 물리적 컴퓨터 간에 리소스를 공유할 필요가 없으므로 성능이 향상됩니다. | 병렬 작업의 워크로드는 시스템의 프로세서 전체에 분산됩니다. |
대규모 병렬 처리 시스템의 성능은 선형적입니다. 단, 노드 수에 비례하여 증가합니다. | SMP 데이터베이스는 여러 서버에서 실행될 수 있습니다. 그러나 다른 리소스를 공유합니다. |
제품 개요
- Teradata 의미: Teradata는 오픈 소스입니다. 데이터베이스 관리 시스템 대규모 데이터 웨어하우징 애플리케이션 개발을 위한 것입니다.
- Teradata는 NCR Corporation의 사업부였습니다. 1979년에 설립되었으나 2007년 XNUMX월 NCR에서 분리되었습니다.
- Teradata는 데이터 웨어하우징에 초점을 맞춘 전체 서비스 제품군을 제공합니다.
- Teradata는 시스템 성능을 높이기 위해 노드를 추가하여 대용량 데이터를 처리할 때 선형 확장성을 제공합니다.
- Teradata의 세 가지 중요한 구성 요소는 1) 구문 분석 엔진 2) MPP 3) 액세스 모듈 프로세서(AMP)입니다.
- Teradata는 모든 조직의 데이터 웨어하우징 및 ETL 요구 사항을 충족하는 완벽한 제품군을 제공합니다.
- 공급망 관리, 마스터 데이터 관리, 수요망 관리 등에 주로 사용되는 Teradata 애플리케이션