Azure Storage Account
여기에 저장된 데이터는 최소 3개의 복사본을 자동으로 갖는다(LRS)
데이터가 자동으로 Azure Datacenter에 백업되지는 않는다
현재 저장 한도는 미국과 유럽의 경우 2PB, 기타 모드 지역은 500TB로 파일 수 제한이 없다
Azure Import Export service
- Storage account로 부터 파일 복사 가능
- Driveset CSV file, dataset CSV file 사전에 필요
- root folder의 Driveset.csv 파일 수정
- dataset.csv도 수정 (파일을 가져올지 폴더를 가져올지에 따아 항목에 추가
Recovery services vault
- 데이터를 보관하는 azure의 저장소 엔티티
- 데이터는 일반적으로 가상 머신, 워크로드, 서버 또는 워크스테이션에 대한 구성 정보 또는 데이터의 복사본. 이 vault를 사용하여 다양한 azure 서비스에 대한 백업 에디터 보관 가능
Azure Storage Account으로 복사된 데이터는 3개 이상의 복사본으로 자동으로 유지 된다
자동으로 다른 data center로 백업 되지는 않는다
Access tier
- hot, cool, archive 3가지 존재
- archive: lowest storage cost, 데이터 검색 비용이 다른거에 비해 높음. 아카이브 계층의 데이터를 검색하는데 몇 시간이 걸릴 수 있음. blob가 archive에 있는 동안에는 오프라인 상태이므로 수정 불가. 읽거나 다운로드 하기 위해서는 온라인 계층으로 rehydrate 해야 함. 장기 백업, 2차 backup, 장기간 저장해야 하며 거의 액세스 되지 않는 데이터에 적합
Azure Databricks
Azure Databricks는 Apache Spark-based analytics service 이다
이 플랫폼은 머신 러닝 라이브러리를 포함한다
Azure Data Lake analytics
can run massively parallel data transformation and processing programs across petabytes of data.
Azure HDInsight
An open-source framework for the distributed processing and analysis of big data sets in clusters.