【1】 進化
 時代ごとに必要とされるものが違ってくる。昔は、データを整理してためておくだけで十分凄い事だった。

データウェアハウスを徹底解説!データベースとの違い・DWH・RDB (BOXIL)

データベース
・最新のデータを貯蓄
・データを見る時は検索
・多種なデータの寄せ集め


である。溜めてあるだけではなく、時間軸に沿って、人間が理解を深める必要が出てきた。

データウェアハウス (ウィキペディア)

直訳すれば「データの倉庫」である。利用者により定義範囲は異なるが、一般に時系列に整理された大量の統合業務データ、もしくはその管理システムを指す。


である。特徴としては、

データウェアハウス(DWH)の4つの要件について (Classmethod)

1.サブジェクトごとに編成されていること(subject oriented)
2.データが統合されていること(integrated)
3.時系列データを持つこと(time variant)
4.データが永続すること(non-volatile)


である。RDBの現在が分かればよいだけではなく、過去も知る必要がある。

null

【2】 最新
 コンピュータ性能が高まるにしたがって、整理自体も使う時に考え、しかも出来る限り多くのデータを保持しておく考え方が必要になってきた。

データレイクとは? (talend)

 多数のソースからのビッグデータを元のままの多様な形式で保持する中央ストレージリポジトリです。
」「
データレイク vs データウェアハウス
・スキーマオンリード(Schema on Read) vs スキーマオンライト(Schema on Write)
・ユーザーのアクセシビリティが複雑 vs 単純
・柔軟 vs 硬直


である。つまり使う時に、データの意味を考えるが故に、使い方うための対応が複雑だが活用の観点では柔軟という事である。英語では、

Data lake (Wikipedia)
[
a system or repository of data stored in its natural/raw format,[1] usually object blobs or files. A data lake is usually a single store of all enterprise data including raw copies of source system data and transformed data used for tasks such as reporting, visualization, advanced analytics and machine learning. A data lake can include structured data from relational databases (rows and columns), semi-structured data (CSV, logs, XML, JSON), unstructured data (emails, documents, PDFs) and binary data (images, audio, video).
]

である。参考にどうぞ。

 この先は、意味や文脈も含めたデータ蓄積だと思う。次回の解説の機会があれば触れたい。


null

★ 菩提心 + ダイス(確率制御)→ ボダイス


★ 一読1クリックで、応援お願いします → null ←

null ◆◆ 注意書き ◆◆  ←必ずお読み下さい。

2014年【8月28日】 ●トランプ2組ゲーム「レットラー」の正しい遊び方

2019年【8月15日】 大腸検査●