數據湖和數據倉庫的差別如下:
1、在儲存方面上,數據湖中數據爲非結構化的,所有數據都保持原始形式。存儲所有數據,並且僅在分析時再進行轉換。而數據倉庫就是數據通常從事務系統中提取。
2、在數據抓取中數據湖就是捕獲半結構化和非結構化數據。而數據倉庫則是捕獲結構化數據並將其按模式組織。
3、在架構中數據湖通常,在存儲數據之後定義架構,使用較少的初始工作並提供更大的靈活性。在數據倉庫中存儲數據之前定義架構,這需要清理和規範化數據,這意味着架構的靈活性要低不少。