Delta Lake UniForm は、レイクハウス内のあらゆるフォーマットやタイプのデータを統合し、効果的な分析や AI ワークロードを実現します。

さまざまなフォーマットに対応
データのフォーマットを問わず、既存の分析ツールや AI ツールを利用できます。UniForm はフォーマット間を即座に自動変換するため、ソースデータの単一コピーを保持したまま、任意のIceberg や Hudi クライアントを使用して Unity Catalog エンドポイントから Delta テーブルを読み込むことができます。UniForm を使用することで、ベンダーのロックインなしにデータのポータビリティを維持できます。
エコシステム全体でつながる
Delta Lake には広範なコネクタエコシステムがあり、複数のフレームワークと言語をサポートしています。Delta Sharing は、セキュアなデータ共有のための新しいオープンプロトコルです。データの場所を問わず、組織内外でのデータ共有を容易にします。Unity Catalog とのネイティブな統合により、組織間の共有データを一元的に管理、監視します。データ資産をベンダーやパートナーとセキュアに共有して連携を強化すると同時に、セキュリティおよびコンプライアンスの要件を満たします。また、主要なツールやプラットフォームとの統合により、任意のツールから共有データを視覚化、クエリ、強化、管理できます。

高速で信頼性の高い性能
Delta Lake は、データ ロードとクエリを他のストレージ形式よりも最大 1.7 倍高速化し、大規模なスケールとスピードを提供します。1 万社以上のお客さまに実運用で使用されている Delta Lake は、単一のパイプラインで1 秒あたり 4,000 万件を超えるイベントを処理できるよう拡張されています。Delta Lake では、1 日あたり 5 エクサバイトを超える処理が行われています。
Delta Lake テーブルで UniForm が有効になっている場合、他のフォーマットのメタデータを書き込んでもクエリ性能が低下することはありません。UniForm テーブルは、ネイティブエンジンの独自フォーマットと同等の読み取り性能を発揮します。

AI が最適な価格性能を実現
Databricks データインテリジェンスプラットフォームは、使用パターンに基づいてデータを最適化します。Databricks データインテリジェンスエンジンである DatabricksIQ が提供するAI主導のパフォーマンス拡張機能により、データの管理、設定、チューニングが自動的に行われます。
リキッドクラスタリング:パーティショニングにつきものの頭痛の種である、高いカーディナリティのカラムをパーティショニングできるかどうかの心配や、パーティションカラムを変更する際の高価 な書き換えをすることなく、十分に調整、パーティショニングされたテーブルのパフォーマンスを提供します。 その結果、最小限の構成で、高速かつ適切にクラスタ化されたテーブルが実現します。
予測最適化:最高のパフォーマンスと価格のためにデータを自動的に最適化します。データの使用パターンから学習し、実行すべき適切な最適化のプランを構築し、超最適化されたサーバーレスインフラ上でそれらの最適化を実行します。

大規模運用のためのセキュリティとガバナンス
Delta Lake は、詳細なアクセス制御によりデータガバナンスを確実にしてリスクを軽減します。これは通常のデータレイクでは不可能です。データレイクのデータを迅速かつ正確に更新し、GDPR をはじめとする規制へのコンプライアンス、監査ログによる高度なデータガバナンスの維持を可能にします。これらのケイパビリティは、レイクハウス初のマルチクラウドデータカタログである Unity Catalog の一部としてDatabricks にネイティブに統合され、拡張されています。



