Dolt Veritabanı 2.0: SQL verileri için dallar ve taahhütler

kapanış bildirimi

Bu makale İngilizce olarak da mevcuttur. Teknik yardımla tercüme edildi ve yayınlanmadan önce editoryal olarak gözden geçirildi.

Dolt 2.0 ile sürümlü SQL veritabanı depolama motorunda pek çok şey değişiyor. Birkaç temel özellik artık ilk kez varsayılan olarak etkinleştirildi: otomatik çöp toplama ve geçmiş veriler için yeni bir arşiv formatı. Ayrıca vektör verileri için beta desteği ve JSON veya BLOB gibi veri türleri için Uyarlanabilir Depolama adı verilen yeni bir süreç de mevcuttur. Geliştiricilere göre Dolt artık MySQL'den daha iyi Sysbench değerlerine ulaşıyor.

Duyurudan sonra devamını okuyun

Açık kaynaklı proje Dolt, Git'ten sonra modellenen sürüm yönetimine sahip ilişkisel bir veritabanıdır. Geliştiriciler veritabanlarını işleyebilir, dallandırabilir, birleştirebilir ve veri kümeleri arasındaki farkları karşılaştırabilir. Teknik olarak proje, MySQL uyumlu bir SQL katmanını kendi versiyonlu depolama motoruyla birleştiriyor. Dolt, diğer şeylerin yanı sıra işbirliğine dayalı veri bakımı, tekrarlanabilir veri kümeleri, kontroller veya veri mühendisliği iş akışları için kullanılır.

Artık varsayılan olarak etkinleştirilen çöp toplama, artık arka planda referans verilmeyen veri bloklarını kaldırır ve öncelikli olarak büyük veya oldukça dallanmış veritabanlarının çalışmasını basitleştirmeyi amaçlar. Dolt her değişikliği kaydettiği için, özellikle sürümlü veritabanlarında depolama gereksinimleri hızla artıyor. Şimdiye kadar yöneticilerin genellikle temizliği manuel olarak veya planlanmış bir iş aracılığıyla başlatması gerekiyordu. Proje, devam eden operasyonlar sırasında da işe yarayan çevrimiçi atık toplama sistemini zaten uygulamaya koymuştu.

Yeni arşiv formatı da varsayılan olarak etkindir. Geçmiş verileri daha kompakt bir şekilde saklar ve dolayısıyla depolama gereksinimlerini azaltır. Geliştirme sırasında proje %50'ye varan tasarruf kaydetti. Format öncelikle çok sayıda anlık görüntüye veya uzun değişiklik geçmişine sahip veritabanlarını hedeflemektedir ve uzun vadeli arşivleme ve soğuk depolama senaryolarını kolaylaştırmayı amaçlamaktadır.

Performans söz konusu olduğunda DoltHub, Dolt'un genel olarak MySQL'in biraz ilerisinde olduğu kendi Sysbench sonuçlarına atıfta bulunuyor. Sysbench, OLTP iş yükleri için yaygın bir kıyaslama aracıdır ve ekleme, güncelleme ve okuma gibi tipik veritabanı işlemlerini ölçer. Belgelere göre Dolt, yazma işlemleri için MySQL'den yaklaşık %10 daha hızlıdır, okuma erişimi ise %5 civarında hala biraz daha yavaştır. Performans daha önce sürümlü veritabanları için büyük bir engel olarak görülüyordu.

Duyurudan sonra devamını okuyun

Vektör verileri için beta desteği de yenidir. Bunlar, anlamsal arama veya erişim sistemleri için yapay zeka uygulamaları tarafından kullanılanlar gibi sayısal yerleştirmelerdir. Pgvector veya özel vektör veritabanları gibi PostgreSQL uzantıları bile artık benzer işlevler sunuyor. Ancak sürüm notlarında açıkça bir beta durumundan bahsediliyor.

Uyarlanabilir Depolama ile Dolt ayrıca TEXT, JSON, GEOMETRY ve BLOB türleri için yeni bir depolama stratejisi sunuyor. Motor, büyük içeriği dinamik olarak farklı şekilde kodlar veya bu içeriği dış kaynaklardan sağlar. Geliştiriciler, mekanizmayı, büyük değerleri bile gerçek tablo satırlarının dışında otomatik olarak saklayan PostgreSQL'in TOAST'ıyla karşılaştırıyor. Amaç, örneğin büyük JSON belgeleri veya ikili verilerle daha düşük bellek tüketimi ve daha verimli G/Ç erişimidir.

Tüm değişikliklere ilişkin ayrıntılar GitHub'daki sürüm notlarında bulunabilir. Geliştiricilere göre Dolt 2.0, 1.x veritabanlarıyla temelde uyumlu olmaya devam ediyor. Ancak 2.x ile oluşturulan tüm veritabanları eski 1.x istemcileriyle okunamaz. Karma dağıtımları yöneten veya geri alma planlayan herkesin geçiş sırasında bunu dikkate alması gerekir.


(fo)


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir