Deduplikace dat v systému Windows Server 2012

Windows Server 2012 představuje novou funkci Data Deduplikace (Deduplikace dat). Co je deduplikace? Deduplikace dat Obecně se jedná o postup pro nalezení a odstranění duplicitních dat na paměťovém médiu, aniž by byla ohrožena integrita informací. Účelem duplikace je uložit informace do malých bloků (32-128 Kb), identifikovat je stejné (duplicitní bloky) a uložit pouze jednu kopii pro každý blok a nahradit duplicitní bloky odkazy na jednu kopii.

Dříve bylo nutné organizovat deduplikaci pomocí produktů třetích stran (existují hardwarová deduplikační řešení na úrovni diskových polí a software na úrovni souborů). Náklady na taková řešení byla poměrně vysoká, protože jsou primárně zaměřeny na bohaté firemní zákazníky. Tato funkce je nyní zcela zdarma pro všechny uživatele Windows Server 2012.

Existuje malý hack, který vám umožní povolit deduplikaci v klientských operačních systémech (Windows 8 a Windows 8.1). Podrobnosti v článku: Jak povolit deduplikaci dat v systému Windows 8.1

V systému Windows Server 2012 je deduplikace implementována jako dvě součásti:

  • Ovladač filtru, který řídí funkce vstupu / výstupu
  • Deduplikační služby - řídí tři operace („Odběr odpadu“, „Optimalizace“ a „Čištění“).

Tyto komponenty jsou zodpovědné za nalezení odpovídajících dat, organizaci jejich uložení v jednotném čísle a za správný přístup k nim.

Dříve byla deduplikace v produktech společnosti Microsoft nalezena na poštovním serveru Exchange 200/2003/2007 - ve složce Single Instance Storage (pouze jedna kopie zprávy je uložena na serveru v poštovní schránce jednoho z příjemců a zbytek příjemců obdrží pouze odkaz na tuto adresu).

Deduplikace dat v systému Windows Server 2012 běží na pozadí a začíná ve výchozím nastavení každou hodinu. Proces začíná, když je zatížení serveru nízké a nesnižuje celkový výkon serveru. Ve výchozím nastavení jsou soubory, které nebyly přístupné déle než 30 dnů, deduplikovány. Kromě toho se postup neprovádí pro následující typy souborů: aac, aif, aiff, asf, asx, au, avi, flac, jpeg, m3u, uprostřed, midi, mov, mp1, mp2, mp3, mp4, mpa, mpe, MPEG, mpeg2, mpeg3, mpg, ogg, qt, qtw, beran, rm, rmi, rmvb, snd, swf, vob, wav, vosk, wma, wmv, wvx, accdb, accde, accdr, accdt, docm, docx, tečka, dotx, pptm, potm, potx, ppam, ppsx, pptx, sldx, sldm, thmx, xlsx, xlsm, xltx, xltm, xlsb, xlam, xll, eso, oblouk, arj, bhx, b2, kabina, gz, gzip, hpk, hqx, jar, lha, lzh, lzx, pak, jáma, vzácně, moře, sedět, sqz, tgz, uu, uue, z, zip, zoo.

Funkce správy deduplikace je k dispozici z GUI a přes PowerShell. Zvažte obě možnosti.

Grafické uživatelské rozhraní pro deduplikaci dat systému Windows Server 2012

Chcete-li povolit deduplikaci dat, musíte nainstalovat komponentu Data Deduplicaion role File and Storage Services. Můžete to udělat z konzole Server Manahger.

Po dokončení instalace součásti otevřete Správce serveru -> Souborové a úložné služby -> Svazky -> konzola a klepněte pravým tlačítkem myši na sekci, pro kterou chcete povolit deduplikaci, a vyberte Konfigurace deduplikace dat.

V dalším okně zaškrtněte políčko „Povolit deduplikaci dat“. Zde můžete určit adresáře, které nemusí být deduplikovány a nastavení plánovače deduplikace.

Ve sloupci se zobrazí aktuální úroveň deduplikace. Deduplikace Hodnotit (aktualizováno za několik hodin).

Aby bylo možné analyzovat využití místa na disku a možné úspory z umožnění deduplikace pro tento svazek, byl vyvinut nástroj DDPEVAL.exe. Po povolení deduplikace dat můžete odhadnout, kolik místa na disku můžete ušetřit po povolení deduplikace dat pomocí následujícího příkazu (pro velké svazky může vytvořit značné zatížení CPU)

c: \ windows \ system32 \ ddpeval.exe e: \

V mém případě by úspory byly asi 57%.

Deduplikace Powershell

Proces deduplikace lze také řídit z Powershell. Chcete-li to provést, nainstalujte funkci deduplikace dat pomocí příkazů:

Import-Module ServerManager
Add-WindowsFeature - název FS-Data-Deduplication
Deduplikace importního modulu

Po povolení funkce deduplikace musí být tato funkce nakonfigurována. Chcete-li povolit deduplikaci jednotky D:, spusťte příkaz:

Enable-DedupVolume D:

Ve výchozím nastavení jsou soubory, ke kterým nelze přistupovat (Poslední přístup) po dobu delší než 30 dnů, deduplikovány. Tuto hodnotu lze změnit například na 2 dny, za tímto účelem spusťte příkaz:

Set-DedupVolume D: -MinimumFileAgeDays 2

Proces deduplikace je obvykle spuštěn plánovačem systému Windows, ale lze jej také spustit ručně:

Start-DedupJob D: Optimalizace typu

Aktuální statistiky lze zobrazit příkazem:

Get-DedupStatus

Seznam aktuálních úkolů lze najít pomocí příkazu:

Get-DedupJob

Všechny výsledky svazku lze zobrazit příkazem PoSH:

Get-DedupMetadata -Volume D:

A nakonec můžete deduplikaci svazku zcela zrušit příkazem:

Start-DedupJob -Volume D: -Type Unoptimization

Níže uvedený obrázek ukazuje, že po povolení deduplikace na jednotce E: (pro test jsem do ní vložil 4 stejné ISO s Windows 8), se velikost použitého místa na disku snížila z 12 GB na 3 GB.

Služba deduplikace ukládá svou databázi a deduplikované kousky do adresáře System Volume Information. Proto byste v žádném případě neměli ručně zasahovat do její struktury.

Doporučené postupy pro použití deduplikace dat v systému Windows Server 2012

Společnost Microsoft zveřejnila následující výsledky studie o účinnosti duplikace různých typů dat.

Datové typyMožná úspora místa
Obecné údaje50-60%
Docs30-50%
Knihovna aplikací70-80%
Knihovna VHD (X)80-95%

Klíčové vlastnosti deduplikace dat v systému Windows Server 2012:

  • Funguje pouze na svazcích NTFS a nepodporuje systém souborů ReFS.
  • Není podporováno pro spouštěcí a systémové svazky
  • Nepracuje s komprimovanými a šifrovanými soubory NTFS
  • Podporuje ukládání do mezipaměti a BITS
  • Nepodporuje soubory menší než 32 kB
  • Není nakonfigurováno prostřednictvím skupinových zásad
  • Nepodporuje sdílené svazky clusteru
  • Deduplikace - proces není okamžitý a trvá nějakou dobu