Pro operační systém Windows se používají soubory založené na souborech. Microsoft Windows a souborové systémy

Proč smartphone nespouští programy z paměťové karty? Jak se ext4 zásadně liší od ext3? Proč flash disk vydrží déle, když jej naformátujete na NTFS a ne na FAT? Jaký je hlavní problém F2FS? Odpovědi leží ve strukturálních vlastnostech souborových systémů. Budeme o nich mluvit.

Úvod

Souborové systémy určit, jak budou data uložena. Určují, s jakými omezeními se uživatel setká, jak rychlé budou operace čtení a zápisu a jak dlouho bude disk fungovat bez poruch. To platí zejména pro levné SSD a jejich mladší bratry - flash disky. Znáte-li tyto funkce, můžete z jakéhokoli systému vytěžit maximum a optimalizovat jeho využití pro konkrétní úkoly.

Pokaždé, když potřebujete udělat něco netriviálního, musíte zvolit typ a parametry souborového systému. Chcete například urychlit nejběžnější operace se soubory. Toho lze dosáhnout na úrovni souborového systému různé způsoby: Indexování zajistí rychlé vyhledávání a předrezervace volných bloků usnadní přepisování často se měnících souborů. Předběžná optimalizace dat v paměť s náhodným přístupem sníží počet požadovaných I/O operací.

Takové vlastnosti moderních souborových systémů, jako je líný zápis, deduplikace a další pokročilé algoritmy, pomáhají prodloužit dobu bezproblémového provozu. Jsou relevantní zejména pro levné SSD s paměťovými čipy TLC, flash disky a paměťové karty.

Existují samostatné optimalizace pro různé úrovně diskových polí: souborový systém může například podporovat zjednodušené zrcadlení svazku, okamžité vytváření snímků nebo dynamické škálování bez přepnutí svazku do režimu offline.

Černá skříňka

Uživatelé obecně pracují se systémem souborů, který je standardně nabízen operačním systémem. Málokdy vytvářejí nové diskové oddíly a ještě méně často přemýšlejí o jejich nastavení - jednoduše použijí doporučené parametry nebo dokonce koupí předem naformátovaná média.

Pro fanoušky Windows je vše jednoduché: NTFS na všech diskových oddílech a FAT32 (nebo stejný NTFS) na flash discích. Pokud existuje NAS a používá nějaký jiný souborový systém, pak pro většinu zůstává mimo vnímání. Jednoduše se k němu připojí přes síť a stahují soubory jako z černé skříňky.

Na mobilních gadgetech s Androidem se ext4 nejčastěji nachází ve vnitřní paměti a FAT32 na kartách microSD. Yabloko vůbec nezajímá, jaký mají souborový systém: HFS+, HFSX, APFS, WTFS... pro ně jsou jen krásné ikony složek a souborů nakreslené těmi nejlepšími designéry. Uživatelé Linuxu mají nejbohatší výběr, ale můžete přidat podporu pro nenativní souborové systémy ve Windows i macOS – o tom později.

Společné kořeny

Bylo vytvořeno přes sto různých souborových systémů, ale o něco více než tucet lze považovat za aktuální. I když byly všechny vyvinuty pro své vlastní specifické aplikace, mnoho z nich spolu souviselo na koncepční úrovni. Jsou si podobné, protože používají stejný typ struktury reprezentace (meta)dat – B-stromy („bi-stromy“).

Jako každý hierarchický systém začíná B-strom kořenovým záznamem a poté se větví na listové prvky – jednotlivé záznamy souborů a jejich atributy neboli „listy“. Hlavním bodem vytvoření takové logické struktury bylo urychlit vyhledávání objektů souborového systému na velkých dynamických polích - jako pevné disky s kapacitou několika terabajtů nebo ještě působivějšími poli RAID.

B-stromy vyžadují mnohem méně přístupů na disk než jiné typy vyvážených stromů k provádění stejných operací. Toho je dosaženo díky tomu, že finální objekty v B-stromech jsou hierarchicky umístěny ve stejné výšce a rychlost všech operací je přesně úměrná výšce stromu.

Stejně jako ostatní vyvážené stromy mají B-stromy stejnou délku cesty od kořene k jakémukoli listu. Místo toho, aby rostly nahoru, více se větví a rozšiřují: všechny body větvení v B-stromu ukládají mnoho odkazů na podřízené objekty, takže je lze snadno najít za méně volání. Velké množství ukazatelů snižuje počet časově nejnáročnějších diskových operací – polohování hlavy při čtení libovolných bloků.

Koncept B-stromů byl formulován již v sedmdesátých letech a od té doby prošel různými vylepšeními. V té či oné podobě je implementován v NTFS, BFS, XFS, JFS, ReiserFS a mnoha DBMS. Všichni jsou příbuzní z hlediska základních principů organizace dat. Rozdíly se týkají detailů, často dost důležitých. Související souborové systémy mají také společnou nevýhodu: všechny byly vytvořeny pro specifickou práci s disky ještě před příchodem SSD.

Flash paměť jako motor pokroku

Jednotky SSD postupně nahrazují diskové jednotky, ale prozatím jsou nuceny používat souborové systémy, které jsou jim cizí, předávané děděním. Jsou postaveny na flash paměťových polích, jejichž principy fungování se liší od principů diskových zařízení. Zejména flash paměť musí být před zápisem vymazána, což je operace, kterou čipy NAND nemohou provádět na úrovni jednotlivých buněk. Je to možné pouze u velkých bloků zcela.

Toto omezení je způsobeno tím, že v paměti NAND jsou všechny buňky sloučeny do bloků, z nichž každý má pouze jedno společné připojení k řídicí sběrnici. Nebudeme zabíhat do podrobností o organizaci stránky a popisovat kompletní hierarchii. Důležitý je samotný princip skupinových operací s buňkami a skutečnost, že velikosti bloků flash paměti jsou obvykle větší než bloky adresované v jakémkoli souborovém systému. Proto musí být všechny adresy a příkazy pro disky s NAND flash přeloženy přes abstrakční vrstvu FTL (Flash Translation Layer).

Kompatibilitu s logikou diskových zařízení a podporu příkazů jejich nativních rozhraní zajišťují řadiče flash pamětí. Typicky je FTL implementováno v jejich firmwaru, ale může být (částečně) implementováno na hostiteli - například Plextor píše ovladače pro své SSD, které urychlují zápis.

Bez FTL se to neobejde, protože i zápis jednoho bitu do konkrétní buňky spouští celou řadu operací: řadič najde blok obsahující požadovanou buňku; blok je celý přečten, zapsán do mezipaměti nebo do volného místa, poté zcela vymazán a poté je přepsán zpět s nezbytnými změnami.

Tento přístup připomíná každodenní život v armádě: Aby mohl seržant dát rozkaz jednomu vojákovi, sestaví všeobecnou formaci, povolá chudáka z formace a ostatním přikáže, aby se rozešli. V dnes již vzácné paměti NOR byly organizací speciální jednotky: každá buňka byla řízena nezávisle (každý tranzistor měl individuální kontakt).

Úkoly pro řadiče přibývají, protože s každou generací flash paměti klesá technický proces její výroby, aby se zvýšila hustota a snížily náklady na ukládání dat. Spolu s technologickými standardy se snižuje i odhadovaná životnost čipů.

Moduly s jednoúrovňovými buňkami SLC měly deklarovaný zdroj 100 tisíc přepisovacích cyklů a ještě více. Mnoho z nich stále funguje na starých flash discích a CF kartách. Pro enterprise-class MLC (eMLC) byl zdroj deklarován v rozmezí 10 až 20 tisíc, zatímco pro běžné spotřebitelské MLC se odhaduje na 3-5 tisíc. Paměti tohoto typu aktivně ždímají ještě levnější TLC, jejichž zdroje sotva dosahují tisíce cyklů. Udržet životnost flash paměti na přijatelné úrovni vyžaduje softwarové triky a jedním z nich se stávají nové souborové systémy.

Zpočátku výrobci předpokládali, že souborový systém není důležitý. Samotný řadič musí obsluhovat krátkodobou řadu paměťových buněk jakéhokoli typu a rozdělovat mezi ně zátěž optimálním způsobem. Pro ovladač souborového systému simuluje běžný disk a sám provádí nízkoúrovňové optimalizace pro jakýkoli přístup. V praxi však optimalizace různá zařízení se liší od magických po fiktivní.

U podnikových SSD je vestavěným řadičem malý počítač. Má velkou vyrovnávací paměť (půl gigabajtu nebo více) a podporuje mnoho technik efektivity dat, aby se zabránilo zbytečným přepisovacím cyklům. Čip organizuje všechny bloky v mezipaměti, provádí líné zápisy, provádí deduplikaci za běhu, rezervuje některé bloky a jiné vymaže na pozadí. Všechna tato kouzla se dějí zcela bez povšimnutí OS, programů a uživatele. U takového SSD je opravdu jedno, jaký souborový systém je použit. Interní optimalizace mají mnohem větší dopad na výkon a zdroje než ty externí.

Levné SSD (a ještě více flash disky) jsou vybaveny mnohem méně chytrými ovladači. Mezipaměť v nich je omezená nebo chybí a pokročilé serverové technologie se vůbec nepoužívají. Ovladače v paměťových kartách jsou tak primitivní, že se často tvrdí, že vůbec neexistují. Pro levná zařízení s flash pamětí proto zůstávají relevantní externí metody vyvažování zátěže – především pomocí specializovaných souborových systémů.

Od JFFS po F2FS

Jedním z prvních pokusů napsat souborový systém, který by zohledňoval principy organizace flash paměti, byl JFFS – Journaling Flash File System. Původně byl tento vývoj švédské společnosti Axis Communications zaměřen na zvýšení paměťové efektivity síťových zařízení, které Axis vyráběl v devadesátých letech. První verze JFFS podporovala pouze paměť NOR, ale již ve druhé verzi se spřátelila s NAND.

V současné době má JFFS2 omezené použití. Stále se používá hlavně v linuxových distribucích pro vestavěné systémy. Nachází se v routerech, IP kamerách, NAS a dalších stálicích internetu věcí. Obecně všude tam, kde je vyžadováno malé množství spolehlivé paměti.

Dalším pokusem o vývoj JFFS2 byl LogFS, který ukládal inody do samostatného souboru. Autory této myšlenky jsou Jorn Engel, zaměstnanec německé divize IBM, a Robert Mertens, učitel na univerzitě v Osnabrücku. Zdroj LogFS je k dispozici na GitHubu. Soudě podle toho, že poslední změna byl vyroben před čtyřmi lety, LogFS si nikdy nezískal popularitu.

Tyto pokusy však podnítily vznik dalšího specializovaného souborového systému – F2FS. Byl vyvinut společností Samsung Corporation, která tvoří značnou část flash paměti vyráběné ve světě. Samsung vyrábí čipy NAND Flash pro svá vlastní zařízení i pro jiné společnosti a také vyvíjí SSD se zásadně novými rozhraními namísto starších diskových. Vytvoření specializovaného souborového systému optimalizovaného pro flash paměti bylo z pohledu Samsungu dlouho opožděnou nutností.

Před čtyřmi lety, v roce 2012, Samsung vytvořil F2FS (Flash Friendly File System). Její nápad byl dobrý, ale realizace se ukázala jako hrubá. Klíčový úkol při vytváření F2FS byl jednoduchý: snížit počet operací přepisu buněk a rozložit na ně zátěž co nejrovnoměrněji. To vyžaduje provádění operací na více buňkách ve stejném bloku současně, spíše než je vynucovat jednu po druhé. To znamená, že není potřeba okamžité přepisování existujících bloků na první žádost OS, ale ukládání příkazů a dat do mezipaměti, přidávání nových bloků do volného místa a zpožděné mazání buněk.

Dnes je již podpora F2FS v Linuxu (a potažmo v Androidu) oficiálně implementována, ale v praxi zatím nepřináší žádné zvláštní výhody. Hlavní rys tohoto souborového systému (líné přepisování) vedl k předčasným závěrům o jeho účinnosti. Starý trik s ukládáním do mezipaměti dokonce oklamal rané verze benchmarků, kde F2FS prokázalo pomyslnou výhodu ne o pár procent (jak se očekávalo), nebo dokonce o několiknásobek, ale o řády. Ovladač F2FS jednoduše ohlásil dokončení operace, kterou ovladač právě plánoval provést. Pokud je ale skutečný výkonový zisk pro F2FS malý, tak opotřebení článků bude určitě menší než při použití stejného ext4. Ty optimalizace, které levný řadič neumí, budou provedeny na úrovni samotného souborového systému.

Rozsahy a bitmapy

F2FS je prozatím pro geeky vnímáno jako exotické. I ve svém vlastním smartphony Samsung ext4 stále platí. Mnozí to považují za další vývoj ext3, ale není to tak úplně pravda. Jde spíše o revoluci než o prolomení hranice 2 TB na soubor a pouhé zvýšení dalších kvantitativních ukazatelů.

Když byly počítače velké a soubory malé, adresování nebyl problém. Každému souboru byl přidělen určitý počet bloků, jejichž adresy byly zaneseny do korespondenční tabulky. Takto fungoval souborový systém ext3, který funguje dodnes. Ale v ext4 se objevil zásadně odlišný způsob adresování - rozsahy.

Oblasti lze považovat za rozšíření inodů jako diskrétní sady bloků, které jsou zcela adresovány jako souvislé sekvence. Jeden rozsah může obsahovat celý středně velký soubor, ale pro velké soubory stačí přidělit tucet nebo dva rozsahy. To je mnohem efektivnější než adresování stovek tisíc malých bloků o čtyřech kilobajtech.

Samotný nahrávací mechanismus se v ext4 také změnil. Nyní jsou bloky distribuovány okamžitě v jedné žádosti. A to ne předem, ale bezprostředně před zápisem dat na disk. Líná alokace více bloků vám umožňuje zbavit se zbytečných operací, kterými se ext3 provinil: v něm byly bloky pro nový soubor alokovány okamžitě, i když se celý vešel do mezipaměti a byl plánován jako dočasné smazání.


Dieta s omezením TUKU

Kromě vyvážených stromů a jejich modifikací existují další oblíbené logické struktury. Existují souborové systémy se zásadně odlišným typem organizace – například lineární. Pravděpodobně alespoň jeden z nich používáte často.

Tajemství

Hádejte hádanku: ve dvanácti začala přibírat, v šestnácti byla hloupá tlustá a ve dvaatřiceti ztloustla a zůstala prosťáčka. Kdo je ona?

Správně, toto je příběh o systému souborů FAT. Požadavky na kompatibilitu jí zajistily špatnou dědičnost. Na disketách to bylo 12bitové, zap pevné disky- nejprve to bylo 16bitové, ale do dnešních dnů se dostalo jako 32bitové. V každé další verzi se počet adresovatelných bloků zvyšoval, ale na její podstatě se nic nezměnilo.

Stále oblíbený souborový systém FAT32 se objevil před dvaceti lety. Dnes je stále primitivní a nepodporuje seznamy řízení přístupu, diskové kvóty, kompresi na pozadí ani jiné moderní technologie optimalizace zpracování dat.

Proč je v dnešní době potřeba FAT32? Vše je stále pouze pro zajištění kompatibility. Výrobci se správně domnívají, že oddíl FAT32 může číst jakýkoli OS. Proto jej vytvářejí na externích pevných discích, USB Flash a paměťové karty.

Jak uvolnit flash paměť smartphonu

Karty microSD(HC) používané v chytrých telefonech jsou ve výchozím nastavení naformátovány na FAT32. To je hlavní překážkou instalace aplikací na ně a přenosu dat z interní paměti. Abyste to překonali, musíte na kartě vytvořit oddíl s ext3 nebo ext4. Lze do něj přenést všechny atributy souborů (včetně vlastníka a přístupových práv), takže jakákoli aplikace může fungovat, jako by byla spuštěna z vnitřní paměti.

Windows neumí vytvořit více než jeden oddíl na flash discích, ale za tímto účelem můžete spustit Linux (alespoň ve virtuálním stroji) nebo pokročilý nástroj pro práci s logickými oddíly - například MiniTool Partition Wizard Free. Po objevení dalšího primárního oddílu s ext3/ext4 na kartě nabídne aplikace Link2SD a podobné mnohem více možností než v případě jednoho oddílu FAT32.


Další argument ve prospěch výběru FAT32 je často uváděn jako nedostatek žurnálování, což znamená rychlejší operace zápisu a menší opotřebení paměťových buněk NAND Flash. V praxi vede použití FAT32 k opaku a přináší mnoho dalších problémů.

Flash disky a paměťové karty rychle umírají kvůli skutečnosti, že jakákoli změna v FAT32 způsobí přepsání stejných sektorů, kde jsou umístěny dva řetězce tabulek souborů. Uložil jsem celou webovou stránku a byla stokrát přepsána - s každým přidáním dalšího malého GIF na flash disk. Spustili jste přenosný software? Vytváří dočasné soubory a za běhu je neustále mění. Proto je mnohem lepší používat NTFS na flash discích s tabulkou $MFT odolnou proti selhání. Malé soubory lze ukládat přímo do hlavní tabulky souborů a její přípony a kopie se zapisují do různých oblastí flash paměti. Indexování NTFS navíc zrychluje vyhledávání.

INFO

Pro FAT32 a NTFS nejsou teoretická omezení úrovně vnoření specifikována, ale v praxi jsou stejná: v adresáři první úrovně lze vytvořit pouze 7707 podadresářů. Ti, kteří si rádi hrají na matrjošky, to ocení.

Dalším problémem, se kterým se většina uživatelů potýká, je, že není možné zapsat soubor větší než 4 GB na oddíl FAT32. Důvodem je, že ve FAT32 je velikost souboru popsána 32 bity v alokační tabulce souborů a 2^32 (mínus jeden, abych byl přesný) jsou přesně čtyři koncerty. Ukazuje se, že na čerstvě zakoupenou flashku nelze zapsat ani film v běžné kvalitě, ani obraz DVD.

Kopírování velkých souborů není tak špatné: když se o to pokusíte, chyba je alespoň okamžitě viditelná. V jiných situacích funguje FAT32 jako časovaná bomba. Přenosný software jste si například zkopírovali na flash disk a zpočátku jej bez problémů používáte. Po dlouhé době se některý z programů (například účetnictví nebo email), databáze nafoukne a... prostě se přestane aktualizovat. Soubor nelze přepsat, protože dosáhl limitu 4 GB.

Méně zřejmým problémem je, že v systému FAT32 lze datum vytvoření souboru nebo adresáře zadat do dvou sekund. To není dostatečné pro mnoho kryptografických aplikací, které používají časová razítka. Nízká přesnost atributu data je dalším důvodem, proč FAT32 není z hlediska zabezpečení považován za platný souborový systém. Jeho slabiny však lze využít i pro vlastní účely. Pokud například zkopírujete jakékoli soubory z oddílu NTFS na svazek FAT32, budou z nich vymazána všechna metadata a také zděděná a speciálně nastavená oprávnění. FAT je prostě nepodporuje.

exFAT

Na rozdíl od FAT12/16/32 byl exFAT vyvinut speciálně pro USB Flash a velké (≥ 32 GB) paměťové karty. Rozšířený FAT odstraňuje výše zmíněnou nevýhodu FAT32 - přepisování stejných sektorů při jakékoliv změně. Jako 64bitový systém nemá prakticky významná omezení velikosti jednoho souboru. Teoreticky může mít délku 2^64 bajtů (16 EB) a karty této velikosti se brzy neobjeví.

Dalším zásadním rozdílem mezi exFAT je jeho podpora pro přístupové seznamy (ACL). To už není stejný prosťáček z devadesátých let, ale uzavřenost formátu brání implementaci exFAT. Podpora ExFAT je plně a legálně implementována pouze ve Windows (od XP SP2) a OS X (od 10.6.5). Na Linuxu a *BSD je podporován buď s omezeními, nebo ne zcela legálně. Microsoft vyžaduje licencování pro použití exFAT a v této oblasti existuje mnoho právních sporů.

Btrfs

Další významný zástupce souborových systémů založených na B-stromech se nazývá Btrfs. Tento FS se objevil v roce 2007 a původně byl vytvořen v Oracle s ohledem na práci s SSD a RAID. Lze jej například dynamicky škálovat: vytvářet nové inody přímo na běžícím systému nebo rozdělovat svazek na podsvazky, aniž byste je přidělovali volný prostor.

Mechanismus copy-on-write implementovaný v Btrfs a plná integrace s modulem Device mapper kernel vám umožňují pořizovat téměř okamžité snímky prostřednictvím virtuálních blokových zařízení. Předkomprese (zlib nebo lzo) a deduplikace urychlují základní operace a zároveň prodlužují životnost flash paměti. To je patrné zejména při práci s databázemi (je dosaženo 2-4násobné komprese) a malými soubory (jsou zapisovány v uspořádaných velkých blocích a lze je ukládat přímo do „listů“).

Btrfs také podporuje úplný režim protokolování (data a metadata), kontrolu objemu bez odpojení a mnoho dalších moderních funkcí. Kód Btrfs je publikován pod licencí GPL. Tento souborový systém je v Linuxu podporován jako stabilní od verze jádra 4.3.1.

Deníky

Téměř všechny více či méně moderní souborové systémy (ext3/ext4, NTFS, HFSX, Btrfs a další) patří do obecné skupiny žurnálovaných, protože uchovávají záznamy o provedených změnách v samostatném protokolu (žurnálu) a jsou proti němu kontrolovány v případ selhání během diskových operací . Nicméně granularita protokolování a odolnost proti chybám těchto systémů souborů se liší.

Ext3 podporuje tři režimy protokolování: s zpětná vazba, organizované a kompletní protokolování. První režim zahrnuje zaznamenávání pouze obecných změn (metadat), prováděných asynchronně s ohledem na změny v samotných datech. Ve druhém režimu se provádí stejný záznam metadat, ale přísně před provedením jakýchkoli změn. Třetí režim je ekvivalentní úplnému protokolování (změny jak v metadatech, tak v samotných souborech).

Pouze poslední možnost zajišťuje integritu dat. Zbývající dva pouze urychlují detekci chyb během kontroly a zaručují obnovení integrity samotného souborového systému, nikoli však obsahu souborů.

Žurnálování v NTFS je podobné druhému režimu protokolování v ext3. Do protokolu se zapisují pouze změny metadat a samotná data mohou být v případě poruchy ztracena. Tato metoda protokolování v NTFS nebyla zamýšlena jako způsob dosažení maximální spolehlivosti, ale pouze jako kompromis mezi výkonem a odolností proti chybám. To je důvod, proč lidé, kteří jsou zvyklí pracovat s plně žurnálovanými systémy, zvažují pseudožurnálování NTFS.

Přístup implementovaný v NTFS je v některých ohledech dokonce lepší než výchozí v ext3. Systém NTFS navíc pravidelně vytváří kontrolní body, aby zajistil dokončení všech dříve odložených diskových operací. Kontrolní body nemají nic společného s body obnovy v \System Volume Information\ . Toto jsou pouze záznamy protokolu služeb.

Praxe ukazuje, že takovéto částečné žurnálování NTFS ve většině případů pro bezproblémový provoz postačuje. Disková zařízení totiž neztrácejí energii okamžitě ani při náhlém výpadku proudu. Napájecí zdroj a četné kondenzátory v samotných jednotkách poskytují jen minimální množství energie, které stačí k dokončení aktuální operace zápisu. U moderních SSD disků s jejich rychlostí a efektivitou obvykle stačí stejné množství energie k provedení nevyřízených operací. Pokus o přechod na úplné protokolování by výrazně snížil rychlost většiny operací.

Připojení souborů třetích stran v systému Windows

Použití souborových systémů je omezeno jejich podporou na úrovni OS. Windows si například nerozumí s ext2/3/4 a HFS+, ale někdy je nutné je použít. To lze provést přidáním příslušného ovladače.

VAROVÁNÍ

Většina ovladačů a pluginů pro podporu systémů souborů třetích stran má svá omezení a ne vždy fungují stabilně. Mohou být v konfliktu s jinými ovladači, antiviry a virtualizačními programy.

Otevřený ovladač pro čtení a zápis ext2/3 oddílů s částečnou podporou ext4. V Nejnovější verze jsou podporovány oblasti a oddíly až do 16 TB. LVM, seznamy řízení přístupu a rozšířené atributy nejsou podporovány.


Existuje bezplatný plugin Pro Total Commander. Podporuje čtení ext2/3/4 oddílů.


coLinux je otevřený a bezplatný port linuxového jádra. Spolu s 32bitovým ovladačem vám umožňuje provozovat Linux Prostředí Windows od roku 2000 do 7 bez použití virtualizačních technologií. Podporuje pouze 32bitové verze. Vývoj 64bitové modifikace byl zrušen. coLinux umožňuje mimo jiné organizovat z Windows přístup do oddílů ext2/3/4. Podpora projektu byla v roce 2014 pozastavena.

Windows 10 již může mít vestavěnou podporu pro konkrétní Linux soubor systémy, je to jen skryté. Tyto myšlenky navrhuje ovladač na úrovni jádra Lxcore.sys a služba LxssManager, která je načtena jako knihovna procesem Svchost.exe. Další informace o tom najdete ve zprávě Alexe Ionesca „Linuxové jádro skryté uvnitř Windows 10“, kterou přednesl na Black Hat 2016.


ExtFS pro Windows je placený ovladač od Paragonu. Běží na Windows 7 až 10 a podporuje přístup pro čtení/zápis do svazků ext2/3/4. Poskytuje téměř kompletní podporu pro ext4 ve Windows.

HFS+ pro Windows 10 je další proprietární ovladač od Paragon Software. Navzdory názvu funguje ve všech Verze Windows počínaje XP. Poskytuje plný přístup k systémům souborů HFS+/HFSX na discích s libovolným rozložením (MBR/GPT).

WinBtrfs je raný vývoj ovladače Btrfs pro Windows. Již ve verzi 0.6 podporuje přístup pro čtení i zápis do svazků Btrfs. Zvládne pevné i symbolické odkazy, podporuje alternativní datové toky, ACL, dva typy komprese a asynchronní režim čtení/zápisu. Zatímco WinBtrfs neví, jak používat mkfs.btrfs, btrfs-balance a další nástroje k údržbě tohoto souborového systému.

Schopnosti a omezení souborových systémů: souhrnná tabulka

Souborový systém Maximální velikost svazku Omezte velikost jednoho souboru Délka správného názvu souboru Délka celého názvu souboru (včetně cesty od kořenového adresáře) Omezte počet souborů a/nebo adresářů Přesnost indikace data souboru/adresáře Práva dos-tu-pa Pevné odkazy Symbolické odkazy Momentky Komprese dat na pozadí Šifrování dat na pozadí Dědeček-ple-ka-tion dat
FAT16 2 GB v 512 bajtových sektorech nebo 4 GB v 64 kB clusterech 2 GB 255 bajtů s LFN - - - - - - - - - -
FAT32 8 TB sektorů po 2 KB 4 GB (2^32 – 1 bajt) 255 bajtů s LFN až 32 podadresářů s CDS 65460 10 ms (vytvořit) / 2 s (upravit) Ne Ne Ne Ne Ne Ne Ne
exFAT ≈ 128 PB (2^32-1 shluky 2^25-1 bajtů) teoreticky / 512 TB kvůli omezením třetích stran 16 EB (2^64 – 1 bajt) 2796202 v katalogu 10 ms ACL Ne Ne Ne Ne Ne Ne
NTFS 256 TB v klastrech o velikosti 64 kB nebo 16 TB v klastrech o velikosti 4 kB 16 TB (Win 7) / 256 TB (Win 8) 255 znaků Unicode (UTF-16) 32 760 znaků Unicode, maximálně 255 znaků na prvek 2^32-1 100 ns ACL Ano Ano Ano Ano Ano Ano
HFS+ 8 EB (2^63 bajtů) 8 EB 255 znaků Unicode (UTF-16) samostatně neomezené 2^32-1 1 s Unix, ACL Ano Ano Ne Ano Ano Ne
APFS 8 EB (2^63 bajtů) 8 EB 255 znaků Unicode (UTF-16) samostatně neomezené 2^63 1 ns Unix, ACL Ano Ano Ano Ano Ano Ano
Ext3 32 TB (teoreticky) / 16 TB ve 4 kB clusterech (kvůli omezení programů e2fs) 2 TB (teoreticky) / 16 GB pro starší programy 255 znaků Unicode (UTF-16) samostatně neomezené - 1 s Unix, ACL Ano Ano Ne Ne Ne Ne
Ext4 1 EB (teoreticky) / 16 TB ve 4 KB clusterech (kvůli omezení programů e2fs) 16 TB 255 znaků Unicode (UTF-16) samostatně neomezené 4 miliardy 1 ns POSIX Ano Ano Ne Ne Ano Ne
F2FS 16 TB 3,94 TB 255 bajtů samostatně neomezené - 1 ns POSIX, ACL Ano Ano Ne Ne Ano Ne
BTRFS 16 EB (2^64 – 1 bajt) 16 EB 255 znaků ASCII 2^17 bajtů - 1 ns POSIX, ACL Ano Ano Ano Ano Ano Ano

Souborový systém- Část operační systém, který řídí umístění a přístup k souborům a adresářům na disku.

Přístup– postup pro navázání komunikace s pamětí a soubory v ní umístěnými pro zápis a čtení dat.

Soubor- logicky související sbírka dat nebo programů pro umístění externí paměť je přidělena pojmenovaná oblast.

Soubor slouží jako účetní jednotka informací v OS. Jakékoli akce s informacemi v OS se provádějí se soubory: zápis na disk, zobrazení, zadávání z klávesnice, tisk, čtení informací atd.

K charakterizaci souboru se používají následující parametry:

Celé jméno;

Objem v bajtech;

Datum vytvoření;

Čas vytvoření;

Speciální atributy: R (pouze pro čtení) – pouze pro čtení, H (skryté) – skrytý soubor, S (systém) – systémový soubor, A (Archiv) – archivovaný soubor.

Atributy jsou další parametry, které definují vlastnosti souboru. Operační systém vám je umožňuje ovládat a měnit; stav atributů se bere v úvahu při provádění automatických operací se soubory. Účel atributů je uveden v tabulce. 2.1.

Tabulka 2.1

Atribut Účel
Pouze na čtení Omezuje možnost práce se souborem – zakazuje v něm provádět změny
Skrytý Signalizuje operačnímu systému, že tento soubor by se neměly zobrazovat na obrazovce během operací se soubory, určené k ochraně před náhodným (úmyslným nebo neúmyslným) poškozením souboru
Konec stolu. 2.1
Systém Označuje soubory, které mají důležité funkce v provozu samotného operačního systému. Jeho charakteristický rys Problém je, že to nelze změnit pomocí operačního systému. Zpravidla většina souborů, které mají nastavit atribut„Systém“ má také nastaven atribut „Skrytý“.
Archivováno Dříve používané ke spouštění programů Rezervovat kopii. V současné době se nepoužívá

Na disku soubor nevyžaduje pro své umístění souvislé místo, může zabírat volné shluky v různých částech disku. Cluster je minimální jednotka místa na disku, která může být přidělena souboru. Soubor může zabírat jeden cluster nebo několik desítek
v závislosti na množství informací obsažených v souboru. Velikost clusteru (4K, 8K, 16K, 32 KB atd.) závisí na typu systému souborů (FAT, HPFS, NTFS) a kapacitě disku.

Systém souborů FAT(File Allocation Table) je alokační tabulka souborů pro DOS a Windows 9x, původně vyvinutá pro diskety. Výhodou FAT je jeho široké využití a podpora většinou operačních systémů. Existují FAT16 a FAT32, které používají pro adresování 16 a 32 bitů, což vede k adresování 2 16 a 2 32 klastrů. Systém souborů FAT16 umožňuje adresovat 2 16 = 65 536 clusterů. Výsledkem je, že pro logický disk s kapacitou 500 MB zabírá každý cluster 8 KB a pro disk 1,0 GB se velikost clusteru stane 16 KB. Při ukládání malého souboru (méně než 1 KB) tedy nebude podstatná část clusteru využita. Čím větší je velikost oddílu pevný disk, čím větší je minimální množství nedělitelné paměti přidělené souboru a tím větší jsou ztráty. Tyto ztráty jsou výrazně sníženy při použití efektivnějších souborových systémů. souborový systém HPFS(High Performance File System) umožňuje překonat řadu dalších nevýhod FAT.



Například při použití HPFS:

Rychlost vyhledávání souboru a práce s ním se zvyšuje díky tomu, že informace o souboru jsou umístěny vedle samotného souboru;

Eliminuje fragmentaci souborů, která snižuje výkon systému a opotřebovává disky.

Podobného efektu je dosaženo použitím souborového systému NTFS (Windows NT). Souborový systém NTFS(NT File System) - vyvinutý společností Microsoft, je vývojem souborového systému HPFS. Podporuje disky do velikosti 16 777 216 terabajtů a obsahuje dvě kopie MFT (Master File Table) s transakčním systémem (požadavky na změnu dat) při zápisu souborů na disk, což zvyšuje spolehlivost. NTFS zaručuje bezpečnost dat v případě kopírování, přesouvání nebo mazání souborů nebo složek, i když dojde k selhání hardwaru nebo výpadku napájení.



Soubory mohou ukládat různé typy a formy prezentace informací: texty, obrázky, výkresy, čísla, programy, tabulky atd. Vlastnosti konkrétní soubory určuje jejich formát. Pod formát je chápán jako jazykový prvek, který symbolicky popisuje reprezentaci informací v souboru.

Logické jednotky, na které se zapisují soubory, se nazývají operační systém A:, B:, C:, D: atd. Disky jsou organizovány adresáře (složky)– adresáře souborů označující jejich umístění na disku. Adresáře ukládají úplné názvy souborů a také charakteristiky, jako je datum a čas vytvoření, velikost v bajtech a speciální atributy. Soubory se spojují do adresářů podle jakékoli společné charakteristiky určené jejich tvůrcem (podle typu, příslušnosti, účelu, doby vytvoření atd.). Adresáře na nižších úrovních jsou vnořeny do adresářů vyšších úrovní vysoké úrovně a jsou pro ně vnořené. Tato struktura souborového systému se nazývá hierarchický. Nejvyšší úroveň hierarchie - vykořenit adresář disku. Vždy existuje jeden kořenový adresář (pro OS Windows je kořenovým adresářem Plocha), ve kterém jsou umístěny adresáře (složky) a soubory. Každá složka
naopak může obsahovat podsložky a soubory atd.

Složka má dva stavy: aktuální (aktivní), ve kterém je práce uživatele vykonávána v aktuálním počítačovém čase, a pasivní, která aktuálně nemá žádné spojení se složkou.

Funkce údržby struktury souborů zahrnují následující operace, které probíhají pod kontrolou operačního systému:

Vytváření souborů a složek a přiřazování jim názvů;

Přejmenování souborů a složek;

Kopírování a přesouvání souborů mezi jednotkami počítače a mezi složkami na stejném disku;

Mazání souborů a složek;

Procházení strukturou souborů za účelem přístupu k danému souboru nebo složce;

Správa atributů souborů.

Podle metod pojmenovávání souborů se rozlišují „krátké“ a „dlouhé“ názvy. „Krátký“ název souboru se skládá ze dvou částí: samotný název a příponu názvu. Vlastnímu názvu souboru je přiděleno 8 znaků a jeho přípona je
3 znaky. Název je od přípony oddělen tečkou. Název i přípona mohou obsahovat pouze alfanumerické znaky latinské abecedy. „Krátký“ název je tvořen podle pravidel pro tvorbu názvů souborů operačního systému MS DOS. Přípona obvykle popisuje formát souboru, například:

Hlavní nevýhodou „krátkých“ názvů je jejich nízký obsah. S příchodem operačního systému není vždy možné vyjádřit vlastnosti souboru několika znaky Systémy Windows 95 byl zaveden koncept „dlouhého“ jména. Tento název může obsahovat až 255 znaků. „Dlouhý“ název může obsahovat libovolné znaky kromě devíti speciálních:

\ / : * ? " < > |

V názvu jsou povoleny mezery a více teček. Přípona názvu zahrnuje všechny znaky za poslední tečkou.

V hierarchické datové struktuře je uvedena adresa souboru trasa (přístupem), vedoucí z horní části struktury do souboru. Při psaní přístupové cesty k souboru, která prochází systémem podsložek, jsou všechny mezisložky odděleny znakem „\“ (zpětným lomítkem). Celý název souboru obsahuje název disku, přístupovou cestu a název souboru (příklad je na obr. 2.1).

From:\My Documents\Current\Abstracts\Operating Systems.doc

Rýže. 2.1. Celý název souboru

Jsme zvyklí na termíny jako „soubor“ a „složka“ nebo „adresář“. Ale co je to za mechanismus, který spravuje soubory, kontroluje je a kontroluje jejich pohyb?

Obrazně lze systém ukládání souborů na disk přirovnat k obrovskému a chaoticky uspořádanému skladu, do kterého je neustále dodáváno nové zboží. K dispozici je vedoucí skladu, který přesně ví, kde se každý produkt nachází a jak se k němu rychle dostat. Takovými správci v systému ukládání souborů jsou .

Pojďme zjistit, jak souborový systém funguje, jaké existují jeho typy, a zvážit základní operace se souborovým systémem, které ovlivňují výkon systému.

Jak funguje systém souborů Windows

Operační systém přiřadí každému souboru jméno, které jej stejně jako adresa identifikuje v systému. Tato cesta je řádek, na jehož začátku je uvedena logická jednotka, na které je soubor uložen, a následně se postupně zobrazují všechny složky podle stupně jejich vnoření.

Když program vyžaduje soubor, odešle požadavek do operačního systému, který je zpracován souborovým systémem Windows. Pomocí přijaté cesty systém obdrží adresu umístění úložiště souborů (fyzické umístění) a předá ji programu, který požadavek odeslal.

Souborový systém má tedy svou vlastní databázi, která na jedné straně vytváří shodu mezi fyzickou adresou souboru a jeho cestou a na druhé straně ukládá další atributy souboru, jako je velikost, datum vytvoření, soubor přístupová práva a další.

V souborových systémech FAT32 a NTFS je takovou databází hlavní tabulka souborů (MFT).

Co se vlastně stane, když přesouváte, kopírujete a odstraňujete soubory?

Jakkoli se to může zdát divné, ne všechny operace se soubory a složkami vedou k fyzickým změnám na pevném disku. Některé operace provádějí pouze změny MFT a samotný soubor zůstává na stejném místě.

Podívejme se blíže na proces souborového systému při provádění základních operací se soubory. To nám pomůže pochopit, jak se OS zanáší, proč se některé soubory načítají dlouho a co je třeba udělat pro zlepšení výkonu operačního systému.

1. Přesuňte soubor: Tato operace zahrnuje změnu jedné cesty na druhou. Proto je třeba změnit pouze záznam v hlavní tabulce souborů a samotný soubor není nutné fyzicky přesouvat. Zůstává na stejném místě beze změny.

2. Zkopírujte soubor: Tato operace zahrnuje vytvoření další dodatečné implementace souboru v novém umístění. V tomto případě se v MFT nejen vytvoří záznam, ale také se na novém místě objeví další skutečná kopie souboru.

3. Smazání souboru: V tomto případě je soubor nejprve umístěn do koše. Po vyvolání funkce „Vyprázdnit“ koš systém souborů vymaže položku z MFT. V tomto případě se soubor fyzicky nesmaže, ale zůstane na svém původním místě. A bude existovat, dokud nebude přepsán. Tuto funkci je třeba vzít v úvahu při mazání důvěrných souborů: je lepší použít speciální programy.

Nyní je jasné, proč je operace přesunutí rychlejší než operace kopírování. Opakuji, ve druhém případě je potřeba kromě provádění změn v hlavní tabulce souborů také vytvořit fyzickou kopii souboru.

Jaké typy souborových systémů existují?

1. FAT16 (tabulka přidělených souborů 16). Podporován byl starší souborový systém, který dokázal zpracovat pouze soubory nepřesahující 2 GB pevné disky s kapacitou ne větší než 4 GB a mohl uložit a zpracovat maximálně 65 636 souborů. S rozvojem technologií a rostoucími potřebami uživatelů byl tento souborový systém nahrazen NTFS.

2. FAT32. S nárůstem objemu dat uložených na paměťových médiích byl vyvinut a představen nový souborový systém Windows, který začal podporovat soubory až do velikosti 4 GB a maximální kapacitu pevného disku nastavil na 8 TB. V současnosti se FAT32 zpravidla používá pouze na externích paměťových médiích.

3. NTFS (New Technology File System). Jedná se o standardní souborový systém nainstalovaný na všech moderních počítačích s operačním systémem Windows. Maximální velikost souboru zpracovávaného tímto systémem souborů je 16 TB; Maximální podporovaná velikost pevného disku je 256 TB.

Další funkcí NTFS je protokolování jeho akcí. Zpočátku jsou všechny změny zapsány do speciálně určené oblasti a teprve poté jsou zaznamenány do tabulky souborů. To pomáhá předcházet ztrátě dat, například kvůli výpadkům napájení.

4. HSF+ (hierarchický souborový systém+). Standardní souborový systém pro běžící počítače systém MacOS. Podobně jako NTFS podporuje velké soubory a pevné disky s kapacitou několika set terabajtů.

Chcete-li změnit systém souborů, budete muset naformátovat oddíl pevného disku. Obvykle tato operace zahrnuje úplné odstranění všechny dostupné informace v této sekci.

jak zjistit typ souborového systému?

Nejjednodušší způsob: otevřete „Průzkumník souborů“ -> vyberte oddíl pevného disku, který vás zajímá -> klikněte na něj pravým tlačítkem myši -> v zobrazené nabídce vyberte možnost „Vlastnosti“ -> v okně, které se otevře, vyberte „ Obecné“.

Údržba systému souborů Windows

Je třeba poznamenat, že systém souborů neudržuje „pořádek“ na pevném disku. OS Windows je navržen tak, že ukládá nové soubory do první nepřidělené buňky, na kterou narazí. Navíc, pokud se soubor nevejde celý do této buňky, pak se rozdělí na několik částí (fragmentuje). V souladu s tím se prodlouží doba přístupu a otevření takového souboru, což ovlivňuje celkový výkon systému.

Abyste tomu zabránili a „udělali věci do pořádku“ v systému souborů, musíte pravidelně defragmentovat oddíly pevného disku.

Chcete-li to provést, znovu přejděte na vlastnosti oddílu pevného disku, který vás zajímá (jak je popsáno výše), přejděte na kartu „Služba“ a klikněte na tlačítko „Defragmentace“.

V okně, které se otevře, můžete nakonfigurovat činnost automatické defragmentace disku.

Chcete-li provést defragmentaci sami, vyberte oddíl pevného disku, klikněte na tlačítko „Analyzovat disk“ -> a poté na „Defragmentace disku“.

Počkejte na dokončení operace a zavřete okno.

Obecné informace o souborových systémech

Operační systém Windows 8 podporuje několik systémů souborů: NTFS, FAT a FAT32. Ale může to fungovat jen pro NTFS, to znamená, že jej lze nainstalovat pouze na oddíl pevného disku naformátovaný v daném systému souborů. To je způsobeno funkcemi a bezpečnostními nástroji, které jsou součástí NTFS, ale chybí v souborových systémech Windows předchozí generace: FAT16 A FAT32. Dále se podíváme na celou řadu souborových systémů pro Windows, abychom pochopili, jakou roli hrají v provozu systému a jak se vyvíjely během vývoje Windows až po Windows 8.

Výhody NTFS se týkají téměř všeho: výkonu, spolehlivosti a efektivity práce s daty (soubory) na disku. Tedy jeden z hlavních cílů tvorby NTFS bylo zajistit vysokorychlostní provádění operací se soubory (kopírování, čtení, mazání, zápis), jakož i poskytování dalších možností: komprese dat, obnova poškozených systémových souborů na velkých discích atd.

Další hlavní účel tvorby NTFS došlo k implementaci zvýšených bezpečnostních požadavků, protože souborové systémy TLUSTÝ, FAT32 v tomto ohledu nebyli vůbec dobří. Přesně v NTFS můžete povolit nebo zakázat přístup k jakémukoli souboru nebo složce (omezit přístupová práva).


Nejprve se podívejme na srovnávací charakteristiky souborových systémů a poté se na každý z nich podíváme podrobněji. Srovnání jsou pro větší přehlednost uvedena v tabulkové formě.

Souborový systém TLUSTÝ Pro moderní pevné disky (kvůli omezeným možnostem) se prostě nehodí. Pokud jde o FAT32, pak se dá ještě použít, ale s určitou rezervou. Pokud si koupíte HDD 1000 GB, pak jej budete muset rozdělit alespoň na několik oddílů. A pokud se chystáte na střih videa, tak to pro vás bude velmi těžké Limit 4 GB jako maximální možná velikost souboru.

Souborový systém nemá všechny tyto nevýhody. NTFS. Tedy, aniž bychom zacházeli do detailů a speciálních funkcí souborového systému NTFS, můžete se rozhodnout v jeho prospěch.

Soubor
Systém
Možnosti
Objemové rozměry Maximální velikost souboru
TLUSTÝ Od 1,44 MB do 4 GB 2 GB
FAT32 Teoreticky jsou možné velikosti svazků od 512 MB do 2 TB. Komprese není podporována na úrovni systému souborů 4 GB
NTFS Minimální doporučená velikost je 1,44 MB a maximální 2 TB. Podpora komprese souborů, adresářů a svazků na úrovni souborového systému. Maximální velikost je omezena pouze velikostí svazku (teoreticky - 264 bajtů mínus 1 kilobajt. Prakticky - 244 bajtů mínus 64 kilobajtů)

Obecné použití FAT32 lze odůvodnit pouze v případech, kdy máte na počítači nainstalováno několik operačních systémů a žádný z nich nepodporuje NTFS. Ale dnes takoví lidé prakticky neexistují. Pokud nechcete nainstalovat starožitnost, jako je Windows 98.

Systém souborů FAT

Souborový systém TLUSTÝ(obvykle to znamená TUK 16) byl vyvinut před poměrně dlouhou dobou a byl určen pro práci s malými diskovými a souborovými svazky a jednoduchou adresářovou strukturou. Zkratka TLUSTÝ znamená Tabulka přidělení souborů(z anglické tabulky umístění souborů). Tato tabulka je umístěna na začátku svazku a uchovávají se její dvě kopie (pro zajištění větší stability).
Tuto tabulku používá operační systém k vyhledání souboru a určení jeho fyzického umístění na pevném disku. Pokud je tabulka (a její kopie) poškozena, operační systém nemůže číst soubory. Jednoduše nedokáže určit, který soubor je který, kde začíná a kde končí. V takových případech se říká, že souborový systém „selhal“.
Souborový systém TLUSTÝ původně vyvinut společností Microsoft pro diskety. Teprve poté jej začali používat pro pevné disky. Zpočátku to tak bylo FAT12(pro diskety a pevné disky do 16 MB) a pak se to rozrostlo do FAT16, který byl uveden do provozu s operačním systémem MS-DOS 3.0.

Souborový systém FAT32

Počínaje Windows 95 OSR2, Microsoft začíná aktivně používat FAT32- dvaatřicetibitová verze TLUSTÝ. Co dělat, technologický pokrok nestojí a příležitosti TUK 16 zjevně nestačilo.
V porovnání s ní FAT32 začal poskytovat optimálnější přístup k diskům, vyšší rychlost I/O operací a také podporu velkých objemů souborů (kapacita disku až 2 TB).
V FAT32 efektivnější vynakládání prostředků místo na disku(pomocí menších shluků). Přínos ve srovnání s FAT16 je asi 10...15 %. Tedy při používání FAT32 Na stejný disk lze zapsat o 10...15 % více informací než při použití FAT16.
Navíc je třeba poznamenat, že FAT32 poskytuje vyšší provozní spolehlivost a rychlejší spouštění programu.
To je způsobeno dvěma významnými inovacemi:
schopnost přesunout kořenový adresář a záložní kopie TLUSTÝ(pokud je hlavní kopie poškozena)

Schopnost uložit záložní kopii systémových dat.

Souborový systém NTFS

Obecná informace
Žádná z verzí FAT neposkytuje přijatelnou úroveň zabezpečení. To, stejně jako potřeba dalších souborových mechanismů (komprese, šifrování), vedlo k potřebě vytvořit zásadně nový souborový systém. A stal se z toho souborový systém NT (NTFS)
NTFS- z angličtiny Nový technologický systém souborů - nový technologický souborový systém
Jak již bylo zmíněno, jeho hlavní výhodou je bezpečnost: pro soubory a složky NTFS Přístupová práva lze přidělit (čtení, zápis atd.). Díky tomu se výrazně zvýšila bezpečnost dat a stabilita systému. Přidělení přístupových práv vám umožňuje zakázat/povolit všem uživatelům a programům provádět jakékoli operace se soubory. Bez dostatečných práv například neoprávněný uživatel nebude moci změnit žádný soubor. Nebo opět bez dostatečných práv nebude virus schopen soubor poškodit.
Kromě, NTFS, jak je uvedeno výše, poskytuje lepší výkon a možnost pracovat s velkým množstvím dat.

Od Windows 2000 se používá verze NTFS 5.0, který kromě standardních umožňuje implementovat následující funkce:

Šifrování dat- tato funkce je implementována speciálním doplňkem NTFS nazvaným Šifrování systému souborů(EFS)- šifrování souborového systému. Díky tomuto mechanismu lze šifrovaná data číst pouze na počítači, na kterém k šifrování došlo.
Diskové kvóty- nyní je možné přiřadit uživatelům konkrétní (omezenou) velikost disku, kterou mohou používat.
Efektivní ukládání řídkých souborů. Existují soubory, které obsahují velký počet po sobě jdoucích prázdných bajtů. Souborový systém NTFS umožňuje optimalizovat jejich ukládání.

Pomocí protokolu změn- umožňuje zaznamenávat všechny přístupové operace k souborům a svazkům.

A ještě jedna inovace NTFS - montážní body. Pomocí bodů připojení můžete definovat různé nesouvisející složky a dokonce jednotky v systému jako jednu jednotku nebo složku. To má velký význam pro sběr heterogenních informací umístěných v systému na jednom místě.

■ A konečně mějte na paměti, že pokud jste nastavili určitá oprávnění pro soubor v systému NTFS a poté jej zkopírujete do oddílu FAT, budou ztracena všechna jeho přístupová práva a další jedinečné atributy obsažené v systému NTFS. Buď opatrný.

NTFS zařízení. Hlavní tabulka souborů MFT.
Jako každý jiný souborový systém rozděluje NTFS veškerý využitelný prostor na shluky- minimální datové bloky, do kterých jsou soubory rozděleny. NTFS podporuje téměř jakoukoli velikost clusteru – od 512 bajtů do 64 KB. Obecně přijímaným standardem je však cluster o velikosti 4 KB. Je to ten, který se používá ve výchozím nastavení. Princip existence shluků lze ilustrovat na následujícím příkladu.
Pokud je velikost vašeho clusteru 4 KB (což je s největší pravděpodobností) a potřebujete uložit soubor o velikosti 5 KB, bude mu ve skutečnosti přiděleno 8 KB, protože se nevejde do jednoho clusteru a místo na disku je přidělené pro soubor pouze pomocí clusterů .
Pro každý disk NTFS existuje speciální soubor - MFT (Master Allocation Table - hlavní tabulka souborů). Tento soubor obsahuje centralizovaný adresář všech souborů na disku. Když je soubor vytvořen, NTFS vytvoří a vyplní MFT odpovídající záznam, který obsahuje informace o atributech souboru, obsahu souboru, názvu souboru atd.

kromě MFT, existuje ještě 15 speciálních souborů (spolu s MFT - 16), které jsou pro operační systém nepřístupné a jsou tzv. metasoubory. Jména všech metasoubory začít symbolem $ , Ale standardní prostředky Není možné, aby si je operační systém prohlížel a viděl je vůbec. Níže jsou uvedeny příklady hlavních metasouborů:

SMFT- MFT samotný.
$MFTmirr- kopie prvních 16 záznamů MFT umístěná uprostřed disku (zrcadlo).
$LogFile- soubor podpory protokolování.
$Volume- servisní informace: jmenovka svazku, verze systému souborů atd.
$AttrDef- seznam standardních atributů souborů na svazku.
$. - kořenový adresář.
$Bitmap- objemová mapa volného prostoru.
$Boot - boot sektor(pokud je oddíl spouštěcí).
$kvóta- soubor, který zaznamenává uživatelská práva k využití místa na disku.
$Upcase- tabulka shody mezi velkými a malými písmeny v názvech souborů na aktuálním svazku.
Je to potřeba hlavně proto, že v NTFS jsou názvy souborů psány v kódování Unicode, který se skládá z 65 tisíc různých symbolů, jejichž hledání velkých a malých ekvivalentů je velmi netriviální.
Pokud jde o princip organizace dat na disku NTFS, je konvenčně rozdělen na dvě části. Prvních 12 % disku je přiděleno pro tzv MFT zóna- prostor, do kterého metasoubor MFT roste.
Do této oblasti není možné zapisovat žádná uživatelská data. Zóna MFT je vždy prázdná. To se provádí tak, aby se soubor nejdůležitějších služeb (MFT) při růstu nefragmentoval. Zbývajících 88 % disku je normální úložný prostor pro soubory.
Při nedostatku místa na disku se však může zmenšit samotná zóna MFT (pokud je to možné), takže nepocítíte žádné nepohodlí. V tomto případě budou nová data již zapsána do bývalé zóny MFT.
Pokud se následně uvolní místo na disku, MFT zóna se opět zvětší, ale v defragmentované podobě (tedy ne jako jeden blok, ale v několika částech na disku). Na tom není nic špatného, ​​prostě se má za to, že systém je spolehlivější, když soubor MFT není defragmentován. Navíc, když soubor MFT není defragmentován, celý systém souborů běží rychleji. Čím více je tedy soubor MFT defragmentován, tím pomaleji systém souborů pracuje.

Pokud jde o velikost souboru MFT, je přibližně vypočítána na základě 1 MB na 1000 souborů.

Převeďte oddíly FAT32 na NTFS bez ztráty dat. převést nástroj

Stávající oddíl FAT32 můžete snadno převést na NTFS. Pro tento účel poskytuje Windows 8, Windows 8.1 nástroj příkazového řádku konvertovat

Jeho provozní parametry jsou zobrazeny na snímku obrazovky

Chcete-li tedy převést jednotku D: na NTFS, in příkazový řádek měli byste zadat následující příkaz:

Poté budete požádáni o zadání jmenovky svazku, pokud existuje (jmenovka svazku je uvedena vedle názvu jednotky v okně Můj počítač. Slouží k podrobnější identifikaci disků a může a nemusí být použit. Například by to mohlo být Ukládání souborů (D:).
Chcete-li převést flash disk, příkaz vypadá takto:

convert e : /fs:ntfs /nosecurity /x

ŘÍDÍCÍ ROBOT

s disciplínami

" Informatika a výpočetní technika“ na téma:

"OS"

"Souborové systémy"

1. Operační systémy

2. Souborové systémy

3. Systémy souborů a názvy souborů

Reference

1. Operační systémy

Operační systém, OS (anglicky) provozníSystém) - základní komplex počítačové programy, zajišťující kontrolu počítačového hardwaru, práci se soubory, vstup a výstup dat a také spouštění aplikačních programů a utilit.

Když zapnete počítač, operační systém se načte do paměti dříve než ostatní programy a poté slouží jako platforma a prostředí pro jejich práci. Kromě výše uvedených funkcí může operační systém provádět další, například poskytování uživatelského rozhraní, síťové interakce atd. Od 90. let 20. století nejrozšířenější operační systémy pro osobní počítače a servery patří do rodiny OS Microsoft Windows a Windows NT, Mac OS a Mac OS X, systémy třídy UNIX a Unixové(zejména GNU/Linux).

Operační systémy lze klasifikovat podle základní technologie ([Unix] nebo Windows), typu licence ([proprietární] nebo [open source]), ať už se aktuálně vyvíjí (starší DOS nebo NextStep nebo moderní GNU/Linux a Windows) , pro pracovní stanice (DOS, Apple) nebo pro servery (), [operační systém v reálném čase|operační systém v reálném čase] a [embedded operační systém|embedded OS] (, ), nebo specializované (řízení výroby, školení atd. .). Účel a hlavní vlastnosti programu MS EXCEL. Rozhraní programu. Základní prvky rozhraní. Koncepce tabulky, buňky, řádku, sloupce, adresního systému. Pohyb po poli tabulky. Vstup dat. Typy dat. Úprava obsahu buňky. Změna šířky a výšky buňky. Vlastnosti buňky (příkaz Formát buněk).

2. Souborové systémy

Všechny moderní operační systémy umožňují vytvoření souborového systému, který je určen k ukládání dat na disky a poskytování přístupu k nim.

Hlavní funkce souborového systému lze rozdělit do dvou skupin:

Funkce pro práci se soubory (vytváření, mazání, přejmenování souborů atd.)

Funkce pro práci s daty uloženými v souborech (zápis, čtení, vyhledávání dat atd.)

Je známo, že soubory se používají k uspořádání a ukládání dat na počítačová média. Soubor je posloupnost libovolného počtu bajtů, která má jedinečný vlastní název nebo pojmenovanou oblast na médiu počítače.

Strukturování mnoha souborů na počítačových médiích se provádí pomocí adresářů, ve kterých jsou uloženy atributy (parametry a podrobnosti) souborů. Adresář může obsahovat mnoho podadresářů, což vede k rozvětveným strukturám souborů na discích. Uspořádání souborů do stromové struktury se nazývá souborový systém.

Princip organizace souborového systému je tabulkový. Údaje o tom, kde na disku je soubor zapsán, jsou uloženy v tabulce File Allocation Table (FAT).

Tato tabulka je umístěna na začátku svazku. Pro ochranu svazku jsou na svazku uloženy dvě kopie FAT. Pokud je poškozena první kopie FAT diskové nástroje můžete použít druhou kopii k obnovení svazku.

FAT má podobný design jako obsah knihy, protože jej operační systém používá k vyhledání souboru a určení shluků, které soubor zabírá na pevném disku.

Nejmenší fyzickou jednotkou úložiště dat je sektor. Velikost sektoru je 512 bajtů. Vzhledem k tomu, že velikost tabulky FAT je omezená, pro disky větší než 32 MB není možné poskytnout adresování každému jednotlivému sektoru.

V tomto ohledu jsou skupiny sektorů podmíněně spojeny do shluků. Cluster je nejmenší jednotka adresování dat. Velikost clusteru na rozdíl od velikosti sektoru není pevná a závisí na kapacitě disku.

Nejprve se pro diskety a malé pevné disky (méně než 16 MB) používala 12bitová verze FAT (nazývaná FAT12). MS-DOS pak představil 16bitovou verzi FAT pro větší disky.

Operační systémy MS DOS, Win 95, Win NT implementují 16bitová pole v alokačních tabulkách souborů. Systém souborů FAT32 byl zaveden ve Windows 95 OSR2 a je podporován ve Windows 98 a Windows 2000.

FAT32 je vylepšená verze FAT navržená pro použití na svazcích větších než 2 GB.

FAT32 poskytuje podporu pro disky o velikosti až 2 TB a efektivnější využití místa na disku. FAT32 používá menší clustery, což umožňuje efektivnější využití místa na disku.

Windows XP používá FAT32 a NTFS. Slibnějším směrem ve vývoji souborových systémů byl přechod na NTFS (New Technology File System) s dlouhými názvy souborů a spolehlivým bezpečnostním systémem.

Velikost oddílu NTFS není omezena. NTFS minimalizuje množství plýtvaného místa na disku zápisem malých souborů do velkých clusterů. NTFS navíc umožňuje ušetřit místo na disku komprimací samotného disku, samostatné složky a soubory.

Podle metod pojmenovávání souborů se rozlišují „krátké“ a „dlouhé“ názvy.

Podle konvence přijaté v MS-DOS byl způsob pojmenovávání souborů na počítačích IBM PC konvencí 8.3, tzn. Název souboru se skládá ze dvou částí: skutečného názvu a přípony názvu. Název souboru je přidělen 8 znaků a jeho přípona - 3 znaky.

Název je od přípony oddělen tečkou. Název i přípona mohou obsahovat pouze alfanumerické znaky latinské abecedy. Názvy souborů zapsané podle konvence 8.3 jsou považovány za „krátké“.

S příchodem operačního systému Windows 95 byl zaveden koncept „dlouhého“ názvu. Takový název může obsahovat až 256 znaků. To je poměrně dost k vytvoření smysluplných názvů souborů. „Dlouhý“ název může obsahovat libovolné znaky kromě devíti speciálních znaků: /: *?< > |.

V názvu jsou povoleny mezery a více teček. Název souboru končí příponou o třech znacích. Přípona se používá ke klasifikaci souborů podle typu.

Jedinečnost názvu souboru je zajištěna tím, že úplný název souboru je považován za vlastní název souboru spolu s cestou k němu. Cesta k souboru začíná názvem zařízení a zahrnuje všechny názvy adresářů (složek), kterými prochází. Znak „“ (zpětné lomítko - zpětné lomítko) se používá jako oddělovač. Například: D: Documents and SettingsTVAMy documentlessons-tva robots. txt Navzdory skutečnosti, že údaje o umístění souborů jsou uloženy v tabulkové struktuře, jsou uživateli prezentovány ve formě hierarchické struktury - to je pro lidi pohodlnější a operační systém se postará o všechny potřebné transformace .

Běžný soubor je pole bajtů a lze jej číst a zapisovat od libovolného bajtu souboru. Jádro nerozpoznává hranice záznamů v běžných souborech, ačkoli mnoho programů považuje odřádkování za zalomení řádků, ale jiné programy mohou očekávat jiné struktury. Samotný soubor neukládá žádné systémové informace o souboru, ale systém souborů ukládá některé informace o vlastníkovi, oprávněních a použití každého souboru.

Volaná komponenta název souboru je řetězec dlouhý až 255 znaků. Tato jména jsou uložena ve zvláštním typu souboru tzv katalog. Zavolá se informace o souboru v adresáři vstup do adresáře a obsahuje kromě názvu souboru i ukazatel na samotný soubor. Položky adresáře mohou odkazovat na jiné adresáře i na běžné soubory. Tím se vytvoří hierarchie adresářů a souborů, která se nazývá souborový systém. souborový systém;

Obrázek 2-2. Malý souborový systém

Jeden malý souborový systém je znázorněn na obrázku 2-2. Adresáře mohou obsahovat podadresáře a neexistují žádná omezení ohledně toho, jak hluboko může být jeden adresář vnořen do jiného. Aby byla zachována integrita souborového systému, jádro neumožňuje procesům zapisovat přímo do adresářů. Souborový systém může ukládat nejen běžné soubory a adresáře, ale také odkazy na jiné objekty, jako jsou zařízení a sokety.

Souborový systém tvoří strom, jehož začátek je v kořenový adresář, někdy nazývané jménem rozřezat, který odpovídá znaku jednoduchého lomítka (/). Kořenový adresář obsahuje soubory; v našem příkladu na obrázku 2.2 obsahuje vmunix, kopii souboru spustitelného objektu jádra. Obsahuje také adresáře; v tomto příkladu obsahuje adresář usr. Uvnitř adresáře usr je adresář bin, který obsahuje hlavně spustitelný objektový kód programů jako ls a vi.

Proces přistupuje k souboru zadáním cesta před ním, což je řetězec skládající se z několika nebo žádných názvů souborů oddělených lomítkem (/). Jádro přidružuje ke každému procesu dva adresáře, přes které lze interpretovat cesty k souborům. Kořenový adresář proces je nejvyšší bod v systému souborů, kterého může proces dosáhnout; obvykle odpovídá kořenovému adresáři celého souborového systému. Zavolá se trasa začínající znakem lomítka absolutní trasa, a je interpretován jádrem počínaje kořenovým adresářem procesu.

Zavolá se název cesty, který nezačíná lomítkem relativní cesta, a je interpretován relativně k aktuální pracovní adresář proces. (Tento adresář se také nazývá zkráceně aktuální adresář nebo pracovní adresář) Samotný aktuální adresář lze identifikovat přímo jménem tečka, což odpovídá jednomu bodu (). Název souboru tečka-tečka(.) označuje nadřazený adresář aktuálního adresáře. Kořenový adresář je sám sobě předkem.

Publikace na dané téma