Souborový systém

Z Multimediaexpo.cz

Souborový systém (anglicky file system) je v informatice označení pro způsob organizace dat ve formě souborů (a většinou i adresářů) tak, aby k nim bylo možné snadno přistupovat. Souborové systémy jsou uloženy na vhodném typu elektronické paměti, která je umístěna přímo v počítači (pevný disk nebo CD…) nebo může být zpřístupněna pomocí počítačové sítě (NFS, SMB, AppleTalk…).

Obsah

Účel souborového systému

Údaje v elektronické paměti jsou přístupné v podstatě jako vektor dvojkových čísel. Přitom různé oblasti tohoto vektoru mohou být v závislosti na typu a okamžitém stavu paměti různě rychle dostupné. Například harddisk nebo CD-mechanika potřebuje určitý čas na přesun hlavičky na jinou stopu a než se pod hlavičku dostane oblast s požadovanými daty. Souborový systém zajišťuje ukládání a čtení dat paměťového média tak, aby s nimi uživatelé mohli pracovat ve formě souborů a adresářů. Základní ideou souborového systému je tedy zpřístupnění a ukládání dat pomocí hierarchicky organizovaného systému adresářů a souborů. Představme si rozsáhlou knihovnu dokumentů, kde bychom mohli popsat přístup ke konkrétnímu dokumentu například následovně: "budova C/2. patro/místnost č. 12/regál 3/šuplík D2/Šanon Akta-X/Dokument Vetřelec". V analogické abstraktní formě zpřístupňuje informace souborový systém, až na to že místo "budovy" nejsíše budeme mít písmeno označující logický disk, místo "patra" adresář 1. hierarchické úrovně, místo "místnosti" podadresář, dále podpodadresář, atp. Jednotlivým dokumentům v šanonech by pak odpovídaly soubory. Základním pravidlem každého souborového systému je, že data musí být jednoznačně určena svým jménem. Z toho vyplývá, že dva soubory nebo podadresáře umístěné ve stejném adresáři nesmí mít stejné jméno. Jednoúčelová zařízení jako jsou mp3 přehrávače nebo digitální fotoaparáty mohou podporovat pouze omezenou podmnožinu funkcí souborového systému. Avšak s plnohodnotnými hierarchickými souborovými systémy se setkáváme stále častěji (například v mobilních telefonech). Souborový systém zaznamenává kromě jména souboru a jeho umístění v hierarchii adresářů další informace sloužící pro správu souborů. Především jsou to časové známky (nejdůležitější je čas poslední změny). Dále může souborový systém vést informace o vlastnících souborů a přístupových právech, což je důležité ve víceuživatelských systémech, nebo při zpřístupňování dat na disku pomocí počítačové sítě.

Organizace dat na disku

Pevné disky jsou obvykle logicky rozděleny na oddíly (partition), takže souborový systém se rozkládá jen na konkrétním oddílu a ne na celém disku. To umožňuje mít na pevném disku více nezávislých souborových systémů, které mohou být různého typu. Informace uložené v systému souborů dělíme na metadata a data. Metadata popisují strukturu systému souborů a nesou další služební a doplňující informace, jako je velikost souboru, čas poslední změny souboru, čas posledního přístupu k souboru, vlastník souboru, oprávnění v systému souborů, seznam bloků dat, které tvoří vlastní soubor atd. Pojmem data pak míníme vlastní obsah souboru, který můžeme přečíst, když soubor otevřeme. Software, který realizuje souborový systém, bývá obvykle součástí operačního systému. Většina operačních systémů podporuje několik různých souborových systémů. V Microsoft Windows nalezneme podporu pro souborové systémy FAT a NTFS a ISO 9660 pro ukládání souborů na CD a DVD. V Linuxu nalezneme kromě již zmíněných také ext2, ext3, ext4, ReiserFS, JFS, XFS a mnoho dalších. DOS podporuje systémy FAT, po instalaci CD/DVD driveru také ISO 9660. Solaris podporuje především UFS a ZFS, ale i mnoho dalších.

Omezení souborových systémů

Různé souborové systémy mohou mít různá omezení, například:

  • velikost paměťového média kterou je daný systém schopen pokrýt
  • délka souboru
  • délka jména souboru
  • počet zanořených podadresářů
  • podporovaná znaková sada

Žurnálování v systému souborů

Podrobnější informace naleznete v článku: Žurnálovací systém souborů.

Zápis dat a metadat do systému souborů probíhá v několika krocích. Proto nejsou data a metadata v každém okamžiku konzistentní. Dojde-li v takové chvíli k havárii počítače (např. výpadek elektrického proudu, chyba hardware, software a podobně), zůstane systém souborů v nekonzistentním stavu. Z tohoto důvodu je při dalším startu operačního systému vhodné, aby byla provedena kontrola a nekonzistentní data byla opravena. K tomu může dojít automaticky (např. v Linuxu nebo ve Windows 95 a novějších systémech) nebo je nutné spustit kontrolu ručně (systémy DOS). Celková kontrola systému souborů a všech vazeb mezi daty a metadaty je časově velmi náročná operace, při které navíc může dojít ke zbytečné ztrátě již částečně zapsaných informací. Proto jsou moderní systémy souborů rozšířeny o žurnálování, které umožňuje po havárii rychlou opravu eventuálních nekonzistencí. Principem techniky je uchovávání chronologického záznamu prováděných operací, do kterého se zapisují všechny prováděné činnosti. Pokud dojde např. k výpadku napájení, je po restartu nekonzistence opravena návratem do předchozího zaznamenaného stavu za pomoci záznamů z žurnálu. Mezi žurnálovací souborové systémy patří např. NTFS, HFS+, ext3, ext4, XFS nebo ReiserFS.

Kvóty

Kvóty (anglicky quota) jsou limity nastavené správcem systému, které určitým způsobem omezují použití souborového systému. Nejčastěji se kvóty používají na omezení následujících věcí:

  • velikosti využitého místa (usage nebo block quota)
  • počtu souborů (file nebo inode quota)

Dále může administrátor systému nastavit varování, tzv. soft quota, které uživatele informuje v případě, že se blíží ke svému limitu (který je pak nazýván hard quota). Často se také nastavuje tzv. grace interval, který v případě potřeby umožňuje krátkodobé mírné překročení kvóty.

Síťové souborové systémy

Síťové souborové systémy (network filesystem) je označení pro systémy souborů, které jsou dostupné prostřednictvím počítačové sítě. Ve skutečnosti leží soubory a adresáře na jiném počítači a přistupujeme k nim pomocí speciálních síťových volání služeb (např. SMB, NFS, CODA apod.). Na vzdáleném počítači jsou pak soubory a adresáře fyzicky uloženy v podobě klasického systému souborů. Speciálními síťovými systémy souborů jsou distribuované souborové systémy (např. GFS v Linuxu), které se mohou rozkládat na několika počítačích, které jsou navzájem propojeny pomocí počítačové sítě.

Databázové souborové systémy

V poslední době se začínají objevovat souborové systémy, které se odklánějí od klasické hierarchické struktury souborů a přiklánějí se více k databázovému pojetí reprezentace dat založené na jejich charakteristikách, tj. například na typu souboru, datu vytvoření, autoru a jiných metadat.

Přehledové tabulky

Tabulka omezení a doplňující informace

Souborový systém Maximální délka názvu souboru Použitelné znaky v názvech adresářů[1] Maximální délka cesty Maximální velikost souboru Maximální velikost diskového oddílu[2] Vyvinul Používáno od r. Původní operační systém
V6FS 14b[3] libovolný bajt kromě NULL a / [3] Bez omezení[4] 8 MB 2 TB Bell Labs 1972 Version 6 Unix
V7FS 14b[3] libovolný bajt kromě NULL a / [3] Bez omezení[4] 1 GB 2 TB Bell Labs 1979 Version 7 Unix
FAT12 255b Unicode kromě NULL[5] [3] Bez omezení[4] 32MiB 32MiB až (??) 512MiB Microsoft 1980 QDOS
FAT16 8b (původně) / 255b (pouze LFN / VFAT) Unicode kromě NULL[5] [3] Bez omezení[4] 2 Gb / 4 GB 16 MB až 4 GB Microsoft 1983 MS-DOS verze 2
FAT32 8b (DOS bez LFN) / 255b (pouze LFN / VFAT) Unicode kromě NULL[5] [3] Bez omezení[4] 2 Gb / 4 GB 2 TB[6] Microsoft 1997 Windows 95c
FATplus 255b Unicode kromě NULL[5] [3] Bez omezení[4] 256GiB 2TiB Udo Kuhnt a další 2006 Enhanced DR-DOS
MFS 30b libovolný bajt kromě NULL [3] Bez omezení[4]  ?  ? Apple 1983 Mac OS
HFS 30b[5] libovolný bajt kromě NULL [3] Bez omezení[4]  ?  ? Apple 1985 Mac OS
OFS  ?  ?  ?  ?  ? Metacomco pro Commodore 1985 Amiga OS
HPFS 255b Všechny bajty kromě NULL[7] Bez omezení[4] 4 GB 8 GB až 2TB[8] IBM & Microsoft 1988 OS/2
NTFS 255b Unicode kromě NULL Bez omezení[4] 16 TB 16 EB Microsoft, Gary Kimura, Tom Miller 1995 Windows NT
HFS+ 255 znaků[9] Unicode kromě NULL[10] [3]  ? 8 EB 8 EB Apple 1998 Mac OS
FFS 255b Libovolný bajt kromě NULL[3] Bez omezení[4] 4 GB 256 TB Kirk McKusick 1983 4.2BSD
Amiga FFS (Amiga) 255b Libovolný bajt kromě NULL[3] Bez omezení[4] 4 GB 256 TB Commodore 1987 Amiga OS verze 1.3
UFS1 255b Libovolný bajt kromě NULL[3] Bez omezení[4] 4 GB až 256 TB 256 TB Kirk McKusick 1994 4.4BSD
UFS2 255b Libovolný bajt kromě NULL[3] Bez omezení[4] 512 GB až 32 PB 1 YB Kirk McKusick 2002 FreeBSD 5.0
NILFS  ?  ?  ?  ?  ? NTT 2005 Linux
ext2 255b libovolný bajt kromě NULL a / [3] Bez omezení[4] 16 GB až 2 TB[2] 2 TB až 32 TB Rémy Card 1993 Linux
ext3 255b libovolný bajt kromě NULL a / [3] Bez omezení[4] 16 GB až 2 TB[2] 2 TB až 32 TB Stephen Tweedie 1999 Linux
ext4 255b libovolný bajt kromě NULL a / [3] Bez omezení 16 TB 1 EB Theodore Ts'o a další 2006 Linux
ReiserFS V3 4032b/255znaků Libovolný bajt kromě NULL[3] Bez omezení[4] 8 TB[11] 16 TB Namesys 2001 Linux
Reiser4  ?  ? Bez omezení[4] 8 TB na x86  ? Namesys 2004 Linux
XFS 255b Libovolný bajt kromě NULL[3] Bez omezení[4] 9 EB[4] 9 EB[4] SGI 1994 IRIX
JFS 255b Libovolný bajt kromě NULL[3] Bez omezení[4] 8EB 512TB až 4PB IBM 1990 AIX[12]
JFS2 255b Libovolný Unicode znak kromě NULL Bez omezení[4] 4 PB 32 PB IBM 1999 OS/2 WSeB
Be File System 255b Libovolný bajt kromě NULL[3] Bez omezení[4] 12288b až 260GB[13] 256 PB až 2EB Be Inc., D. Giampaolo, C. Meurillon 1996(?) BeOS
NSS  ? Závisí na použitém jmenném prostoru[14] Omezení limitované klientem 8 TB 8 TB Novell 1998 Netware 5
NWFS 80b Závisí na použitém jmenném prostoru[14] Bez omezení[4] 4 GB 1 TB Novell 1985 Netware 286
ODS-2  ?  ?  ?  ?  ? DEC 1979 OpenVMS
ODS-5 236b[15]  ? 4096b[16] 1 TB 1 TB DEC 2003 OpenVMS verze 8
UDF 255b Libovolný Unicode znak kromě NULL 1023b 16EB  ? ISO/ECMA/OSTA 1995 -
UFS 255b Libovolný bajt kromě NULL Bez omezení[4] 4 GB až 256 TB 256 TB Kirk McKusick 1994 4.4BSD
UFS2 255b Libovolný bajt kromě NULL Bez omezení[4] 512 GB až 32 PB 1 YB Kirk McKusick 2002 FreeBSD 5.0
QNX 4.x 255b libovolný bajt kromě NULL 255b 4 GB 8 GB až 2 TB (?) QNX Software Systems QNX 1990 QNX
VxFS 255b Libovolný bajt kromě NULL[3] Bez omezení[4] 16EB  ? VERITAS 1991 SVR4.0
Plan9 Fosil+Venti  ?  ?  ?  ?  ? Bell Labs 2003 Plan9 verze 4
ZFS 255b Libovolný Unicode znak kromě NULL Bez omezení[4] 16EB 16EB Sun Microsystems 2004 Solaris 10
LFFS  ?  ? Unicode znak kromě NULL  ?[4]  ?  ? Symbian OS 2003 Symbian OS S60 6.1

Vlastnosti souborového systému

Souborový systém Typ souboru metadata Vlastník uložených souborů Přístupová práva k souborům podle POSIX Čas vytvoření Čas poslední změny Čas posledního přístupu Last entry change timestamps Čas poslední archivace Seznam přístupových práv Zabezpečení/MAC labels Pevné odkazy Symbolické odkazy Alternate data stream / resource fork
FAT12  ? N N A A A N N N N N N N
FAT16  ? N N A A A N N N N N N N
FAT32  ? N N A A A N N N N N N N
FATplus  ? N N A A A N N N N N N N
HPFS  ? A[17] N A A A N N N  ? N N N
NTFS  ? A N[18] A A A A N A  ? A A[19] A
HFS+  ? A A A A  ?  ?  ?  ?  ? A A A

Žurnálování

Souborový systém Žurnálovací systém Meta-data only journaling Citlivost na velikost znaků Case-preserving Logování změn souborů Delayed allocation Rozšíření Proměnlivá velikost datového bloku[20]
FAT12 N N N N N N N N
FAT16 N N N N N N N N
FAT32 N N N N N N N N
FATplus N N N N N N N N
HPFS N N N A N N A  ?
NTFS Obnova[21] A A A A N  ?  ?
HFS+ N  ? A A N N N  ?
FFS N N A A N N N N
UFS1 N N A A N N N N
UFS2 N A A A N N N A
Mac OS X UFS N N A A N N N N
ext2 N N A A N N N N
ext3 A A A A N N N  ?
ReiserFS V3 A A A A N N N  ?
Reiser4 A A A A N N A  ?
XFS A A A A A A A  ?
JFS A A A A N N  ?  ?
Be File System N A A A  ? N N  ?
NSS  ? A A A A N N  ?
NWFS N N A A A N N  ?
ODS-5 N A N A A N N  ?
VxFS A N A A A N N  ?
ZFS N  ? A A N N  ?  ?

Poznámky

  1. Jedná se o omezení vyplývající ze struktury vlastních adresářových záznamů. Některé ovladače souborových systémů mohou zavést svá vlastní omezení názvů souborů a adresářů; stejně tak i některé operační systémy mohou mít vlastní omezení bez ohledu na použitý souborý systém. MS-DOS, Microsoft Windows a OS/2 nedovolují použití znaků \ / : ? * „ > < | NUL v názvech souborů a adresářů ve všech souborových systémech. Unixy a Linux nedovolují použití znaků / NUL v názvech souborů a adresářů ve všech souborových systémech.
  2. 2,0 2,1 2,2 Pro souborové systémy, které mají proměnlivé velikosti alokačních jednotek (bloků/clusterů) je uvedeno rozmezí velikostí, ukazující maximální velikost volume pro minimalní a maximální možnou velikost alokační jednotky souborového systému (např. 512 bytů a 128KiB pro FAT - což jsou velikosti clusterů povoleny pro datovou strukturu na disku, ačkoliv některé ovladače a operační systémy nepodporují velikost clusteru větší než 32KiB).
  3. 3,00 3,01 3,02 3,03 3,04 3,05 3,06 3,07 3,08 3,09 3,10 3,11 3,12 3,13 3,14 3,15 3,16 3,17 3,18 3,19 3,20 3,21 3,22 V těchto souborových systémech mají adresářové položky „.“ a „..“ zvláštní význam. Adresářové položky s těmito jmény nejsou zakázané a skutečně existují jako běžné položky adresářů ve struktuře dat na disku. Nicméně jsou povinné, s povinnými hodnotami, jsou automaticky vytvořeny v každém adresáři při jeho vytvoření; a adresáře bez nich jsou považovány za poškozené.
  4. 4,00 4,01 4,02 4,03 4,04 4,05 4,06 4,07 4,08 4,09 4,10 4,11 4,12 4,13 4,14 4,15 4,16 4,17 4,18 4,19 4,20 4,21 4,22 4,23 4,24 4,25 4,26 4,27 4,28 4,29 Struktura na disku nemá žádné vlastní omezení. Některé ovladače souborového systému a operační systémy ale mohou mít vlastní limity. MS-DOS nepodporuje cesty delší než 260 bytů pro FAT12 a FAT16. Windows NT nepodporují cesty delší než 32767 bytů pro NTFS.
  5. 5,0 5,1 5,2 5,3 5,4 Soubor ve FAT12, FAT16 a FAT32 má krátký název a může mít navíc dlouhý název. Pro dlouhé názvy platí uvedená omezení. Krátké názvy jsou přesně 11 bajtů dlouhé (8 bajtů název, 3 bajty přípona; doplněné mezerami, pokud jsou kratší); nesmí obsahovat znaky NUL (0x00) a 229 (0xE5), které mají zvláštní význam (označení konce adresáře, respektive smazané položky); a při normálním použití neobsahují malá písmena (lowercase). Některé ovladače souborových systémů nebo operační systémy nemusí podporovat dlouhé názvy. Například MS-DOS bez ovladače třetí strany (také Windows 95 a Windows 98 nabootované v režimu MS-DOS) umožńují přístup pouze ke krátkým názvům. Také v OS/2 ovladače k souborovým systémům FAT12 a FAT16 umožńují přístup pouze ke krátkým názvům.
  6. I když FAT32 oddíly takové velikosti fungují po vytvoření bez problému, některé programy neumožňují vytvořit FAT32 oddíl větší než 32GB. Mezi tyto programy patří instalační program Windows XP, což svádí k chybné domněnce že se jedná o limit souborového systému.
  7. Adresářové položky „.“ a „..“ v HPFS, které je možné vidět v uživatelských programech, jsou víceméně fikce vytvořená ovladači souborových systémů. Ve skutečnosti adresářové datové struktury na disku neobsahují záznamy s takovými názvy, ale místo toho obsahují zvláštní záznam „start“. Přestože adresáře s těmito názvy mohou na disku fyzicky existovat, nemohou být vytvořeny běžnými funkcemi a adresář obsahující takové záznamy je považován za poškozený.
  8. To je omezení struktury na disku. Ovladač souborového systému HPFS pro OS/2 používá vrchních 5 bitů čísla sektoru oddílu pro vlastní účely, omezujíc velikost diskového oddílu, který dokáže spravovat na 64 GB.
  9. Starší verze HFS podporovala pouze 31 znakové názvy souborů. Kvůli tomu některé starší aplikace nepracovaly dobře se soubory, které měly názvy delší.
  10. HFS+ podporuje escape sekvence, která umožňuje použití libovolných Unicode znaků. Uživatelé předchozí verze uvidí escape sekvence místo požadovaných znaků.
  11. ReiserFS má teoretické maximum pro velikost souboru 1EB, ale „stránkovací keš to omezuje na 8TB na každé architektuře s 32 bitovým integerem“[1]
  12. JFS vychází z AIX a byl kompletně přepsán pro OS/2. Linuxový souborový systém byl založen na verzi z OS/2.
  13. Velmi se liší v závislosti na velikosti bloku a fragmentaci block allocation groups.
  14. 14,0 14,1 NSS umožňuje, aby soubory měli různá jména v různých jmenných prostorech.
  15. Maximální délka názvu souboru včetně přípony může být jen 236 bajtů; přestože každá jméno i přípona samostatně mohou být teoreticky až 255 bajtů dlouhé.
  16. Maximální délka cesty může být teoreticky 4096 bajtů, ale limity délek jednotlivých komponent jí omezují na 1664 bajtů.
  17. Struktura f-node obsahuje položku pro identifikátor uživatele. Nicméně s výjimkou operačního systému OS/2 Warp Server tato položka nebývá použita.
  18. NTFS access control list může vyjádřit každou přístupovou politiku zadatelnou přístupovými právy standardu POSIX, ale rozhranní POSIXového typu není podporováno bez přídavných programů jako Services for UNIX nebo Cygwin.
  19. NTFS 5.0 a vyšší umožňuje vytvářet tzv. junctions („křížení“), které dovoluje jednotlivým adresářům (ale nikoliv jednotlivým souborům) namapování kamkoliv do adresářové struktury lokálně spravovaného disku. Lze tak učinit skrze tzv. reparse points, které umožňují flexibilní rozšíření běžného procesu rozlišování jmen.
  20. Proměnlivá velikost datového bloku odkazuje na systémy, které podporují různou velikost bloku pro každý soubor. (To je podobné extentům, ale trochu odlišný výběr implementace.) Současná podpora v UFS2 je pouze pro čtení.
  21. NTFS ukládá vše, dokonce i souborová data, jako meta-data, takže jeho log připomíná spíš blokové žurnálování.

Externí odkazy