Čo sú to dátové súbory? Dátové súbory

Lekcia č. 7

Vypracovanie lekcie na tému „Dátové súbory“.

Téma lekcie: Dátové súbory.

Účel lekcie: Rozvinúť u študentov pochopenie dátového súboru. Postupy pri práci so súbormi.

Ciele lekcie:

  1. Dátové súbory.
  2. Postupy pri práci so súbormi.

Vybavenie lekcie:počítač, projektor.

Plán lekcie

1. Organizačná chvíľa (pozdrav).

- Dobrý deň, prosím posaďte sa. Kto dnes chýba?

2. Učenie sa nového materiálu.

Dátové súbory.

Dátový súbor je priestor na magnetickom médiu vyhradený na ukladanie informácií a má špecifický názov. Súbor je aj postupnosť čísel (kódov), z ktorých niektoré sú chápané ako riadiace kódy (napr. existuje kód konca súboru, pri textových súboroch je indikátor konca riadku). Čo je táto postupnosť čísel, sa dá vyriešiť iba v programe. V samotnom súbore nie sú žiadne znaky, ktoré by nám umožnili určiť povahu informácií.

Práca so súborom na fyzickej úrovni je mimoriadne náročná. Preto pre súbor, rovnako ako pre bežnú premennú, určuje typ Pascal. Môžete napríklad napísať:

a: súbor celého čísla; (Celočíselný súbor.)

f: súbor reťazca; (Súbor reťazca.)

Algoritmus pre prácu so súborom:

  1. Súbor je priradený k premennej súboru pomocou špeciálnej procedúry.
  1. Otvorí sa alebo vytvorí premenná súboru (súbor bude fyzicky otvorený, ale programátor nie je zapojený do tohto procesu).
  2. Vykonajú sa potrebné operácie čítania a zápisu údajov.
  3. Premenná súboru je zatvorená.

Úloha 1. Napíšme program, ktorý vykoná nasledujúce akcie:

  1. Súbor sa otvorí.
  2. Zapíše 100 po sebe idúcich celých čísel.
  3. Súbor je uzavretý.
  4. Súbor sa otvorí.
  5. Čísla obsiahnuté v súbore sa prečítajú a vytlačia na obrazovke.

Príklad programu;

I,u: celé číslo;

(Je definovaná premenná, ktorá sa potom môže naviazať na súbor,

F: súbor celého čísla;

začať

(Premenná súboru je viazaná na súbor,

ktorého meno je uvedené v apostrofoch)

Assign(f,'file');

(Keďže takýto súbor ešte neexistuje, je vytvorený a otvorený)

Prepis(f);

(Čísla sa zapíšu do súboru)

Pre i:=1 až 100 do write(f,i);

(Súbor sa zatvorí)

Close(f);

(Keďže súbor už existuje, jednoducho sa otvorí)

Reset(f);

(Čísla sa načítajú zo súboru a zobrazia sa na obrazovke)

Pre i:=1 až 100 do

Začať

Čítaj(f,u);

Napíšte(‘ ‘,u);

Koniec;

koniec.

Súborová premenná nemôže byť úplne obyčajná premenná. Preto sú pre premenné súboru poskytnuté špeciálne procedúry a funkcie. Nižšie je uvedený krátky zoznam procedúr a funkcií, ktoré pracujú so súbormi v Borland Pascal.

  1. priradiť - procedúra, ktorá spája súbor s premennou súboru.
  2. resetovať - otvorí existujúci súbor a nastaví ukazovateľ polohy súboru na prvok nula.
  3. prepísať - vytvorí súbor.
  4. skrátiť - oreže súbor od aktuálnej pozície.
  5. hľadať - nastaví ukazovateľ súboru na zadanú pozíciu.
  6. eof - funkcia, ktorá vracia true, ak bol dosiahnutý koniec súboru, a false inak.
  7. veľkosť súboru - vypočíta veľkosť súboru v počte záznamov typu uvedeného vo vyhlásení o súbore.

Poznámka

Pre súbor existuje niečo ako ukazovateľ na aktuálnu pozíciu. Toto je hodnota typu celé číslo (pre Borland Pascal je to hodnota typu longint ), ktorý ukladá aktuálne číslo pozície súboru. Každá operácia čítania/zápisu presunie ukazovateľ na ďalší záznam. Záznam sa vzťahuje na dĺžku typu špecifikovaného vo vyhlásení súboru. Číslovanie záznamov v súbore začína od nuly.

Dátové štruktúry vo vyššie uvedenom príklade sú definované celkom správne, ale v príkaze napis(f,a); kompilátor vygeneruje chybové hlásenie. Konkrétne: kompilátor ohlási, že došlo k nezhode typu. Zdá sa, že premenné typy a a f sú rovnaké. Z pohľadu kompilátora to však nie je pravda. Opísali sme dve rôzne štruktúry a kompilátor správne predpokladá, že môžu byť odlišné a nerobí si tú námahu skontrolovať, či sú rovnaké.

Tento problém sa rieši nasledovne:

Príklad programu;

Usescrt;

Typ

R = záznam

S:reťazec;

I:integer;

Koniec;

A:r;

F: súbor z r;

začať

A.s:="fsfsfsf";

A.i: = 8;

Napíšte(f,a);

koniec.

Tento program implementuje rovnakú úlohu ako predchádzajúci, ale kompilátor nemá žiadne problémy.

Súbor môže byť súčasťou komplexnej štruktúry. Napríklad pole súborov je celkom prijateľné:

f:array súbor celého čísla;

Súbor môže byť súčasťou záznamu:

Príklad programu;

Nahrávka

S:reťazec;

F: súbor celého čísla;

Koniec;

začať

Assign(a.f,"file.dat");rewrite(a.f);

koniec.

Tento príklad otvorí súbor polí. To znamená, že každá položka súboru je pole s dĺžkou 10 celých čísel. Okrem toho nemôžeme definovať hodnoty všetkých desiatich prvkov, stále ich bude v súbore zapísaných desať, ako je uvedené v definícii poľa.

Ten istý fyzický súbor je možné otvoriť ako jeden typ súboru a potom otvoriť ako súbor iného typu:

Príklad programu; Usescrt;

S:reťazec;

I:integer;

F:súbor reťazca;

D:súbor celého čísla;

začať

Clrscr;

Assign(f,"file.dat");rewrite(f);

S:="gdgdgjagdjasg";

Pre i:=1 až 10 do write(f,s);

Close(f);

Assign(d,"file.dat");reset(d);

Aj keď nie eof(d) urobte

Začať

Read(d,i);write(i," ");

Koniec;

koniec.

V tomto príklade sa súbor s názvom file.dat otvorí ako reťazcový súbor a naplní sa nejakým obsahom, potom sa zatvorí a znova otvorí ako súbor s číslami. Takéto operácie sú pre jazyk Pascal celkom legálne, je to dôsledok skutočnosti, že typ súboru nie je na fyzickej úrovni nijako fixovaný.

Záver: Súbor - Toto je štruktúra, ktorá vám umožňuje ukladať veľké súbory informácií. Čo typy súborov predstavujú bežné jazykové dátové typy, čo zvyšuje pohodlie ich spracovania. Jedinou nevýhodou ukladania dát do súborov je relatívne nízka prístupová rýchlosť.

3.Domáca úloha.

Preštudujte si látku, ktorú ste sa naučili. Naučte sa základné pojmy: dátový súbor; súbor; algoritmus pre prácu so súbormi; postupy a funkcie, ktoré pracujú so súbormi; záznam.

4. Zhrnutie

Udeľovanie známok žiakom, ktorí v triede dosahovali dobré výsledky.


Súbory uložené vo formáte údajov používa Analysis Studio a táto aplikácia ukladá do týchto súborov údaje o častiach, ktoré sa používajú na offline analýzu. Tieto údaje je možné zadať do zodpovedajúceho súboru s údajmi, ktorý vytvoril používateľ Analysis Studio. Tieto súbory DATA sú zvyčajne klasifikované ako dátové súbory, sú pripojené s príponou .data a konkrétnejšie sa nazývajú offline dátové súbory Analysis Studio. Spoločnosť Appricon vyvinula formát údajov a softvér Analysis Studio, ktorý používateľom poskytuje offline ukladanie údajov a analýzu funkčnosť užitočný štatistický výskum, ukladanie, správa a analýza údajov. Obsah týchto dátových súborov môže zahŕňať dáta zakódované v textových alebo tabuľkových formátoch. Používateľ Analysis Studio môže do údajov tohto súboru zahrnúť aj hlavičky súboru Analysis Studio. Používateľ odpojený od servera Analysis Studio zvyčajne pristupuje k týmto údajom súboru offline, hoci softvér Analysis Studio používateľovi tiež umožňuje prístup k obsahu týchto súborov s údajmi dokonca aj v reálnom čase. Obsah týchto dátových súborov je možné importovať aj z iných databáz, ako je Microsoft SQL Server a údaje spoločnosti Microsoft Prístup. Softvér Analysis Studio spája dátový súbor s príslušným súborom STP a obsah týchto súborov STP pozostáva z metaúdajov objektu a detailov schematického návrhu. Používateľ systému Microsoft Windows môže odstrániť hlavičkový súbor nástroja Analysis Studio dátového súboru, aby mohol otvoriť a zobraziť jeho obsah pomocou tabuliek aplikácie. Microsoft Excel 2010.

Ste tu, pretože máte súbor, ktorý má príponu súboru končiacu na .data. Súbory s príponou .data môžu spúšťať iba niektoré aplikácie. Je možné, že súbory .data sú skôr dátové súbory ako dokumenty alebo médiá , čo znamená, že ich nemožno vôbec prezerať.

čo je súbor .data file?

Súbory uložené vo formáte DATA používa softvér Analysis Studio a táto aplikácia ukladá do týchto súborov DATA podrobnosti používané na offline analýzu. Tieto údaje môže používateľ služby Analysis Studio zadať do súvisiaceho súboru DATA. Tieto súbory DATA, ktoré sa vo všeobecnosti klasifikujú ako dátové súbory, majú príponu .data a konkrétnejšie sa nazývajú offline dátové súbory Analysis Studio. Appricon vyvinul DATA formát a softvér Analysis Studio, aby používateľom poskytol offline ukladanie údajov a analytické funkcie, ktoré sú užitočné pri štatistickom výskume, ukladaní, správe a analýze údajov. Obsah týchto DATA súborov môže zahŕňať údaje zakódované vo formáte obyčajného textu alebo vo formátoch oddelených tabulátormi. Používatelia nástroja Analysis Studio môžu do týchto súborov DATA zahrnúť aj hlavičky súboru Analysis Studio. Používateľ odpojený od servera Analysis Studio zvyčajne pristupuje k týmto súborom DATA v režime offline, hoci softvér Analysis Studio poskytuje používateľovi prístup k obsahu týchto súborov DATA aj v režime online. Obsah týchto DATA súborov možno importovať aj z iných databáz, ako sú databázy Microsoft SQL Server a Microsoft Access. Softvér Analysis Studio priraďuje súbor DATA k zodpovedajúcemu súboru STP a obsah týchto súborov STP pozostáva z metadát objektu a podrobností o schéme projektu. Používateľ systému Microsoft Windows môže odstrániť hlavičkový súbor Analysis Studio súboru DATA a otvoriť a zobraziť jeho obsah pomocou tabuľkového procesora Microsoft Excel 2010.

ako otvoriť súbor .data?

Dvojitým kliknutím spustite súbor .data alebo akýkoľvek iný súbor na počítači. Ak sú vaše priradenia súborov nastavené správne, aplikácia, ktorá má otvoriť váš súbor .data, ho otvorí. Je možné, že si budete musieť stiahnuť alebo zakúpiť správnu aplikáciu. Je tiež možné, že máte na počítači správnu aplikáciu, ale súbory .data s ňou ešte nie sú spojené. V tomto prípade, keď sa pokúsite otvoriť súbor .data, môžete systému Windows povedať, ktorá aplikácia je pre daný súbor správna. Odvtedy otvorenie súboru .data otvorí správnu aplikáciu.

aplikácie, ktoré otvárajú súbor .data

Appricon Analysis Studio

Appricon Analysis Studio

Anaysis studio vyvinuté spoločnosťou Appricon je nástroj na dolovanie údajov a štatistický nástroj, ktorý má metódy automatizovaného regresného modelovania, ktoré možno použiť na získanie vyššej úrovne presnosti a stability. Tento softvér bol vyvinutý na podporu dôležitých a kritických rozhodnutí v oblasti ťažby na webe, marketingu, zákazníckej analýzy, kreditného bodovania, zdravotníctva a ľudských zdrojov. Pre optimálny výkon obsahuje krížové tabuľky, v ktorých je možné graficky zobraziť viacero štatistických meraní, má Coxovu regresiu, optimalizáciu viacerých regresií, optimalizáciu trendových faktorov, vstavanú citlivosť a vstavané what-if pre všetky druhy regresie, sprievodca automatickou koreláciou, obsahuje aj modelovanie pre prežitie, a pre optimálny výkon modelu, má logistickú regresiu a zlomkové polynómy, obsahuje aj sprievodcov časových radov a prognóz, viac ako 25 grafov, pre rýchlu optimalizáciu predpovedí má detektor sezónnosti, viacjadrové výpočty, regresnú analýzu, ktorá obsahuje rôzne porovnávania a analýzy modelov a rýchla hlboká logistická regresia pre vývoj a nasadenie modelu. Analytické štúdio má osobitnú funkciu, ktorá umožňuje svojim používateľom používať rôzne zdroje údajov od rôznych dodávateľov pomocou rovnakého projektu bez problémov s písaním kódov, vrátane súborov MSSQL, Oracle, MSExcel, MSAccess, textových a xml súborov. Tento softvér obsahuje obmedzenie 500 riadkov na súbor údajov, ale s neobmedzeným počtom premenných.

varovné slovo

Dávajte pozor, aby ste nepremenovali príponu na .data súboroch ani na iných súboroch. Toto nezmení typ súboru. Iba špeciálny softvér na konverziu môže zmeniť súbor z jedného typu súboru na iný.

Druhý súbor potrebný na fungovanie See5 je dátový súbor. Má príponu *.data. V našom prípade je to súbor USR. údajov.

Každý objekt v dátovom súbore má svoj vlastný riadok. Ak je hodnota cieľovej premennej v hornej časti súboru s názvami premenných, riadok začína hodnotou tejto cieľovej premennej. Potom nasledujú hodnoty všetkých ostatných charakteristík oddelené čiarkami. Neznáme hodnoty premenných sú zakódované otáznikom „?“, za ktorým nasleduje zvislá čiara „|“ Môžete písať komentáre, ktoré systém neakceptuje.

Nižšie je uvedený celý dátový súbor USR. údajov, ktorý použijeme na demonštráciu schopností See5.

Testovacie dátové súbory (voliteľné)

Na kontrolu kvality vytvoreného rozhodovacieho stromu a zodpovedajúceho súboru logických pravidiel poskytuje systém See5 možnosť pracovať so špeciálnymi súbormi, ktoré obsahujú dodatočné testovacie údaje.

Tretí typ súboru používaný systémom See5 obsahuje nové testovacie objekty. Toto sa nazýva aj kontrolná vzorka. Tento súbor USR. test je voliteľný a ak sa použije, má už popísaný formát súboru USR. údajov.

Ďalší súbor podpory USR. prípady je tiež voliteľné. Obsahuje objekty s neznámou klasifikáciou.

Súbor nákladov

Posledný určený typ súboru USR. náklady,obsahuje informácie o nákladoch na rôzne chyby klasifikácie. Vyplnenie tohto súboru je voliteľné. Prideľovanie trestov za chyby však môže byť veľmi užitočné pri vývoji niektorých aplikácií.

Používateľské rozhranie

V hlavnom okne See5 je päť tlačidiel (obr. 1). Uveďme ich zľava doprava.

Pomocou tlačidla Nájdite Da ta (umiestnenie údajov) otvorí okno na zobrazenie dostupných dátových súborov a ich načítanie do systému.

Jediným stlačením tlačidla Construct Klasifikátor (vytvorenie klasifikátora) sa otvorí dialógové okno na výber typu klasifikátora a nastavenie jeho parametrov. Tlačidlo Stop je určené na zastavenie procesu vytvárania rozhodovacieho stromu.

Tlačidlo Použite Klasifikátor(použite klasifikátor) ​​spúšťa proces interaktívnej klasifikácie jedného alebo viacerých objektov. Pomocou tlačidla Krížová referencia sa vyvolá okno, v ktorom sú prehľadne odhalené súvislosti medzi objektmi tréningovej množiny a viditeľnými pravidlami pre ich klasifikáciu.

Všetky vyššie uvedené funkcie sú dostupné aj z ponuky Súbor. Na druhej strane v menu Upraviť Je možné upravovať súbor názvov údajov a súbor nákladov na chyby klasifikácie.

Ryža. 1. Hlavné okno systému Pozri5

Budovanie rozhodovacieho stromu

Prvá fáza spracovania údajov zvyčajne používa predvolené systémové parametre. stlač tlačidlo Construct Klasifikátor a potom v zobrazenom dialógovom okne (obr. 29) ihneď kliknite 0 tis(za predpokladu, že dátový súbor USR. dat a je už načítané). Systém zobrazí okno s výsledkami, ktoré vyzerá takto (obr. 3). Prvý riadok správy s výsledkami poskytuje informácie o použitej verzii systému See5 a aktuálnom čase. Potom ďalšie dva riadky hovoria, že klasifikačná premenná je diagnózy a čítať dátový súbor USR. údajov obsahuje 74 objektov, z ktorých každý je opísaný jedenástimi znakmi.

Obr. Dialógové okno pre nastavenie parametrov algoritmu návrhu klasifikátora

Nasledujúce riadky správy zobrazujú vytvorený rozhodovací strom. Dá sa interpretovať nasledovne:

AK Index viac ako 0,69 a Rýchlosť viac ako 18, potom trieda č. 3, inak

AK Index viac ako 0,69 a Rýchlosť nie viac ako 18 a Hrúbka najviac 46, TO trieda č.1

atď.

Každá vetva stromu končí číslom triedy, do ktorej vedie. Hneď za číslom je zápis typu (typov) resp (p/t). Napríklad úplne prvá vetva končí záznamom (12,0). To znamená, že tejto vetve zodpovedá 12 objektov z určitej (tretej) triedy. Posledná vetva končí záznamom 1 (6.0/1.0), z čoho vyplýva, že táto vetva popisuje triedu č.1 a padá sem 6 predmetov, z ktorých 1 je chybný. množstvá P alebo T sa môže ukázať ako zlomková v prípade, keď ktorákoľvek vetva obsahuje určitý počet objektov s neznámymi hodnotami vlastností.

Ďalšia časť správy predstavuje charakteristiky vytvoreného klasifikátora, vyhodnoteného na trénovacej množine. Tu vidíme, že vytvorený rozhodovací strom má 9 vetiev (veľkosť = 9) a chyba klasifikácie je pozorovaná na 5 objektoch, čo je 6,8 %.

IN Záverečná časť správy obsahuje tabuľku s podrobným rozborom výsledkov klasifikácie. Na základe údajov v tejto tabuľke môžeme povedať, že z triedy 1 (zdravé obličky) je správne zaradených 20 objektov a do triedy 2 sú nesprávne zaradené 2 objekty; medzi objektmi triedy 2 (viacnásobné cysty) je 35 diagnostikovaných správne a 2 sú nesprávne uznané ako zdravé; všetky predmety triedy 3 (hydronefróza) sú zaradené správne s výnimkou jedného predmetu, ktorý spadá do triedy č.2.

Nakoniec systém See5 zobrazí správu o čase strávenom riešením. v našom prípade to bolo 0,5 s. Tu je potrebné poznamenať, že algoritmus See5 vo všeobecnosti pracuje pri veľmi vysokej rýchlosti, čo mu umožňuje rýchlo spracovať vysokorozmerné informačné polia obsahujúce tisíce a desiatky tisíc záznamov.

Výsledky našej klasifikácie môžeme analyzovať ešte podrobnejšie. Ak to chcete urobiť, kliknite na tlačidlo Cross-Reference v hlavnom okne See5. Systém zobrazí okno, v ktorého ľavej polovici je nakreslený vytvorený rozhodovací strom a v pravej polovici sú uvedené objekty, ktoré spadajú na jednu alebo druhú vetvu stromu. Ak chcete vybrať záujmovú vetvu, musíte na ňu kliknúť ľavým tlačidlom myši (napravo od pobočky sa zobrazí tmavý kruh - šípka naň ukazuje na obr. 4). Okrem toho, ak kliknete na číslo objektu v pravom poli, systém zobrazí ďalšie okno s názvom Case, ktoré zobrazuje hodnoty charakteristík a vybraného objektu. V prípade znázornenom na obrázku nás zaujíma pobočka (Index<=0.69 и Age.<"43), на которой находятся 10 объектов из 1-го класса и 1 объект из 2-го класса.

Ryža.

4. Zobrazenie výsledkov klasifikácie v okne krížových odkazov

Spustiteľné súbory

1.1. Dávka (BAT)

1.2. Softvér (COM, EXE)

2.1. Jednoduché texty (TXT)

2.2. komplex (DOC)

2.3. Tabuľky (XLS)

2.4. databázy (MDB)

2.5. Archív (RAR, ZIP)

2.6. Grafika (BMP, JPG, GIF)

2.7. Komponenty aplikácie (LIB, OVL)

3. 2.8. Dočasné (TMP) atď. Skratky

– minisúbory obsahujúce odkazy na iné objekty za účelom ich otvorenia (PIF, LNK)

Atribúty súboru:

„Skryté“ – nie je viditeľné, pokiaľ ste špecificky nenastavili zobrazovanie skrytých súborov;

„Pripravený na archiváciu“ – bude archivovaný sprievodcom archiváciou (duplikáciou);

„Komprimovaný“ – bude komprimovaný, aby sa ušetrilo miesto na disku;

„Zašifrované“ – nie je možné otvoriť a skopírovať v inej používateľskej relácii, ale je možné ich vymazať a premenovať;

Poznámka„Indexované“ – v budúcnosti bude označené pre rýchle vyhľadávanie.

. Atribúty „Compressed“, „Encrypted“, „Indexed“ je možné nastaviť iba v systéme súborov NTFS.

Správa objektov systému súborov

Typy operácií s objektmi FS:

1. Navigácia a vyhľadávanie

2. Vytvorenie a vymazanie

3. Úprava a prezeranie

4. Premenovanie a nastavenie atribútov

5. Kopírujte a presúvajte

6. Archivácia a rozbalenie

Spôsoby, ako vytvoriť objekty:

1. Program - editor alebo sprievodca programom

2. Súborový shell alebo správca súborov

3. Kopírovanie (cez schránku alebo pretiahnutie)

Možnosti otvárania objektov:

1. Priečinok: Zoznam obsahu

2. Spustiteľný súbor: spustiť

3. Dátový súbor: spustenie editora alebo prehliadača registrovaného (asociovaného) pre tento typ dokumentu

Možnosti pre dôsledky pretiahnutia objektu („Drag and Drop“):

2. Pravá bunka "Myši" - vyberte z kontextového menu na konci ťahania

3. Ctrl+ľavé tlačidlo. "Myši" - kopírovanie

4. Shift+ľavé tlačidlo. "Myši" - pohybujúce sa

Vlastnosti kopírovania a presúvania:

1. Pri kopírovaní: vytvorí sa duplicitný obsah bajtu

2. Pri presune v rámci jedného disku sa zmení celý názov súboru vo FAT

3. Pri presúvaní medzi rôznymi diskami sa najprv skopíruje súbor, potom FAT indikuje vymazanie tohto súboru

Záver: v rámci jedného disku je operácia presunu rýchlejšia ako operácia kopírovania a naopak medzi rôznymi diskami.

Príklady príkazov systému MS-DOS:

1. Vonkajšie:

1.3. Naformátujte disk: FORMAT názov_disku


2. Interné (vykonávané príkazovým procesorom):

2.1. Vytvoriť adresár: MD názov_adresára

2.2. Odstránenie adresára: RD directory_name

2.3. Odstránenie názvu súboru DEL

2.4. Zobrazenie obsahu aktuálneho adresára: DIR

2.5. Opustenie shellu: EXIT

Tabuľka Spôsoby kopírovania a presúvania súborov

Publikácie na danú tému