Come configurare smartphone e PC. Portale informativo
  • casa
  • TV (Smart TV)
  • Gestione dei file, tipi di file, file system, attributi dei file. Cos'è un file Cos'è un file di dati

Gestione dei file, tipi di file, file system, attributi dei file. Cos'è un file Cos'è un file di dati

Tutte le informazioni contenute nelle variabili e negli array scompaiono al termine del programma. Se potrebbe essere necessaria in futuro, queste informazioni vengono salvate su un disco rigido, un floppy disk o un altro supporto e al successivo avvio del programma vengono ricaricate dal supporto esterno in array o variabili. Viene chiamata tale registrazione su un disco o altro supporto file di dati. Oltre ai file di dati, ci sono anche file eseguibili(programmi in codice macchina con estensione .exe o .com). Alcuni linguaggi e sistemi di programmazione (inclusi i dialetti Pascal - Borland Pascal e Delphi) ti consentono di eseguire tale file dal tuo programma. Pascal ABC non ha questa opzione.

I file sono raggruppati in gruppi (directory o cartelle). Per determinare con quale file lavorare, indicalo nome e cognome. Si compone di più parti, ad esempio:

La directory in cui si trova il nostro programma è la directory di lavoro (corrente). Ciò significa che quando si accede a un file di dati situato in tale directory, non è necessario specificare il percorso.

Per utilizzare il file di dati nel programma è necessario nella sezione VAR descrivere una variabile di file(f/n), che memorizzerà le informazioni su questo file (nome completo, lunghezza, data e ora di creazione, ecc.). Questa descrizione è diversa per i diversi tipi di file. Per esempio:


Nei file descritti come tipici, tutti i dati sono dello stesso tipo (specificato nella descrizione), proprio come negli array. Pertanto, il contenuto degli array viene solitamente archiviato in tali file. È scomodo memorizzare il testo in un file standard, poiché tutte le righe devono avere la stessa lunghezza. Un file di testo viene utilizzato per memorizzare testo con righe di diversa lunghezza. Per separare una riga dall'altra, in un file di questo tipo ogni riga termina con un carattere corrispondente al tasto INVIO. Oltre alle stringhe, puoi anche memorizzare numeri in un file di testo (ma questo è meno economico che in un file standard, dove sono memorizzati in codice binario e non carattere per carattere).

A inserire il nome del file in una variabile di file, viene utilizzato il comando

assegnare(f/n, 'nome file completo');

In questo comando non è necessario specificare il percorso di un file situato nella directory di lavoro (la stessa posizione del programma stesso).

Affinché tutte le altre informazioni sul file siano incluse nella variabile file, è necessario che lo sia aprire utilizzando uno dei seguenti comandi:

reimposta(f/n); - apre un file già esistente e imposta un puntatore al suo inizio (di solito questo è il modo in cui un file viene aperto per la lettura, ma puoi anche scrivere su un file standard. La scrittura avviene invece dei dati esistenti nel file).

aggiungere(f/n); - apre un file già esistente e imposta un puntatore alla sua fine (per aggiungere informazioni dopo la fine del file).

riscrivere(f/n); - crea un nuovo file (se il file esiste già, viene cancellato).

Il puntatore al file memorizza la posizione nel file da cui possiamo leggere (o scrivere) le informazioni. Ogni operazione di lettura o scrittura sposta il puntatore al record successivo.

A leggere le informazioni dal file, inserendolo in una variabile, si utilizzano i comandi:

read(f/n, lista di variabili); - legge da un file standard e di testo.

readln(f/n, elenco di variabili); - legge da un file di testo.

Se da un file di testo non vengono lette singole parole o numeri, ma l'intera riga, viene utilizzata solo una variabile stringa.

write(f/n, lista di variabili); - scrive in un file standard e di testo.

writeln(f/n, elenco di variabili); - scrive in un file di testo con un avanzamento riga.

Per spostarsi all'interno di un file (solo tipico!) utilizzare il comando search(f/n, numero record); . La numerazione dei record nel file inizia da zero. Per arrivare alla fine del file per aggiungere un nuovo record, come numero in questo comando viene utilizzata la funzione filesize(f/n), che determina la dimensione del file (non in byte, ma in record di un determinato tipo).

Quando si legge da un file di lunghezza sconosciuta, è possibile verificare prima di leggere se il file non è ancora terminato utilizzando la funzione eof(f/n), che restituisce true se il puntatore si trova dopo l'ultimo record. Per esempio:


Dopo aver finito di lavorare con il file, è necessario vicino comando chiudi(f/n); . Se non lo fai, Pascal non salverà le modifiche al file su disco. Ma anche se non sono state apportate modifiche, si consiglia di chiudere il file. Successivamente, la variabile file e i buffer dei file (l'area di memoria che Pascal utilizza quando lavora con la memoria) vengono liberati.

Il comando rename(f/n,'new_name') rinomina il file associato a una variabile di file. Il file deve essere chiuso.

Il comando cancella(f/n) cancella il file associato a una variabile di file. Il file deve essere chiuso.

Le operazioni sui file non sempre hanno esito positivo. Ad esempio, quando provi a leggere da un floppy disk che hai dimenticato di inserire nell'unità, viene visualizzato un messaggio di errore e il programma si blocca. È meglio prevenire tali errori. La funzione FileExists('name') restituisce True se sul disco è presente un file con il nome (e il percorso) specificato, altrimenti restituisce False. Deve essere utilizzato prima di tentare di accedere a un file già esistente. Se è necessario creare un nuovo file, viene utilizzata prima la funzione CanCreateFile('name'). Se il nome o il percorso del file non è corretto, oppure non c'è spazio su disco, o per altri motivi non è possibile creare un file con quel nome, restituisce False.

Se hai installato sul tuo computer programma antivirus Potere scansiona tutti i file sul tuo computer, nonché ciascun file individualmente. È possibile eseguire la scansione di qualsiasi file facendo clic con il pulsante destro del mouse sul file e selezionando l'opzione appropriata per eseguire la scansione antivirus del file.

Ad esempio, in questa figura è evidenziato file mio-file.data, quindi è necessario fare clic con il pulsante destro del mouse su questo file e selezionare l'opzione nel menu File "scansiona con AVG". Quando si seleziona questa opzione, AVG Antivirus si aprirà ed eseguirà la scansione del file alla ricerca di virus.


A volte può verificarsi un errore installazione software errata, che potrebbe essere dovuto a un problema riscontrato durante il processo di installazione. Ciò potrebbe interferire con il tuo sistema operativo collegare il file DATA al software applicativo corretto, influenzando il cosiddetto "associazioni di estensioni di file".

A volte semplice reinstallare Microsoft Excel può risolvere il tuo problema collegando correttamente DATI a Microsoft Excel. In altri casi, potrebbero derivare problemi con le associazioni dei file cattiva programmazione del software sviluppatore e potrebbe essere necessario contattare lo sviluppatore per ulteriore assistenza.


Consiglio: Prova ad aggiornare Microsoft Excel alla versione più recente per assicurarti di disporre delle correzioni e degli aggiornamenti più recenti.


Questo può sembrare troppo ovvio, ma spesso Il problema potrebbe essere causato dal file DATA stesso. Se hai ricevuto un file tramite un allegato e-mail o lo hai scaricato da un sito Web e il processo di download è stato interrotto (ad esempio per un'interruzione di corrente o altro motivo), il file potrebbe danneggiarsi. Se possibile, prova a ottenere una nuova copia del file DATA e prova ad aprirlo di nuovo.


Accuratamente: Un file danneggiato può causare danni collaterali a malware precedenti o esistenti sul tuo PC, quindi è importante mantenere il tuo computer aggiornato con un antivirus aggiornato.


Se il tuo file DATA relativi all'hardware del computer per aprire il file che potrebbe essere necessario aggiornare i driver del dispositivo associati a questa apparecchiatura.

Questo problema solitamente associato ai tipi di file multimediali, che dipendono dall'apertura corretta dell'hardware all'interno del computer, ad es. scheda audio o scheda video. Ad esempio, se stai tentando di aprire un file audio ma non riesci ad aprirlo, potrebbe essere necessario aggiornare i driver della scheda audio.


Consiglio: Se quando provi ad aprire un file DATA ricevi Messaggio di errore del file .SYS, probabilmente il problema potrebbe essere associato a driver di dispositivo danneggiati o obsoleti che necessitano di essere aggiornati. Questo processo può essere semplificato utilizzando un software di aggiornamento driver come DriverDoc.


Se i passaggi non risolvono il problema e hai ancora problemi nell'apertura dei file DATA, ciò potrebbe essere dovuto a mancanza di risorse di sistema disponibili. Alcune versioni dei file DATA potrebbero richiedere una quantità significativa di risorse (ad esempio memoria/RAM, potenza di elaborazione) per aprirsi correttamente sul computer. Questo problema è abbastanza comune se si utilizza un hardware del computer abbastanza vecchio e allo stesso tempo un sistema operativo molto più recente.

Questo problema può verificarsi quando il computer ha difficoltà a tenere il passo con un'attività perché il sistema operativo (e altri servizi in esecuzione in background) potrebbero consumare troppe risorse per aprire il file DATA. Prova a chiudere tutte le applicazioni sul PC prima di aprire Analysis Studio Offline Data. Liberare tutte le risorse disponibili sul tuo computer fornirà le migliori condizioni per tentare di aprire il file DATA.


Se tu completato tutti i passaggi sopra descritti e il tuo file DATA ancora non si apre, potrebbe essere necessario eseguirlo aggiornamento dell'attrezzatura. Nella maggior parte dei casi, anche quando si utilizzano versioni precedenti dell'hardware, la potenza di elaborazione può essere ancora più che sufficiente per la maggior parte delle applicazioni utente (a meno che non si stia eseguendo un lavoro ad uso intensivo della CPU, come rendering 3D, modellazione finanziaria/scientifica o intenso lavoro multimediale). Così, è probabile che il tuo computer non disponga di memoria sufficiente(comunemente chiamata "RAM" o memoria ad accesso casuale) per eseguire l'attività di apertura di un file.

File di dati

Durante lo sviluppo dei programmi, spesso è necessario archiviare ed elaborare le informazioni archiviate. Queste informazioni possono essere molto diverse: dati iniziali per la risoluzione di problemi, risultati di calcoli, elenchi e così via. I file di database possono essere utilizzati per memorizzare tali informazioni. I file di dati sono testo. A seconda dell'organizzazione dei dati su dischi o altri supporti della macchina, i file di testo sono suddivisi in file con accesso sequenziale, file ad accesso diretto E file binari.

File di testo sequenziali (file sequenziali) non hanno alcuna struttura. La struttura di questi file è determinata dal programma di lettura stesso. Nei file di testo sequenziali, ogni riga termina con due caratteri speciali: fine riga e ritorno a capo, che vengono immessi nel testo del programma quando si preme il tasto Invio sulla tastiera. Pertanto, uno dei modi più semplici per elaborare un file di testo sequenziale è leggerlo riga per riga. Anche la creazione di file di testo con accesso sequenziale non è difficile. Può essere creato con qualsiasi editor di testo. I dati vengono scritti in un file sequenziale in sequenza byte per byte. Per analizzare e selezionare le informazioni necessarie, il file deve essere letto completamente. Ciò aumenta i requisiti di RAM e riduce la velocità di esecuzione del programma.

File di testo ad accesso diretto (file ad accesso diretto) sono progettati per leggere e scrivere testo o file binari strutturati con record di lunghezza fissa. Permettono di scrivere e recuperare dati da un file in base al numero di record. Ciò riduce il tempo impiegato nella ricerca e nel recupero dei dati. Si tratta tuttavia di un utilizzo inefficiente dello spazio su disco, poiché la lunghezza di ciascun campo del record deve essere specificata in anticipo.

File binari(binari) vengono utilizzati per leggere e scrivere dati strutturati arbitrariamente. I file binari non sono, in senso stretto, un nuovo tipo di file, ma uno dei modi per gestire file di qualsiasi tipo. I metodi per lavorare con i file binari consentono di leggere e modificare qualsiasi byte del file.

Per lavorare con i file di dati, vengono utilizzati comandi per aprire un file, chiudere un file, scrivere e leggere dati da un file, nonché una serie di funzioni che semplificano il lavoro con i file. Tutti questi comandi sono tradizionali per tutte le versioni del linguaggio Basic.

Apertura dei file

Per aprire i file utilizzare il comando Aprire .

Apri “file_spec” per (tipo di file)

Come[#]N



Opzione " specifica_file ”, come è noto, consente di specificare l'unità, il percorso, il nome e l'estensione del nome del file. Ad esempio: R:/Prognoz/Ucheb/prognoz1.dan. Per poter utilizzare un file su computer che eseguono il sistema operativo MS DOS, il nome del file e la sua estensione devono essere formati secondo le regole del sistema operativo MS DOS. Cioè, è possibile utilizzare solo caratteri latini e numeri nel nome file e nell'estensione del nome file, il nome file deve iniziare con una lettera, la lunghezza del nome file non deve superare gli 8 caratteri e l'estensione del nome file non deve superare i quattro caratteri, compreso un punto. Punti e spazi non sono consentiti nel nome del file. La specifica del file è racchiusa tra virgolette.

Opzione Per determina il tipo di file. Il tipo di file ne indica la struttura e l'utilizzo e può assumere i seguenti valori:

Ingresso– file ad accesso sequenziale, aperto in lettura;

Produzione– file ad accesso sequenziale, aperto in scrittura;

Aggiungere- file ad accesso sequenziale, aperto per l'aggiunta di dati;

Binario– il file binario è aperto per la scrittura e la lettura dei dati:

Casuale– il file ad accesso diretto è aperto per la scrittura e la lettura dei dati.

Opzione Accesso determina i diritti di accesso ai dati quando si lavora in reti di computer. Può avere tre significati:

Leggere– è consentita la lettura dei dati dal file;

Scrivere– è consentita la scrittura di dati su un file;

Leggere scrivere- Autorizzato a leggere e scrivere dati. Questa modalità di accesso è quella predefinita.

Opzione Serratura . Poiché la modalità di lettura-scrittura è in genere destinata a funzionare con file che possono essere condivisi da molti utenti o applicazioni, è necessario garantire l'integrità dei dati quando vengono condivisi. A questo scopo viene utilizzato il parametro di blocco che può assumere i seguenti valori:

Condiviso– il file può essere utilizzato da tutti i processi per leggere e scrivere dati;

BloccaLeggi– divieto di lettura. Nessun altro processo può leggere i dati dal file. Questa opzione può essere impostata se nessun altro processo sta attualmente eseguendo un'operazione di lettura.

LockWrite– divieto di registrazione. Nessun altro processo può scrivere dati nel file. Questa opzione può essere impostata se nessun altro processo sta attualmente eseguendo un'operazione di scrittura.

LockReadWrite– divieto di scrittura e lettura dei dati. Questo parametro può essere impostato se nessun altro processo sta attualmente eseguendo un'operazione di scrittura o lettura.

Opzione COME – definisce il numero del canale. Cartello # può essere omesso. Il numero di canale può variare da 1 a 255. Il numero di canali aperti contemporaneamente è determinato dalle restrizioni del sistema operativo specificate nel file Config.sys.

Opzione Len – utilizzato solo nei file ad accesso diretto. Imposta la lunghezza del record in byte.

A apertura o, in altre parole, inizializzazione file vengono eseguite le seguenti operazioni:

viene stabilita una connessione tra la specificazione del file e il suo numero di programma. Pertanto, in tutte le operazioni successive con questo file, viene fatto riferimento al numero del canale e non alla specificazione del file;

viene bloccato un buffer di sistema o software utilizzato per implementare le istruzioni I/O. L'utilizzo di un buffer riduce il numero di accessi del programma al disco e quindi aumenta la velocità di scrittura e lettura dei dati;

si formano i valori iniziali dei parametri situati nel cosiddetto blocco di controllo file.

Chiusura dei file

Per chiudere i file utilizzare il comando Vicino . Sintassi del comando:

Vicino [#<номер канала> ]

Il comando Chiudi con un parametro numero di canale chiude il canale specificato. Il comando Chiudi senza parametri chiude tutti i file aperti. Il comando Chiudi cancella il buffer e indica al sistema operativo di aggiornare la tabella di allocazione dei file.

I comandi per scrivere dati in un file e leggere informazioni da file di dati dipendono dal tipo di file.

Il file di dati di MathCAD11 deve essere semplicemente un file ASCII. MathCAD11 legge file costituiti da numeri separati da virgole, spazi o ritorni a capo. Di seguito sono riportati esempi di alcuni file letti da MathCAD11, presupponendo che siano scritti in formato ASCII:

§ un file creato eseguendo l'output dei dati da un foglio di calcolo su disco;

§ una colonna di numeri digitati in un elaboratore di testi e salvati in formato ASCII;

§ il risultato di un programma scritto in un linguaggio di alto livello;

§ dati esportati dal database.

I numeri nei file di dati possono essere numeri interi come 3 o -1, numeri in virgola mobile come 2.54 o notazioni scientifiche come 4.51E -4 (per 4.5 10 -4). Ad esempio, il seguente elenco di numeri sarebbe una stringa valida in un file di dati MathCAD11:

200, 50 25.1256, 16E – 2, – 16.125E15

MathCAD11 salva i dati anche in file ASCII. I file di dati salvati da MathCAD11 contengono numeri separati da spazi e ritorni a capo. I documenti MathCAD11 stessi non sono file di dati in questo senso. L'unico modo per creare un file di dati da MathCAD11 è utilizzare le funzioni di accesso al file.

Funzioni di accesso ai file

MathCAD11 dispone di sei funzioni di accesso ai file LEGGERE SCRIVERE, AGGIUNGERE, LEGGIPRN, SCRIVIPR , APPENDPRN. Le loro proprietà:

§ Il nome della funzione deve essere stampato in maiuscolo;

§ Se MathCAD11 non riesce a trovare un file di dati, contrassegna la funzione di accesso corrispondente con il messaggio di errore “ file non trovato" Se MathCAD11 tenta di leggere un file di formato inappropriato, contrassegna la funzione con il messaggio “ errore del file”;

§ Lato sinistro di un operatore di assegnazione che utilizza una delle funzioni SCRIVERE, AGGIUNGERE, SCRIVIPRN, APPENDPRN, non deve contenere altro;

§ Ogni nuova uguaglianza mediante funzioni di accesso riapre il file dati. Durante la lettura dei dati, ad esempio, ogni nuova uguaglianza inizia a leggere all'inizio del file;

§ In un'uguaglianza, il file può essere aperto solo una volta. Ciò significa che se la funzione LEGGERE utilizzato con lo stesso argomento nome file due volte nella stessa equazione (questo è possibile quando si utilizza un argomento discreto), la seconda volta LEGGERE inizierà la lettura dal punto in cui la lettura è terminata la prima volta. Perché il LEGGIPRN legge l'intero file, il che significa che LEGGIPRN non può essere utilizzato con lo stesso argomento due volte nella stessa uguaglianza: la seconda volta LEGGIPRN non ci sarà più niente da leggere;

§ Se due uguaglianze in un documento di lavoro utilizzare SCRIVERE O SCRIVIPR con un argomento, i dati della seconda uguaglianza verranno scritti sopra i dati della prima. Dovrebbe essere usato AGGIUNGERE O APPENDPRN se è necessario salvare il primo dato. Queste funzioni aggiungono nuovi dati a un file esistente.

Nella tabella La sezione 6.1 descrive queste sei funzioni.

Tabella 6.1

Funzioni di accesso ai file

Funzione Senso
LEGGERE( file) Legge un valore da un file di dati. Restituisce uno scalare. Tipicamente utilizzato come segue: v i:=LEGGI(“ file")
SCRIVERE( file) Scrive il valore nel file di dati. Se il file esiste già, lo sostituisce con un nuovo file. Utilizzato nelle definizioni della seguente forma: WRITE( file) := v io
AGGIUNGERE( file) Aggiunge un valore a un file esistente. Utilizzato nelle definizioni della forma seguente: APPEND( file) := v io
LEGGIPRN( file) Legge un file di dati strutturati. Restituisce una matrice. Ogni riga nel file di dati diventa una riga nella matrice. Il numero di elementi in ciascuna riga deve essere lo stesso. Tipicamente utilizzato in questo modo: A: = READPRN( file)

Fine della tabella 6.1

Il secondo file richiesto per il funzionamento di See5 è il file di dati. Ha un'estensione *.data. Nel nostro caso questo è il file URSS. dati.

Ogni oggetto nel file di dati ha la propria riga. Se il valore della variabile di destinazione si trova all'inizio del file dei nomi delle variabili, la riga inizia con il valore di quella variabile di destinazione. Poi seguono i valori di tutte le altre caratteristiche, separati da virgole. I valori delle variabili sconosciute sono codificati con un punto interrogativo “?”, seguito da una barra verticale “|” È possibile scrivere commenti che non vengono accettati dal sistema.

Di seguito è riportato l'intero file di dati URSS. dati, che utilizzeremo per dimostrare le capacità di See5.

File di dati di prova (facoltativo)

Per verificare la qualità dell'albero decisionale costruito e il corrispondente insieme di regole logiche, il sistema See5 offre la possibilità di lavorare con file speciali che contengono dati di test aggiuntivi.

Il terzo tipo di file utilizzato dal sistema See5 contiene nuovi oggetti di test. Questo è quello che viene anche chiamato campione di controllo. Questa vita URSS. testè facoltativo e, se utilizzato, ha il formato del file già descritto URSS. dati.

File di supporto successivo URSS. casiè anche facoltativo. Contiene oggetti con classificazione sconosciuta.

File dei costi

L'ultimo tipo di file designato URSS. costi,contiene informazioni sul costo di vari errori di classificazione. Il completamento di questo file è facoltativo. Tuttavia, assegnare penalità per gli errori può essere molto utile durante lo sviluppo di alcune applicazioni.

Interfaccia utente

Ci sono cinque pulsanti nella finestra principale di See5 (Fig. 1). Elenchiamoli da sinistra a destra.

Utilizzando un pulsante Individuare Da ta (posizione dati) apre una finestra per visualizzare i file di dati disponibili e caricarli nel sistema.

Con il semplice tocco di un pulsante Costruire Classificatore (costruzione di un classificatore) si accede alla finestra di dialogo per selezionare il tipo di classificatore e impostarne i parametri. Il pulsante Interrompi ha lo scopo di interrompere il processo di costruzione di un albero decisionale.

Pulsante Utilizzo Classificatore(usa classificatore) avvia il processo di classificazione interattiva di uno o più oggetti. Utilizzando il pulsante Cross-Reference viene richiamata una finestra in cui vengono chiaramente rivelate le connessioni tra gli oggetti del training set e le regole visibili per la loro classificazione.

Tutte le funzioni di cui sopra sono disponibili anche dal menu File. A sua volta, nel menu Modificare È possibile modificare il file dei nomi dei dati e il file dei costi degli errori di classificazione.

Riso. 1. Finestra principale del sistema Vedere5

Costruire un albero decisionale

La prima fase dell'elaborazione dei dati utilizza solitamente i parametri di sistema predefiniti. premi il bottone Costruire Classificatore e poi nella finestra di dialogo che appare (Fig. 29) cliccare immediatamente 0K(assumendo che il file di dati URSS. dat a è già caricato). Il sistema visualizza una finestra dei risultati simile a questa (Fig. 3). La prima riga del rapporto dei risultati fornisce informazioni sulla versione del sistema See5 utilizzata e l'ora corrente. Quindi le due righe successive dicono che la variabile di classificazione è diagnosi e leggere il file di dati URSS. dati contiene 74 oggetti, ciascuno dei quali è descritto da undici caratteristiche.

Fig2. Finestra di dialogo per l'impostazione dei parametri dell'algoritmo di progettazione del classificatore

Le righe seguenti del report mostrano l'albero decisionale costruito. Può essere interpretato come segue:

SE Indice più di 0,69 e Velocità più di 18, poi classe n. 3, altrimenti

SE Indice più di 0,69 e Velocità non più di 18 e Spessore non più di 46, TO classe n. 1

eccetera.

Ogni ramo dell'albero termina con il numero della classe a cui conduce. Immediatamente dopo il numero c'è una voce di tipo(i) o (p/t). Ad esempio, il primo ramo termina con la voce (12,0). Ciò significa che questo ramo corrisponde a 12 oggetti di una certa (terza) classe. L'ultimo ramo termina con il record 1 (6.0/1.0), da cui segue che questo ramo descrive la classe n. 1 e qui rientrano 6 oggetti, di cui 1 errato. Le quantità P O T può risultare frazionario nel caso in cui qualsiasi ramo contenga un certo numero di oggetti con valori di caratteristica sconosciuti.

La sezione successiva del rapporto presenta le caratteristiche del classificatore costruito, valutate sul training set. Qui vediamo che l'albero decisionale costruito ha 9 rami (dimensione = 9) e l'errore di classificazione viene osservato su 5 oggetti, ovvero il 6,8%.

IN La parte finale del rapporto contiene una tabella con l'analisi dettagliata dei risultati della classificazione. Sulla base dei dati di questa tabella, possiamo dire che dalla classe 1 (reni sani), 20 oggetti sono classificati correttamente e 2 oggetti sono classificati erroneamente come classe 2; tra gli oggetti di classe 2 (cisti multiple), 35 vengono diagnosticati correttamente e 2 vengono riconosciuti erroneamente sani; tutti gli oggetti della classe 3 (idronefrosi) sono classificati correttamente ad eccezione di un oggetto che rientra nella classe n. 2.

Infine, il sistema See5 visualizza un messaggio relativo al tempo impiegato sulla soluzione. nel nostro caso era 0,5 s. Qui va notato che l'algoritmo See5 generalmente funziona a una velocità molto elevata, consentendogli di elaborare rapidamente matrici di informazioni ad alta dimensione contenenti migliaia e decine di migliaia di record.

Possiamo analizzare i risultati della nostra classificazione in modo ancora più dettagliato. Per fare ciò, fare clic sul pulsante Riferimento incrociato nella finestra principale di See5. Il sistema visualizzerà una finestra nella metà sinistra della quale è disegnato l'albero decisionale costruito, e nella metà destra sono elencati gli oggetti che cadono sull'uno o sull'altro ramo dell'albero. Per selezionare il ramo di interesse è necessario cliccarci sopra con il tasto sinistro del mouse (a destra del ramo apparirà un cerchio scuro, indicato da una freccia in Fig. 4). Inoltre, se si clicca sul numero di un oggetto nel campo a destra, il sistema visualizzerà un'altra finestra chiamata Case, in cui vengono visualizzati i valori delle caratteristiche e dell'oggetto selezionato. Nel caso mostrato in figura a noi interessa il ramo (Index<=0.69 и Age.<"43), на которой находятся 10 объектов из 1-го класса и 1 объект из 2-го класса.

Riso. 4. Visualizzazione dei risultati della classificazione nella finestra dei riferimenti incrociati

I migliori articoli sull'argomento