Come configurare smartphone e PC. Portale informativo
  • casa
  • sistema operativo
  • Misure dell'informazione (sintattiche, semantiche, pragmatiche). Quantità e qualità delle informazioni

Misure dell'informazione (sintattiche, semantiche, pragmatiche). Quantità e qualità delle informazioni

Informazioni: che cos'è? Su cosa si basa? Quali obiettivi persegue e quali compiti realizza? Di tutto questo parleremo in questo articolo.

informazioni generali

In quali casi viene utilizzato? metodo semantico misurare le informazioni? Viene utilizzata l'essenza dell'informazione, il lato contenuto del messaggio ricevuto è interessante: queste sono le indicazioni per il suo utilizzo. Ma prima diamo una spiegazione di cosa si tratta. Va notato che il metodo semantico di misurazione delle informazioni è un approccio formalizzato difficile che non è stato ancora completamente formato. Viene utilizzato per misurare la quantità di significato nei dati ricevuti. In altre parole, quanta informazione ricevuta è necessaria in questo caso. Questo approccio viene utilizzato per determinare il contenuto delle informazioni ricevute. E se parliamo di un metodo semantico di misurazione delle informazioni, utilizziamo il concetto di thesaurus, che è indissolubilmente legato all'argomento in esame. Cosa rappresenta?

Dizionario dei sinonimi

Vorrei fare una breve introduzione e rispondere a una domanda sul metodo semantico di misurazione delle informazioni. Chi lo ha introdotto? Il fondatore della cibernetica, Norbert Wiener, propose di utilizzare questo metodo, ma esso ricevette un notevole sviluppo sotto l'influenza del nostro connazionale A. Yu. Schrader. Qual è il nome utilizzato per designare la totalità delle informazioni di cui dispone il destinatario delle informazioni. Se confronti il ​​thesaurus con il contenuto del messaggio ricevuto, puoi scoprire quanto ha ridotto l'incertezza. Vorrei correggere un errore che spesso cade sotto l'influenza di un gran numero di delle persone. Pertanto, ritengono che il metodo semantico per misurare le informazioni sia stato introdotto da Claude Shannon. Non si sa esattamente come sia nato questo malinteso, ma questa opinione non è corretta. Claude Shannon ha introdotto un metodo statistico per misurare le informazioni, il cui “successore” è il metodo semantico.

Approccio grafico per determinare la quantità di informazioni semantiche in un messaggio ricevuto

Perché hai bisogno di disegnare qualcosa? La misurazione semantica utilizza questa capacità per comunicare visivamente l'utilità dei dati in grafici facilmente comprensibili. Cosa significa in pratica? Per spiegare lo stato delle cose, una relazione viene tracciata sotto forma di grafico. Se l'utente non è a conoscenza dell'essenza del messaggio ricevuto (uguale a zero), allora il volume informazioni semantiche sarà uguale allo stesso valore. È possibile trovarlo valore ottimale? SÌ! Questo è il nome di un thesaurus, dove il volume delle informazioni semantiche è massimo. Diamo un'occhiata a un piccolo esempio. Supponiamo che un utente riceva un messaggio scritto in una lingua sconosciuta. lingua straniera, oppure una persona può leggere ciò che è scritto lì, ma questa non è più una novità per lui, poiché tutto questo è noto. In questi casi, dicono che il messaggio contiene zero informazioni semantiche.

Sviluppo storico

Questo probabilmente avrebbe dovuto essere discusso un po’ più in alto, ma non è troppo tardi per recuperare il ritardo. Il metodo semantico per misurare le informazioni fu originariamente introdotto da Ralph Hartley nel 1928. In precedenza è stato menzionato che Claude Shannon è spesso citato come fondatore. Perché c’era tanta confusione? Il fatto è che, sebbene il metodo semantico di misurazione delle informazioni sia stato introdotto da Ralph Hartley nel 1928, furono Claude Shannon e Warren Weaver a generalizzarlo nel 1948. Successivamente il fondatore della cibernetica, Norbert Wiener, concepì l'idea del metodo del thesaurus, che ricevette il massimo riconoscimento sotto forma di una misura sviluppata da Yu. I. Schneider. Va notato che per capirlo, è necessario abbastanza alto livello conoscenza.

Efficienza

Cosa ci offre in pratica il metodo del thesaurus? È una vera conferma della tesi secondo cui l'informazione ha una proprietà come la relatività. Va notato che ha un valore relativo (o soggettivo). Per poter valutare oggettivamente informazioni scientifiche, ha introdotto il concetto di thesaurus universale. Il suo grado di cambiamento mostra l’importanza della conoscenza che l’umanità riceve. Allo stesso tempo, è impossibile dire esattamente quale risultato finale (o intermedio) si possa ottenere dalle informazioni. Prendiamo ad esempio i computer. Ingegneria Informaticaè stato creato basandosi sulla tecnologia dei tubi e sullo stato dei bit di ciascuno elemento strutturale ed era originariamente utilizzato per eseguire calcoli. Ora quasi ogni persona ha qualcosa che funziona sulla base di questa tecnologia: radio, telefono, computer, TV, laptop. Anche frigoriferi moderni, stufe e lavandini contengono alcuni componenti elettronici, la cui base sono le informazioni su come facilitare l'uso di questi elettrodomestici da parte di una persona.

Approccio scientifico

Dove viene studiato il metodo semantico di misurazione delle informazioni? L’informatica è la scienza che si occupa di vari aspetti di questo problema. Qual è la particolarità? Il metodo si basa sull'utilizzo del sistema “vero/falso” o del sistema “uno/zero bit”. Quando arriva? determinate informazioni, quindi viene diviso in blocchi separati, che prendono il nome come unità discorsive: parole, sillabe e simili. Ogni blocco riceve un valore specifico. Diamo un'occhiata a un piccolo esempio. Due amici sono lì vicino. Ci si rivolge al secondo con le parole: "Domani avremo un giorno libero". Tutti sanno quando sono i giorni di riposo. Pertanto, il valore di questa informazione è zero. Ma se il secondo dice che domani lavorerà, allora per il primo sarà una sorpresa. In questo caso, infatti, potrebbe succedere che i piani che una persona aveva fatto, ad esempio, per andare a giocare a bowling o frugare in un laboratorio, verranno interrotti. Ogni parte dell'esempio descritto può essere descritta utilizzando uno e zero.

Operare con concetti

Ma cos'altro viene utilizzato oltre al dizionario dei sinonimi? Cos’altro devi sapere per comprendere il modo semantico di misurare le informazioni? I concetti di base che possono essere ulteriormente studiati sono i sistemi di segni. Sono intesi come mezzi per esprimere significato, come regole per interpretare i segni o le loro combinazioni. Diamo un'occhiata a un altro esempio tratto dall'informatica. I computer funzionano con zeri e uno convenzionali. Essenzialmente, si tratta della bassa e alta tensione fornita ai componenti dell'apparecchiatura. Inoltre, trasmettono questi uno e questi zeri all'infinito. Come può la tecnologia differenziarli? La risposta a questa domanda è stata trovata: interruzioni. Quando queste stesse informazioni vengono trasmesse, i risultati lo sono vari blocchi come parole, frasi e significati individuali. Nel linguaggio umano parlato, le pause vengono utilizzate anche per suddividere i dati in blocchi separati. Sono così invisibili che ne notiamo la maggior parte automaticamente. Nella scrittura si utilizzano a questo scopo i punti e le virgole.

Peculiarità

Tocchiamo anche il tema delle proprietà che ha il metodo semantico di misurazione delle informazioni. Sappiamo già che questo è il nome di un approccio speciale che valuta l'importanza delle informazioni. Possiamo dire che i dati che verranno valutati in questo modo saranno oggettivi? No non è vero. L'informazione è soggettiva. Consideriamolo usando come esempio una scuola. C'è uno studente eccellente che è in anticipo rispetto al programma approvato e uno studente medio che studia ciò che viene insegnato in classe. Per il primo, la maggior parte delle informazioni che riceverà a scuola saranno di scarso interesse, poiché le conosce già e non le sente/legge per la prima volta. Pertanto, a livello soggettivo, non avrà molto valore per lui (a causa forse di alcuni commenti dell’insegnante che ha notato durante la presentazione della sua materia). Mentre la media nuova informazione Ha sentito qualcosa solo da remoto, quindi per lui il valore dei dati che verranno presentati nelle lezioni è di un ordine di grandezza maggiore.

Conclusione

Va notato che nell'informatica il metodo semantico di misurazione delle informazioni non è l'unica opzione all'interno della quale è possibile risolvere i problemi esistenti. La scelta dovrebbe dipendere dagli obiettivi prefissati e dalle opportunità presenti. Pertanto, se sei interessato all'argomento o ce n'è bisogno, non possiamo che consigliare vivamente di studiarlo più in dettaglio e di scoprire quali altri metodi di misurazione delle informazioni esistono, oltre alla semantica.

Informazioni e dati

Termine informazione deriva dal latino informatio, che significa spiegazione, informazione, presentazione. Dalla posizione della filosofia materialistica, l'informazione è un riflesso del mondo reale con l'aiuto di informazioni (messaggi). Un messaggio è una forma di presentazione di informazioni sotto forma di discorso, testo, immagini, dati digitali, grafici, tabelle, ecc. In senso lato, l'informazione è un concetto scientifico generale che comprende lo scambio di informazioni tra persone, lo scambio di segnali tra natura vivente e inanimata, persone e dispositivi.

Informazione- informazioni su oggetti e fenomeni dell'ambiente, i loro parametri, proprietà e condizioni, che riducono il grado di incertezza e la conoscenza incompleta su di essi.

L'informatica considera le informazioni come informazioni, dati, concetti concettualmente interconnessi che cambiano le nostre idee su un fenomeno o un oggetto nel mondo circostante. Insieme a quello di informazione, il concetto è spesso utilizzato in informatica dati. Mostriamo come differiscono.

I dati possono essere considerati come segni o osservazioni registrate che per qualche motivo non vengono utilizzate, ma solo archiviate. Quando diventa possibile utilizzare questi dati per ridurre l’incertezza su qualcosa, i dati si trasformano in informazioni. Pertanto, si può sostenere che le informazioni siano i dati utilizzati.

Esempio 2.1. Scrivi dieci numeri di telefono in una sequenza di dieci numeri su un pezzo di carta e mostrali al tuo amico. Percepirà questi numeri come dati, poiché non gli forniscono alcuna informazione

Poi, accanto a ciascun numero, indicare il nome dell'azienda e la tipologia di attività. Per il tuo amico, numeri incomprensibili acquisiranno certezza e si trasformeranno da dati in informazioni che potrebbe utilizzare in futuro.

Uno dei tipi di informazioni più importanti è quello economico. Suo caratteristica distintiva- connessione con i processi di gestione di team di persone e organizzazioni. Informazioni economiche accompagna processi di produzione, distribuzione, scambio e consumo di beni e servizi materiali. Una parte significativa di essa è legata alla produzione sociale e può essere chiamata informazione di produzione.

Informazioni economiche- un insieme di informazioni che riflettono i processi socioeconomici e servono a gestire questi processi e gruppi di persone nella sfera produttiva e non produttiva.

Quando si lavora con le informazioni, c'è sempre una fonte e un consumatore (destinatario). Vengono chiamati i percorsi e i processi che assicurano la trasmissione dei messaggi dalla fonte dell'informazione al suo consumatore comunicazioni informative.

Per il consumatore di informazioni è molto caratteristica importanteè la sua adeguatezza.

Adeguatezza delle informazioni- questo è un certo livello di corrispondenza dell'immagine creata utilizzando le informazioni ricevute con un oggetto, processo, fenomeno, ecc. reale.

IN vita reale Una situazione difficilmente possibile quando si può contare sulla completa adeguatezza delle informazioni. C’è sempre un certo grado di incertezza. La correttezza del processo decisionale umano dipende dal grado di adeguatezza delle informazioni allo stato reale di un oggetto o processo.

Esempio 2.2. Hai completato con successo la scuola e desideri continuare la tua formazione in economia. Dopo aver parlato con gli amici, imparerai che una formazione simile può essere ottenuta in diverse università. Come risultato di tali conversazioni, ricevi informazioni molto contraddittorie che non ti consentono di prendere una decisione a favore di un'opzione o di un'altra, ad es. le informazioni ricevute sono inadeguate alla reale situazione. Per ottenere informazioni più affidabili, acquisti una guida per i candidati alle università, dalla quale ricevi informazioni complete. In questo caso, possiamo dire che le informazioni che hai ricevuto dalla directory riflettono adeguatamente le aree di studio nelle università e ti aiutano a fare la tua scelta finale.

FORME DI ADEGUATEZZA DELL'INFORMAZIONE

L'adeguatezza dell'informazione può essere espressa in tre forme: semantica, sintattica, pragmatica.

Adeguatezza sintattica. Mostra le caratteristiche formali e strutturali dell'informazione e non ne influenza il contenuto semantico. A livello sintattico, vengono presi in considerazione il tipo di supporto e il metodo di presentazione delle informazioni, la velocità di trasmissione ed elaborazione, la dimensione dei codici per la presentazione delle informazioni, l'affidabilità e l'accuratezza della conversione di questi codici, ecc. Le informazioni considerate solo dal punto di vista sintattico vengono solitamente chiamate dati, poiché il lato semantico non ha importanza. Questa forma contribuisce alla percezione delle caratteristiche strutturali esterne, ad es. lato sintattico dell'informazione.

Adeguatezza semantica (nozionale).. Questa forma determina il grado di corrispondenza tra l'immagine dell'oggetto e l'oggetto stesso. L'aspetto semantico implica tenere conto del contenuto semantico delle informazioni. A questo livello, viene analizzata l'informazione riflessa dall'informazione e vengono prese in considerazione le connessioni semantiche. Nell'informatica vengono stabilite connessioni semantiche tra codici per rappresentare le informazioni. Questa forma serve a formare concetti e idee, identificare il significato, il contenuto delle informazioni e la sua generalizzazione.

Adeguatezza pragmatica (del consumatore).. Riflette la relazione tra l'informazione e il suo consumatore, la corrispondenza dell'informazione con l'obiettivo di gestione, che viene implementato sulla sua base. Le proprietà pragmatiche dell'informazione appaiono solo se esiste unità di informazione (oggetto), utente e obiettivo di gestione. L'aspetto pragmatico della considerazione è associato al valore, all'utilità dell'utilizzo delle informazioni quando il consumatore sviluppa una soluzione per raggiungere il suo obiettivo. Da questo punto di vista vengono analizzate le proprietà di consumo delle informazioni. Questa forma di adeguatezza è direttamente correlata a uso pratico informazioni, con la sua conformità con la funzione target del sistema.

MISURE INFORMATIVE

Classificazione delle misure

Per misurare le informazioni vengono introdotti due parametri: quantità di informazioni IO e volume di dati V D .

Tali parametri hanno espressioni ed interpretazioni diverse a seconda della forma di adeguatezza considerata. Ciascuna forma di adeguatezza corrisponde ad una propria misura della quantità di informazioni e del volume dei dati (Fig. 2.1).

Riso. 2.1. Misure di informazione

Misura sintattica dell'informazione

Questa misura della quantità di informazioni opera con informazioni impersonali che non esprimono una relazione semantica con l'oggetto.

Volume di datiVd. in un messaggio viene misurato dal numero di caratteri (bit) in questo messaggio. In diversi sistemi numerici, una cifra ha un peso diverso e l'unità di misura dei dati cambia di conseguenza:

V sistema binario unità di misura della notazione: bit (bit - cifra binaria - cifra binaria);

Nota. IN computer moderni Insieme all'unità di dati minima “bit”, è ampiamente utilizzata l'unità di misura ingrandita “byte”, pari a 8 bit.

V sistema decimale l'unità di misura della notazione è dit (cifra decimale).

Esempio 2.3. Messaggio nel sistema binario a otto bit codice binario 10111011 ha un volume di dati V d=8 bit.

Un messaggio nel sistema decimale sotto forma di numero a sei cifre 275903 ha un volume di dati V d=6 dit.

Quantità di informazioni- a livello sintattico è impossibile determinarlo senza considerare il concetto di incertezza dello stato del sistema (entropia del sistema). Infatti, l'ottenimento di informazioni su un sistema è sempre associato a un cambiamento nel grado di ignoranza del destinatario sullo stato di tale sistema. Consideriamo questo concetto.

Lasciare che il consumatore abbia alcune informazioni preliminari (a priori) sul sistema a prima di ricevere informazioni. La misura della sua ignoranza del sistema è la funzione H(a), che serve allo stesso tempo come misura dell’incertezza dello stato del sistema.

Dopo aver ricevuto un messaggio b, il destinatario ne ha acquisito alcuni Informazioni aggiuntive Ib(a), che riduceva la sua ignoranza a priori in modo che l'incertezza a posteriori (dopo aver ricevuto il messaggio b) dello stato del sistema diventasse Hb(a).

Quindi la quantità di informazioni Ib(a) sul sistema ricevute nel messaggio b verrà determinata come

Ib(a)=H(a)-Hb(a),

quelli. la quantità di informazioni è misurata da un cambiamento (riduzione) nell'incertezza dello stato del sistema.

Se l’incertezza finale Hb(a) diventa zero, allora la conoscenza incompleta originale verrà sostituita piena conoscenza e la quantità di informazioni Ib(a)=H(a). In altre parole, entropia del sistema H(a) può essere visto come una misura delle informazioni mancanti.

L'entropia di un sistema H(a) avente N stati possibili, secondo La formula di Shannon, è uguale a:

Dove Rio - la probabilità che il sistema sia nello stato i-esimo.

Nel caso in cui tutti gli stati del sistema siano ugualmente probabili, cioè le loro probabilità sono uguali Pi= 1/N, la sua entropia è determinata dalla relazione

Spesso le informazioni sono codificate con codici numerici nell'uno o nell'altro sistema numerico, ciò è particolarmente vero quando si presentano informazioni su un computer. Naturalmente, lo stesso numero di cifre in sistemi diversi la notazione può trasmettere un numero diverso di stati dell'oggetto visualizzato, che può essere rappresentato come un rapporto

N= m n,

Dove N-il numero di possibili stati visualizzati;

T - base del sistema numerico (varietà di simboli utilizzati nell'alfabeto);

P - numero di bit (caratteri) nel messaggio.

Esempio 2.4. Ma un messaggio a n bit viene trasmesso al canale di comunicazione utilizzando T vari simboli. Poiché il numero di tutte le possibili combinazioni di codici sarà N= m n, quindi, se qualcuno di essi ha la stessa probabilità di apparire, la quantità di informazioni acquisite dall'abbonato come risultato della ricezione del messaggio sarà IO= logN= log - La formula di Hartley.

Se prendiamo come base del logaritmo T, Quello IO= N. In questo caso, la quantità di informazioni (supponendo che l'abbonato sia completamente all'oscuro a priori del contenuto del messaggio) sarà pari alla quantità di dati IO= VD, ricevuto tramite canale di comunicazione. Per stati non uniformi del sistema, sempre IO< VD= N.

I più comunemente usati sono i logaritmi binari e decimali. Le unità di misura in questi casi saranno rispettivamente bit e dit.

Coefficiente(grado di) contenuto informativo(concisione) di un messaggio è determinata dal rapporto tra la quantità di informazioni e la quantità di dati, vale a dire

Inoltre, 0

Con aumento Y la quantità di lavoro per trasformare le informazioni (dati) nel sistema è ridotta. Pertanto, si sforzano di aumentare il contenuto informativo, per il quale si stanno sviluppando metodi speciali per la codifica ottimale delle informazioni.

Informazioni sulla misura semantica

Per misurare il contenuto semantico delle informazioni, ad es. sua quantità a livello semantico, la più riconosciuta è la misura del thesaurus, che collega le proprietà semantiche dell’informazione con la capacità dell’utente di accettare il messaggio in arrivo. A questo scopo viene utilizzato il concetto dizionario dei sinonimi dell'utente.

Dizionario dei sinonimiè una raccolta di informazioni disponibili per un utente o un sistema.

A seconda della relazione tra il contenuto semantico delle informazioni S e il dizionario dei sinonimi dell'utente S p la quantità di informazioni semantiche cambia Circuito integrato, percepito dall'utente e successivamente da lui incluso nel suo thesaurus. La natura di questa dipendenza è mostrata nella Fig. 2.2. Consideriamo due casi limite di quantità di informazione semantica Circuito integratoè uguale a 0:

A S p 0 l'utente non percepisce né comprende le informazioni in arrivo;

A SP; l'utente sa tutto, ma non ha bisogno delle informazioni in arrivo.

Riso. 2.2. Dipendenza dalla quantità di informazione semantica. percepito dal consumatore, dal suo thesaurus IOC= F(SP)

Quantità massima di informazioni semantiche Circuito integrato il consumatore acquisisce concordandone il contenuto semantico S con il tuo dizionario dei sinonimi S p (S p = S p opt), quando le informazioni in arrivo sono comprensibili per l'utente e gli forniscono informazioni precedentemente sconosciute (non nel suo thesaurus).

Di conseguenza, la quantità di informazioni semantiche contenute in un messaggio, la quantità di nuova conoscenza ricevuta dall'utente, è un valore relativo. Lo stesso messaggio può avere un contenuto significativo per un utente competente ed essere privo di significato (rumore semantico) per un utente incompetente.

Quando si valuta l'aspetto semantico (contenuto) delle informazioni, è necessario sforzarsi di armonizzare i valori S E S p.

Una misura relativa della quantità di informazione semantica può essere il coefficiente di contenuto CON, che è definito come il rapporto tra la quantità di informazione semantica e il suo volume:

Misura pragmatica dell'informazione

Questa misura determina l'utilità delle informazioni (valore) per l'utente per raggiungere il suo obiettivo. Questa misura è anche un valore relativo, determinato dalle peculiarità dell'utilizzo di queste informazioni in un particolare sistema. È consigliabile misurare il valore dell'informazione nelle stesse unità (o vicino ad esse) in cui si misura la funzione obiettivo.

Esempio 2.5. Nel sistema economico proprietà pragmatiche(valore) delle informazioni può essere determinato dall’incremento dell’effetto economico dell’operazione ottenuto attraverso l’utilizzo di tali informazioni per gestire il sistema:

IONB(G)= P(G / B)- P(G),

Dove IONB(G) -valore del messaggio informativo b per il sistema di controllo g,

P(G) - effetto economico atteso a priori dal funzionamento del sistema di controllo g ,

P(G / B) - l'effetto atteso dal funzionamento del sistema g, a condizione che le informazioni contenute nel messaggio b siano utilizzate per il controllo.

Per confronto, presentiamo le misure informative introdotte nella Tabella 2.1.

Tabella 2.1. Unità informative ed esempi

Misura dell'informazione
Unità

Esempi
(per area informatica)

Sintattico:

Approccio Shannon

approccio informatico

Grado di riduzione dell'incertezza

Unità di presentazione delle informazioni

Probabilità dell'evento

Bit, byte, ecc.

Semantico

Dizionario dei sinonimi

Indicatori economici

Pacchetto software applicativo, personal computer, reti di computer, ecc.

Redditività, produttività, tasso di ammortamento, ecc.

Pragmatico

Valore d'uso

Capacità di memoria, prestazioni del computer, velocità di trasferimento dati, ecc.

Tempo per elaborare informazioni e prendere decisioni

QUALITÀ DELLE INFORMAZIONI

La possibilità e l'efficacia dell'utilizzo delle informazioni sono determinate dai bisogni fondamentali del consumatore: indicatori di qualità, come rappresentatività, significatività, sufficienza, accessibilità, pertinenza, tempestività, accuratezza, affidabilità, sostenibilità.

  • Rappresentatività l'informazione è associata alla correttezza della sua selezione e formazione al fine di riflettere adeguatamente le proprietà dell'oggetto. Le cose più importanti qui sono:
  • la correttezza del concetto sulla base del quale è formulato il concetto originale;
  • validità della selezione delle caratteristiche essenziali e delle connessioni del fenomeno mostrato.
  • La violazione della rappresentatività delle informazioni porta spesso a errori significativi.
  • Contenuto l'informazione riflette la capacità semantica pari al rapporto tra la quantità di informazione semantica in un messaggio e il volume dei dati elaborati, ad es. C=Ic/Vd.

All'aumentare del contenuto delle informazioni aumenta il throughput semantico del sistema informativo, poiché per ottenere le stesse informazioni è necessario convertire una quantità minore di dati.

Insieme al coefficiente di contenuto C, che riflette l'aspetto semantico, si può utilizzare anche il coefficiente di contenuto informativo, caratterizzato dal rapporto tra la quantità di informazioni sintattiche (secondo Shannon) e la quantità di dati Y=I/Vd.

  • Sufficienza (completezza) informazione significa che contiene una composizione minima ma sufficiente (insieme di indicatori) per prendere la decisione giusta. Il concetto di completezza dell'informazione è associato al suo contenuto semantico (semantica) e alla pragmatica. In quanto incompleto, cioè Informazioni insufficienti per prendere la decisione giusta e informazioni ridondanti riducono l'efficacia delle decisioni prese dall'utente.
  • Disponibilità l'informazione alla percezione dell'utente è assicurata dall'implementazione di idonee procedure per la sua acquisizione e trasformazione. Ad esempio, in un sistema informativo, l'informazione viene trasformata in una forma accessibile e di facile utilizzo. Ciò si ottiene, in particolare, coordinando la sua forma semantica con il thesaurus dell’utente.
  • Rilevanza le informazioni sono determinate dal grado di conservazione del valore delle informazioni per la gestione al momento del loro utilizzo e dipendono dalla dinamica dei cambiamenti nelle sue caratteristiche e dall'intervallo di tempo trascorso dal verificarsi di queste informazioni.
  • Tempestività informazione significa il suo arrivo entro e non oltre un momento predeterminato, coerente con il momento della risoluzione del compito.
  • Precisione le informazioni sono determinate dal grado di vicinanza delle informazioni ricevute allo stato reale dell'oggetto, processo, fenomeno, ecc. Per le informazioni visualizzate da un codice digitale, sono noti quattro concetti di classificazione di accuratezza:
  • precisione formale, misurata dal valore unitario della cifra meno significativa di un numero;
  • accuratezza reale, determinata dal valore dell'unità dell'ultima cifra del numero, la cui accuratezza è garantita;
  • la massima precisione ottenibile nelle specifiche condizioni operative del sistema;
  • la precisione richiesta, determinata dallo scopo funzionale dell'indicatore.

Credibilità l'informazione è determinata dalla sua proprietà di riflettere gli oggetti della vita reale con la necessaria precisione. L'affidabilità delle informazioni è misurata dalla probabilità di confidenza dell'accuratezza richiesta, vale a dire la probabilità che il valore di un parametro visualizzato dalle informazioni differisca dal valore reale di questo parametro entro la precisione richiesta.

Sostenibilità le informazioni riflettono la loro capacità di rispondere ai cambiamenti nei dati di origine senza violare la precisione richiesta. La stabilità delle informazioni, così come la rappresentatività, è determinata dalla metodologia scelta per la sua selezione e formazione.

In conclusione, va notato che parametri di qualità dell'informazione come rappresentatività, contenuto, sufficienza, accessibilità, sostenibilità sono interamente determinati a livello metodologico di sviluppo dei sistemi informativi. Anche i parametri di pertinenza, tempestività, accuratezza e affidabilità sono determinati in misura maggiore a livello metodologico, ma il loro valore è influenzato in modo significativo dalla natura del funzionamento del sistema, in primo luogo dalla sua affidabilità. Allo stesso tempo, i parametri di pertinenza e accuratezza sono strettamente correlati rispettivamente ai parametri di tempestività e affidabilità.

SU

Misura sintattica informazione.

Questa misura della quantità di informazioni opera con informazioni impersonali che non esprimono una relazione semantica con l'oggetto. Volume dati Vd in questo caso il messaggio viene misurato in base al numero di caratteri (bit) nel messaggio. IN vari sistemi Nella notazione, una cifra ha un peso diverso e l'unità di misura dei dati cambia di conseguenza.

Ad esempio, nel sistema numerico binario l'unità di misura è il bit (cifra bit-binaria - cifra binaria). Un bit è la risposta a una singola domanda binaria (“sì” o “no”; “0” o “1”), trasmessa sui canali di comunicazione utilizzando un segnale. Pertanto, la quantità di informazioni contenute in un messaggio in bit è determinata dal numero di parole binarie del linguaggio naturale, dal numero di caratteri in ciascuna parola e dal numero di segnali binari necessari per esprimere ciascun carattere.

Nei moderni computer, accanto all'unità di misura minima del dato “bit”, è ampiamente utilizzata l'unità di misura ingrandita “byte”, pari a 8 bit. Nel sistema decimale l’unità di misura è il “bit” (cifra decimale).

Quantità di informazioni I a livello sintattico è impossibile determinarlo senza considerare il concetto di incertezza dello stato del sistema (entropia del sistema). Infatti, l'ottenimento di informazioni su un sistema è sempre associato a un cambiamento nel grado di ignoranza del destinatario sullo stato di tale sistema, vale a dire la quantità di informazioni è misurata da un cambiamento (riduzione) nell'incertezza dello stato del sistema.

Coefficiente (grado) di contenuto informativo(concisione) di un messaggio è determinata dal rapporto tra la quantità di informazioni e la quantità di dati, vale a dire

Y=I/Vd, con 0

Con aumento Y la quantità di lavoro per trasformare le informazioni (dati) nel sistema è ridotta. Pertanto, si sforzano di aumentare il contenuto informativo, per il quale si stanno sviluppando metodi speciali per la codifica ottimale delle informazioni.

Misura semantica dell'informazione

Per misurare il contenuto semantico delle informazioni, ad es. sua quantità a livello semantico, la più riconosciuta è la misura del thesaurus, che collega le proprietà semantiche dell’informazione con la capacità dell’utente di accettare il messaggio in arrivo. A questo scopo viene utilizzato il concetto dizionario dei sinonimi dell'utente.

Dizionario dei sinonimiè una raccolta di informazioni disponibili per un utente o un sistema.

A seconda della relazione tra il contenuto semantico delle informazioni S e il dizionario dei sinonimi dell'utente Sp la quantità di informazioni semantiche cambia Io, percepito dall'utente e successivamente da lui incluso nel suo thesaurus.

La natura di questa dipendenza è mostrata in Fig. 1. Considera due casi limite quando la quantità di informazioni semantiche è uguale a 0:

A Sp= 0 l'utente non percepisce né comprende le informazioni in arrivo;

A Sp l'utente sa tutto e non ha bisogno delle informazioni in arrivo.

Argomento 2. Nozioni di base sulla rappresentazione e l'elaborazione delle informazioni in un computer

Letteratura

1. Informatica in Economia: libro di testo/Ed. ESSERE. Odintsova, A.N. Romanova. – M.: Libro di testo universitario, 2008.

2. Informatica: Corso Base: Libro di testo/Ed. S.V. Simonovich. – San Pietroburgo: Pietro, 2009.

3. Informatica. Corso generale: Libro di testo/Coautore: A.N. Guda, M.A. Butakova, N.M. Nechitailo, A.V. Černov; Sotto generale ed. IN E. Kolesnikova. – M.: Dashkov e K, 2009.

4. Informatica per economisti: libro di testo/Ed. Matyushka V.M. - M.: Infra-M, 2006.

5. Informatica economica: Introduzione all'analisi economica dei sistemi informativi - M.: INFRA-M, 2005.

Misure di informazione (sintattiche, semantiche, pragmatiche)

Possono essere utilizzati vari approcci per misurare le informazioni, ma quelli più utilizzati sono statistico(probabilistico), semantico e pag pragmatico metodi.

Statistico Il metodo (probabilistico) per misurare le informazioni è stato sviluppato da K. Shannon nel 1948, che ha proposto di considerare la quantità di informazioni come una misura dell'incertezza dello stato del sistema, che viene rimossa come risultato della ricezione delle informazioni. L’espressione quantitativa dell’incertezza è chiamata entropia. Se, dopo aver ricevuto un determinato messaggio, l'osservatore ha acquisito ulteriori informazioni sul sistema X, quindi l’incertezza è diminuita. La quantità aggiuntiva di informazioni ricevute è definita come:

dove è la quantità aggiuntiva di informazioni sul sistema X, ricevuto sotto forma di messaggio;

Incertezza iniziale (entropia) del sistema X;

Incertezza finita (entropia) del sistema X, che si verificano dopo la ricezione del messaggio.

Se il sistema X può trovarsi in uno degli stati discreti, il cui numero N, e la probabilità di trovare il sistema in ciascuno di essi è uguale e la somma delle probabilità di tutti gli stati è uguale a uno, quindi l'entropia viene calcolata utilizzando la formula di Shannon:

dov'è l'entropia del sistema X;

UN- la base del logaritmo, che determina l'unità di misura dell'informazione;

N– il numero di stati (valori) in cui il sistema può trovarsi.

L’entropia è una quantità positiva e poiché le probabilità sono sempre inferiori a uno e il loro logaritmo è negativo, il segno meno nella formula di K. Shannon rende l’entropia positiva. Pertanto, la stessa entropia, ma con il segno opposto, viene presa come misura della quantità di informazione.

La relazione tra informazione ed entropia può essere intesa come segue: ottenere informazioni (il suo aumento) significa contemporaneamente ridurre l'ignoranza o l'incertezza informativa (entropia)

Pertanto, l'approccio statistico tiene conto della probabilità che appaiano i messaggi: il messaggio meno probabile è considerato più informativo, ovvero meno atteso. La quantità di informazioni raggiunge il suo valore massimo se gli eventi sono ugualmente probabili.

R. Hartley ha proposto la seguente formula per misurare le informazioni:

I=log2n ,

Dove N- numero di eventi ugualmente probabili;

IO– una misura di informazione in un messaggio relativa al verificarsi di uno dei N eventi

La misurazione dell'informazione è espressa nel suo volume. Molto spesso ciò riguarda la quantità di memoria del computer e la quantità di dati trasmessi sui canali di comunicazione. Per unità si intende la quantità di informazione alla quale l'incertezza viene ridotta della metà; viene chiamata tale unità di informazione morso .

Se il logaritmo naturale () viene utilizzato come base del logaritmo nella formula di Hartley, l'unità di misura dell'informazione è nat ( 1 bit = ln2 ≈ 0,693 nat). Se il numero 3 viene utilizzato come base del logaritmo, allora - trattare, se 10, allora - questo (Hartley).

In pratica, viene utilizzata più spesso un'unità più grande: byte(byte) pari a otto bit. Questa unità è stata scelta perché può essere utilizzata per codificare uno qualsiasi dei 256 caratteri dell'alfabeto della tastiera del computer (256=28).

Oltre ai byte, le informazioni vengono misurate in mezze parole (2 byte), parole (4 byte) e doppie parole (8 byte). Sono ampiamente utilizzate anche unità di misura delle informazioni ancora più grandi:

1 kilobyte (KB - kilobyte) = 1024 byte = 210 byte,

1 Megabyte (MB - megabyte) = 1024 KB = 220 byte,

1 Gigabyte (GB - gigabyte) = 1024 MB = 230 byte.

1 terabyte (TB - terabyte) = 1024 GB = 240 byte,

1 Petabyte (PByte - petabyte) = 1024 TB = 250 byte.

Nel 1980, il matematico russo Yu Manin propose l'idea di costruire un computer quantistico, in relazione al quale tale unità di informazione appariva come qubit ( bit quantistico, qubit ) – Il “bit quantistico” è una misura della quantità di memoria in una forma teoricamente possibile di computer che utilizza mezzi quantistici, ad esempio gli spin degli elettroni. Un qubit non può assumere due valori diversi (“0” e “1”), ma diversi, corrispondenti a combinazioni normalizzate di due stati di spin fondamentale, che forniscono un numero maggiore di combinazioni possibili. Pertanto, 32 qubit possono codificare circa 4 miliardi di stati.

Approccio semantico. Una misura sintattica non è sufficiente se è necessario determinare non il volume dei dati, ma la quantità di informazioni necessarie nel messaggio. In questo caso viene considerato l'aspetto semantico, che permette di determinare il contenuto dell'informazione.

Per misurare il contenuto semantico delle informazioni, è possibile utilizzare il thesaurus del destinatario (consumatore). L'idea del metodo del thesaurus è stata proposta da N. Wiener e sviluppata dal nostro scienziato domestico A.Yu. Schrader.

Dizionario dei sinonimi chiamato corpo di informazioni di cui dispone il destinatario delle informazioni. Correlare il thesaurus con il contenuto del messaggio ricevuto permette di scoprire quanto riduce l'incertezza.

Dipendenza del volume delle informazioni semantiche di un messaggio dal thesaurus del destinatario

Secondo la dipendenza presentata nel grafico, se l'utente non dispone di alcun thesaurus (conoscenza dell'essenza del messaggio ricevuto, cioè =0), o della presenza di un tale thesaurus che non è cambiato in seguito all'arrivo del messaggio (), la quantità di informazioni semantiche in esso contenute è uguale a zero. Il thesaurus ottimale () sarà quello in cui il volume delle informazioni semantiche sarà massimo (). Ad esempio, le informazioni semantiche in un messaggio in arrivo su in una lingua straniera sconosciuta ci sarà zero, ma la stessa situazione sarà nel caso se il messaggio non fa più notizia, poiché l'utente sa già tutto.

Misura pragmatica informazione ne determina l'utilità nel raggiungimento degli obiettivi del consumatore. Per fare ciò, è sufficiente determinare la probabilità di raggiungere l'obiettivo prima e dopo aver ricevuto il messaggio e confrontarle. Il valore delle informazioni (secondo A.A. Kharkevich) viene calcolato utilizzando la formula:

dov'è la probabilità di raggiungere l'obiettivo prima di ricevere il messaggio;

La probabilità di raggiungere l'obiettivo è il campo di ricezione del messaggio;

Metodo di valutazione quantitativa delle informazioni: statistico, semantico, pragmatico e strutturale

Per valutare e misurare la quantità di informazioni in conformità con gli aspetti sopra indicati, vengono utilizzati diversi approcci. Tra questi ci sono statistici, semantici, pragmatici e strutturali. Storicamente, l’approccio statistico ha ricevuto il maggiore sviluppo.

Secondo approccio statistico è stato introdotto il concetto di “quantità di informazioni” come misura dell'incertezza dello stato del sistema, rimosso quando si ricevono informazioni. L’incertezza quantitativamente espressa di uno stato si chiama “entropia”. Quando si ottengono informazioni, l'incertezza diminuisce, ad es. entropia, sistemi. Ovviamente, più informazioni riceve l’osservatore, più l’incertezza viene rimossa e l’entropia del sistema diminuisce, cioè L’entropia di un sistema può essere pensata come una misura dell’informazione mancante. Quando l'entropia è zero, l'informazione sul sistema è completa e all'osservatore appare completamente ordinato. Pertanto, l'ottenimento di informazioni è associato a un cambiamento nel grado di ignoranza del destinatario sullo stato di questo sistema.

Va notato che il metodo statistico per determinare la quantità di informazioni praticamente non tiene conto degli aspetti semantici e pragmatici delle informazioni.

Approccio semantico la determinazione della quantità di informazioni è la più difficile da formalizzare e non è stata ancora determinata in modo definitivo.

La misura del thesaurus ha ricevuto il maggior riconoscimento per la misurazione del contenuto semantico delle informazioni. Per comprendere e utilizzare le informazioni, il destinatario deve avere una certa conoscenza.

Se il thesaurus individuale del consumatore (S n) riflette la sua conoscenza su un determinato argomento, la quantità di informazioni semantiche (I c) contenuta in un determinato messaggio può essere valutata dal grado di cambiamento in questo thesaurus che si è verificato sotto l'influenza di questo Messaggio. Ovviamente, la quantità di informazioni (I s) dipende in modo non lineare dallo stato del thesaurus individuale dell’utente e, sebbene il contenuto semantico del messaggio sia costante, utenti con thesauri diversi riceveranno una quantità di informazioni diseguale. Ad esempio, se il thesaurus individuale del destinatario delle informazioni è vicino allo zero (S n = 0), in questo caso la quantità di informazioni ricevute è zero (I c = 0). Ad esempio, quando si ascolta un messaggio in una lingua straniera sconosciuta, è impossibile estrarne informazioni senza conoscere la lingua.

Anche la quantità di informazioni semantiche (I s) in un messaggio sarà uguale a zero se l'utente delle informazioni sa assolutamente tutto sull'argomento, ad es. il suo thesaurus (S n) e il suo messaggio non gli danno nulla di nuovo.

Approccio pragmatico determina la quantità di informazioni come misura che contribuisce al raggiungimento dell'obiettivo. Questo approccio considera la quantità di informazioni come un incremento della probabilità di raggiungere un obiettivo.

Quando si valuta la quantità di informazioni sotto gli aspetti semantici e pragmatici, è necessario tenere conto della dipendenza temporale delle informazioni (poiché le informazioni, soprattutto nei sistemi di gestione degli oggetti economici, tendono ad invecchiare, cioè il loro valore diminuisce nel tempo).

Approccio strutturaleè associato a problemi di archiviazione, riorganizzazione e recupero delle informazioni e, con l'aumentare del volume delle informazioni accumulate, diventa sempre più importante.

L'approccio strutturale astrae dalla soggettività e dal valore relativo dell'informazione e considera le strutture logiche e fisiche dell'organizzazione dell'informazione.

Struttura dell'informazione sociale e lavorativa: indicatori, dettagli e documenti

160 della Convenzione dell’Organizzazione Internazionale del Lavoro (ILO) “Sulle statistiche del lavoro” e 170 Raccomandazione dell’ILO “Sulle statistiche del lavoro” /1985/ definiscono le direzioni principali per la raccolta e l’analisi delle informazioni sociali e del lavoro a livello macroeconomico:

Popolazione economicamente attiva, occupazione, disoccupazione e sottoccupazione;

Salari e orari di lavoro;

Indici dei prezzi dei beni di consumo;

Costo del lavoro;

Spese e redditi domestici;

Infortuni sul lavoro e malattie professionali;

Conflitti di lavoro;

Produttività del lavoro

Indice- una caratteristica generalizzante di un oggetto o processo sacro. L'indicatore funge da strumento metodologico che fornisce la capacità di testare proposizioni teoriche utilizzando dati empirici.

1) qualità registrare la presenza o l'assenza di una definizione. santi
2) quantità. Fissare il grado di espressione, sviluppo, alcune proprietà

Indicatori del lavoro che vengono utilizzati per calcolare la quantità di lavoro impiegato e sono espressi per unità di tempo. Con il loro aiuto vengono calcolati: PT, stipendio, ecc.

Sociale indicatori qualità o caratteristiche quantitative delle proprietà individuali e degli stati degli oggetti e dei processi sociali, riflette le caratteristiche della statistica e della dinamica

Biglietto numero 2

Biglietto numero 3

Modelli informativi: descrittivi e formali

Modelli informativi descrittivi- si tratta di modelli creati in linguaggio naturale (cioè in qualsiasi lingua di comunicazione tra le persone: inglese, russo, cinese, maltese, ecc.) in forma orale o scritta.

Modelli informativi formali- si tratta di modelli realizzati in un linguaggio formale (cioè scientifico, professionale o specialistico). Esempi di modelli formali: tutti i tipi di formule, tabelle, grafici, mappe, diagrammi, ecc.

Modelli cromatici (informativi).- si tratta di modelli creati nel linguaggio naturale della semantica dei concetti di colore e dei loro predicati ontologici (cioè nel linguaggio dei significati e dei significati dei canoni di colore, riprodotti in modo rappresentativo nella cultura mondiale). Esempi di modelli cromatici: modello “atomico” dell'intelligenza (AMI), immanenza interconfessionale delle religioni (MIR), modello di semantica assiologico-sociale (MASS), ecc., realizzati sulla base della teoria e della metodologia del cromatismo.

Tipi di modelli informativi

Tabellare– gli oggetti e le loro proprietà sono presentati sotto forma di elenco e i loro valori sono inseriti in celle rettangolari. L'elenco degli oggetti dello stesso tipo viene inserito nella prima colonna (o riga) e i valori delle loro proprietà vengono inseriti nelle colonne (o righe successive).

Gerarchico– gli oggetti sono distribuiti su livelli. Ogni elemento di alto livello è composto da elementi di livello inferiore e un elemento di livello inferiore può far parte di un solo elemento di livello superiore.

Rete– utilizzato per riflettere sistemi in cui le connessioni tra gli elementi hanno una struttura complessa.

Ticket numero 4. Compiti e funzioni dei sistemi informativi. Tipologia dei sistemi informativi in ​​base alla loro scala, portata, natura dei compiti da risolvere, insieme di funzioni svolte, grado di automazione, tipo di informazioni, ecc.

Sistema informativoè un insieme interconnesso di mezzi, metodi e personale utilizzati per archiviare, elaborare ed emettere informazioni per raggiungere gli obiettivi di gestione.

ü Scopo dell'operazione– soddisfare esigenze informative specifiche all'interno di un ambito tematico specifico

ü Il risultato del funzionamento– prodotti informativi: documenti, raccolte di informazioni, banche dati e servizi di informazione

Biglietto numero 5

Supporto tecnologico dei sistemi di controllo automatizzato: (fornendo sottosistemi di tecnologia dell'informazione) informativo, linguistico, tecnico, software, matematico, organizzativo ed ergonomico. Supporto legale.

Supporto tecnologico- EDP ​​(Elaborazione elettronica dei dati) è un insieme di metodi e mezzi per raccogliere, archiviare, trasmettere, elaborare e proteggere le informazioni basati sulla tecnologia informatica e sulle comunicazioni.

Biglietto numero 6

Scopo e tipologie di postazioni di lavoro

L'uso di un posto di lavoro automatizzato in un ufficio moderno rende il lavoro di uno specialista il più semplice possibile, liberando tempo e fatica che prima venivano spesi in operazioni di routine di raccolta dati e calcoli complessi per attività creative e scientificamente fondate nella risoluzione di problemi professionali. Lo scopo dell’implementazione è migliorare i seguenti indicatori:

Automazione del lavoro, uso di tecnologie per il risparmio di manodopera (ad esempio, l'uso dei computer); aumentare la sicurezza della produzione (se utilizzato nell'industria); adozione più rapida delle decisioni gestionali; mobilità dei lavoratori; aumento della produttività del lavoro

Per caratterizzare il posto di lavoro automatizzato, possiamo distinguere componenti principali dell’informatica, implementandolo. Questi includono:1. supporto tecnico e hardware (computer, stampanti, scanner, registratori di cassa e altre apparecchiature aggiuntive);2. software applicativo e sistemi operativi (OS);3. supporto informativo (standard di documenti e moduli unificati, standard per la presentazione di indicatori, classificatori e informazioni di riferimento);4. dispositivi di rete e di comunicazione (reti locali e aziendali, posta elettronica).

Le caratteristiche di questi componenti determinano il livello del posto di lavoro automatizzato, il suo scopo e le sue caratteristiche. Le postazioni di lavoro sono progettate per fornire le condizioni per il lavoro confortevole, ad alte prestazioni e di alta qualità di uno specialista e devono soddisfare i seguenti requisiti:

L'interfaccia utente dovrebbe essere semplice, comoda e accessibile anche a un utente inesperto. Dovrebbe contenere un sistema di suggerimenti, preferibilmente in forma dimostrativa (video, suono, animazione);

È necessario garantire la sicurezza dello specialista e il rispetto di tutti i requisiti ergonomici (comfort, gamma cromatica e sonora corrispondenti alla migliore percezione, comoda ubicazione delle informazioni e accessibilità di tutti gli strumenti necessari per il lavoro, uno stile unificato di esecuzione delle operazioni, eccetera.);

L'utente della postazione deve eseguire tutte le azioni senza allontanarsi dal sistema, pertanto è necessario che sia dotato di tutte le operazioni necessarie;

Garantire il funzionamento ininterrotto del posto di lavoro automatizzato dovrebbe garantire all'utente il completamento tempestivo delle attività in conformità con il programma di lavoro. Le interruzioni della produzione sono inaccettabili;

L'organizzazione razionale del lavoro di uno specialista crea condizioni di lavoro confortevoli e aumenta la produttività dello specialista;

Il software della postazione di lavoro deve essere compatibile con altri sistemi e tecnologie informatiche, quindi le più preziose sono le tecnologie che combinano più postazioni di lavoro.

Biglietto numero 7

Biglietto numero 8

Biglietto numero 9

CL3Sviluppo

Il 13 gennaio 1988 si tenne a New York una conferenza stampa per annunciare l'unione. Ashton-Tate e Microsoft per sviluppare un nuovo prodotto chiamato Ashton-Tate/Microsoft SQL Server. Lo stesso giorno è stato diffuso un comunicato stampa congiunto che annunciava un nuovo prodotto basato sugli sviluppi di Sybase. Per quanto riguarda il ruolo delle aziende nello sviluppo e nella promozione del prodotto, si legge nel comunicato stampa Ashton-Tate doveva essere responsabile della supervisione dello sviluppo nel campo delle banche dati (e anche fornire i propri sviluppi in questo settore), e Microsoft un ruolo simile è stato assegnato nel campo delle tecnologie per lavorare in reti locali. Una volta rilasciato SQL Server, Ashton-Tate avrebbe concesso in licenza il prodotto a Microsoft e avrebbe gestito le vendite al dettaglio in tutto il mondo, mentre Microsoft avrebbe fornito il prodotto agli OEM di hardware.

Uscita

29 aprile 1989È iniziata la vendita ufficiale di Ashton-Tate/Microsoft SQL Server 1.0. I membri del team di SQL Server indossavano magliette con lo slogan "Ashton-Tate SQL Server: fatto in tempo e orgoglioso di esserlo"(Inglese) Ashton-Tate SQL Server: puntuale e orgoglioso di esserlo) .

La stampa specializzata ha parlato molto positivamente del nuovo prodotto, tuttavia le vendite sono state molto basse.

Nel 1990 la situazione non era migliorata. I piani per la promozione congiunta del prodotto, a seguito dei quali SQL Server avrebbe dovuto guadagnare una posizione nella vasta comunità di sviluppatori dBASE, fallirono. Di conseguenza, Ashton-Tate, che due anni prima aveva ricoperto una posizione di leadership nel mercato dei database nazionali, è stata ora costretta a lottare per la propria esistenza, cosa che a sua volta l'ha costretta a tornare al suo prodotto principale dBASE. Microsoft, nel frattempo, ha lanciato OS/2 LAN Manager con il proprio marchio. Tutto ciò ha portato alla decisione di interrompere la promozione congiunta di SQL Server, dopodiché questo prodotto è stato leggermente modificato e presentato come Microsoft SQL Server.

SQL Server 1.11 (1991)

Nel 1991, Microsoft ha rilasciato una versione intermedia: SQL Server 1.11. Questa versione è dovuta al fatto che l'elenco degli utenti a quel tempo era già stato ampliato in modo significativo. Nonostante il fatto che l'architettura client-server non fosse ancora molto diffusa, i clienti sono comunque passati gradualmente ad essa. Ma nonostante le critiche positive della stampa specializzata, le vendite di SQL Server lasciavano ancora molto a desiderare (diagramma nella diapositiva).

DC5 Cronologia dei rilasci sulla diapositiva.

Biglietto numero 10

Funzionalità

Microsoft SQL Server utilizza una versione di SQL come linguaggio di query chiamato Transact-SQL (T-SQL in breve), che è un'implementazione di SQL-92 (lo standard ISO per SQL) con più estensioni. T-SQL consente una sintassi aggiuntiva per le procedure memorizzate e fornisce supporto per le transazioni (interazione tra il database e l'applicazione host). Microsoft SQL Server e Sybase ASE utilizzano un protocollo a livello di applicazione chiamato Tabular Data Stream (TDS) per comunicare con la rete. Il protocollo TDS è stato implementato anche nel progetto FreeTDS per consentire a varie applicazioni di interagire con i database Microsoft SQL Server e Sybase.

Microsoft SQL Server supporta anche Open Database Connectivity (ODBC), un'interfaccia per consentire alle applicazioni di interagire con il DBMS. SQL Server 2005 offre la possibilità di connettere gli utenti tramite servizi Web che utilizzano il protocollo SOAP. Ciò consente ai programmi client non Windows di connettersi tra piattaforme diverse a SQL Server. Microsoft ha inoltre rilasciato un driver JDBC certificato che consente alle applicazioni basate su Java (come BEA e IBM WebSphere) di connettersi a Microsoft SQL Server 2000 e 2005.

SQL Server supporta il mirroring e il clustering del database. Un cluster SQL Server è una raccolta di server configurati in modo identico; Questo schema aiuta a distribuire il carico di lavoro su più server. Tutti i server hanno un nome virtuale e i dati vengono distribuiti tra gli indirizzi IP delle macchine del cluster durante il ciclo di lavoro. Inoltre, in caso di guasto o guasto su uno dei server del cluster, è disponibile il trasferimento automatico del carico su un altro server.

SQL Server supporta la ridondanza dei dati in tre scenari:

Snapshot: uno snapshot del database viene acquisito e inviato ai destinatari dal server.

Cronologia delle modifiche: tutte le modifiche al database vengono continuamente trasmesse agli utenti.

Sincronizzazione con altri server: i database di più server vengono sincronizzati tra loro. Le modifiche a tutti i database avvengono indipendentemente l'una dall'altra su ciascun server e durante la sincronizzazione i dati vengono riconciliati. Questo tipo di duplicazione offre la possibilità di risolvere le contraddizioni tra i database.

Edizioni di MS SQL Server 2000

Erano disponibili due tipi di SQLServer in diverse edizioni:

· 2000 - SQL Server 2000 32 bit, nome in codice Shiloh (versione 8.0);

· 2003 - SQL Server 2000 a 64 bit, nome in codice Liberty.

SQLServer 2000 è disponibile in diverse edizioni per soddisfare diversi requisiti di prestazioni, runtime e costi dei clienti (organizzativi e individuali).

Edizione Enterprise. Questa edizione è la versione completa di SQLServer offerta più spesso alle organizzazioni. EnterpriseEdition offre funzionalità avanzate di scalabilità e affidabilità necessarie per risolvere applicazioni Internet e aziendali online mission-critical, comprese visualizzazioni partizionate distribuite, porting dei registri e funzionalità di clustering avanzate. Questa edizione sfrutta inoltre appieno l'hardware più avanzato, supportando fino a 32 processori e 64 GB di RAM. Inoltre, SQLServer 2000 EnterpriseEdition include funzionalità di analisi aggiuntive.

Edizione standard. Questa opzione è conveniente per le organizzazioni di medie e piccole dimensioni che non richiedono le complesse funzionalità di scalabilità e disponibilità e il set completo di funzionalità di analisi presenti in SQLServer 2000 EnterpriseEdition. StandardEdition viene utilizzata in sistemi multiprocessore simmetrici con un massimo di 4 processori e fino a 2 GB di RAM.

Edizione personale. Questa edizione include il set completo di strumenti di gestione e la maggior parte delle funzionalità della StandardEdition, ma è ottimizzata per l'uso personale. PersonalEdition funziona non solo con i sistemi operativi server di Microsoft, ma anche con le edizioni personali, che includono Windows 2000 Professional, WindowsNTWorkstation 4.0 e Windows 98. Sono supportati i sistemi a doppio processore. Sebbene questa edizione supporti database di qualsiasi dimensione, le sue prestazioni sono ottimizzate per singoli utenti e piccoli gruppi di lavoro, riducendo il carico di lavoro derivante dall'avere più di cinque utenti simultanei.

Edizione sviluppatore. Questa variante di SQLServer consente agli sviluppatori di creare qualsiasi tipo di applicazione eseguita insieme a SQLServer. Questa edizione include tutte le funzionalità dell'Enterprise Edition, ma con uno speciale contratto di licenza per l'utente finale (EULA) che consente lo sviluppo e il test, ma vieta la distribuzione per scopi di produzione.

DesktopEngine (MSDE). Questa edizione include le funzionalità principali del motore di database SQLServer 2000, ma non include l'interfaccia utente, gli strumenti di gestione, le funzioni di analisi, il supporto per la replica rollup, le licenze di accesso client, le librerie per sviluppatori o la documentazione in linea. Anche qui le dimensioni del database e il livello di carico di lavoro quando si lavora con gli utenti sono limitati. L'edizione DesktopEngine richiede la quantità minima di risorse rispetto ad altre edizioni di SQLServer 2000, rendendola ideale per l'implementazione di un data warehouse autonomo.

Edizione WindowsCEE. Questa edizione è la versione di SQLServer 2000 per i dispositivi che eseguono WindowsCE. Si tratta di un software compatibile con altre edizioni di SQLServer 2000, che consente agli sviluppatori di sfruttare le proprie competenze e applicazioni esistenti per estendere la funzionalità del data warehouse relazionale con soluzioni eseguibili su nuove classi di dispositivi.

Funzionalità di SQL Server 2000

MicrosoftSQL Server 2000 include una serie di funzionalità che ne semplificano l'installazione, la distribuzione e il funzionamento, oltre a supportare la scalabilità, il data warehousing e l'integrazione del sistema con altri software server.

Include molti strumenti e funzionalità che semplificano l'installazione, la distribuzione, la gestione e l'utilizzo dei database. SQL Server 2000 fornisce agli amministratori di database un set completo di strumenti necessari per ottimizzare SQL Server 2000 all'interno dei sistemi industriali online. SQL Server 2000 viene eseguito in modo efficiente anche su piccoli sistemi monoutente con un sovraccarico amministrativo minimo.

L'installazione o l'aggiornamento è controllato da un'applicazione di interfaccia utente grafica (GUI) che guida l'utente mentre inserisce le informazioni richieste dal programma di installazione. Il programma di installazione rileva automaticamente se si dispone di una versione precedente di SQL Server. Al termine dell'installazione di SQL Server 2000, viene chiesto all'utente se desidera eseguire la procedura guidata di aggiornamento di SQL Server 2000, che guiderà rapidamente l'utente attraverso il processo di aggiornamento. Pertanto, l'intero processo di installazione o aggiornamento viene completato rapidamente, con l'utente che deve inserire un minimo di informazioni.

SQL Server 2000 modifica automaticamente e dinamicamente la propria configurazione durante l'esecuzione. Man mano che il numero di utenti connessi a SQL Server 2000 aumenta, è possibile allocare dinamicamente le risorse necessarie, come la memoria. Quando il carico diminuisce, SQL Server 2000 libera le risorse e le restituisce al sistema. Se sul server sono in esecuzione altre applicazioni contemporaneamente, SQL Server 2000 rileverà che ad esse viene allocata memoria virtuale aggiuntiva e ridurrà la quantità di memoria virtuale utilizzata per ridurre il sovraccarico di paging. SQL Server 2000 può inoltre aumentare o ridurre automaticamente le dimensioni del database man mano che le informazioni vengono aggiunte o rimosse.

SQL Server 2000 funziona con altri prodotti software per fornire un archivio di informazioni stabile e sicuro per Internet e Intranet:

· SQL Server 2000 funziona con i meccanismi di sicurezza e crittografia di Windows 2000 Server e Windows NT Server, implementando l'archiviazione sicura delle informazioni;

· SQL Server 2000 è un servizio di archiviazione ad alte prestazioni per applicazioni Web che eseguono Microsoft Internet Information Services;

· SQL Server 2000 può essere utilizzato insieme a Site Server per servire siti Web di e-commerce grandi e complessi;

· Il supporto dei socket TCP/IP consente di integrare SQL Server 2000 con Microsoft Proxy Server per implementare comunicazioni protette su Internet e Intranet.

È possibile creare SQL Server 2000 in modo che funzioni al livello richiesto per eseguire siti Internet di grandi dimensioni. Inoltre, il motore di database di SQL Server 2000 dispone del supporto integrato per XML e l'Assistente Web consente di generare pagine HTML (Hypertext Markup Language) dai dati di SQL Server 2000 e di pubblicare tali dati su HTTP (Hypertext Transport Protocol) e FTP. (File Transfer Protocol).

SQL Server supporta l'autenticazione di Windows, che consente di utilizzare account utente e di dominio di Windows NT e Windows 2000 come account SQL Server 2000.

Windows 2000 autentica gli utenti quando si connettono alla rete. Quando si connette a SQL Server, il software client richiede una connessione attendibile, che può essere concessa solo se gli utenti sono autenticati da Windows NT o Windows 2000. Pertanto, SQL Server stesso non esegue l'autenticazione utenti, ma gli utenti non necessitano di accessi e password separati per connettersi a ciascun sistema SQL Server.SQL Server 2000 può inviare e ricevere messaggi di posta elettronica e cercapersone da Microsoft Exchange o altri server di posta compatibili con MAPI (Message Application Programming Interface). Questa funzionalità consente l'invio di posta utilizzando batch, procedure memorizzate e trigger di SQL Server 2000. Gli eventi e le notifiche di SQL Server 2000 possono essere configurati in modo tale che, se si verifica un problema serio o rischia di verificarsi, l'amministratore del server viene automaticamente avvisato tramite e-mail o cercapersone.

Strumenti di SQL Server 2000

Direttore d'impresa

SQL Server Enterprise Manager è il principale strumento di amministrazione di SQL Server 2000, supporta un'interfaccia utente compatibile con MMC (Microsoft Management Console) e consente di risolvere una serie di attività amministrative:

· definire gruppi di server che eseguono SQL Server;

· registrare i singoli server in un gruppo;

· configurare qualsiasi impostazione di SQL Server per tutti i server registrati;

· creare e amministrare database, oggetti, ID utente, login e diritti di accesso a SQL Server su ciascuno dei server registrati;

· Definire ed eseguire tutte le attività amministrative di SQL Server su ciascun server registrato;

· costruire e testare in modo interattivo istruzioni SQL, pacchetti e script richiamando SQL Query Analyser;

· chiamare varie procedure guidate di SQL Server.

MMC supporta un'interfaccia comune per la gestione di varie applicazioni server su una rete Microsoft Windows. Le applicazioni server includono un componente denominato snap-in che fornisce un'interfaccia agli utenti MMC per gestire l'applicazione server. SQL Server Enterprise Manager è uno snap-in MMC per Microsoft SQL Server 2000.

Agente SQL Server

SQL Server Agent viene eseguito su un server che esegue un'istanza di SQL Server 2000 o versioni precedenti di SQL Server. SQL Server Agent è responsabile della risoluzione delle seguenti attività:

· esecuzione di lavori SQL Server pianificati per l'esecuzione in un momento specifico o dopo un periodo di tempo specificato;

· definire condizioni speciali che richiedono l'esecuzione di un'azione specificata dall'amministratore, come avvisare qualcuno inviando un cercapersone o un'e-mail o eseguendo un'attività che soddisfa queste condizioni;

· avviare attività definite dagli amministratori che eseguono la replica.

Profilo SQL

SQL Profiler è uno strumento per la registrazione di eventi di SQL Server 2000. Gli eventi vengono archiviati in un file di traccia, che può essere successivamente analizzato o utilizzato per ripetere una sequenza di azioni per diagnosticare il problema. SQL Profiler viene utilizzato per:

· esecuzione passo passo delle query problematiche e determinazione dell'origine del problema;

· ricerca e diagnosi di query lente;

· registrare sequenze di istruzioni SQL che portano a problemi;

· monitorare le prestazioni di SQL Server e regolarne il carico.

SQL Profiler supporta inoltre il controllo delle azioni eseguite sulle istanze di SQL Server. Le informazioni sulle attività relative alla sicurezza vengono archiviate per una successiva revisione da parte dell'amministratore della sicurezza.

Responsabile del servizio

SQLServerServiceManager è progettato per avviare, arrestare e sospendere i componenti server SQLServer 2000. Questi componenti vengono eseguiti come servizi in Microsoft Windows NT o Windows 2000 e come programmi eseguibili separati in Windows 95 e Windows 98.

Server SQL. Implementa il motore di database SQL Server. È presente un servizio SQL Server per ogni istanza di SQL Server in esecuzione su un computer.

Agente SQL Server. Implementa un agente che esegue attività amministrative pianificate di SQL Server. È disponibile un servizio SQL Server Agent per ogni istanza di SQL Server in esecuzione su un computer.

Microsoft Search (solo Windows NT e Windows 2000). Implementa un meccanismo di ricerca full-text. Esiste una sola copia, indipendentemente dal numero di istanze di SQL Server nel computer.

MSDTC (solo Windows NT e Windows 2000). Gestisce le transazioni distribuite. Esiste una sola copia, indipendentemente dal numero di istanze di SQL Server nel computer.

MSSQLServerOLAPService (solo Windows NT e Windows 2000). Implementa servizi di analisi. Esiste una sola copia, indipendentemente dal numero di istanze di SQL Server nel computer.

La finestra Service Manager può essere nascosta e rappresentata da un'icona nella barra delle applicazioni. Per visualizzare un menu che elenca le attività supportate da Service Manager, fare clic con il pulsante destro del mouse sull'icona nella barra delle applicazioni.

Analizzatore di query SQL

SQL Query Analyser è uno strumento GUI progettato per risolvere molti problemi diversi:

· creare query e script SQL, nonché eseguirli con database SQL Server;

· creazione di oggetti di database utilizzati di frequente in script standard;

· copiare oggetti di database esistenti;

· esecuzione di procedure memorizzate senza specificarne i parametri;

· Debug delle procedure memorizzate;

· Debug delle query che presentano problemi di prestazioni;

· cercare oggetti nei database, nonché visualizzare e lavorare con oggetti;

· aggiungere, aggiornare ed eliminare righe nella tabella;

· definizione di scorciatoie da tastiera per eseguire le query utilizzate di frequente; aggiunta dei comandi utilizzati di frequente al menu Strumenti.

SQL Query Analyser viene avviato direttamente dal menu Start o da SQL Server Enterprise Manager. Può anche essere avviato inserendo isqlw al prompt dei comandi.

Biglietto numero 11

Oggetti di grandi dimensioni

DB2/2 e DB2/6000 fornire all'utente nuovi tipi di dati come oggetti binari di grandi dimensioni (BLOBS) e oggetti di testo di grandi dimensioni (CLOBS).

BLOB consentono di archiviare qualsiasi tipo di dati fino a due gigabyte di dimensione.

Opzione 1: la funzione ha accesso diretto al database, il che consente le massime prestazioni, ma rappresenta una potenziale minaccia per le prestazioni del server e l'integrità dei dati

Opzione 2: la funzione viene eseguita come processo separato dal server del database, che protegge i dati e il DBMS, ma riduce le prestazioni

professionisti

Esiste una buona versione gratuita

Buon supporto tecnico gratuito

È possibile ricevere supporto a pagamento dal produttore, che ne consente l'utilizzo nel settore aziendale Entrprise

Con configurazioni

Buona performance

Gestisce meglio situazioni come "memoria insufficiente per il server 1C".

Non c'è limite a 256 tabelle, il che espande le possibilità quando si lavora con RLS

Aspetti negativi

Pochi specialisti

Bassa prevalenza

La dimensione del database è maggiore rispetto ad altri database secondari

C'è una regolazione automatica del sistema, ma è incompleta

Alcuni messaggi potrebbero non essere elaborati correttamente dalla piattaforma.

Biglietto numero 12

Biglietto numero 14

Biglietto numero 15.

Windows Open Services Architecture (WOSA) è un insieme di standard aperti per l'interazione dei sistemi applicativi

Windows supporta una famiglia di standard che semplificano la scrittura e l'apertura verticale delle applicazioni. Il nome generale di questi standard è WOSA (Windows Open Services Architecture.

(WOSA) fornisce una serie di standard aperti per l'interazione dei componenti del sistema applicativo sui lati server e client.

La famiglia si divide in tre categorie:

norme di carattere generale;

standard di comunicazione;

standard per applicazioni e servizi finanziari.

Il gruppo di norme di carattere generale comprende:

— Open Database Connectivity (ODBC): accesso ai database

— MAPI (Messaging Application Programming Interface): inoltro dei messaggi

— TAPI (Telephony Application Programming Interface): accesso tramite linea telefonica

Al gruppo di comunicazione
gli standard includono i seguenti elementi:

API di comunicazione host SNA di Windows

Interfaccia di comunicazione Windows Sockets basata sul protocollo TCP/IP

Microsoft Remote Procedure Call (RPC): interfaccia di chiamata di procedura remota

Il gruppo di standard per applicazioni e servizi finanziari comprende due elementi

Estensione WOSA per dati di mercato in tempo reale (WOSA/XRT)

Estensione WOSA per i servizi finanziari (WOSA/XFS)

Ciascuno degli standard della famiglia WOSA descrive un'architettura che include i seguenti componenti principali:

Interfaccia di programmazione dell'applicazione (API)

Interfaccia server (SPI)

Responsabile del gruppo di applicazioni/servizi

Database per la registrazione di applicazioni/servizi.

Biglietto numero 16

Riso. 1. Movimento delle informazioni dal database all'applicazione

La figura mostra che quando si sviluppa un'applicazione DBMS, il programmatore lavora con insiemi di componenti progettati per scambiare informazioni con i database e visualizzarle. A seconda del meccanismo di accesso al database selezionato, alcuni insiemi di componenti potrebbero non essere utilizzati, ma tutti, indipendentemente dalle caratteristiche del database utilizzato e dal meccanismo di accesso allo stesso, hanno proprietà e metodi simili.

ODBC (Open Database Connectivity - accesso aperto ai database) - sviluppato da Microsoft, universale Interfaccia di programmazione applicazioni per accedere ai database.

L'obiettivo principale dello sviluppo del protocollo ODBC è standardizzare i meccanismi di interazione con vari DBMS. Il problema principale associato allo sviluppo di applicazioni che interagiscono con database basati su speciali API SQL era che ogni DBMS aveva la propria interfaccia di programmazione, ognuno aveva le sue caratteristiche e non funzionava esattamente come gli altri. A questo proposito, lo sviluppo dell'applicazione è dipeso in modo significativo dal DBMS utilizzato. Microsoft ha compiuto un passo importante per risolvere questo problema. L'idea principale era quella di sviluppare un'interfaccia universale al livello della famiglia di sistemi operativi Windows, che potesse essere supportata in diversi DBMS.

Vediamo brevemente la struttura del software ODBC:

· Interfaccia di chiamata di funzione ODBC: Questo è il cosiddetto livello superiore di ODBC, contenente l'API, che viene utilizzata direttamente dalle applicazioni. Questa API è implementata come una libreria di collegamento dinamico Dll e fa parte del sistema operativo Windows;

· Driver ODBC: Questo è il cosiddetto livello inferiore di ODBC, contenente un insieme di driver per il DBMS che supportano il protocollo ODBC. Come parte della tecnologia, per ciascun DBMS può essere sviluppato un driver ODBC corrispondente, che fungerà da collegamento intermedio tra il programma applicativo e il DBMS, traducendo le chiamate alle funzioni DBMS in chiamate a funzioni DBMS specializzate interne. Ciò risolve il problema della standardizzazione. Per molti DBMS moderni esistono driver ODBC specializzati installati separatamente nel sistema operativo;

· Gestione driver ODBC: Questo meccanismo software rappresenta il livello intermedio di ODBC, gestendo il processo di caricamento dei driver necessari.

Il diagramma di esecuzione del programma utilizzando il protocollo ODBC per l'accesso ai dati è mostrato in Fig. 2.

Riso. 2. Diagramma di esecuzione del programma utilizzando il protocollo ODBC per accedere ai dati

Il sistema operativo Windows include diversi meccanismi per l'accesso ai database: ODBC,OLEDB E ADO.

Tecnologia ODBC(dall'inglese Apri Connettività database– meccanismo aperto per l’accesso ai database 1 ) è un componente del sistema operativo finestre, progettato per unificare l'accesso alle informazioni archiviate in banche dati vari tipi. ODBCè costituito da un insieme di driver che effettuano operazioni di cambio con determinati banche dati e un driver manager che trasferisce le richieste dall'applicazione al conducente e trasferisce le informazioni dal conducente all'applicazione (Fig. 3).

Riso. 3. Movimento di informazioni tra l'applicazione e il database utilizzando ODBC

Il linguaggio di query viene utilizzato per ottenere e modificare i dati SQL, indipendentemente dal fatto che sia supportato dal database a cui accede l'applicazione. Se il database non supporta la lingua SQL, quindi l'accesso ad esso non è diverso dall'accesso a DB, supporto SQL. Questa è l'unificazione dell'accesso ai database da parte del sistema ODBC– l'applicazione specifica il nome del driver da utilizzare per connettersi al database e invia una richiesta che descrive la composizione delle informazioni richieste. Ulteriore meccanismo ODBC esegue tutte le operazioni necessarie per ottenere informazioni, nascondendo all'applicazione le specifiche di lavorare con un database specifico. Accesso all'applicazione ODBC effettuato attraverso API-funzioni implementate in librerie dinamiche.

I migliori articoli sull'argomento