Cum se configurează smartphone-uri și PC-uri. Portal informativ
  • Acasă
  • Recenzii
  • Ce înseamnă valabilitate. Cum să remediați cele mai frecvente greșeli

Ce înseamnă valabilitate. Cum să remediați cele mai frecvente greșeli

Validitatea, în esența sa, este o caracteristică complexă, care include, pe de o parte, informații despre dacă o tehnică este potrivită pentru a măsura pentru ce a fost creată și, pe de altă parte, care este eficacitatea, eficiența și utilitatea sa practică.

Verificarea validității unei tehnici se numește validare.

Pentru a efectua validarea pragmatică a unei tehnici, adică pentru a-i evalua eficacitatea, eficiența, semnificația practică, se utilizează de obicei un criteriu extern independent - un indicator al manifestării proprietății studiate în Viata de zi cu zi... Un astfel de criteriu poate fi atât performanța academică (pentru teste de capacitate de învățare, teste de realizare, teste de inteligență), cât și realizările de producție (pentru metode de orientare profesională), cât și eficacitatea activităților reale - desen, modelare etc. teste de abilități speciale), evaluări subiective (pentru teste de personalitate).

4 tipuri de criterii externe:

  1. criterii de performanță (acestea pot include, cum ar fi cantitatea de muncă prestată, performanța academică, timpul petrecut în formare, rata de creștere a calificărilor etc.);
  2. criterii subiective (acestea includ tipuri diferite răspunsuri care reflectă atitudinea unei persoane față de ceva sau cineva, părerea, opiniile, preferințele sale; de obicei criteriile subiective se obțin folosind interviuri, chestionare, chestionare);
  3. criterii fiziologice (sunt folosite pentru a studia efectul mediu inconjuratorși alte variabile situaționale asupra corpului și psihicului uman; puls măsurat, tensiunea arterială, rezistența electrică a pielii, simptomele de oboseală etc.);
  4. criteriile accidentelor (aplicate atunci când scopul studiului se referă, de exemplu, la problema selecției pentru muncă a unor astfel de persoane care sunt mai puțin susceptibile la accidente).

Valabilitatea empirică.

Dacă, în cazul validității semnificative, evaluarea testului se efectuează pe cheltuiala experților (care stabilesc corespondența sarcinilor de testare cu conținutul subiectului de măsurare), atunci validitatea empirică este măsurată întotdeauna cu ajutorul statisticilor. corelație: se calculează corelația a două serii de valori - scoruri la test și indicatori parametru extern, ales ca criteriu de valabilitate.

Validitatea constructiei.

Validitatea constructului se referă la un construct teoretic în sine și implică căutarea factorilor care explică comportamentul performanței testului. Ca tip special, validitatea de construct este canonizată în articolul lui Cronbach și Mil (1955). Autorii au evaluat folosind acest tip de validitate toate studiile de testare care nu vizau în mod direct prezicerea unor criterii semnificative. Studiul conținea informații despre constructele psihologice.

Valabilitate „după conținut”.

Valabilitatea conținutului necesită ca fiecare sarcină, sarcină sau întrebare care aparține unei anumite zone să aibă șanse egale de a fi elemente de testare. Valabilitatea conținutului evaluează corespondența conținutului testului (sarcini, întrebări) cu aria de comportament măsurată. Testele, compilate de două echipe de dezvoltare, sunt efectuate pe un eșantion de subiecți. Fiabilitatea testelor este calculată prin împărțirea itemilor în două părți, rezultând un indice de validitate semnificativă.

Valabilitate „predictivă”.

Valabilitatea „predictivă” este determinată și de un criteriu extern destul de fiabil, dar informațiile despre acesta sunt colectate la ceva timp după test. Un criteriu extern este de obicei exprimat în unele evaluări ale capacității unei persoane de tipul de activitate pentru care a fost selectat în funcție de rezultatele testelor de diagnostic. Deși această tehnică este cel mai în concordanță cu sarcina tehnicilor de diagnosticare - prezicerea succesului viitor, este foarte dificil de aplicat. Precizia prognozei este invers legată de timpul stabilit pentru o astfel de prognoză. Cu cât trece mai mult timp după măsurare, cu atât cantitate mare factorii trebuie luaţi în considerare la aprecierea valorii predictive a tehnicii. Cu toate acestea, este aproape imposibil să luați în considerare toți factorii care influențează predicția.

Valabilitate „retrospectivă”.

Se determină pe baza unui criteriu care reflectă evenimente sau o stare de calitate din trecut. Poate fi folosit pentru a obține rapid informații despre capacitățile predictive ale tehnicii. Deci, pentru a verifica în ce măsură rezultate frumoase test de aptitudini învățare rapidă, puteți compara notele anterioare ale performanței academice, opiniile experților din trecut etc. la persoanele cu înalte și scăzute acest moment indicatori de diagnostic.

Valabilitate convergentă și discriminantă.

Strategia includerii anumitor itemi în test depinde de modul în care psihologul definește constructul diagnostic. Dacă Eysenck definește proprietatea „nevrotism” ca fiind independentă de extraversie-introversie, atunci aceasta înseamnă că în chestionarul său ar trebui să existe itemi aproximativ egal împărțiți cu care introvertiții nevrotici și extravertiții nevrotici vor fi de acord. Dacă, în practică, se dovedește că itemii din cadranul „Nevrotism-Introversie” vor prevala în test, atunci, din punctul de vedere al teoriei lui Eysenck, aceasta înseamnă că factorul „nevrotism” este încărcat cu un factor irelevant. - „introversie”. (Efectul este exact același dacă există o părtinire în eșantion - dacă conține mai mulți introvertiți nevrotici decât extrovertiți nevrotici.)

Pentru a nu se confrunta cu astfel de dificultăți, psihologii ar dori să se ocupe de astfel de indicatori (puncte) empiric care informează fără ambiguitate doar despre un singur factor. Dar această cerință nu este niciodată într-adevăr îndeplinită: orice indicator empiric se dovedește a fi determinist nu numai prin factorul de care avem nevoie, ci și prin alții - irelevant pentru problema de măsurare.

Astfel, în legătură cu factorii care sunt definiți conceptual ca ortogonali cu măsurabilul (care apar cu acesta în toate combinațiile), autorul testului ar trebui să aplice o strategie de echilibrare artificială atunci când selectează elementele.

Corespondenţa punctelor cu factorul măsurat asigură valabilitate convergentă Test. Echilibrarea elementelor cu privire la factorii irelevanți oferă validitate discriminantă. Din punct de vedere empiric, se exprimă în absența unei corelații semnificative cu un test care măsoară o proprietate independentă conceptual.

O persoană folosește diverse tehnici și instrumente pentru a verifica sau măsura o anumită calitate. Măsura în care această tehnică și instrument sunt capabile să producă rezultate de înaltă calitate indică validitatea lor. Ce înseamnă acest concept în psihologie? Care sunt tipurile de valabilitate? În psihologie, această proprietate este de obicei aplicabilă testelor și tehnicilor utilizate de specialiști.

Ce este valabilitatea?

Conceptul luat în considerare are multe definiții. Ce este valabilitatea? Aceasta este caracterul adecvat și validitatea aplicării unei tehnici sau rezultat într-o anumită situație. Valoare aplicată a acestui cuvânt- gradul de corespondență a rezultatelor și metodelor cu sarcinile atribuite.

Validitatea este o măsurare a unei alte valori care măsoară calități specifice. Astfel, o tehnică are ca scop măsurarea unei anumite calități, de exemplu, inteligența, iar validitatea ei ar trebui să arate cât de bine ajută tehnica la obținerea rezultatelor.

Cu alte cuvinte, validitatea poate fi numită fiabilitate. Măsoară acele teste și tehnici care măsoară anumite calități psihologice. Cu cât măsoară mai bine calitățile pe care le măsoară, cu atât este mai mare valabilitatea acestora.

Valabilitatea devine importantă în două moduri:

  1. Când se dezvoltă o anumită tehnică.
  2. Când o anumită tehnică arată rezultate și este necesar să se stabilească cât de înaltă sunt aceste rezultate.

Astfel, validitatea este o caracteristică care indică adecvarea unei anumite tehnici pentru a măsura o anumită calitate și utilitatea, calitatea și eficacitatea acestei tehnici.

Mai multe tipuri de validitate sunt utilizate în mod obișnuit pentru a valida un anumit test sau metodă. De asemenea, compară indicatorii care sunt dați de diferite instrumente. Există multe modalități de a măsura o anumită calitate sau caracteristică psihologică. Mai des, psihologii vor folosi tehnica care dă rezultate mai fiabile. Acest lucru va arăta valabilitatea sa ridicată.

Împreună cu validitatea, este adesea luat în considerare conceptul de fiabilitate. Tehnicile și testele trebuie să fie de încredere, adică trebuie să fie constante, de încredere. Experimentatorul trebuie să fie sigur că ia în considerare exact calitatea pe care dorește să o ia în considerare. Acesta este motivul pentru care fiabilitatea poate să nu fie întotdeauna validă, dar validitatea trebuie să fie întotdeauna de încredere.

Valabilitate în psihologie

Validitatea este utilizată în multe domenii ale vieții în care sunt măsurate diverse valori. În psihologie devine necesară și validitatea, mai ales în psihologia experimentală. Valabilitatea în psihologie este:

  • încrederea experimentatorului că măsoară calitatea de care are nevoie;
  • fiabilitatea indicatorilor care măsoară această calitate.

Dacă cititorul a trecut cel puțin o dată testele psihologice, atunci știe despre dorința interioară de a obține un răspuns specific la întrebarea pusă. Valabilitatea unui test arată experimentatorului un rezultat specific pe care îl obține prin testare. Stă aici sarcina specifica, răspunsul la care ar trebui să primească după ce a efectuat toate acțiunile necesare.

Tehnicile și testele trebuie să fie utile și de încredere, ceea ce se măsoară prin validitatea lor.

Există trei moduri de a verifica validitatea:

  1. Evaluarea validității conținutului este corespondența rezultatelor evaluării subiectului cu calitățile reale care se manifestă în realitate. Aici se folosește un astfel de concept precum validitatea facială - o persoană trebuie să vadă legătura reală dintre conținutul metodologiei în sine și rezultatele acesteia și realitatea în care se manifestă calitatea măsurată.
  2. Evaluarea validității constructului - determinarea faptului că o metodologie calculează constructe solide și specificate din punct de vedere științific. Validarea convergentă vă permite să utilizați mai multe tehnici care iau în considerare caracteristici similare și oferă rezultate mai precise pentru calitatea în cauză. Validarea discriminantă exclude alte tehnici care privesc calitățile care nu sunt corelate cu calitatea dorită.
  3. Evaluarea validității criteriului reprezintă conformitatea rezultatelor cu indicatorii așteptați, care sunt relevați în alte moduri. Utilizează validitatea predictivă pentru a ajuta la prezicerea comportamentului viitor.

Tipuri de valabilitate

Există mai multe tipuri de validitate, pe care le vom lua în considerare mai jos:

  1. Validitatea externă este o generalizare a concluziei unei situații, populație, variabile independente. Se împarte în:
  • Valabilitatea operațională.
  • Validitatea constructului - o explicație a comportamentului unei persoane la momentul testului.
  1. Valabilitatea internă este o schimbare în timpul experimentului sub influența unor factori neschimbabili.
  2. Valabilitate diferențială.
  3. Valabilitate incrementală.
  4. Valabilitatea mediului este un indicator pe care o persoană este capabilă să-l facă acțiuni diferite care poate avea succes într-o situație și nu în alta.

Această clasificare este folosită de psihologia experimentală. Psihologia organizațională și psihodiagnostica folosesc o clasificare diferită:

  1. Validitatea constructiei. Se împarte în:
  • Valabilitate convergentă.
  • Valabilitate divergentă.
  1. Valabilitatea criteriilor (empirice) - calculul corelației în funcție de punctajul la testul unui parametru extern, care a fost ales ca indicator valid. Se împarte în:
  • Valabilitate curentă - studiul parametrului la timpul prezent.
  • Valabilitate retrospectivă - o condiție sau un eveniment care a avut loc în trecut.
  • Validitate predictivă - predicție de comportament, calitate.
  1. Valabilitatea conținutului - utilizat în experimente în care se ia în considerare o anumită interacțiune, activitate. Are o subspecie:
  • Valabilitate evidentă.

Alte tipuri de valabilitate sunt:

  • A priori.
  • congruente.
  • Legate de.
  • Constructiv.
  • Consens.
  • Factorială.
  • teoretic etc.

Ce este valabilitatea testului?

Mulți oameni fac teste. Există teste psihologice speciale folosite de psihologi și alte teste tabloide. Care este valabilitatea unui test, care este un criteriu important pentru acesta? Acesta este un indicator al conformității caracteristicilor, calității, proprietăților cu testul care le măsoară.

Testele sunt diferite. Ele sunt folosite pentru a măsura parametrii psihofiziologici ai unei persoane. Cea mai mare rată de valabilitate rămâne de 80%. Utilizarea testelor devine utilă atunci când vă permit să obțineți date exacte asupra anumitor caracteristici specifice. Există mai multe abordări pentru a studia validitatea unui test:

  1. Valabilitatea constructivă, care vă permite să studiați mai profund calitățile unei persoane într-o situație, activitate, sistem.
  2. Validitatea din spatele criteriului este studiul unui parametru în prezent și prognozarea lui în viitor.
  3. Validitatea conținutului este corespondența constructelor psihologice, diversitatea lor.
  4. Validitate predictivă - prezice dezvoltarea unei anumite calități în viitor, ceea ce este dificil deoarece se poate dezvolta diferit la oameni diferiți.

Până când nu s-au determinat fiabilitatea și validitatea testului, acesta nu este utilizat în practica psihologică. Depinde mult de zonele în care sunt aplicate testele. Există teste educaționale, profesionale și alte teste care sunt utilizate în instituții individuale pentru a prezice și a identifica caracteristicile solicitanților.

Pe site-ul de ajutor psihologic, site-ul, puteți face și teste care au deja valabilitate ridicată și arată rezultate de încredere.

Ce este Validitatea metodei?

Ce este Validitatea metodei? Acesta este un indicator care indică dacă metoda luată în considerare este angajată în studiul calității, caracteristicilor pentru care este destinată. În același timp, se pune accent pe faptul că subiectul testat care este testat poate să se vadă și să se caracterizeze diferit. Acesta este motivul pentru care rezultatele nu țin întotdeauna cont de opiniile persoanelor care pot să nu observe anumite caracteristici ale lor.

Validarea este verificarea validității unei metode. Pentru a determina eficacitatea, eficiența, caracterul practic al metodei utilizate, se utilizează un indicator extern independent - calitatea care se observă în viața de zi cu zi. Există 4 tipuri de indicatori externi:

  1. Criteriul de performanță este timpul petrecut, volumul de muncă, nivelul de performanță academică, creșterea competențelor profesionale etc.
  2. Criterii subiective - opinie, opinii, preferințe, atitudinea subiectului față de cineva sau ceva. Aici folosim chestionare, interviuri, chestionare.
  3. Criterii fiziologice - influența lumii exterioare asupra psihicului și corpului uman. Măsoară ritmul cardiac, ritmul respirator, simptomele de oboseală etc.
  4. Criteriul aleatoriei - este posibil, de exemplu, să selectăm persoane care nu sunt predispuse la accidente? Studiul impactului unui caz specific.

O abordare teoretică a măsurării validității metodelor ne permite să recunoaștem dacă o tehnologie studiază într-adevăr exact calitatea pentru care a fost concepută.

Valabilitatea este determinată și de apariția calității studiate. Este bine dacă este răspândită, ceea ce face ca tehnica să fie necesară și utilă. Schimbările etice și culturale din societate devin și ele importante.

Rezultat

În practica psihologică se folosesc adesea teste și tehnici care ajută la studiul personalității unei persoane. Aici vorbim în special despre parametri interni care nu sunt vizibile pentru ochi. Trăsături de caracter, comportament, posibilă prognoză pentru viitor, cum va fi o persoană și cum va fi viața lui - toate acestea sunt studiate prin diverse teste și metode care urmăresc un singur rezultat - studiul unei persoane.

Rezultatul unei determinări cu succes a validității unui anumit instrument este cunoașterea cu succes a fiecărei persoane, indiferent de modul în care se privește pe sine. Oamenii adesea nu observă anumite calități ale lor, rareori se privesc cu o privire sobră. Testele și tehnicile vă permit să dezvăluiți parametrii individuali.

Prognoza testelor și metodelor valide este o cunoaștere rapidă și de înaltă calitate a unei alte persoane cu capacitatea de a o ajuta în rezolvarea oricărei probleme psihologice. Acest lucru nu se va realiza în curând, dar instrumentele existente și-au demonstrat deja eficacitatea. De obicei, această întrebare interesează numai acele persoane care sunt implicate în determinarea calității testelor și metodelor. Cu toate acestea, oamenii obișnuiți vor găsi util să știe în ce exerciții ar trebui să aibă încredere și care nu.

Biletul numărul 9

Chestionare de motivație și caracteristicile acestora.

Chestionare de motivație - un grup de chestionare concepute pentru a diagnostica sfera-nevoia-motivațională a unui individ, care vă permite să stabiliți spre ce vizează activitatea individului (motivele ca motive care determină alegerea direcției de comportament). În plus, întrebarea cum se realizează reglarea dinamicii comportamentului este esențială. În acest caz, ei recurg adesea la măsurarea atitudinilor. Elaborarea chestionarelor de motive în psihodiagnostic este în mare măsură legată de necesitatea evaluării influenței factorului „dezirabilitate socială”, care are un caracter atitudinal și reduce fiabilitatea datelor obținute cu ajutorul chestionarelor de personalitate. Cele mai cunoscute chestionare de motive sunt „Lista preferințelor personale” elaborată de A. Edwards (1954), care este menită să măsoare „forța” nevoilor, împrumutată din lista propusă de G. Murray pentru testul tematic de apercepție. Aceste nevoi includ, de exemplu, nevoia de succes, respect, leadership etc. „Puterea” fiecărei nevoi nu este exprimată în valori absolute, dar în ceea ce privește „forța” altor nevoi, adică. se folosesc indicatori de personalitate. Pentru a studia rolul factorului „dezirabilitate socială” A. Edwards (1957) a propus un chestionar special. Alte chestionare de motive sunt de asemenea utilizate pe scară largă, de exemplu, „Form for the study of personality” de D. Jackson (1967), chestionare de A. Mehrabyan (1970) etc.

După fiabilitate, un alt criteriu cheie pentru evaluarea calității metodelor este validitatea. Problema validității unei metode este decisă numai după ce a fost stabilită fiabilitatea ei suficientă, deoarece o metodă nesigură nu poate fi valabilă. Dar cea mai fiabilă tehnică este practic inutilă fără a-i cunoaște validitatea.

Trebuie remarcat faptul că problema validității până de curând pare a fi una dintre cele mai dificile. Definiția cea mai înrădăcinată a acestui concept este cea dată în cartea lui A. Anastasi: „Validitatea unui test este un concept care ne spune ce măsoară un test și cât de bine îl face”.

Din acest motiv, nu există o abordare universală unică pentru determinarea validității. În funcție de partea de validitate pe care cercetătorul dorește să ia în considerare, se folosesc diferite metode de demonstrare. Cu alte cuvinte, conceptul de validitate include diferitele sale tipuri, care au un sens aparte. Verificarea validității unei tehnici se numește validare.



Validitatea în primul său sens este legată de metoda în sine, adică este valabilitatea instrumentului de măsurare. Această verificare se numește validare teoretică. Validitatea în al doilea sens se referă deja nu atât la tehnică, cât la scopul utilizării acesteia. Aceasta este o validare pragmatică.

Rezumând, putem spune următoarele:

în validarea teoretică, cercetătorul este interesat de proprietatea în sine, măsurată prin metodă. Acest lucru înseamnă în esență că validarea psihologică reală este în curs de realizare;

cu validarea pragmatică, esența subiectului măsurării (proprietățile psihologice) nu se vede. Concentrare principala este făcută pentru a demonstra că ceva care este măsurat prin metodologie are o legătură cu anumite domenii de practică.

Efectuarea validării teoretice, spre deosebire de pragmatică, este uneori mult mai dificilă. Fără a intra încă în detalii specifice, haideți să ne oprim schiță generală asupra modului în care este verificată validitatea pragmatică: este selectat un criteriu extern independent de metodă care determină succesul într-o anumită activitate (educațională, profesională etc.), iar rezultatele metodei de diagnosticare sunt comparate cu acesta. Dacă legătura dintre ele este recunoscută ca fiind satisfăcătoare, atunci se face o concluzie despre semnificația practică, eficiența și eficacitatea tehnicii de diagnosticare.

Pentru a determina validitatea teoretică, este mult mai dificil să găsim vreun criteriu independent care să fie în afara metodologiei. Prin urmare, în primele etape ale dezvoltării testologiei, când conceptul de validitate tocmai lua contur, a existat o idee intuitivă că testul măsoară:

1) metoda a fost numită validă, deoarece ceea ce măsoară este pur și simplu evident;

2) dovada validității s-a bazat pe încrederea cercetătorului că metoda sa permite înțelegerea subiectului;

3) tehnica a fost considerată validă (adică s-a acceptat afirmația că cutare sau cutare test măsoară o astfel de calitate) doar pentru că teoria pe baza căreia s-a construit tehnica este foarte bună.

Acceptarea afirmațiilor nefondate cu privire la validitatea metodologiei nu a putut continua perioadă lungă de timp... Primele manifestări ale criticii cu adevărat științifice au dezmințit această abordare: a început căutarea dovezilor bazate științific.

Astfel, a efectua o validare teoretică a unei metodologii înseamnă a demonstra că o metodologie măsoară exact acea proprietate, calitate pe care, conform intenției cercetătorului, ar trebui să o măsoare.

Deci, de exemplu, dacă a fost dezvoltat un test pentru a diagnostica dezvoltarea mentală a copiilor, este necesar să se analizeze dacă măsoară cu adevărat această dezvoltare particulară și nu alte caracteristici (de exemplu, personalitatea, caracterul etc.). Astfel, pentru validare teoretică problema cardinala este relația dintre fenomenele psihologice și indicatorii lor, prin care aceste fenomene psihologice încearcă să învețe. Aceasta arată cât de mult coincid intenția autorului și rezultatele metodologiei.

Nu este atât de dificil să se efectueze validarea teoretică a unei noi metode, dacă este pentru măsurare a acestei proprietati o metodă cu validitate dovedită este deja disponibilă. Prezența unei corelații între metodologia nouă și o metodologie similară deja dovedită indică faptul că metodologia dezvoltată măsoară aceeași calitate psihologică ca și cea de referință. Si daca metoda nouaîn același timp, se dovedește a fi mai compact și mai economic în conducerea și procesarea rezultatelor, apoi psihodiagnosticul are ocazia de a folosi un instrument nou în locul celui vechi.

Dar validitatea teoretică este dovedită nu numai prin compararea cu indicatorii aferenti, ci și cu cei în care, pe baza ipotezei, conexiuni semnificative nu trebuie sa fie. Astfel, pentru verificarea validității teoretice, este important, pe de o parte, să se stabilească gradul de legătură cu o metodologie aferentă (validitate convergentă) și absența acestei legături cu metode care au o bază teoretică diferită (validitate discriminantă). ).

Este mult mai dificil să se efectueze validarea teoretică a unei metode atunci când un astfel de mod de verificare este imposibil. Aceasta este situația cu care se confruntă cel mai adesea un cercetător. În astfel de circumstanțe, doar o acumulare treptată a diferitelor informații despre proprietatea studiată, analiza premiselor teoretice și a datelor experimentale, experiența semnificativă cu tehnica ne permite să dezvăluim semnificația sa psihologică.

Rol important pentru a înțelege ce măsoară metodologia, joacă o comparație a indicatorilor săi forme practice Activități. Dar aici este deosebit de important ca metodologia să fie elaborată temeinic în termeni teoretici, adică să existe o bază științifică solidă, fundamentată. Apoi, la compararea metodologiei cu un criteriu extern preluat din practica cotidiană, corespunzător a ceea ce măsoară aceasta, se pot obține informații care susțin ideile teoretice despre esența ei.

Este important să ne amintim că, dacă validitatea teoretică este dovedită, atunci interpretarea indicatorilor obținuți devine mai clară și mai lipsită de ambiguitate, iar numele metodei corespunde domeniului de aplicare a acesteia. În ceea ce privește validarea pragmatică, ea presupune testarea unei metodologii din punctul de vedere al eficacității, semnificației, utilității sale practice, întrucât are sens să se folosească o tehnică de diagnosticare doar atunci când se dovedește că proprietatea măsurată se manifestă în anumite situații de viață, în anumite tipuri de activitate. Ei îi acordă o mare importanță, mai ales acolo unde se pune problema selecției.

Dacă ne întoarcem din nou la istoria dezvoltării testologiei, putem distinge o astfel de perioadă (20-30 ai secolului XX), când conținutul științific al testelor și bagajul lor teoretic erau de mai puțin interes. A fost important ca testul să funcționeze, să ajute la selectarea rapidă a celor mai pregătiți oameni. Un criteriu empiric de evaluare a itemilor testului a fost considerat singurul ghid corect în rezolvarea problemelor științifice și aplicate.

Utilizarea tehnicilor de diagnostic cu o justificare pur empirică, fără o bază teoretică clară, a condus adesea la concluzii pseudoștiințifice, la nejustificate. recomandari practice... Era imposibil să numim exact acele caracteristici, calități pe care le-au relevat testele. Erau în esență teste oarbe.

Această abordare a problemei validității testelor a fost tipică până la începutul anilor 1950. secolul XX nu numai în SUA, ci și în alte țări. Slăbiciunea teoretică a metodelor empirice de validare nu putea decât să trezească critici din partea acelor oameni de știință care, în elaborarea testelor, au cerut să se bazeze nu numai pe empirism și practică, ci și pe un concept teoretic. Se știe că practica fără teorie este oarbă, iar teoria fără practică este moartă. În prezent, evaluarea teoretică și practică a validității metodelor este percepută ca fiind cea mai productivă.

Pentru a efectua o validare pragmatică a unei metode, adică pentru a-i evalua eficacitatea, eficiența și semnificația practică, se utilizează de obicei un criteriu extern independent - un indicator al manifestării proprietății studiate în viața de zi cu zi. Un astfel de criteriu poate fi atât performanța academică (pentru teste de capacitate de învățare, teste de realizare, teste de inteligență), cât și realizările de producție (pentru metode de orientare profesională), cât și eficacitatea activităților reale - desen, modelare etc. teste de abilități speciale), evaluări subiective (pentru teste de personalitate).

Cercetătorii americani D. Tiffin și E. McCormick, după ce au analizat criteriile externe folosite pentru a demonstra validitatea, disting patru tipuri de ele [31 fiecare):

1) criterii de performanță (acestea pot include, cum ar fi cantitatea de muncă prestată, performanța academică, timpul petrecut în formare, rata de creștere a calificărilor etc.);

2) criterii subiective (cuprind diverse tipuri de răspunsuri care reflectă atitudinea unei persoane față de ceva sau cineva, părerea, părerile, preferințele acestuia; de obicei criteriile subiective se obțin prin interviuri, chestionare, chestionare);

3) criterii fiziologice (sunt folosite pentru a studia influența mediului și a altor variabile situaționale asupra corpului și psihicului uman; se măsoară frecvența pulsului, tensiunea arterială, rezistența electrică a pielii, simptomele de oboseală etc.);

4) criteriile accidentelor (aplicate atunci când scopul studiului se referă, de exemplu, la problema selectării pentru muncă a unor persoane mai puțin susceptibile la accidente).

Criteriul extern trebuie să îndeplinească trei cerințe de bază:

trebuie să fie relevantă;

fără interferențe;

de încredere.

Relevanța înseamnă corespondența semantică a unui instrument de diagnostic cu un criteriu vital independent. Cu alte cuvinte, ar trebui să existe încredere că criteriile implică tocmai acele trăsături ale psihicului individual care sunt măsurate prin metoda diagnosticului. Criteriul extern și tehnica de diagnostic ar trebui să fie într-o corespondență semantică internă între ele, să fie omogene calitativ în esență psihologică. Dacă, de exemplu, testul măsoară caracteristicile individuale ale gândirii, capacitatea de a efectua acțiuni logice cu anumite obiecte, concepte, atunci în criteriu este necesar să se caute manifestarea tocmai a acestor aptitudini. Acest lucru se aplică în mod egal activitate profesională... Are nu unul, ci mai multe obiective, sarcini, fiecare dintre acestea fiind specifică și prezintă propriile condiții de implementare. Aceasta presupune existența mai multor criterii de desfășurare a activităților profesionale. Prin urmare, nu trebuie făcută nicio comparație între succesul diagnosticului și performanța generală. Este necesar să se găsească un criteriu care, prin natura operațiunilor efectuate, să fie corelat cu metodologia.

Dacă nu se știe cu privire la un criteriu extern dacă este relevant pentru proprietatea măsurată sau nu, atunci compararea rezultatelor tehnicii de psihodiagnostic cu aceasta devine practic inutilă. Nu permite să se ajungă la nicio concluzie care ar putea evalua validitatea metodei.

Cerințele de libertate de interferență sunt cauzate de faptul că, de exemplu, succesul educațional sau industrial depinde de două variabile: de persoana însăși, de caracteristicile sale individuale, măsurate prin metode, și de situația, condițiile de studiu, munca care poate introduce interferența, „poluează” criteriul aplicat... Pentru a evita într-o oarecare măsură acest lucru, este necesar să se selecteze pentru cercetare astfel de grupuri de oameni care se află mai mult sau mai puțin în aceleași condiții. Se poate folosi o altă metodă. Constă în corectarea influenței interferențelor. Această ajustare este de obicei de natură statistică. De exemplu, productivitatea ar trebui luată nu în termeni absoluti, ci în raport cu productivitatea medie a lucrătorilor care lucrează în condiții similare.

Când se spune că un criteriu ar trebui să aibă o fiabilitate semnificativă statistic, aceasta înseamnă că ar trebui să reflecte constanța și stabilitatea funcției studiate.

Căutarea unui criteriu adecvat şi uşor de identificat este foarte importantă şi sarcini dificile validare. În testologia occidentală, multe metode sunt descalificate doar pentru că nu au putut găsi un criteriu potrivit pentru testarea lor. De exemplu, pentru majoritatea chestionarelor, datele privind validitatea lor sunt discutabile, deoarece este dificil de găsit un criteriu extern adecvat care să corespundă cu ceea ce măsoară.

Evaluarea validității metodelor poate fi cantitativă și calitativă.

Pentru a calcula un indicator cantitativ - coeficientul de validitate - rezultatele obținute prin utilizarea tehnicii de diagnosticare sunt comparate cu datele obținute printr-un criteriu extern al acelorași persoane. Sunt utilizate diferite tipuri de corelații liniare (după Spearman, Pearson).

De câte materii sunt necesare pentru a calcula validitatea?

Practica a arătat că nu ar trebui să fie mai puțin de 50, dar cel mai bine este mai mult de 200. Adesea se pune întrebarea, care ar trebui să fie valoarea coeficientului de valabilitate pentru ca acesta să fie considerat acceptabil? În general, se observă că este suficient ca coeficientul de validitate să fie semnificativ statistic. Coeficientul de valabilitate de ordinul 0,20-0,30 este recunoscut ca fiind mic, 0,30-0,50 ca mediu si peste 0,60 ca mare.

Dar, după cum subliniază A. Anastazi, K.M. Gurevich și alții, nu este întotdeauna adecvat să se utilizeze corelația liniară pentru a calcula coeficientul de validitate. Această tehnică este justificată doar atunci când s-a dovedit că succesul într-o anumită activitate este direct proporțional cu succesul în efectuarea unui test de diagnostic. Poziția testatorilor străini, în special a celor care sunt angajați în adecvarea profesională și selecția profesională, se rezumă cel mai adesea la o recunoaștere necondiționată a faptului că cel care a îndeplinit mai multe sarcini în cadrul testului este mai potrivit pentru profesie. Dar se poate si cazul ca pentru succes in activitate sa ai nevoie de o proprietate la nivelul de 40% din solutia de testare. Succesul în continuare la test nu mai are nicio semnificație pentru profesie. Un exemplu ilustrativ din monografia lui K.M.Gurevici: un poștaș trebuie să știe să citească, dar fie că citește cu viteză normală, fie cu viteză foarte mare, nu mai are sens profesional. Cu un astfel de raport dintre indicatorii metodologiei și criteriul extern, criteriul diferențelor poate fi cel mai adecvat mod de stabilire a validității.

Este posibil și un alt caz: un nivel de calitate mai înalt decât îl cere profesia este o piedică în calea succesului profesional. Deci, chiar și în zorii secolului XX. Cercetătorul american F. Taylor a descoperit că cei mai dezvoltați lucrători din producție au productivitate scăzută muncă. Adică, nivelul înalt al dezvoltării lor mentale i-a împiedicat să lucreze foarte productiv. În acest caz, analiza varianței sau calcularea rapoartelor de corelație ar fi mai potrivită pentru calcularea coeficientului de validitate.

După cum a arătat experiența testologilor străini, nicio procedură statistică nu este capabilă să reflecte pe deplin diversitatea evaluărilor individuale. Prin urmare, un model diferit este adesea folosit pentru a demonstra validitatea metodelor - evaluări clinice. Aceasta nu este altceva decât o descriere calitativă a esenței proprietății studiate. În acest caz, vorbim despre utilizarea unor tehnici care nu se bazează pe prelucrarea statistică.

Tipuri de valabilitate

Validitatea, în esența sa, este o caracteristică complexă, care include, pe de o parte, informații despre dacă o tehnică este potrivită pentru a măsura pentru ce a fost creată și, pe de altă parte, care este eficacitatea, eficiența și utilitatea sa practică.

Verificarea validității unei tehnici se numește validare.

Pentru a efectua o validare pragmatică a unei metode, adică pentru a-i evalua eficacitatea, eficiența și semnificația practică, se utilizează de obicei un criteriu extern independent - un indicator al manifestării proprietății studiate în viața de zi cu zi. Un astfel de criteriu poate fi atât performanța academică (pentru teste de capacitate de învățare, teste de realizare, teste de inteligență), cât și realizările de producție (pentru metode de orientare profesională), cât și eficacitatea activităților reale - desen, modelare etc. teste de abilități speciale), evaluări subiective (pentru teste de personalitate).

4 tipuri de criterii externe:

criterii de performanță (acestea pot include, cum ar fi cantitatea de muncă prestată, performanța academică, timpul petrecut în formare, rata de creștere a calificărilor etc.);

criterii subiective (cuprind diverse tipuri de răspunsuri care reflectă atitudinea unei persoane față de ceva sau cineva, părerea, opiniile, preferințele acestuia; de obicei criteriile subiective se obțin prin interviuri, chestionare, chestionare);

criterii fiziologice (se folosesc pentru studierea influenței mediului și a altor variabile situaționale asupra corpului și psihicului uman; se măsoară frecvența pulsului, tensiunea arterială, rezistența electrică a pielii, simptomele de oboseală etc.);

criteriile accidentelor (aplicate atunci când scopul studiului se referă, de exemplu, la problema selecției pentru muncă a unor astfel de persoane care sunt mai puțin susceptibile la accidente).

Valabilitatea empirică.

Dacă, în cazul validității de fond, evaluarea testului se realizează pe cheltuiala experților (care stabilesc corespondența sarcinilor de testare cu conținutul subiectului de măsurare), atunci validitatea empirică se măsoară întotdeauna cu ajutorul statisticilor. corelație: se calculează corelarea a două serii de valori - scorurile testelor și indicatorii printr-un parametru extern ales ca criteriu de valabilitate.

Validitatea constructiei.

Validitatea constructului se referă la un construct teoretic în sine și implică căutarea factorilor care explică comportamentul performanței testului. Ca tip special, validitatea de construct este canonizată în articolul lui Cronbach și Mil (1955). Autorii au evaluat folosind acest tip de validitate toate studiile de testare care nu vizau în mod direct prezicerea unor criterii semnificative. Studiul conținea informații despre constructele psihologice.

Valabilitate „după conținut”.

Valabilitatea conținutului necesită ca fiecare sarcină, sarcină sau întrebare care aparține unei anumite zone să aibă șanse egale de a fi elemente de testare. Valabilitatea conținutului evaluează corespondența conținutului testului (sarcini, întrebări) cu aria de comportament măsurată. Testele, compilate de două echipe de dezvoltare, sunt efectuate pe un eșantion de subiecți. Fiabilitatea testelor este calculată prin împărțirea itemilor în două părți, rezultând un indice de validitate semnificativă.

Valabilitate „predictivă”.

Valabilitatea „predictivă” este determinată și de un criteriu extern destul de fiabil, dar informațiile despre acesta sunt colectate la ceva timp după test. Un criteriu extern este de obicei exprimat în unele evaluări ale capacității unei persoane de tipul de activitate pentru care a fost selectat în funcție de rezultatele testelor de diagnostic. Deși această tehnică este cel mai în concordanță cu sarcina tehnicilor de diagnosticare - prezicerea succesului viitor, este foarte dificil de aplicat. Precizia prognozei este invers legată de timpul stabilit pentru o astfel de prognoză. Cu cât trece mai mult timp după măsurare, cu atât mai mulți factori trebuie luați în considerare atunci când se evaluează valoarea predictivă a tehnicii. Cu toate acestea, este aproape imposibil să luați în considerare toți factorii care influențează predicția.

Valabilitate „retrospectivă”.

Se determină pe baza unui criteriu care reflectă evenimente sau o stare de calitate din trecut. Poate fi folosit pentru a obține rapid informații despre capacitățile predictive ale tehnicii. De exemplu, notele anterioare, opiniile experților din trecut și așa mai departe pot fi comparate pentru a testa cât de bune scorurile la testele de aptitudini corespund învățării rapide. la persoanele cu indicatori de diagnostic ridicat și scăzut în acest moment.

Valabilitate convergentă și discriminantă.

Strategia includerii anumitor itemi în test depinde de modul în care psihologul definește constructul diagnostic. Dacă Eysenck definește proprietatea „nevrotism” ca fiind independentă de extraversie-introversie, atunci aceasta înseamnă că în chestionarul său ar trebui să existe itemi aproximativ egal împărțiți cu care introvertiții nevrotici și extravertiții nevrotici vor fi de acord. Dacă, în practică, se dovedește că itemii din cadranul „Nevrotism-Introversie” vor prevala în test, atunci, din punctul de vedere al teoriei lui Eysenck, aceasta înseamnă că factorul „nevrotism” este încărcat cu un factor irelevant. - „introversie”. (Efectul este exact același dacă există o părtinire în eșantion - dacă conține mai mulți introvertiți nevrotici decât extrovertiți nevrotici.)

Pentru a nu se confrunta cu astfel de dificultăți, psihologii ar dori să se ocupe de astfel de indicatori (puncte) empiric care informează fără ambiguitate doar despre un singur factor. Dar această cerință nu este niciodată într-adevăr îndeplinită: orice indicator empiric se dovedește a fi determinist nu numai prin factorul de care avem nevoie, ci și prin alții - irelevant pentru problema de măsurare.

Astfel, în legătură cu factorii care sunt definiți conceptual ca ortogonali cu măsurabilul (care apar cu acesta în toate combinațiile), autorul testului ar trebui să aplice o strategie de echilibrare artificială atunci când selectează elementele.

Corespondența itemilor cu factorul măsurat asigură validitatea convergentă a testului. Echilibrarea elementelor cu privire la factorii irelevanți oferă validitate discriminantă. Din punct de vedere empiric, se exprimă în absența unei corelații semnificative cu un test care măsoară o proprietate independentă conceptual.

Tipuri de valabilitate

Există mai multe tipuri de validitate datorită particularităților tehnicilor de diagnosticare, precum și a statutului temporar al criteriului extern În multe lucrări (A. Anastazi, 1982; LF Burlachuk, SM Morozov, 1989; KM. Gurevich, 1970; BV Kulagin , 1984; În Cherny, 1983; „Psihodiagnostica generală”, 1987 etc.) sunt denumite cel mai adesea următoarele:

1. Valabilitate „după conținut”. Această tehnică este folosită în primul rând în testele de realizare. De obicei, testele de realizare nu includ tot materialul pe care l-au promovat elevii, ci o mică parte din acesta (3-4 întrebări). Este posibil să fii sigur că răspunsurile corecte la aceste câteva întrebări indică asimilarea întregului material. La asta ar trebui să răspundă validarea conținutului. Pentru a face acest lucru, se face o comparație a succesului la test cu evaluările de specialitate ale profesorilor (conform acest material). Valabilitatea conținutului se aplică și testelor bazate pe criterii. Această tehnică este uneori denumită validitate logică.

2. Valabilitatea „simultaneității”, sau valabilitatea curentă, este determinată folosind un criteriu extern prin care informațiile sunt colectate concomitent cu experimentele folosind metodologia testată. Cu alte cuvinte, sunt colectate date referitoare la performanța actuală în timpul perioadei de testare, performanța în aceeași perioadă și așa mai departe.Acest lucru este corelat cu rezultatele succesului la test.

3. Valabilitate „predictivă” (numită și valabilitate „predictivă”). De asemenea, este determinat de un criteriu extern destul de fiabil, dar informațiile despre acesta sunt colectate la ceva timp după test. Un criteriu extern este de obicei exprimat în unele evaluări ale capacității unei persoane de tipul de activitate pentru care a fost selectat în funcție de rezultatele testelor de diagnostic. Deși această tehnică este cel mai în concordanță cu sarcina tehnicilor de diagnosticare - prezicerea succesului viitor, este foarte dificil de aplicat. Precizia prognozei este invers legată de timpul stabilit pentru o astfel de prognoză. Cu cât trece mai mult timp după măsurare, cu atât mai mulți factori trebuie luați în considerare atunci când se evaluează valoarea predictivă a tehnicii. Cu toate acestea, este aproape imposibil să luați în considerare toți factorii care influențează predicția.

4. Valabilitatea „retrospectivă”. Se determină pe baza unui criteriu care reflectă evenimente sau o stare de calitate din trecut. Poate fi folosit pentru a obține rapid informații despre capacitățile predictive ale tehnicii. De exemplu, notele anterioare, opiniile experților din trecut și așa mai departe pot fi comparate pentru a testa cât de bune scorurile la testele de aptitudini corespund învățării rapide. la persoanele cu indicatori de diagnostic ridicat și scăzut în acest moment.

Corelație

Corelația (dependența de corelație) este o relație statistică a două sau mai multe variabile aleatoare (sau cantități care pot fi considerate ca atare cu un grad acceptabil de acuratețe). În acest caz, modificările valorilor uneia sau mai multor dintre aceste cantități conduc la o modificare sistematică a valorilor unei alte cantități sau altor cantități. O măsură matematică a corelației a două variabile aleatoare este raportul de corelație sau coeficientul de corelație (sau). Dacă o modificare a unei variabile aleatoare nu conduce la o schimbare regulată a unei alte variabile aleatoare, ci conduce la o modificare a unei alte caracteristici statistice a unei anumite variabile aleatoare, atunci conexiune similară nu este considerată corelație, deși este statistică.

Pentru prima dată, termenul „corelație” a fost introdus în circulația științifică de către paleontologul francez Georges Cuvier în secolul al XVIII-lea. El a dezvoltat „legea corelației” părților și organelor ființelor vii, cu ajutorul căreia se poate restabili aspectul unui animal fosil, având la dispoziție doar o parte din rămășițele sale. În statistică, cuvântul „corelație” a fost folosit pentru prima dată de biologul și statisticianul englez Francis Galton la sfârșitul secolului al XIX-lea.

Unele tipuri de coeficienți de corelație pot fi pozitivi sau negativi (de asemenea, este posibil să nu existe o relație statistică - de exemplu, pentru variabile aleatoare independente). Dacă se presupune că se stabilește o relație de ordine strictă asupra valorilor variabilelor, atunci corelația negativă este o corelație în care o creștere a unei variabile este asociată cu o scădere a unei alte variabile, în timp ce coeficientul de corelație poate fi negativ; o corelație pozitivă în astfel de condiții este o corelație în care o creștere a unei variabile este asociată cu o creștere a unei alte variabile, în timp ce coeficientul de corelație poate fi pozitiv.

* Fiabilitatea și validitatea unui test sunt caracteristici ale conformității unui studiu cu criteriile formale care determină calitatea și adecvarea pentru utilizare în practică.

Ce este fiabilitatea

În timpul testării fiabilității testului, consistența rezultatelor obținute este evaluată atunci când testul este repetat. Discrepanțele de date ar trebui să fie absente sau nesemnificative. În caz contrar, este imposibil să te raportezi cu încredere la rezultatele testelor.

Fiabilitatea testului este un criteriu care indică faptul că este considerat semnificativ următoarele proprietăți teste:

  • reproductibilitatea rezultatelor obținute în urma studiului;
  • gradul de precizie sau instrumentele aferente;
  • sustenabilitatea rezultatelor peste o anumită perioadă timp.

În interpretarea fiabilității, se pot distinge următoarele componente principale:

  • fiabilitatea instrumentului de măsurare (și anume alfabetizarea și obiectivitatea elementului de testare), care poate fi evaluată prin calcularea coeficientului corespunzător;
  • stabilitatea trăsăturii studiate pe o perioadă lungă de timp, precum și predictibilitatea și netezimea fluctuațiilor sale;
  • obiectivitatea rezultatului (adică independența acestuia față de preferințele personale ale cercetătorului).

Factori de fiabilitate

Gradul de fiabilitate poate fi influențat de o serie de factori negativi, dintre care cei mai semnificativi sunt următorii:

  • imperfecțiunea metodologiei (instrucțiuni incorecte sau inexacte, formularea neclară a sarcinilor);
  • instabilitate temporară sau fluctuații constante ale valorilor indicatorului care este studiat;
  • inconsecvența mediului în care sunt efectuate studiile inițiale și repetate;
  • comportamentul schimbător al cercetătorului, precum și instabilitatea stării subiectului;
  • abordare subiectivă în evaluarea rezultatelor testelor.

Metode de evaluare a fiabilității testului

Atunci când se determină fiabilitatea unui test, pot fi utilizate următoarele tehnici.

Metoda de retestare este una dintre cele mai comune. Vă permite să stabiliți gradul de corelare între rezultatele cercetării, precum și momentul la care acestea au fost efectuate. Această tehnică este simplă și eficientă. Cu toate acestea, testele repetate tind să provoace iritații și reacții negative la subiecți.

  • validitatea constructivă a unui test este un criteriu utilizat în evaluarea unui test care are structura ierarhica(utilizat în studiul fenomenelor psihologice complexe);
  • validitatea criteriului presupune o comparare a rezultatelor testelor cu nivelul de dezvoltare a subiectului uneia sau alteia caracteristici psihologice;
  • validitatea conținutului determină corespondența metodologiei cu fenomenul studiat, precum și gama de parametri pe care aceasta o acoperă;
  • validitatea predictivă este cea care vă permite să evaluați dezvoltarea viitoare a unui parametru.

Tipuri de criterii de valabilitate

Valabilitatea testului este unul dintre indicatorii care vă permit să evaluați adecvarea și adecvarea unei tehnici pentru studierea unui anumit fenomen. Există patru criterii principale care îl pot afecta:

  • criteriul interpretului (vorbim despre calificările și experiența cercetătorului);
  • criterii subiective (atitudinea subiectului față de un anumit fenomen, care se reflectă în rezultatul final al testului);
  • criterii fiziologice (starea de sănătate, oboseală și alte caracteristici care pot avea un impact semnificativ asupra rezultatului final al testului);
  • criteriul accidentelor (are loc în determinarea probabilităţii producerii unui eveniment).

Criteriul de validitate este o sursă independentă de date privind un anumit fenomen (proprietate psihologică), al cărui studiu se realizează prin testare. Până când rezultatele nu sunt verificate pentru conformitatea cu criteriul, validitatea nu poate fi judecată.

Cerințe de bază pentru criterii

Criteriile externe care afectează scorul de validitate al testului trebuie să îndeplinească următoarele cerințe de bază:

  • corespondența cu însăși domeniul în care se desfășoară cercetarea, relevanța, precum și o legătură semantică cu modelul diagnostic;
  • absența oricăror interferențe sau lacune ascuțite în eșantion (care este că toți participanții la experiment trebuie să se întâlnească în avans setați parametriși să fie în condiții similare);
  • parametrul investigat trebuie să fie de încredere, constant și să nu fie supus modificărilor bruște.

Metode de stabilire a valabilității

Testarea validității testelor se poate face în mai multe moduri.

Evaluarea validității aparente implică verificarea dacă un test este potrivit pentru scopul propus.

Evaluarea validității constructive se realizează atunci când se efectuează o serie de experimente pentru a studia un anumit indicator complex. Include:

  • validare convergentă - verificarea relației estimărilor obținute prin diverse metode complexe;
  • validare divergentă, ceea ce înseamnă că metodologia nu implică evaluarea unor indicatori străini care nu au legătură cu studiul principal.

Evaluarea validității predictive presupune stabilirea posibilității de predicție a fluctuațiilor viitoare ale indicatorului studiat.

concluzii

Validitatea și fiabilitatea testelor sunt măsuri complementare care oferă cea mai completă evaluare a corectitudinii și semnificației rezultatelor cercetării. Ele sunt adesea determinate în același timp.

Fiabilitatea arată cât de mult se poate de încredere în rezultatele testelor. Aceasta se referă la constanța lor de fiecare dată când se efectuează un test similar cu aceiași participanți. Un grad scăzut de fiabilitate poate indica o denaturare deliberată sau o abordare iresponsabilă.

Conceptul de validitate a testului este legat de aspectul calitativ al experimentului. Întrebarea este dacă instrumentul ales corespunde evaluării unui anumit fenomen psihologic. Aici se pot aplica atât indicatorii calitativi (aprecierea teoretică), cât și indicatorii cantitativi (calculul coeficienților corespunzători).

1. Un indicator al calității metodei, a capacității acesteia de a da rezultate care reflectă în mod adecvat fenomenul studiat, i.e. exact acele rezultate pentru care este destinat (metoda V.). 2. O măsură a conformității teoriei cu datele empirice, capacitatea de a face predicții rezonabil de precise bazate pe teorie (teoria V). 3. Măsura corespondenței rezultatelor realității studiate, mai precis, ideilor despre realitate (V. rezultate). În acest articol V. se discută în primul sens. În știința pozitivistă se disting V. măsurători, V. intern și extern al procedurilor experimentale și V. de inferență statistică.

B. procedee de măsurare

Măsurarea este înțeleasă ca procesul de asociere a unui concept teoretic cu una sau mai multe variabile latente, iar acestea din urmă cu variabile observabile. În teoria clasică, un rezultat de măsurare include două componente necorelate: adevărat și fals. Se fac ipoteze despre erorile de măsurare care fac cunoscut comportamentul erorii. B. O procedură de măsurare este o măsură a conformității sale cu constructul măsurat. Mai des decât altele se evaluează V. criteriu (numit adesea empiric), constructiv, convergent și discriminant.Ca metode auxiliare de stabilire a V., se folosesc rezumarea literaturii de specialitate pe această temă, evaluări ale experților.

Criteriul B. al procedurii de măsurare se apreciază prin etanşeitate legătură statistică(corelații) între rezultatele măsurate și criteriul extern. Astfel, criteriul V. al scalei de conducere înseamnă că indicatorul obţinut se corelează cu un indicator obţinut independent, de exemplu, date sociometrice. O indicare a criteriului V. implică nu numai un mesaj despre coeficientul de corelație dintre indicatorii de testare și un indicator extern, ci și despre toate circumstanțele studiului: cum și în ce situație a fost măsurat criteriul, pe ce eșantion a fost efectuat studiul , etc. Criteriile pot fi actuale (măsurate simultan folosind o procedură validată) și prognostice. V. predictiv este foarte de dorit pentru metodele de măsurare orientate practic. Dezavantajele acestei abordări sunt dificultatea de a selecta un criteriu și riscul de a măsura un criteriu invalid, ceea ce reduce semnificativ coeficientul de corelație obținut. Atât comportamentul evaluat, cât și criteriul se pot schimba în timp, iar eșantioanele pot fi părtinitoare. Dacă cercetătorul ar putea găsi criteriul perfect, crearea procedurii de măsurare ar deveni redundantă. În acest sens, paradoxul formulat de J. Kelly este de înțeles: metoda V. este capacitatea sa de a furniza informații deja cunoscute. Dependenţa criteriului V. de proprietăţile criteriului, imposibilitatea de a găsi un indicator obiectiv satisfăcător în multe domenii de cunoaştere reduc semnificativ valoarea criteriului V. ca indicator al calităţii unui procedeu de măsurare.

V. constructivă se stabilește prin relația statistică dintre indicatorii acestei proceduri și alte metode care măsoară un construct înrudit. Ipotezele despre o relație statistică sunt formulate înainte de verificarea lor, pe baza unei teorii semnificative. Validarea constructelor este un proces lung și nicio corelație empirică nu poate garanta fiabilitatea unei măsurători. Teoretic, se postulează relația dintre constructe, se estimează corelația dintre indicatorii acestor constructe, pe baza datelor obținute, se revizuiesc relațiile așteptate teoretic dintre constructe sau dintre constructe și indicatori. Se selectează un nou construct (sau un nou indicator, sau o nouă teorie despre relația dintre constructe), iar procesul se repetă din nou. Ambele constructe pot fi fără legătură. Acest lucru se întâmplă atunci când metodele de măsurare sub același nume se bazează pe fundamente teoretice diferite. Alte probleme sunt asociate cu situațiile în care indicatorul măsurat utilizat pentru validarea procedurii nu este măsurat suficient de valid; același indicator măsoară simultan diferite constructe; erorile de măsurare se corelează între ele. Dacă cercetătorul este sigur că diagrama structurală este corectă (nu există legături între indicatori și constructe străine, iar corelația dintre erorile de măsurare este zero), el / ea poate găsi corelația dintre constructe, corectată pentru nefiabilitatea indicatorilor.

Analiza factorială a indicatorilor este adesea utilizată pentru aprecierea V. constructivă a procedurii de măsurare. Acest nume se referă la o gamă largă de metode de reducere a dimensionalității datelor, atunci când un număr mic de variabile latente (factori) sunt extrase dintr-un set de variabile măsurate. Numărul și interpretabilitatea teoretică a factorilor sunt interpretate ca o măsură a V. a metodei de măsurare, iar încărcările factorilor de variabile măsurate - ca o măsură a V. a indicatorilor. Încărcarea factorială este o măsură standardizată legătură structuralăîntre factorul comun (variabila latentă) şi indicator. Este adesea definită ca corelația dintre un factor și o variabilă. Metodele binecunoscute de analiză factorială (de exemplu, analiza axei principale) este o procedură exploratorie, i.e. nu permite testarea ipotezelor statistice, iar rezultatul analizei este determinat semnificativ solutii tehnice pe care cercetătorul le acceptă. În acest sens, posibilitățile metodei ca mijloc de validare sunt limitate. Pentru a slăbi arbitrariul la efectuarea analizei factoriale, se utilizează validarea încrucișată: eșantionul este împărțit aleatoriu în jumătate, factorii sunt extrași pe o jumătate a eșantionului, iar validitatea și stabilitatea soluției factoriale sunt verificate pe cealaltă jumătate.

Conceptele de V. convergent și discriminant au fost introduse de D. Kambell și D. Fiske ca doi indicatori interrelaționați ai fiabilității metodei. V. convergent necesită „convergenţă” (corelaţie înaltă) a constructelor înrudite, V. discriminant - absenţa corelaţiilor între măsurătorile constructelor neînrudite. Mai riguros, acest concept este implementat în abordarea cunoscută sub numele de „Multe caracteristici – multe metode”, sau MHMM (MTMM – multe trăsături, multe metode). Esența sa este că mai multe proprietăți sunt măsurate prin mai multe metode. Ar trebui să existe corelații mari între indicatorii aceleiași proprietăți măsurați folosind metode diferite și corelații scăzute între indicatorii diferitelor proprietăți măsurați folosind aceeași metodă. A treia condiție este excesul primului set de coeficienți de corelație față de al doilea. Există, de asemenea, metode statistice mai riguroase pentru analiza matricei de corelație MCHMM. În ultimii ani, ecuațiile structurale au câștigat popularitate, în special analiza factorilor de confirmare, care, în conformitate cu un model semnificativ, descompune covarianța măsurătorilor în componente asociate cu influența metodelor, proprietăților și erorilor. Coeficienții structurali obținuți sunt interpretați ca indicatori ai lui V.

B. metoda experimentala

Gama de concepte asociate cu evaluarea V. a experimentului (și rezultatele experimentului) a fost dezvoltată de metodologii post-pozitiviști în anii 1960 (D. Campbell, T. Cook, J. Stanley și alții). Într-o tradiție epistemologică care datează de la J.C. Mill și care leagă cauzalitatea de manipulare, un adevărat experiment cu distribuție aleatorie testarea subiecților în condiții este considerată ca fiind singurul mijloc de testare convingătoare a ipotezelor cauzale. Din acest punct de vedere, afirmațiile cauzale din științele neexperimentale (sociologie) sunt ilegitime. Precedenta in timp a presupusei cauze (variabila independenta) asupra efectului (variabila dependenta) ca una dintre conditiile conexiunii cauzale in experiment este asigurata de manipularea si masurarea consecintelor acestuia. O altă cerință pentru inferența cauzală este mai dificil de îndeplinit - absența unor explicații alternative plauzibile. V. intern este înțeles ca încrederea că variabila independentă X este principalul motiv pentru variabilitatea sistematică a valorilor variabilei dependente Y, adică. nu există alte variabile care să medieze relația dintre X și Y. Nu putem garanta B. experimentului, dar ținând cont de particularitățile procedurii de cercetare utilizate, putem identifica și elimina cauzele fundamentale ale invalidării. Campbell și Stanley au propus o clasificare a motivelor scăderii V-ului intern. Istoricul (fondul) este evenimentele care au avut loc între X și Y și le-ar putea afecta covarianța. Modificări naturale - modificări ale stării interne a subiecților, care nu sunt asociate cu influența lui X, cum ar fi oboseala, creșterea, învățarea. Efectul instrumentului este legat de modificări nedorite proceduri de măsurare (defecțiuni tehnice, oboseală a observatorilor). Efecte de regresie statistică (alunecare la medie) se observă atunci când au fost selectate grupuri experimentale și/sau de control pe baza extremelor indicatorilor relevanți; din motive statistice până la momentul celei de-a doua măsurători valorile maxime indicatorii vor scădea, iar minimul va crește. Selectarea grupurilor ca cauză a invalidității este asociată cu o selecție non-aleatorie (neechivalentă) a subiecților sau a altor unități de cercetare. Abandonul („mortalitatea experimentală”) se referă la abandonul neuniform și non-aleatoriu al participanților la studiu. Interacțiunea selecției cu alți factori descrie o situație în care nu întâmplător subiecții selectați au antecedente personale diferite, tendință la oboseală, abandonuri etc. caz ideal... Acest lucru se aplică și proiectelor de studii neexperimentale în care noi amenințări sunt adăugate la lista de motive pentru scăderea validității.

V. externă caracterizează gradul de generalizare a rezultatelor obţinute pentru altele populatiilorși contexte. Replicarea cu succes a unui studiu este una dintre cele conditii importante apreciind validitatea teoriilor şi ajută la clarificarea gamei de validitate a acestora din urmă. Una dintre strategiile de realizare a V. externă este şi identificarea şi eliminarea cauzelor responsabile de primire aleatorie rezultat. Acestea sunt, în special, efectul reactiv (influența procedurii inițiale de măsurare asupra comportamentului subiecților) și interferența reciprocă a influențelor experimentale. Alte strategii se bazează pe utilizarea unui design de experiment randomizat cu o singură măsurare după studiu (care înlătură efectul reactiv); reducerea riscului de influență a experimentatorului (de exemplu, reducerea la minimum a contactelor dintre experimentator și subiect, creșterea numărului de cercetători sau metoda dublu-orb, când cercetătorul nu știe care dintre subiecți este expus la ce influențe înainte de final). a experimentului); creşterea V. ecologică (realism) a studiului. Un rol metodologic important în asigurarea V. cercetării științifice îl joacă reproducerea cu expansiune, atunci când fiecare replicare ulterioară a unui experiment prevede modificări procedurale minore.

B. Inferență statistică

V. de inferență statistică înseamnă îndeplinirea unui set de condiții care reduc probabilitatea unei decizii statistice incorecte despre ipoteza nulă (despre egalitatea parametrului la o anumită valoare sau corespondența modelului statistic cu datele obținute) sau amploarea efectului. Principala metodă de luare a deciziilor statistice în ultimele decenii a fost testarea semnificației statistice, adică. pe egalitatea parametrului cu o anumită valoare. Pentru aceasta se folosesc criteriile z, t, F, x2 etc.. Se compară valoarea obţinută empiric a criteriului cu cea critică, iar pe baza acestei comparaţii se respinge sau nu se respinge ipoteza nulă. Astfel, soluția este binară (da-nu). În acest proces, se poate face una dintre cele trei greșeli: respingeți incorect ipoteza nulă adevărată (eroarea de primul fel, alfa), acceptați incorect ipoteza alternativă adevărată (eroarea de al doilea fel, beta) și formulați incorect ipoteze statistice, adică traduce incorect întrebarea de cercetare în limbajul statisticii.

Ameninţările la adresa V. de inferenţă statistică sunt numeroase şi de natură diferită. Utilizarea indicatorilor nevalidi (secțiunea acestui articol, Valabilitatea procedurilor de măsurare) nu face posibilă interpretarea cu încredere a rezultatului obținut. Utilizarea unor variabile măsurate nesigur conduce la o subestimare semnificativă a statisticilor obţinute.

O clasă mare de amenințări la adresa inferenței statistice este asociată cu o formulare incorectă a modelului. În special, cel mai faimos modele liniare sunt alese în cazurile în care ipotezele de bază sunt încălcate: relația dintre variabile este neliniară, există valori extreme, variațiile variabilei dependente pentru diferite niveluri variabila independentă nu este egală, variabilele sunt măsurate mai aproximativ decât cere modelul, valorile lipsă ale variabilelor sunt distribuite într-un mod non-aleatoriu. Pachetele standard de analiză statistică oferă metode de diagnosticare a încălcărilor ipotezelor modelului. Erorile conceptuale mai complexe apar din cauza definirii incorecte a variabilelor ca independente sau covariante, alegerii incorecte a modelelor pentru măsurători dependente (repetate) sau independente, efecte fixe sau aleatorii. La compararea mai multor medii sau la evaluarea semnificației mai multor corelații, cercetătorii nu iau întotdeauna în considerare inflația erorilor de primul fel: de exemplu, pentru j variabile obținem k = j (j - 1) / 2 corelații, iar probabilitatea de a obține accidental cel puțin un coeficient de corelație semnificativ, alfatotal. , este egală cu 1 - (1 - alfa) k. Folosind de asemenea un numar mare variabile la numar mic observațiile (respondenții) creează „supra-adecvare” a modelului atunci când modelul descrie în mod ideal datele eșantionului, dar este inadecvat pentru a descrie populația generală.

Mulți greșeli simple Inferența statistică se datorează combinației bizare și mecanice a două abordări diferite ale soluției statistice - Fisher și Neumann-Pearson. Această din urmă abordare subliniază importanța puterii testului pentru aprecierea semnificației. Deci, rezultatul se poate dovedi a fi nesemnificativ statistic din motive legate de putere insuficientă metoda: impact experimental slab, eșantion mic sau eterogen, măsurare nesigură a variabilelor, valoare excesiv de mică a erorii de tip I. Semnificația statistică este probabilitatea ca rezultatul obținut să fie aleatoriu într-un eșantion de o dimensiune dată, dar această valoare nu spune nimic despre mărimea efectului. Orientările moderne recomandă raportarea în publicații nu numai a indicelui de semnificație (p), ci și a valorilor efectului (indicatorii tipici sunt r-ul lui Pearson, t-ul lui Student, d-ul lui Cohen, g-ul lui Hidges, nu2 pentru analiza varianței etc.). Alte alternative la deciziile binare cu privire la semnificația statistică sunt intervale de încredere, statisticile bayesiene și, mai larg, reproducerea extinderii și meta-analiză.

B. în cercetarea calitativă

V. în cercetarea calitativă nu poate fi evaluată folosind metodele clasice descrise mai sus. O serie de autori arată primitivitatea abordărilor existente de evaluare a V. și „criterionologiei” în general (T. Schwandt, J. Smith). În același timp, respingerea ideii de credibilitate / autenticitate, spre deosebire de obiectivitatea discreditată, pare prea radicală chiar și pentru oamenii de știință postmoderni. Prin urmare, alți autori (E. Guba, I. Lincoln, S. Kvale, S. Mishler) încearcă să reformuleze criteriile tradiționale de validitate, făcându-le mai puțin pozitiviste. Se discută noi proceduri de fundamentare a fiabilității: validarea comunicativă (participarea subiecților la discutarea rezultatelor; implicarea colegilor în discuție), validarea procedurală (acuratețea, temeinicia și completitudinea notelor de teren sau a datelor obținute; completă, echilibrată și transparentă). descrierea rezultatelor, deschisă altor interpretări; sensibilitate la părere de la colegi; reverificarea concluziilor asupra altor fragmente din materialul obţinut) etc. Printre alte abordări de fundamentare a fiabilității rezultatelor, trebuie menționată stabilirea gradului de plauzibilitate ca evaluare a cunoștințelor dobândite din poziția de cunoștințe deja existente; încrederea (credibilitatea) ca evaluare și înțelegere colectivă a rezultatelor, ținând cont de natura fenomenului și de circumstanțele observării acestuia; înrădăcinarea în date, includerea în contextul programului de cercetare (fiabilitatea), care se bazează pe studiul și evaluarea atentă a aspectelor procedurale; sensibilitatea ca abilitatea unui cercetător de a vedea problema socialași contribuie la rezolvarea acesteia; Autenticitatea ontologică și educațională - capacitatea de a ridica conștiința participanților la cercetare (în primul caz) și a mediului lor (în al doilea); autenticitatea catalitică ca influență asupra programelor sociale care îmbunătățesc calitatea vieții populației studiate.

Autorii postmoderni discută concepte și principii fundamental noi de fundamentare a cunoștințelor: validarea ironică (J. Baudrillard), neopragmatică (J.-F. Lyotard), rizomatică (J. Derrida). N. Denzin a fundamentat metoda triangulației ca o alternativă radicală la abordările tradiționale de validare. Triangularea este utilizarea combinată și îmbogățită reciproc a diferitelor metode, metodologii, date, teorii și/sau cercetători. Pluralitatea abordărilor și tehnicilor este menită să slăbească restricțiile epistemologice, să depășească granițele stabilite, să dezvăluie noi aspecte ale fenomenului. De remarcat că ideea de triangulare [adevăr] a fost generată în post-pozitivism (D. Campbell), unde a fost înțeleasă ca o anumită procedură, un set de trucuri utile: pe lângă intervievarea oamenilor „obișnuiți”, intervievarea experților; împărțiți aleatoriu eșantionul de subiecți în jumătate și analizați datele separat; excludeți o variabilă din analiză și vedeți cum se schimbă modelul; validați un construct utilizând mai multe caracteristici - abordarea cu multe metode și așa mai departe. Pentru a evita asocierile nedorite cu pozitivismul, etnograful postmodern L. Richardson, într-un spirit radical, respinge ideea de triangulare și oferă o altă metaforă atractivă - un cristal, nu un triunghi, mai degrabă cristalizare decât triunghiulare. Cristalul creează, refractează și distorsionează simultan, are mai multe fațete și niciuna dintre fațetele sale nu este mai autentică decât oricare alta. Ca și cunoașterea, cristalul crește și se prăbușește. Abordarea metaforică a problemei fundamentarii cunoștințelor și aprecierii calității acesteia nu este întâmplătoare. Este conceput pentru a distruge abordările bazate pe criterii și ideile despre standarde. Cercetarea socială este valoroasă doar atunci când oferă șanse egale de a vorbi în fața reprezentanților grupuri diferite, creează versiuni equiprobabile și suprimă interpretările dominante, „corecte”.

Definiție excelentă

Definiție incompletă ↓

Top articole similare