Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ
  • shtëpi
  • Interesante
  • Problemet moderne të shkencës dhe arsimit. Përdorimi i filtrave Kalman

Problemet moderne të shkencës dhe arsimit. Përdorimi i filtrave Kalman

Filtri Kalman

Filtri Kalman përdoret gjerësisht në aplikimet inxhinierike dhe ekonometrike duke filluar nga radarët dhe sistemet vizion teknik për vlerësimin e parametrave të modeleve makroekonomike. Filtrimi Kalman është një pjesë e rëndësishme e teorisë së kontrollit dhe luan një rol të madh në krijimin e sistemeve të kontrollit. Së bashku me një kontrollues linear-kuadratik, filtri Kalman bën të mundur zgjidhjen e problemit të kontrollit linear-kuadratik Gaussian. Filtri Kalman dhe rregullatori linear kuadratik - Zgjidhja e mundshme problemet më themelore në teorinë e kontrollit.

Në shumicën e aplikacioneve, numri i parametrave që përcaktojnë gjendjen e një objekti është më i madh se numri i parametrave të vëzhgueshëm të disponueshëm për matje. Duke përdorur një model të një objekti të bazuar në një numër matjesh të disponueshme, filtri Kalman lejon që dikush të marrë një vlerësim të gjendjes së brendshme.

Filtri Kalman është krijuar për të vlerësuar në mënyrë rekursive vektorin e gjendjes së një sistemi dinamik të njohur a priori, d.m.th., për të llogaritur gjendjen aktuale të sistemit është e nevojshme të dihet matja aktuale, si dhe gjendjen e mëparshme vetë filtri. Kështu, filtri Kalman, si shumë filtra të tjerë rekurzivë, zbatohet në një paraqitje kohore dhe jo në frekuencë.

Një shembull i qartë i aftësive të filtrit është marrja e vlerësimeve të sakta, të përditësuara vazhdimisht të pozicionit dhe shpejtësisë së një objekti, bazuar në rezultatet e një serie kohore të matjeve të pasakta të vendndodhjes së tij. Për shembull, në radar detyra është të gjurmoni një objektiv, të përcaktoni vendndodhjen, shpejtësinë dhe nxitimin e tij, ndërsa rezultatet e matjes vijnë gradualisht dhe janë shumë të zhurmshme. Filtri Kalman përdor një model probabilistik të dinamikës së objektivit që specifikon llojin e lëvizjes së mundshme të objektit, i cili redukton ndikimin e zhurmës dhe siguron vlerësime të mira të pozicionit të objektit në të tashmen, të ardhmen ose kohën e kaluar.

Prezantimi

Filtri Kalman funksionon me konceptin e një vektori të gjendjes së sistemit (një grup parametrash që përshkruajnë gjendjen e sistemit në një moment të caktuar kohor) dhe përshkrimin e tij statistikor. NË rast i përgjithshëm Dinamika e një vektori të gjendjes së caktuar përshkruhet nga dendësia e probabilitetit të shpërndarjes së përbërësve të tij në çdo moment të kohës. Nëse keni një model të caktuar matematikor të vëzhgimeve të sistemit, si dhe një model të ndryshimit apriori në parametrat e vektorit të gjendjes (domethënë, si një proces formues Markov), mund të shkruani një ekuacion për densitetin e probabilitetit të pasëm të vektori i gjendjes në çdo kohë. E dhënë ekuacioni diferencial quhet ekuacioni Stratonovich. ekuacioni i Stratonovich pamje e përgjithshme nuk mund të zgjidhet. Një zgjidhje analitike mund të merret vetëm në rastin e një numri kufizimesh (supozime):

  • Gausianiteti i densiteteve të probabilitetit apriori dhe të pasëm të vektorit të gjendjes në çdo kohë (përfshirë atë fillestar)
  • Gausianiteti i formimit të zhurmës
  • Gausianiteti i zhurmës së vëzhgimit
  • bardhësia e zhurmës së vëzhgimit
  • lineariteti i modelit të vëzhgimit
  • lineariteti i modelit të procesit të formimit (i cili, kujtojmë, duhet të jetë një proces Markov)

Filtri klasik Kalman është një ekuacion për llogaritjen e momentit të parë dhe të dytë të densitetit të probabilitetit të pasëm (në kuptimin e një vektori të pritjeve matematikore dhe një matrice variancash, duke përfshirë ato reciproke) sipas kufizimeve të dhëna. Për shkak të faktit se për densitetin normal të probabilitetit pritshmëria matematikore dhe matrica e dispersionit përcaktojnë plotësisht densitetin e probabilitetit, mund të themi se filtri Kalman llogarit densitetin e probabilitetit të pasëm të vektorit të gjendjes në çdo moment të kohës. Kjo do të thotë se ai përshkruan plotësisht vektorin e gjendjes si një sasi vektoriale të rastësishme.

Vlerat e llogaritura të pritshmërive matematikore në këtë rast janë vlerësime optimale sipas kriterit të gabimit rrënjë-mesatar-katror, ​​i cili përcakton përdorimin e gjerë të tij.

Ekzistojnë disa lloje të filtrit Kalman, të ndryshëm në përafrime dhe truket që duhet të përdoren për të zvogëluar filtrin në formën e përshkruar dhe për të zvogëluar dimensionin e tij:

  • Filtri i zgjeruar Kalman (EKF). Reduktimi i modeleve jolineare të vëzhgimit dhe procesi i formësimit duke përdorur linearizimin nëpërmjet zgjerimit të serisë Taylor.
  • Filtri Kalman pa aromë (UKF). Përdoret në problemet në të cilat linearizimi i thjeshtë çon në shkatërrim lidhje të dobishme ndërmjet komponentëve të vektorit të gjendjes. Në këtë rast, "linearizimi" bazohet në transformimin pa aromë.
  • Filtri i Ansamblit Kalman (EnKF). Përdoret për të zvogëluar dimensionin e një problemi.
  • Opsionet janë të mundshme me një filtër shtesë jolinear, i cili bën të mundur reduktimin e vëzhgimeve jo-gausiane në ato normale.
  • Opsionet me një filtër "zbardhues" janë të mundshme, duke ju lejuar të punoni me zhurmë "me ngjyrë"
  • etj.

Modeli i sistemit dinamik të përdorur

Filtrat Kalman bazohen në sisteme dinamike lineare të kampionuara me kohë. Sisteme të tilla modelohen nga zinxhirët Markov duke përdorur operatorë linearë dhe terma me një shpërndarje normale. Gjendja e sistemit përshkruhet nga një vektor me dimension të fundëm - vektori i gjendjes. Në çdo ritëm të kohës operator linear vepron në vektorin e gjendjes dhe e transferon atë në një vektor tjetër të gjendjes (ndryshimi përcaktues i gjendjes), shtohet një vektor i caktuar i zhurmës normale (faktorë të rastësishëm) dhe, në rastin e përgjithshëm, një vektor kontrolli që modelon ndikimin e sistemit të kontrollit. Filtri Kalman mund të konsiderohet si një analog i modeleve të fshehura Markov, me ndryshimin se variablat që përshkruajnë gjendjen e sistemit janë elementë të një grupi të pafund. numra realë(ndryshe nga grupi i fundëm i hapësirës së gjendjes në modelet e fshehura të Markovit). Për më tepër, modelet e fshehura Markov mund të përdorin shpërndarje arbitrare për vlerat pasuese të vektorit të gjendjes, ndryshe nga filtri Kalman, i cili përdor një model zhurme të shpërndarë normalisht. Ekziston një marrëdhënie strikte midis filtrit Kalman dhe ekuacioneve të fshehura të modelit Markov. Një përmbledhje e këtyre dhe modeleve të tjera është dhënë nga Roweis dhe Chahramani (1999).

Kur përdorni një filtër Kalman për të marrë vlerësime të vektorit të gjendjes së procesit nga një seri matjesh të zhurmshme, është e nevojshme të përfaqësohet një model këtë proces në përputhje me strukturën e filtrit - në formë ekuacioni i matricës lloj i caktuar. Për çdo goditje k funksionimi i filtrit, është e nevojshme të përcaktohen matricat në përputhje me përshkrimin e mëposhtëm: evolucioni i procesit F k; matrica e vëzhgimit H k; matrica e kovariancës së procesit P k; matrica e kovariancës së zhurmës së matjes R k; në prani të veprimeve të kontrollit - një matricë e koeficientëve të tyre B k .

Ilustrim se si funksionon filtri. Matricat shënohen me katrorë. Elipset shënojnë matricat e shpërndarjeve normale me shumë variacione (përfshirë mesataret dhe kovarianca). Vektorët janë lënë të paqarkuar. Në rastin më të thjeshtë, disa matrica nuk ndryshojnë me kalimin e kohës (nuk varen nga indeksi k), por ende përdoren nga filtri në çdo cikël funksionimi.

Modeli i sistemit/procesit supozon se gjendja e vërtetë në atë kohë k përftohet nga gjendja e vërtetë për momentin k−1 sipas ekuacionit:

,
  • F k- matrica e evolucionit të procesit/sistemit që ndikon në vektor x k−1 (vektori i gjendjes për momentin k−1 );
  • B k- matrica e kontrollit, e cila aplikohet në vektorin e veprimeve të kontrollit u k ;
  • w k- proces normal i rastësishëm me pritshmëri matematikore zero dhe matricë të kovariancës P k, i cili përshkruan natyrën e rastësishme të evolucionit të sistemit/procesit:

Në këtë moment k bëhet vëzhgimi (matja). z k vektor i gjendjes së vërtetë x k, të cilat lidhen me njëra-tjetrën nga ekuacioni:

Ku H k- matrica matëse që lidh vektorin e gjendjes së vërtetë dhe vektorin e matjeve të marra, v k- zhurma e bardhë Gaussian e matjeve me pritje matematikore zero dhe matricë të kovariancës R k :

Gjendja fillestare dhe vektorët procese të rastësishme në çdo rrahje ( x 0 , w 1 , …, w k , v 1 , …, v k) konsiderohen të pavarura.

Shumë janë të vërteta sistemet dinamike nuk mund të përshkruhet saktë nga ky model. Në praktikë, dinamika që nuk merret parasysh në model mund të prishë seriozisht performancën e filtrit, veçanërisht kur punoni me një sinjal të panjohur të hyrjes stokastike. Për më tepër, dinamika që nuk merret parasysh në model mund ta bëjë filtrin të paqëndrueshëm. Nga ana tjetër, zhurma e bardhë e pavarur si sinjal nuk do të bëjë që algoritmi të divergjojë. Problemi i ndarjes së zhurmës së matjes nga dinamika që nuk merret parasysh në model është kompleks; ai zgjidhet duke përdorur teorinë e sistemeve të kontrollit të fuqishëm.

Filtri Kalman

Filtri Kalman është një lloj filtri rekurziv. Për të llogaritur vlerësimin e gjendjes së sistemit për ciklin aktual të funksionimit, ai ka nevojë për një vlerësim të gjendjes (në formën e një vlerësimi të gjendjes së sistemit dhe një vlerësim të gabimit në përcaktimin e kësaj gjendjeje) në cikli i mëparshëm i funksionimit dhe matjet në ciklin aktual. Kjo pronë e dallon atë nga filtrat e paketave, të cilat kërkojnë njohuri të historisë së matjeve dhe/ose vlerësimeve gjatë ciklit aktual të funksionimit. Më tej, me shënim do të kuptojmë vlerësimin e vektorit të vërtetë për momentin n duke marrë parasysh matjet nga momenti i fillimit të punës deri në m përfshirëse.

Gjendja e filtrit përcaktohet nga dy ndryshore:

Përsëritjet e filtrit Kalman ndahen në dy faza: ekstrapolim dhe korrigjim. Gjatë ekstrapolimit, filtri merr vlerësim paraprak gjendja e sistemit (në literaturën në gjuhën ruse shpesh shënohet , ku do të thotë "ekstrapolim" dhe k- numri i shenjës në të cilën është marrë) për hapin aktual sipas vlerësimit përfundimtar të gjendjes nga hapi i mëparshëm (ose një vlerësim paraprak për shenjën tjetër sipas vlerësimit përfundimtar të hapit aktual, në varësi të interpretimi). Ky vlerësim paraprak quhet gjithashtu një vlerësim apriori i shtetit, pasi nuk merret duke përdorur vëzhgimet e hapit përkatës. Në fazën e korrigjimit, ekstrapolimi a priori plotësohet me matjet përkatëse aktuale për të korrigjuar vlerësimin. Vlerësimi i rregulluar quhet gjithashtu vlerësimi i gjendjes së pasme, ose thjesht vlerësimi i vektorit të gjendjes. Në mënyrë tipike, këto dy faza alternojnë: ekstrapolimi kryhet në bazë të rezultateve të korrigjimit deri në vëzhgimin tjetër dhe korrigjimi kryhet në lidhje me të dhënat e disponueshme. hapi tjeter vëzhgime, etj. Megjithatë, një zhvillim tjetër i ngjarjeve është gjithashtu i mundur; nëse për ndonjë arsye vëzhgimi rezultoi i padisponueshëm, atëherë faza e korrigjimit mund të anashkalohet dhe ekstrapolimi mund të kryhet bazuar në vlerësimin e pakorrigjuar (ekstrapolim a priori). Po kështu, nëse matjet e pavarura janë të disponueshme vetëm në cikle të caktuara pune, korrigjimet janë ende të mundshme (zakonisht duke përdorur një matricë të ndryshme vëzhgimi H k ).

Faza e ekstrapolimit

Faza e korrigjimit

Devijimi i marrë në hap k vëzhgimet nga vëzhgimi i pritur nga ekstrapolimi:
Matrica e kovariancës për vektorin e devijimit (vektori i gabimit):
Matrica e fitimit optimal Kalman, e formuar në bazë të matricave të kovariancës së ekstrapolimit ekzistues të vektorit të gjendjes dhe matjeve të marra (nëpërmjet matricës së kovariancës së vektorit të devijimit):
Korrigjimi i ekstrapolimit të marrë më parë të vektorit të gjendjes - marrja e një vlerësimi të vektorit të gjendjes së sistemit:
Llogaritja e matricës së kovariancës për vlerësimin e vektorit të gjendjes së sistemit:

Shprehja për matricën e kovariancës së vlerësimit të vektorit të gjendjes së sistemit është e vlefshme vetëm kur përdoret vektori i dhënë optimal i koeficientëve. Në përgjithësi, kjo shprehje ka një formë më komplekse.

Invariante

Nëse modeli është absolutisht i saktë dhe absolutisht i saktë kushtet fillestare dhe, atëherë vlerat e mëposhtme ruhen pas çdo numri përsëritjesh të filtrit - ato janë të pandryshueshme:

Pritjet matematikore të vlerësimeve dhe ekstrapolimeve të vektorit të gjendjes së sistemit dhe matricave të gabimit janë vektorë zero:

ku është pritshmëria matematikore.

Matricat e llogaritura të kovariancës së ekstrapolimeve, vlerësimet e gjendjes së sistemit dhe vektorët e gabimit përkojnë me matricat e vërteta të kovariancës:

Shembull i ndërtimit të filtrit

Le të imagjinojmë një karrocë që qëndron në shina pafundësisht të gjata në mungesë të fërkimit. Fillimisht është në qetësi në pozicionin 0, por nën ndikimin e faktorëve të rastësishëm i nënshtrohet nxitimit të rastësishëm. Ne matim pozicionin e karrocës çdo ∆ t sekonda, por matjet janë të pasakta. Ne duam të marrim vlerësime të pozicionit të karrocës dhe shpejtësisë së saj. Le të aplikojmë filtrin Kalman për këtë problem dhe të përcaktojmë të gjitha matricat e nevojshme.

Në këtë problem matricat F , H , R Dhe P nuk varen nga koha, ne do t'i heqim indekset e tyre. Përveç kësaj, ne nuk kontrollojmë karrocën, pra matricën e kontrollit B mungon.

Koordinatat dhe shpejtësia e karrocës përshkruhen nga një vektor në hapësirën e gjendjes lineare

ku është shpejtësia (derivati ​​i parë i koordinatës në lidhje me kohën).

Ne do të supozojmë se ndërmjet ( k−1)-të dhe k në ciklin e troleja lëviz me nxitim konstant një k, i shpërndarë sipas ligjit normal me pritshmëri matematikore zero dhe devijim standard σa. Në përputhje me mekanikën Njutoniane, ne mund të shkruajmë

.

Matrica e kovariancës së efekteve të rastësishme

(σ a- skalar).

Në çdo hap të punës matet pozicioni i karrocës. Le të supozojmë se gabimi i matjes vk ka një shpërndarje normale me pritshmëri matematikore zero dhe devijim standard σ z. Pastaj

dhe matrica e kovariancës së zhurmës së vëzhgimit ka formën

.

Pozicioni fillestar karrocat dihen me siguri

, .

Nëse pozicioni dhe shpejtësia e karrocës dihen vetëm afërsisht, atëherë matrica e shpërndarjes mund të inicializohet mjaftueshëm një numër i madh L, në mënyrë që numri të tejkalojë variancën e matjeve të koordinatave

, .

Në këtë rast, në ciklet e para të funksionimit, filtri do të përdorë rezultatet e matjes me peshë më të madhe se informacioni i disponueshëm apriori.

Nxjerrja e formulave

Matrica e kovariancës së vlerësimit të vektorit të gjendjes

Sipas përcaktimit të matricës së kovariancës P k|k

zëvendësoni shprehjen për të vlerësuar vektorin e gjendjes

dhe shkruani shprehjen për vektorin e gabimit

dhe vektorët e matjes

nxjerrim vektorin e gabimit të matjes v k

meqenëse vektori i gabimit të matjes v k nuk lidhet me argumente të tjera, marrim shprehjen

në përputhje me vetitë e kovariancës vektoriale kjo shprehje konvertohet në formë

duke zëvendësuar shprehjen për matricën e kovariancës së ekstrapolimit të vektorit të gjendjes me P k|k−1 dhe përcaktimi i matricës së kovariancës së zhurmës së vëzhgimit në R k, marrim

Shprehja që rezulton është e vlefshme për një matricë të koeficientit arbitrar, por nëse është një matricë e koeficientit optimal Kalman, atëherë kjo shprehje për matricën e kovariancës mund të thjeshtohet.

Matrica e fitimit optimal

Filtri Kalman minimizon shumën e katrorëve të pritjeve matematikore të gabimeve të vlerësimit të gjendjes së vektorit.

Vektori i gabimit të vlerësimit të vektorit të gjendjes

Detyra është të minimizohet shuma e pritshmërive matematikore të katrorëve të përbërësve të një vektori të caktuar

,

që është ekuivalente me minimizimin e gjurmës së matricës së kovariancës të vlerësimit të vektorit të gjendjes P k|k. Le të zëvendësojmë shprehjet ekzistuese në shprehjen për matricën e kovariancës së vlerësimit të vektorit të gjendjes dhe ta plotësojmë atë në një katror të plotë:

Vini re se termi i fundit është matrica e kovariancës së disa ndryshoreve të rastësishme, kështu që gjurma e saj është jo negative. Minimumi i gjurmës arrihet kur termi i fundit vendoset në zero:

Argumentohet se kjo matricë është ajo e dëshiruara dhe, kur përdoret si matricë e koeficientëve në filtrin Kalman, minimizon shumën e gabimeve mesatare në katror në vlerësimin e vektorit të gjendjes.

Matrica e kovariancës së vlerësimit të vektorit të gjendjes duke përdorur matricën e koeficientit optimal

Shprehje për matricën e kovariancës së vlerësimit të vektorit të gjendjes P k|k kur përdoret matrica e koeficientit optimal do të marrë formën:

Kjo formulë është llogaritëse më e thjeshtë dhe për këtë arsye përdoret pothuajse gjithmonë në praktikë, por është e saktë vetëm kur përdoret matrica e koeficientit optimal. Nëse, për shkak të saktësisë së ulët llogaritëse, lind një problem me stabilitetin llogaritës, ose nëse përdoret në mënyrë specifike një matricë koeficienti që është e ndryshme nga ajo optimale, duhet të përdorni formulë e përgjithshme për matricën e kovariancës së vlerësimit të vektorit të gjendjes.

Kritika ndaj filtrit Kalman

Aktiv aktualisht Kritikat kryesore të filtrit Kalman kryhen në fushat e mëposhtme

  • Tutorial

Në internet, përfshirë në Habré, mund të gjeni shumë informacione rreth filtrit Kalman. Por është e vështirë të gjesh një përfundim lehtësisht të tretshëm për vetë formulat. Pa një përfundim, e gjithë kjo shkencë perceptohet si një lloj shamanizmi, formulat duken si një grup simbolesh pa fytyrë, dhe më e rëndësishmja, shumë deklarata të thjeshta që shtrihen në sipërfaqen e teorisë janë përtej kuptimit. Qëllimi i këtij artikulli do të jetë të flasim për këtë filtër në një gjuhë sa më të aksesueshme.
Filtri Kalman është mjeti më i fuqishëm filtrimi i të dhënave. Parimi i tij kryesor është se filtrimi përdor informacion në lidhje me fizikën e vetë fenomenit. Le të themi, nëse filtroni të dhënat nga shpejtësia e një makine, atëherë inercia e makinës ju jep të drejtën të perceptoni kërcimet shumë të shpejta në shpejtësi si një gabim matjeje. Filtri Kalman është interesant sepse, në një farë kuptimi, është filtri më i mirë. Më poshtë do të diskutojmë më në detaje se çfarë kuptimi kanë saktësisht fjalët "më e mira". Në fund të artikullit do të tregoj se në shumë raste formulat mund të thjeshtohen deri në atë masë sa të mos mbetet pothuajse asgjë prej tyre.

program arsimor

Para se të njiheni me filtrin Kalman, unë sugjeroj të kujtoj disa përkufizime të thjeshta dhe fakte nga teoria e probabilitetit.

Vlera e rastësishme

Kur thonë se është dhënë një ndryshore e rastësishme, nënkuptojnë se kjo vlerë mund të marrë vlerat e rastësishme. Merr vlera të ndryshme me probabilitete të ndryshme. Kur të rrokullisni, të themi, një kuti, do të shfaqet një grup diskrete vlerash: . Kur ne po flasim për, për shembull, në lidhje me shpejtësinë e një grimce endacake, atëherë, padyshim, duhet të merremi me të grup i vazhdueshëm vlerat. Ne do të shënojmë vlerat "të braktisura" të një ndryshoreje të rastësishme me, por ndonjëherë do të përdorim të njëjtën shkronjë me të cilën shënojmë ndryshoren e rastësishme:
Në rastin e një grupi të vazhdueshëm vlerash, një ndryshore e rastësishme karakterizohet nga një densitet probabiliteti, i cili na dikton se probabiliteti që një variabël i rastësishëm të "bie jashtë" në një lagje të vogël me një pikë gjatësi është e barabartë me . Siç mund ta shohim nga fotografia, kjo probabilitet është e barabartë me sipërfaqen e drejtkëndëshit të hijezuar nën grafik:

Shumë shpesh në jetë, variablat e rastësishëm shpërndahen Gaussian kur densiteti i probabilitetit është i barabartë me .

Shohim që funksioni ka formën e një zile me qendër në një pikë dhe gjerësi karakteristike të rendit .
Meqenëse po flasim për shpërndarjen Gaussian, do të ishte turp të mos përmendim se nga erdhi. Ashtu si numrat janë të vendosur fort në matematikë dhe gjenden në vendet më të papritura, shpërndarja Gaussian ka zënë rrënjë të thella në teorinë e probabilitetit. Një deklaratë e jashtëzakonshme që shpjegon pjesërisht gjithëpraninë Gaussian është kjo:
Le të ketë një variabël të rastësishëm me një shpërndarje arbitrare (në fakt, ka disa kufizime për këtë arbitraritet, por ato nuk janë aspak strikte). Le të bëjmë eksperimente dhe të llogarisim shumën e vlerave "të braktisura" të një ndryshoreje të rastësishme. Le të bëjmë shumë eksperimente të tilla. Është e qartë se çdo herë do të marrim një vlerë të ndryshme të shumës. Me fjalë të tjera, kjo shumë është në vetvete një variabël i rastësishëm me ligjin e vet specifik të shpërndarjes. Rezulton se kur është mjaft i madh, ligji i shpërndarjes së kësaj shume priret në shpërndarjen Gaussian (nga rruga, gjerësia karakteristike e "këmbanës" rritet si ). Lexojmë më hollësisht në Wikipedia: teorema e kufirit qendror. Në jetë, shumë shpesh ka sasi që janë shuma e një numri të madh të variablave të rastësishme të pavarura të shpërndara identike, dhe për këtë arsye ato janë të shpërndara Gaussian.

Vlera mesatare

Vlera mesatare e një ndryshoreje të rastësishme është ajo që do të marrim në kufi nëse kryejmë shumë eksperimente dhe llogarisim mesataren aritmetike të vlerave të rënë. Vlera mesatare shënohet në mënyra të ndryshme: matematikanët pëlqejnë ta shënojnë atë përmes (pritshmërisë matematikore ose vlerës mesatare), dhe matematikanëve të huaj u pëlqen ta shënojnë atë përmes (pritjes). Fizikanët përmes ose. Do ta caktojmë në mënyrë të huaj: .
Për shembull, për një shpërndarje Gaussian, mesatarja është .

Dispersion

Në rastin e shpërndarjes Gaussian, ne shohim qartë se ndryshorja e rastësishme preferon të bjerë në një lagje të caktuar të vlerës së saj mesatare.

Edhe një herë admironi shpërndarjen Gaussian



Siç shihet nga grafiku, përhapja karakteristike e vlerave është e rendit të . Si mund ta vlerësojmë këtë përhapje vlerash për një ndryshore arbitrare të rastësishme nëse e dimë shpërndarjen e saj? Ju mund të vizatoni një grafik të densitetit të probabilitetit të tij dhe të vlerësoni gjerësinë karakteristike me sy. Por ne preferojmë të shkojmë në rrugën algjebrike. Ju mund të gjeni gjatësinë mesatare (modulin) e devijimit nga vlera mesatare: . Kjo vlerë do të jetë një vlerësim i mirë i përhapjes karakteristike të vlerave. Por ju dhe unë e dimë shumë mirë se përdorimi i moduleve në formula është një gjë dhimbje koke, prandaj kjo formulë përdoret rrallë për të vlerësuar shpërndarjen karakteristike.
Një mënyrë më e thjeshtë (e thjeshtë për sa i përket llogaritjeve) është gjetja e . Kjo sasi quhet dispersion dhe shpesh shënohet si . Rrënja e variancës është notë e mirë shpërndarja e një ndryshoreje të rastësishme. Rrënja e variancës quhet edhe devijimi standard.
Për shembull, për shpërndarjen Gaussian, ne mund të llogarisim se varianca e përcaktuar më sipër është saktësisht e barabartë me , që do të thotë se devijimi standard është i barabartë me , që përputhet shumë mirë me intuitën tonë gjeometrike.
Në fakt, këtu fshihet një mashtrim i vogël. Fakti është se në përkufizimin e shpërndarjes Gaussian, nën eksponent ka një shprehje. Kjo dy është në emërues pikërisht në mënyrë që devijimi standard të jetë i barabartë me koeficientin. Kjo do të thotë, vetë formula e shpërndarjes Gaussian është shkruar në një formë të përshtatur posaçërisht në mënyrë që ne të llogarisim devijimin standard të saj.

Variabla të rastësishme të pavarura

Ndryshoret e rastësishme mund të jenë të varura ose jo. Imagjinoni të hidhni një gjilpërë në një aeroplan dhe të regjistroni koordinatat e të dy skajeve. Këto dy koordinata janë të varura; ato lidhen me kushtin që distanca midis tyre të jetë gjithmonë e barabartë me gjatësinë e gjilpërës, megjithëse janë variabla të rastit.
Variablat e rastësishëm janë të pavarur nëse rezultati i të parës është plotësisht i pavarur nga rezultati i të dytit. Nëse variablat e rastësishëm janë të pavarura, atëherë vlera mesatare e produktit të tyre është e barabartë me produktin e vlerave të tyre mesatare:

Dëshmi

Për shembull, të kesh sy blu dhe të mbarosh shkollën me një medalje ari janë variabla të rastësishme të pavarura. Nëse me sy blu, le të themi, medalistët e artë, atëherë medalistët me sy blu. Ky shembull na tregon se nëse variablat e rastësishëm specifikohen nga dendësia e probabilitetit të tyre dhe , atëherë pavarësia e këtyre vlerave shprehet në faktin se dendësia e probabilitetit ( vlera e parë ka rënë dhe e dyta) gjendet me formulën:

Nga kjo rrjedh menjëherë se:

Siç mund ta shihni, vërtetimi kryhet për variablat e rastësishëm që kanë spektri i vazhdueshëm vlerat dhe janë të specifikuara nga dendësia e probabilitetit të tyre. Në raste të tjera, ideja e provës është e ngjashme.

Filtri Kalman

Formulimi i problemit

Le të shënojmë vlerën që do të masim dhe më pas do të filtrojmë. Kjo mund të jetë pozicioni, shpejtësia, nxitimi, lagështia, shkalla e erë e keqe, temperatura, presioni, etj.
Le të fillojmë me një shembull të thjeshtë, i cili do të na çojë në formulimin detyrë e përbashkët. Imagjinoni që ne kemi një makinë të kontrolluar me radio që mund të shkojë vetëm përpara dhe prapa. Ne, duke ditur peshën e makinës, formën, sipërfaqen e rrugës etj., kemi llogaritur se si ndikon leva e kontrollit në shpejtësinë e lëvizjes.

Pastaj koordinatat e makinës do të ndryshojnë sipas ligjit:

Në jetën reale, ne nuk mund të marrim parasysh në llogaritjet tona shqetësime të vogla që veprojnë në makinë (era, gunga, guralecë në rrugë), kështu që shpejtësia reale e makinës do të ndryshojë nga ajo e llogaritur. Një ndryshore e rastësishme do të shtohet në anën e djathtë të ekuacionit të shkruar:

Ne kemi një sensor GPS të instaluar në makinë që përpiqet të masë koordinatat e vërteta të makinës dhe, natyrisht, nuk mund ta matë atë me saktësi, por e mat me një gabim, që është gjithashtu një variabël i rastësishëm. Si rezultat, marrim të dhëna të gabuara nga sensori:

Detyra është që, duke ditur leximet e pasakta të sensorit, të gjeni një përafrim të mirë për koordinatat e vërteta të makinës. Këtë përafrim të mirë do ta shënojmë si .
Në formulimin e problemit të përgjithshëm, çdo gjë mund të jetë përgjegjëse për koordinatat (temperatura, lagështia...), dhe ne do të shënojmë anëtarin përgjegjës për kontrollin e sistemit nga jashtë si (në shembullin me makinë). Ekuacionet për koordinatat dhe leximet e sensorëve do të duken kështu:

(1)

Le të diskutojmë në detaje atë që dimë:

Vlen të përmendet se detyra e filtrimit nuk është një detyrë zbutëse. Ne nuk po përpiqemi të zbutim të dhënat e sensorit, ne po përpiqemi të marrim vlerën më të afërt me koordinatat reale.

Algoritmi Kalman

Do të argumentojmë me induksion. Imagjinoni që në hapin e thtë kemi gjetur tashmë një vlerë të filtruar nga sensori që përafron mirë koordinatat e vërteta të sistemit. Mos harroni se ne e dimë ekuacionin që kontrollon ndryshimin në koordinatën e panjohur:

Prandaj, pa marrë ende vlerën nga sensori, mund të supozojmë se në hap sistemi do të evoluojë sipas këtij ligji dhe sensori do të tregojë diçka afër . Fatkeqësisht, nuk mund të themi ende asgjë më të saktë. Nga ana tjetër, në hapin që do të kemi në dorë lexim i pasaktë sensor
Ideja e Kalman është që për të marrë përafrimin më të mirë të koordinatës së vërtetë, ne duhet të zgjedhim një terren të mesëm midis leximit të pasaktë të sensorit dhe parashikimit tonë të asaj që prisnim të shihte. Ne do t'i japim një peshë leximit të sensorit dhe një peshë do të mbetet në vlerën e parashikuar:

Koeficienti quhet koeficienti Kalman. Varet nga hapi i përsëritjes, kështu që do të ishte më e saktë të shkruanim , por tani për tani, për të mos rrëmuar formulat e llogaritjes, do të heqim indeksin e tij.
Ne duhet të zgjedhim koeficientin Kalman të tillë që të rezultojë vlera optimale koordinatat do të ishin më afër koordinatës së vërtetë. Për shembull, nëse e dimë se sensori ynë është shumë i saktë, atëherë do t'i besojmë më shumë leximit të tij dhe do t'i japim vlerën më shumë peshë (afër njërës). Nëse sensori, përkundrazi, nuk është aspak i saktë, atëherë do të përqendrohemi më shumë në vlerën e parashikuar teorikisht.
Në përgjithësi, për të gjetur vlerën e saktë të koeficientit Kalman, thjesht duhet të minimizoni gabimin:

Ne përdorim ekuacionet (1) (ato që janë në sfond blu në kuti) për të rishkruar shprehjen e gabimit:

Dëshmi


Tani është koha për të diskutuar se çfarë do të thotë shprehja minimizon gabimin? Në fund të fundit, gabimi, siç e shohim, është në vetvete një ndryshore e rastësishme dhe çdo herë merr kuptime të ndryshme. Në të vërtetë nuk ka një qasje të vetme për të përcaktuar se çfarë do të thotë të kesh gabim minimal. Ashtu si në rastin e dispersionit të një ndryshoreje të rastësishme, kur u përpoqëm të vlerësonim gjerësinë karakteristike të shpërndarjes së saj, këtu do të zgjedhim kriterin më të thjeshtë për llogaritjet. Ne do të minimizojmë mesataren e gabimit në katror:

Le të shkruajmë shprehjen e fundit:

çelësi i provës

Nga fakti që të gjitha variablat e rastësishme të përfshira në shprehjen për janë të pavarura dhe vlerat mesatare të gabimeve të sensorit dhe modelit janë të barabarta me zero: , rrjedh se të gjithë termat "kryq" janë të barabartë me zero:
.
Plus, formulat për variancat duken shumë më të thjeshta: dhe (pasi )

Kjo shprehje merr vlerë minimale, kur (derivatin e barazojmë me zero)

Këtu tashmë po shkruajmë një shprehje për koeficientin Kalman me indeksin e hapit, kështu theksojmë se varet nga hapi i përsëritjes.
Ne zëvendësojmë në shprehjen e gabimit mesatar katror vlerën e koeficientit Kalman që e minimizon atë. Ne marrim:

Problemi ynë është zgjidhur. Ne kemi marrë një formulë përsëritëse për llogaritjen e koeficientit Kalman.

Të gjitha formulat në një vend


Shembull

Në foton reklamuese në fillim të artikullit, filtrohen të dhënat nga një sensor fiktiv GPS i instaluar në një makinë fiktive, e cila po udhëton në mënyrë uniforme me një përshpejtim të njohur fiktiv.

Shikoni sërish rezultatin e filtrimit


Kodi Matlab

pastroji të gjitha; N=100% numri i mostrave a=0.1% nxitim sigmaPsi=1 sigmaEta=50; k=1:N x=k x(1)=0 z(1)=x(1)+normrnd(0,sigmaEta); për t=1:(N-1) x(t+1)=x(t)+a*t+normrnd(0,sigmaPsi); z(t+1)=x(t+1)+normrnd(0,sigmaEta); fundi; %kalman filtri xOpt(1)=z(1); eOpt(1)=sigmaEta; % eOpt(t) është një rrënjë katrore e gabimin dispersion (variancë). Nuk është një ndryshore e rastësishme. për t=1:(N-1) eOpt(t+1)=sqrt((sigmaEta^2)*(eOpt(t)^2+sigmaPsi^2)/(sigmaEta^2 +eOpt(t)^2+sigmaPsi^2)) K(t+1)=(eOpt(t+1))^2/sigmaEta^2 xOpt(t+1)=(xOpt(t)+a*t )*(1-K(t+1))+K(t+1)*z(t+1) fundi; komplot(k,xOpt,k,z,k,x)

Analiza

Nëse gjurmoni se si ndryshon koeficienti Kalman me hapat e përsëritjes, mund të tregoni se ai gjithmonë stabilizohet në një vlerë të caktuar. Për shembull, kur gabimet e rrënjës mesatare katrore të sensorit dhe modelit kanë një raport dhjetë me një, atëherë grafiku i koeficientit Kalman në varësi të hapit të përsëritjes duket si ky:

shembullin e mëposhtëm ne do të diskutojmë se si kjo do të ndihmojë për ta bërë jetën tonë shumë më të lehtë.

Shembulli i dytë

Në praktikë, shpesh ndodh që ne nuk dimë asgjë modeli fizik atë që ne filtrojmë. Për shembull, keni dashur të filtroni leximet nga akselerometri juaj i preferuar. Ju nuk e dini paraprakisht me çfarë ligji keni ndërmend të rrotulloni akselerometrin. Informacioni më i madh që mund të grumbulloni është varianca e gabimit të sensorit. Në një situatë kaq të vështirë, e gjithë injoranca e modelit të lëvizjes mund të drejtohet në një ndryshore të rastësishme:

Por, thënë sinqerisht, një sistem i tillë nuk i plotëson më kushtet që vendosëm në variablin e rastësishëm, sepse tani e gjithë fizika e panjohur e lëvizjes fshihet atje, dhe për këtë arsye nuk mund të themi se në momente të ndryshme kohore gabimet e modelit janë të pavarura nga njëri-tjetrin dhe se vlerat mesatare të tyre janë zero. Në këtë rast, nga në përgjithësi, Teoria e filtrit Kalman nuk është e zbatueshme. Por, ne nuk do t'i kushtojmë vëmendje këtij fakti, por do të zbatojmë marrëzi të gjithë kolosin e formulave, duke përzgjedhur koeficientët me sy, në mënyrë që të dhënat e filtruara të duken bukur.
Por ju mund të shkoni ndryshe, shumë më tepër mënyra e thjeshtë. Siç e pamë më lart, koeficienti Kalman gjithmonë stabilizohet në vlerë me rritjen e numrit të hapit. Prandaj, në vend që të zgjedhim koeficientët dhe të gjejmë koeficientin Kalman duke përdorur formula komplekse, ne mund ta konsiderojmë këtë koeficient të jetë gjithmonë një konstante dhe të zgjedhim vetëm këtë konstante. Ky supozim nuk do të prishë pothuajse asgjë. Së pari, ne tashmë po përdorim në mënyrë të paligjshme teorinë Kalman, dhe së dyti, koeficienti Kalman shpejt stabilizohet në një konstante. Në fund, gjithçka do të jetë shumë më e thjeshtë. Nuk kemi nevojë fare për formula nga teoria e Kalmanit, thjesht duhet të zgjedhim një vlerë të pranueshme dhe ta fusim atë në formulën përsëritëse:

Grafiku i mëposhtëm tregon i filtruar me dy menyra te ndryshme të dhëna nga një sensor fiktiv. Me kusht që të mos dimë asgjë për fizikën e fenomenit. Metoda e parë është e sinqertë, me të gjitha formulat nga teoria e Kalmanit. Dhe e dyta është e thjeshtuar, pa formula.

Siç mund ta shohim, metodat nuk janë pothuajse të ndryshme. Një ndryshim i vogël vërehet vetëm në fillim, kur koeficienti Kalman ende nuk është stabilizuar.

Diskutim

Siç e kemi parë, ideja kryesore e filtrit Kalman është që ne duhet të gjejmë një koeficient të tillë që vlera e filtruar

Mesatarisht, do të ndryshonte më së paku nga vlera reale e koordinatës. Ne shohim që vlera e filtruar është një funksion linear i leximit të sensorit dhe vlerës së filtruar të mëparshme. Dhe vlera e mëparshme e filtruar është, nga ana tjetër, funksion linear nga leximi i sensorit dhe vlera e mëparshme e filtruar. Dhe kështu me radhë derisa zinxhiri të kthehet plotësisht. Kjo do të thotë, vlera e filtruar varet nga të gjithë Leximet e mëparshme të sensorit në mënyrë lineare:

Prandaj, filtri Kalman quhet filtër linear.
Mund të vërtetohet se nga të gjithë filtrat linearë, filtri Kalman është më i miri. Më e mira në kuptimin që gabimi mesatar në katror i filtrit është minimal.

Rast shumëdimensional

E gjithë teoria e filtrit Kalman mund të përgjithësohet në rastin shumëdimensional. Formulat atje duken pak më të frikshme, por ideja për t'i nxjerrë ato është e njëjtë si në rastin njëdimensional. Ju mund t'i shihni ato në këtë artikull të mrekullueshëm:
Ky filtër përdoret në fusha të ndryshme - nga inxhinieria radio në ekonomi. Këtu do të diskutojmë idenë kryesore, kuptimin, thelbin të këtij filtri. Do të paraqitet në gjuhën më të thjeshtë të mundshme.
Le të supozojmë se duhet të matim disa sasi të një objekti të caktuar. Në inxhinierinë e radios, ata më së shpeshti merren me matjen e tensioneve në daljen e një pajisjeje të caktuar (sensor, antenë, etj.). Në shembullin me elektrokardiograf (shih), kemi të bëjmë me matje të biopotencialeve në trupin e njeriut. Në ekonomi, për shembull, vlera e matur mund të jetë kursi i këmbimit. Çdo ditë kursi i këmbimit është i ndryshëm, d.m.th. çdo ditë “matjet e tij” na japin një vlerë të ndryshme. Dhe nëse përgjithësojmë, mund të themi se pjesa më e madhe e veprimtarisë njerëzore (nëse jo e gjitha) vjen në matje dhe krahasime të vazhdueshme të sasive të caktuara (shih librin).
Pra, le të supozojmë se vazhdimisht po matim diçka. Le të supozojmë gjithashtu se matjet tona vijnë gjithmonë me ndonjë gabim - kjo është e kuptueshme, sepse nuk ka ideale instrumente matëse, dhe secili prodhon një rezultat gabimi. Në rastin më të thjeshtë, ajo që përshkruhet mund të reduktohet në shprehjen e mëposhtme: z=x+y, ku x – kuptimin e vërtetë, të cilën duam ta masim dhe të cilën do ta masnim nëse do të kishim një pajisje matës ideale, y është gabimi i matjes i paraqitur nga pajisja matëse dhe z është sasia që kemi matur. Pra, detyra e filtrit Kalman është të hamendësojë (përcaktojë) nga z-ja që kemi matur, cila ishte vlera e vërtetë e x-it kur morëm z-në tonë (i cili përmban vlerën e vërtetë dhe gabimin e matjes). Është e nevojshme të filtrohet (të hiqet) vlera e vërtetë e x nga z-për të hequr zhurmën shtrembëruese y nga z. Kjo do të thotë, duke pasur vetëm një shumë në dorë, duhet të hamendësojmë se cilët terma e dhanë këtë shumë.
Në dritën e sa më sipër, le të formulojmë gjithçka si më poshtë. Le të ketë vetëm dy numra të rastit. Na jepet vetëm shuma e tyre dhe na kërkohet ta përdorim këtë shumë për të përcaktuar se cilat janë termat. Për shembull, na është dhënë numri 12 dhe ata thonë: 12 është shuma e numrave x dhe y, pyetja është se me çfarë janë të barabartë x dhe y. Për t'iu përgjigjur kësaj pyetjeje, krijojmë një ekuacion: x+y=12. Ne morëm një ekuacion me dy të panjohura, prandaj, duke folur në mënyrë rigoroze, nuk është e mundur të gjejmë dy numra që japin këtë shumë. Por ende mund të themi diçka për këto shifra. Mund të themi se këta ishin ose numrat 1 dhe 11, ose 2 dhe 10, ose 3 dhe 9, ose 4 dhe 8, etj., gjithashtu ishte ose 13 dhe -1, ose 14 dhe -2, ose 15 dhe - 3, etj. Kjo do të thotë, ne mund të përcaktojmë grupin nga shuma (në shembullin tonë 12) opsionet e mundshme, të cilat japin gjithsej saktësisht 12. Një nga këto opsione është çifti që po kërkojmë, i cili në fakt dha 12. Vlen gjithashtu të theksohet se të gjitha opsionet për çiftet e numrave që japin një total prej 12 formojnë drejtëzën e treguar. në figurën 1, e cila është dhënë nga ekuacioni x+y=12 (y=-x+12).

Fig.1

Kështu, çifti që po kërkojmë shtrihet diku në këtë vijë të drejtë. E përsëris, është e pamundur të zgjedhësh nga të gjitha këto opsione çiftin që ekzistonte në të vërtetë - i cili dha numrin 12, pa ditur asnjë të dhënë shtesë. Megjithatë, në situatën për të cilën u shpik filtri Kalman, të dhëna të tilla ekzistojnë. Aty paraprakisht rreth numra të rastësishëm diçka dihet. Në veçanti, i ashtuquajturi histogram i shpërndarjes për çdo çift numrash është i njohur atje. Zakonisht merret pas vëzhgimit mjaft të gjatë të shfaqjes së këtyre numrave të njëjtë të rastit. Dmth, për shembull, nga përvoja dihet se në 5% të rasteve zakonisht shfaqet çifti x=1, y=8 (këtë çift e shënojmë si më poshtë: (1,8)), në 2% të rasteve çifti. x=2, y=3 ( 2.3), në 1% të rasteve një çift (3.1), në 0.024% të rasteve një çift (11.1), etj. E përsëris, ky histogram është dhënë për të gjitha çiftet numrat, duke përfshirë ata që mblidhen deri në 12. Kështu, për çdo çift që mbledh 12, mund të themi se, për shembull, çifti (1, 11) shfaqet 0,8% të rasteve, çifti (2, 10) – në 1% të rasteve, çifti (3, 9) – në 1,5% të rasteve, etj. Kështu, ne mund të përdorim histogramin për të përcaktuar se në cilën përqindje të rasteve shuma e termave të një çifti është e barabartë me 12. Le të, për shembull, në 30% të rasteve shuma jep 12. Dhe në 70% të mbetur, çiftet e mbetura bien - këto janë (1,8), (2, 3), (3,1), etj. – ato që mblidhen me numra të ndryshëm nga 12. Për më tepër, le të shfaqet, për shembull, çifti (7,5) në 27% të rasteve, ndërsa të gjitha çiftet e tjera që mbledhin deri në 12 shfaqen në 0,024%+0,8% +1 %+1.5%+…=3% e rasteve. Pra, nga histogrami zbuluam se numrat që mblidhen deri në 12 shfaqen në 30% të rasteve. Për më tepër, ne e dimë se nëse rrokulliset një 12, atëherë më shpesh (27% nga 30%) arsyeja për këtë është çifti (7,5). Kjo është, nëse tashmë Nëse rrotullohet një 12, mund të themi se në 90% të rasteve (27% e 30% - ose, po e njëjta gjë, 27 herë nga çdo 30) arsyeja e rrokullisjes së 12 është çifti (7,5 ). Duke ditur se më shpesh arsyeja për marrjen e një shume të barabartë me 12 është çifti (7.5), është logjike të supozohet se, ka shumë të ngjarë, ajo ka rënë tani. Sigurisht, ende nuk është fakt që në fakt tani numri 12 është formuar nga ky çift i veçantë, megjithatë, herën tjetër, nëse hasim 12, dhe përsëri supozojmë çiftin (7,5), atëherë në rreth 90% e rasteve nga 100% do kemi te drejte. Por nëse hamendësojmë çiftin (2, 10), do të kemi të drejtë vetëm në 1% të 30% të rasteve, që është e barabartë me 3,33% të hamendjeve të sakta krahasuar me 90% kur hamendësojmë çiftin (7,5). Kjo është ajo - kjo është pika e algoritmit të filtrit Kalman. Kjo do të thotë, filtri Kalman nuk garanton që nuk do të bëjë gabim në përcaktimin e shumës me shumën, por garanton se do të bëjë një gabim një numër minimal herë (probabiliteti i një gabimi do të jetë minimal), pasi ai përdor statistika - një histogram të shfaqjes së çifteve të numrave. Është gjithashtu e nevojshme të theksohet se algoritmi i filtrimit Kalman shpesh përdor të ashtuquajturën densitet të shpërndarjes së probabilitetit (PDD). Sidoqoftë, është e nevojshme të kuptohet se kuptimi atje është i njëjtë me atë të një histogrami. Për më tepër, një histogram është një funksion i ndërtuar në bazë të PDF dhe është përafrimi i tij (shih, për shembull,).
Në parim, ne mund ta përshkruajmë këtë histogram si një funksion i dy ndryshoreve - domethënë në formën e një sipërfaqe të caktuar mbi planin xy. Aty ku sipërfaqja është më e lartë, probabiliteti për të marrë çiftin përkatës është më i lartë. Figura 2 tregon një sipërfaqe të tillë.


Fig.2

Siç mund ta shihni më lart drejtëza x+y=12 (e cila ka variante çiftesh të dhënash gjithsej 12), pikat e sipërfaqes ndodhen në lartësi të ndryshme dhe lartësia më e lartë është për variantin me koordinata (7,5). Dhe kur hasim një shumë të barabartë me 12, në 90% të rasteve arsyeja e shfaqjes së kësaj shume është pikërisht çifti (7,5). Ato. Është ky çift, i cili mblidhet deri në 12, që ka probabilitetin më të lartë të ndodhjes, me kusht që shuma të jetë 12.
Kështu, ideja e filtrit Kalman përshkruhet këtu. Mbi këtë bazë ndërtohen të gjitha llojet e modifikimeve të tij - të përsëritura me një hap, me shumë hapa, etj. Për një studim më të thelluar të filtrit Kalman, unë rekomandoj librin: Van Trees G. Teoria e zbulimit, vlerësimit dhe modulimit.

p.s. Për ata që janë të interesuar për shpjegimet e koncepteve të matematikës, siç thonë ata "në gishta", ne mund t'ju rekomandojmë këtë libër dhe në veçanti kapitujt nga seksioni i tij "Matematika" (mund të blini vetë librin ose kapituj të veçantë prej tij ).

Le të ketë një sistem të caktuar, gjendja e të cilit karakterizohet në mënyrë unike nga një grup i caktuar sasish, të cilat, si rregull, janë të paarritshme për matje (aektor i gjendjes së sistemit).

Ka një sërë variablash. Në një farë mënyre lidhet me gjendjen e sistemit, i cili mund të matet me një saktësi të caktuar. Algoritmi i filtrit Kalman ju lejon të ndërtoni një vlerësim real të gjendjes së sistemit në kohë reale, bazuar në matjet që përmbajnë gabime. Vektori i matjes konsiderohet si një sinjal dalës shumëdimensional i sistemit, i cili është i zhurmshëm, vektori i gjendjes është një sinjal shumëdimensional i panjohur për t'u përcaktuar, kushti i optimalitetit për vlerësimin e ndërtuar është min katrori mesatar i tij. gabimet.

Karakteristikat e filtrit Kalman:

    Ju lejon të merrni një zgjidhje për problemin e formuluar në formën e

    Filtri nuk është i palëvizshëm

    Ka një formë të përsëritur, domethënë është i përshtatshëm për programim. Vlerësimet e reja merren duke rregulluar të vjetrat bazuar në vëzhgimet e reja.

Në rastin e përgjithshëm, jepet një hapësirë ​​Hilbert n-dimensionale.

Përcaktohet një proces që formohet nga një sistem dinamik linear i quajtur filtër formësimi

Dx/dt =A(t) x(t) +B(t)u(t)+V(t)

    X(t) - proces i rastësishëm n-dimensional.

- U(t) - c grumbull procesi në formën e b.sh me matricën e kovariancës

K u (t, M (t)(t-)

X(t) vëzhguar duke përdorur një metër:

Y(t) = c(t)x(t) +n(t)

n(t) =B.Sh.

K n (t, ) = M=R(t)(t-)

Në bazë të vëzhgimeve gjatë një intervali kohor, ju duhet të gjeni një vlerësim të sinjalit x(t) tx(t))

x (t)=x(t) – x(t)- gabim në vlerësim

Kriteri i optimalitetit është katrori i tij. Forma

//X (t) // 2 min

Proceset u(t) Dhe x(t) Dhe V(t) Dhe n(t) nuk janë të ndërlidhura dhe filtri i formësimit plotëson kushtet e realizueshmërisë fizike.

U(t) x(t) x(t) n(t)

FF - filtri i formësimit

u

U(t)y(t)

L

x(t) x(t)

Vetitë dinamike të sistemit varen nga L, zgjedhje L ofron

X(t) – x(t)o

t

Kushtet fillestare në çdo cikël të ri të algoritmit janë një vlerësim i gjendjes së sistemit dhe vlera karakterizon gabimin e tij.

Algoritmi përpunon në mënyrë sekuenciale vektorët e matjes së sapoardhur, duke marrë parasysh këtë vlerë, llogaritur. në ciklin e mëparshëm. Në sp. Hapi, me përpunim matës, i specifikuar nr. për këtë algoritëm kalc. pa korrigjime të tyre bazuar në matricat e kovariateve. Korrigjuar t.o. Epo. dhe janë prodhimi i filtrit Kalman në çdo cikël. Aktiv fazën përfundimtare Algoritmi po përgatitet për ardhjen e një vektori të ri matës. Bazuar në një transformim të caktuar linear, duke lidhur vektorin e gjendjes së tij pasuese me atë të mëparshëm, parashikohet një vlerësim i gjendjes së sistemit në kohën e matjes së ardhshme.

Le të shqyrtojmë një filtër Kalman shumëdimensional për rastin e palëvizshëm. Përshkrimi i vetë objektit duhet të dihet:

X(K+1) = Ax(K)+Bu(K)+V(k)

Y(K) = cx(K0+n(K)

A 1 B 1 C=konst(rasti spitalor)

Informacioni apriori për sinjalin duhet të dihet:

M[x] =x o u cov [x] = o

Duhet të dihet a priori informacioni për zhurmën, d.m.th. R(v) - Dendësia Gaussian  M[v]=o; cov[V]=V

P(n)M[n]=o; cov[n]=N

V - zhurma e objektit; n - zhurma e matjes

Algoritmi i filtrit Kalman:

X(K+1) = Ax(k)+Bu(k)+L(K+1)

Çdo vlerësim rrjedh nga ai i mëparshmi x(K) dhe bazuar në matjen aktuale y(u+1); parashikon mostrën aktuale - Ax(u)+Bu(K)- gjendje e ekstrapoluar.

L Cbu(K) rregullon vlerësimin aktual bazuar në vlerësimin e gabimit

C- risi midis vlerës së vëzhguar dhe të parashikuar.

L(K+1) - Koeficienti Kalman që ndryshon në kohë.

L= KoC 1 fq -1 p- matrica e vetë sinjalit; Ko- e vetmja zgjidhje pozitive e përcaktuar për një ekuacion të matricës algjebrike (ekuacioni i Reccati)

Ky identifikues duhet të jetë i qëndrueshëm, domethënë eigenvalue matricat ka një pjesë reale "-".

Ekuacioni i filtrit Kalman përcakton në mënyrë unike të gjithë koeficientët identifikues bazuar në të dhënat mbi natyrën e ndërhyrjes në përputhje me zgjedhjen e kriterit min CK gabimet.

Le të shkruajmë formën e përsëritur:

L(K+1) =(K+1) c 1 -1 = P(K+1)C 1 N -1

(K+1) = AP(K)A 1 +V

P(K+1)= [ -1 (K+1)>C 1 N -1 C] -1 = (K+1)- (K+1)C 1 -1 c(k+1)

(K+1)- vlera apriori e matricës së kovariancës së sinjalit x, bazuar në k vëzhgime.

Fillimisht llogaritet:

1. (k+1)

2.P(k+1)

3. L(k+1)

4.x(k+1)

Shembull: e thjeshtuar sepse: rasti apriori (filtri i kamerës Kalman); Dhe c=1

Konsiderimi i sinjaleve të rastësishme të palëvizshme x(k) me karaktere statistikore të njohura deformohet b.sh statistikore. maksimumi/ vlerësimi më i mirë x(i)

X(k+1) = sëpatë (k) +v(k)

Y(k) = x(k)+n(k)

X(o)=x o P(o)=P o

M[v]=o M=Vij

M[k]=o M=Nij

M=O

x^(n+1)=ax(k)+L(k+1)

l(k+1)=(k+1)[(k+1)+N] -1 = (k+1)/(k+1)+N

(k+1)=AP(k)A 1 +V=a 2 P(k)+v

P(k+1)=[ -1 (k+1)+N -1 ] -1 = (k+1)N/(k+1)+N

X(k+1)=(1-l(k+1))ax(k)+l(k+1)y(k+1)=N/ (k+1)+N sëpatë(k)+(k+1)/ (k+1)+N y(k+1)

L

L(k+1)+ (k+1)=1

Le të supozojmë se ka informacion apriori:

X o =oP o =o N=V=

K(k) l(k) P(k)

1 N 0,5 0,5 N

2 1 ,25 N 0,555 0,555 N

3 1 ,28 N 0,56 0,56N

4 1 ,28 N 0,56 0,56N

x o =oP o = N=V a=

k(k) l(k) P(k)

o

1 1 N

2 1 ,5 N 0,6 0,6 N

3 1.3N 0,565 0,565 N

4 1 ,283 N 0,56 0,565 N

5 1 ,28 N 0,56 0,56 N

0 ,56 N

P(k) =P(k-1)=P - gjendja e stacionaritetit të filtrit

R= N/+N =(a 2 P+V)N/a 2 P+N+V

(a 2 P +V)N =PN+P(a 2 P+V)

P 2 +N+V-a 2 N/a 2 P – VN/a 2 =O

P 2 +3Np – 2N 2 =O

P=0,56 N

    Fitimi L nuk varet nga vëzhgimet dhe mund të llogariten paraprakisht për të gjithë procedurën.

    Varësia kohore e matricave A, B, ME nuk sjell ndryshime thelbësore (kur këto matrica njihen plotësisht)

    Filtri Kalman zbaton procesin e vlerësimit paralitik.

    Me një shpërndarje porcionale të variablave të rastësishëm në rastin stacionar, filtri në shqyrtim është optimal, në kuptimin e metodës polim. Sheshe, nëse sistemi nuk është i palëvizshëm, atëherë filtri është optimal.

Vlerësimi i njëkohshëm i parametrave dhe gjendjes së objektit

Duke marrë parasysh detyrën e vlerësimit të gjendjeve, kur dihet vetëm struktura e matricës së objektit, domethënë dihen funksionet që përmbajnë matricat dhe nuk dihen vlerat e parametrave që përmbajnë vetë funksionet. Një qasje e drejtpërdrejtë për zgjidhjen e një problemi të tillë përfshin zgjerimin e vektorit të gjendjes për shkak të parametrave të panjohur.

U(t)x 1 (t)

Y 1 (t)

Y 2 (t)

Është e nevojshme të vlerësohet gjendja X dhe vlera mesatare e zhurmës P nga vëzhgimet e sinjaleve të disponueshme 1 Dhe 2 ku A i panjohur

Le të krijojmë një vektor të gjendjes së zgjeruar që do të përcaktojmë:

X 1 (t)x 1 (t)

X(t)= a = x 2 (t)

Nx 3 (t)

A=n=o(meqenëse nuk janë filtra të kohës)

X 1 (t)/u(t) = 1/a+s x 1 o (t) = -x 1 (t)x 2 (t)+u(t)

X 1 (t) = u(t)/a+s

X 1 (t)(a+s)= u(t)x 1 x 2 +sx 1 =u

Për vektorin e gjendjes, shkruani ekuacionin e bashkimit x(t) Dhe u(t) e pamundur.

X = A(x(t)+B(x(t),t) u(t)

-x 1 +x 2 (t) 1

A = o B = o

Merrni parasysh vektorin e vëzhgimeve

Y(t) =c(x(t), t) + v(t)

C(x(t), t) =

V(t) =

Le të përshkruhet objekti

X = j(x,u, a, v, t)

Y = g(x,u, Me,n, t)

X(x,u,a, v, t)

[x/a] nuk mund të konvertohet në M- forma lineare, ku M nuk varet nga X Dhe A.

Edhe për një objekt linear problemi është i përbashkët.

Vlerësimi i parametrave dhe gjendjeve në lidhje me këtë parametër dhe vektor të gjendjes. Të gjitha qasjet duhet të bazohen në akordimin e modelit dhe të jenë përsëritëse.

Le të shqyrtojmë bazuar në sinjalet e mostrës:

X(k+1) = t(x(k), u(k), a(k), v(k), k)

Y9k) = g(x(k), n(k), me (k), n(k), k)

Përdoret një objekt jo-linear jo-stacionar

(x(k), u(k), a(k), k) + G(k)V(k)g(x(k)u(k)c(k)k)+n(k)

(aditiv i zhurmës së objektit) (aditivë për zhurmën e vëzhgimit)

A(k)x(k) +B(k)u(k) c(k)x(k)+D(k)u(k)

(objekt linear) i vëzhgueshëm i variablave të gjendjes relative lineare

Ax(k)+Bu(k) cx(k) + Du(k)

(objekt i palëvizshëm) matrica e vëzhgimit është konstante)

(k)=o

Në këtë formë, problemi quhet me dy pika.

Identifikimi i objekteve jolineare

Lloji i jolinearitetit Hammerstein.

Ky model mbështetet në supozimin se jolineariteti dhe dinamika mund të ndahen. Kjo mund të përfaqësohet në formën e kombinimeve të njëpasnjëshme të 2 lidhjeve: inerciale jolineare dhe lineare dinamike.

U(t)y(t)

Y(t) = d

Në një sinjal njëdimensional, duhet të identifikohen 2 funksione. Këto funksione përfaqësohen në formën e një zgjerimi mbi disa funksione të specifikuara nga sistemi.

(u)=aj j (u); w(t) =b i w i (t)

j=1 i=1

Le të prezantojmë shënimin e mëposhtëm:

Y ij (t) = i () j }

Artikujt më të mirë mbi këtë temë