Т. Ламбева, София 1046, бул. „Хр.Смирненски” 1, Р420, lambeva_fgs@uacg.bg
Ключови думи: Робастни методи;гравиметрични мрежи, релативни гравиметрични измервания, Tау-тест, Датски метод
Научна област: Гравиметрия, Физическа геодезия, Статистика
РЕЗЮМЕ
В резултат на изследвания, редица автори изучават разпределението на грешките, като допускат възможност за „смущаване” на основното разпределение на грешките, с определена вероятност, както и възможността вида на основното разпределение да се различава от този на нормалното. Емпирично при някои измервания са установени „по-широки краища” (widetails) на разпределението на грешките, в сравнение с нормалното разпределение. В такива случаи, на отклонения от предположението за закона на разпределение, усилията са насочени към използването на подходящи методи, не зависещи от параметрите на разпределението или на такива, които са определени чрез предположение за познаване на вида му и обоснованото им извеждане, чрез прилагане на метода на максималното правдоподобие или други Бейесови методи.
В настоящата статия се разглеждат методи основаващи се на тези принципи, подходящи за оценката на релативни гравиметрични мрежи.
Въведение
Редица автори отбелязват, че разпределението на случайните грешки може да бъде симетрично, но да не бъде нормално. Може да бъде по-заострено или по-плосковърхо. Съществува и вариант, при който разпределението на грешките да е нормално, но данните да съдържат измервания, чиито грешки не са типични за него. Възможно е да имат друга средна стойност или да принадлежат към нормално разпределение с друго стандартно отклонение[7].
В този случай разпределението (), получено в резултат на „смущение” или „замърсяване” на измерванията (с грешки, нямащи нормално разпределение) се основава на следното предположениеза него [12]:
G= (1-ε)F+εH, (1)
където F е допуснатото разпределение (най-често нормалното), а част от грешките (ε) имат неизвестното смущаващо разпределение H.
Още от началото на XIXвекредица статистици и практици – астрономът и математик Bessel (1818), астрономът Newcomb (1886), геофизикът Jeffreys (1939)и др.[13], в резултат на емпирични изследвания установяват, че действителните разпределения на грешките в измерванията са с ясно изразени „по-широко разпростиращи се краища”[1], в сравнение с тези на нормалното разпределение [10], [14].Изследвано е влиянието на този факт върху определяне на параметрите на положението – най-вероятна стойност, медиана и др., както и на техните качества.
Наименованието на робастните методи за оценка произлиза от англ. „robust”, чиито синоними са „строг”, „силен”, „здрав”. Статистическо значение на термина е дадено от Box (1953) [12].Теорията на робастността определя процедурите и методите за оценка, нечувствителни към отклонението от идеализираните предположения за модели в статистиката, според дефиницията на Hampel (1986).
Робастните методи се отнасят към класа на непараметричните и по-рядко към свободните от разпределения процедури [13].
Разграничават се следните видове робастност:
- Идеализираните предположения в статистиката често се отнасят за разпределенията на грешките в измерванията. В този случай се говори за робастност на разпределението [12]
- Друг аспект на робастността е в контекста на изследване на недопустимите или грубите грешки. В този случай се употребява терминът „outlier” робастност (или устойчивост срещу грешки). Това са процедури, осигуряващи безопасност и даващи индикация за недопустими грешки [12]. В голяма част от научните изследвания се разглежда именно тази робастност, която често се нарича и „outlier” анализ. Този анализ се прилага в три различни направления – при изследване на регресионни модели (на независими измервания с идентични разпределения), при изследване на времеви редове, при изследване на данни от измервания [12]. Данните в последните две групи могат да бъдат зависими и с различни разпределения.
Draper и Smith[7] обръщат особено внимание, че робастните методи могат да бъдат както подходящи, така и неуместни. Като възможни проблеми те изтъкват от една страна, че не е известен типът на робасната оценка, която е подходяща, а от друга страна, че много често не е известно при какво предположение за разпределение на грешките е целесъобразно те да се приложат. Авторите препоръчват на практика да се формулира алтернативен закон на разпределение. Като последваща стъпка следва да се постулира структурата на параметричния модел, отговарящ на алтернативното предположение за грешките в измерванията. В следствие на предходните допускания се подчертава, че за оценка на параметрите е целесъобразно да се приложи принципът на максималното правдоподобие или еквивалентен на него Бейсов метод[7].
Съществуват основно два, принципно различни, подхода за моделиране и оценка на данни, които не се основават на закона за нормално разпределение. Първият се нарича „оutlier” диагностика или тестване за недопустими грешки. Чрез него се идентифицират отделни измервания, които не отговарят на определен модел, с помощта на статистически тестове. Те се премахват от измерванията и в последствие се обработват с МНМК. Ако грешките в измерванията са повече, процесът е итеративен. Този подход е наречен пасивен [23], [4].
Вторият подход използва т.нар. робастни техники за оценка, основаващи се на методи, които изцяло или до някаква степен се влияят от наличието на груби грешки. При него влиянието на грубите грешки се минимизира най-често чрез промяна на тежестите на измерванията. Тази група методи се наричат активни.
При пасивните методи най-напред се открива грешката и след това се извършва моделирането и оценката на данните с МНМК. Активните методи първо моделират регресията, която се удовлетворява от мнозинството от данните и след това се идентифицират измерванията с потенциални грешки (оutliers). Това са тези измервания, които получават големи поправки след робастната оценка [23]. Целта на двата метода е еднаква, но по своята същност те се различават по това, че решават задачата за елиминиране на недопустимите грешки в измерванията в противоположен ред.
2. Пасивни методи
Пасивните методи за оценка се осъществяват чрез статистически тестове, изпълняващи проверка на статистически хипотези с предварително зададена доверителна вероятност. Резултатът от изпълнението на статистическите тестове води до нови оценки на параметрите на функционалния и стохастичния модел, поради което те могат да се приемат като част от метода за оценка.
Най-често при изравнението на геодезически и гравиметрични мрежи се прилагат пасивни методи. Предварителното премахване на не допустимите грешки и прилагането на МНМК е робастен метод [23].
В зависимост от обхвата на своето действие пасивните методи се разграничат в две основни групи – глобални и локални. Глобалните тестове контролират измерванията като цяло чрез проверка на стойността на сумата от квадрата на поправките. Най-често прилагания глобален тест при геодезически и гравиметрични мрежи, при предположение, че грешките в измерванията имат нормално разпределение е χ2 (Хи- квадрат) – тестът .
Неизпълнението на глобалния тест дава информация за :
- наличие на грешки над допустимите в измерванията;
- за некоректен модел на корелационната матрица на измерванията;
- липсващи параметри във функционалния модел.
Хи-квадрат разпределението за степени на свобода над 50, асимптотично клони към нормалното разпределение [1].
Локалните тестове или тестовете на поправките проверяват отделните измервания за наличие на недопустими грешки.
При изравнението на гравиметрични мрежи подходящ за приложение е Тау-тестът (τ-тест). Методът е предложен от Pope (1976) [22], като се отличава от останалите методи за диагностика по това, че определя по-големи доверителни интервали. Диференцира допустимите стойности в зависимост от степените на свобода решаваната задача.
Тау-тестът се прилага когато априорната средна квадратна грешка за единица тежест не е известна, за разлика от метода „datasnooping”,предложен от Baarda (1968) [3].
Pope[22] и Caspary(1996) [5] поясняват причината за приложение на Тау-теста. Поправките и техните средни квадратни грешки са получени от едни и същи данни и следователно са статистически зависими. Това налага вместо приложение на разпределение на Стюдент при анализа на поправките да се използва абсолютната стойност на стюдентизираната поправка и Тау-разпределението.
Терминът „стюдентизиране” се отнася до моделиране на статистически данни, така, че да са независими от параметрите на дадено разпределение. Използването му се характеризира с използване на средната квадратна грешка на случайната величина (в случая поправка), поради не познаване на стандартните й отклонения.
Pope[22] разглежда маргиналното разпределение на ι-та поправка, което го представя – n(0, σν), като нормално, с нулево математическо очакване и стандартно отклонение σν и при независими измервания. Стюдентизираните поправките се представят във вида:
, (2)
където е средната квадратна грешка след изравнението на поправката , а σ0 е средната квадратна грешка за единица тежест след изравнението. Специфичното в случая е че поправките , посредством изравнените стойности на измерените величини са зависими със средните квадратни грешки на поправките (определени са от една извадка) , т.е. те са вътрешно стюдентизирани. Pope в този случай определя, че поправката e пропорционална на величината , където τ е параметър на Тау разпределението [22]. Авторът пояснява, че стохастичните параметри на изследваната величина (поправката), са заменени с техните оценки, които са получени от една извадка, т. е. тези оценки са зависими. Ако стохастичните параметри на изследвания ред от стойности са получени от различни извадки, поправките биха били външно стюдентизирани и биха съответствали на величината , където t е параметър на разпределението на Стюдънт [22].
Нулевата хипотеза при τ– теста допуска, че поправките са с нормално разпределение, с математическо очакване равно на нула и стандартно отклонение σν – n(0,σν), за всяко i=1,…..,n [22]. Нулевата (H0) и алтернативната (Ha) хипотези са:
H0 : E(νi)=0;
Ha : една поправка е с недопустима стойност (outlier). (3)
За реализиране на Тау-теста – проверката на статистическата хипотеза се трансформира [22]в:
, (4)
(5)
Означението е критична стойност изчислена по формулата:
, (6)
а t е разпределението на Стюдънт с f степени на свобода. Разпределението на Стюдънт, за дадена доверителна вероятност β, осигурява по-широки доверителни интервали от нормалното разпределение. При степени на свобода над 20 то асимптотично приближава нормалното [1].
Връзката между глобалното (α) и локалното (α0) нива на значимост е представено от [22] и представя вероятността за потвърждаване на нулевата хипотеза за i-та поправка да е:
; (7)
или , (8)
където n е броят на измерванията, а α0 е локалното ниво на значимост. Обикновено глобалното ниво на значимост се приема между 1% и 5%.
Отхвърлянето на дадена хипотеза (формула (3)) може да се дължи [18] на:
- Грешка в детерминистичния модел – на измерванията;
- Грешка в измерванията – Математическото очакване E(νi)≠0 или дисперсията D(νi)≠1;
- Грешно предположение за стохастичния модел – D(νi)≠Kνν
- Математическо очакване е равно на нула;
- Стандартно отклонение е единица за всички степени на свобода;
- Има крайни граници;
- За големи степени на свобода конвергира към нормалното разпределение и се различава от него при малките степени на свобода.
Тау разпределението не е универсално, параметърът му се представя с формула (6), като за първи път е публикувано от Thompson (1935). То има следните характеристики, дадени от Patterson (1985):
Извършването на теста става чрез откриване на максималната стойност и извършване на проверка с критичната стойност. Ако това е изпълнено се отстранява измерването, съответстващо на Ti. Изравнението се извършва отново и проверката се повтаря докато не бъдат отстранени всички измервания с грешки над допустимите.
При използване на друг локален тест – “datasnooping” методaсе предполага, че средната квадратна грешка за единица тежест е известна. Чрез нейната стойност се изчислява средната квадратна грешка на поправките. За изпълнението му се определят стюдентизираните поправки:
, (9)
където: е матрица на обратните тежести на поправките; P са тежестите на измерванията;A е конфигурационната матрица пред неизвестните.
Извършва се проверката:
, (10)
където cα е критична стойност изчислена чрез нормираното нормално [1] разпределение n(0,1), определена за ниво на значимост α[4].
В [12] критичната стойност е представена:
(11)
където с N,F, χ2 са означени съответно нормалното разпределение, разпределението на Фишер и Хи- квадрат разпределението.
3. Активни методи
Реализирането на робастните методи става с помощта количествени и качествени показатели за робастност [12].Статистическата процедура, която е качествено робастна, предполага, че при малки промени в допуснатия модел ще настъпят малки промени в оценката. МНМК не е качествено робастен метод.
Изискването на робастните методите е да сакачествени – нечувствителни към малки изменения от предположението, а количествените показатели за робастност са длъжни да отразяват възможното, максимално, влошаване на качеството на оценките при отклонения от предположението с вероятност ε [13].
Hampel освен понятието за качествена робастност, определя и понятията глобална и локална робастност [14]. Глобалната робастност е свързана със степента на смущение, преди която оценката остава качествена. Глобалната робастност е свързана с понятията максимално отклонение (maximum bias) и прагова точка (breakdown point). Локалната робастност е свързана с понятието функция на влияние (influencefunction).
Caspary (1996) формулира три характеристики, които трябва да притежават робастните методи за оценка:
- Необходимо да имат високо ниво на чувствителност или висока прагова точка (breakdownpoint – BP), т.е. да успяват да идентифицират грубите грешки, като следят те да не надвишават определена стойност;
- Робастните методи за оценка трябва да имат непрекъсната и ограничена функция на влияние (influencefunction – IF). IF дефинира чувствителността на оценката към груби грешки.
- Робастните методи за оценка трябва да имат висока асимптотична ефективност – дисперсиите на оценките около очакваните им стойности трябва да бъдат минимални.
При робастните методи критерият на МНМК [pvv]=min се заменя с определянето на минимум на по-подходящи функции на поправките. Но самият метод на най-малките квадрати е робастен при условието за нормално разпределени грешки. При робастните методи за оценка се прилагат строги процедури, които са по-малко чувствителни към отклонение на разпределението на грешките от нормалното. Една такава процедура е използването на L1 норма за вектора на поправките [6].
Huber(1964) класифицира робастните методи за оценка в следните категории:
- М – методи за оценка (М-Estimation methods) – свързани с метода на Максималното правдоподобие. Означението “M” произлиза от метода „Maximum likelihood”;
- L – методи за оценка (L-Estimation methods) – линейни комбинации на подредени статистики на измерванията;
- R – методи за оценки (R-Estimation methods) – основава се на въвеждане на ранг на поправките.
Освен изброените методи се разглеждат т.нар. S – оценки (S – Estimationmethods). Това са методи, минимизиращи разсейването на поправките. Наименованието произлиза от “scale”.
Единият от начините за реализиране на М- методите: чрез итеративен процес на МНМК с промяна на тежестите, а другият е чрез използване на нелинейни алгоритми илиметоди на нелинейното програмиране.
Известни са различни активни робастни методи – Метод на Huber (1964), метод на най-малкото абсолютнo отклонение от медианата (Edgeworth, 1887), метод на най-малката медиана от квадратите (Rousseeuw, 1984), метод на Hampel, (1974, 1976), Датски метод (Krarup, 1967) и много други.
4. Приложение в гравиметрични мрежи
МНМК е най-често използванияметод за оценка налокални, национални и глобални гравиметрични мрежи. При Международната Стандартизационна Мрежа – IGSN71 и Обединена Европейска Гравиметрична Мрежа UEGN 2002,освен прилагане на основния принцип на МНМК са използвани итеративни методи, водещи до минимизиране на дисперсиите на поправките. Въведена е подходящата функция за определяне на тежестите на релативните гравиметрични измервания.
При IGSN71е въведено изискване за определяне на тежестите чрез обратно пропорционална зависимост на времето [20]:
, (12)
където So е средна квадратна грешка за единица тежест, а bo и b1 са параметри на регресионната права на поправките (зависимостта на поправките с времето), изчислени от предходно изравнение. Измерванията, извършени за интервала от време ΔТ, получават поправки P(ΔТ).
При UEGN 2002 за определяне на тежестите на измерванията е използвана итеративно функцията [15)]:
, (13)
където [vv]l е сумата от квадрата на поправките от серия l,nl е броят на измерванията в серия l, a ε е малко число.
Робастни методи са прилагани при Основната гравиметрична мрежа на Унгария [6] вдва варианта. При първият е заложен принципът за определяне на минимум на сумата от абсолютните стойности на поправките, катоZavoti (1999) представя двуфазов симплекс алгоритъм за решаване на задачата. Вторият вариант е с използване на Датски метод.
Датският метод е предложен от датския математик, физик и геодезист TorbenKrarup (1967) и може да се интерпретира като итеративно решение на Бeйесовите принципи на оценка, за търсене на минимум на дисперсията на некорелирани, нормално разпределени грешки в измерванията [19]. Методът е използван от Датския геодезически институт.
За изравнението на Основната гравиметрична мрежа на Унгария [6] и използван Датския метод и МНМК, като за първоначален модел на тежестите е приет модел с тежест 1 за всички измервания. Решението е извършено итеративно, като за всяко следващо изравнение тежестите се изчисляват:
, (14)
където j е номерът на итерацията,i е номерът на измерването, параметърът ak се определя от зависимостта като
(15)
μ0 е средната квадратна грешка с тежест 1.
При Локалната гравиметрична мрежа на провинция Валенсия, Испания [21] е използван робастен метод за оценка, базиран на метода на Huber(1964). Причината за неговото прилагане са установените различия в гравиметричните разлики, определени в един и същ момент. Този факт налага промяна в стратегията за съставяне на модела на тежестите.
Елементите на тежестната матрица на измерванията за всяка следваща итерация са изчислени чрез умножение на стойността от предходната итерация с мащабен коефициент съгласно изискванията:
(16)
където k е прието 1.5, σ се определя за всяка измерена гравиметрична разлика и всеки гравиметър по отделно.
В резултат на приложения метод се изменят тежестите общо на 52 измервания, като 80% са измерванията от единия гравиметър.
Като вариант на метод за оценка при Първокласната гравиметрична мрежа на Македония е използван Датски метод [9] със следният вид на модифициращата функция, приложена от [5] и [17]:
, (17)
където k е номерът на итерацията, σ0 е ср. кв. грешка за единица тежест. Константата обикновено се избира между 2 и 3, като зависи от броя на свръхизмерванията и качесвото на измерванията [5].
В този си вид модифициращата функция е пропорционална на диференциалната функция на Лаплас(1774) с медиана равна на нула Разпределението на Лаплас наричано още първи закон на грешките представя честотата на появяване на грешките с помощта на екпоненциална функция. Keynes (1911) доказва, че допускането на такъв закон на разпределение на грешките и прилагане на метод подобен на принципа на максималното правдоподобие води до целева функция – търсене на минимум на абсолютните отклонение от медиана [16]. В случая на формула (17) при нулева стойност на математическото очакване, респ. и медиана, се поставя изискване за търсене на минимум на абсолютните стойности на стюдентизираните поправки, извън интервала определен от параметъра .
Друга възможна интерпретация на метода е дадена от [8] чрез нелинейното програмиране. Намиране на най-големия брой измервания, които са взаимно съвместими (консистентни) и използване само на тези измервания в изравнението по МНМК за определяне на параметрите. Алтернативна формулировка е намиране на онези измервания, които не са съвместими с множеството от измерванията и изключването им от изравнението.
Според същите автори Датския метод не може да бъде класифициран между съществуващите робастни методи от теорията на максималното правдоподобие. Представянето на проблемите, дадени от формули (16) и (17) са подобни на клъстърните проблеми в статистика [8].
Според [5] основната идея на метода се състои в това, че големите поправки индикират по-грешни измервания.
Датския метод е подходящ за приложение в интервала определен от допустимата стойност на Тау-теста и стойност на параметъра при данни с по-малка вероятност за грешки.
Друга възможност за използване на Датския метод е за въвеждане на еднакви изисквания към стюдентизираните поправки (еднаква критична стойност ) при използване на два и повече гравиметъра. Тази стойност може да бъде стойността на определена от гравиметъра, имащ най-малка максимална стюдентизирана поправка, като тази стойност бъде използвана за критична при останалите гравиметри. В този случай на практика Датския метод се прилага само на гравиметрите имащи по-големи стойности на стюдентизираните поправки.
4. Заключения
От направеното изложение може да се обобщи, че робастните методи са подходящи и намират приложение при оценката на гравиметрични мрежи. Като най-приложими могат да бъдат определени Тау-тестът и Датският метод.
При оценката на гравиметрични мрежи и по-специално на релативни гравиметрични измервания е подходящ и прилаган в практиката пасивния робастен метод на Pope– Тау тест. Предимството на метода е възможността за извършване на обоснован контрол на поправките, при различни степени на свобода на решаваната задача и без необходимостта от познаването на априорната средна квадратна грешка за единица тежест. Той установява един по-широк доверителен интервал за поправките, вследствие на отчетената зависимост между поправката и средната й квадратна грешка. Често при първокласните гравиметрични мрежи степените на свобода са твърде ограничени в сравнение с геодезически мрежи. Също така в получените поправки към гравиметричните разлики често присъства остатъчното влияние на физическа корелация. Тау-тестът е по-малко взискателен към допустимите стойности на измерванията. Този факт ограничава изключването на измервания от обработката, но от друга налага въвеждане на допълнителни процедури за предварителна или последваща оценка на точността. Това са процедури за проверка на разпределенията на грешките, за наличие на корелация и автокорелация, за липса на значими параметри на функционалния модел и други, специфични за релативни гравиметрични измервания и мрежи.
Приложението на Датския метод при оценка на релативни гравиметрични измервания и мрежи е възможно като самостоятелен метод. Подходящо е и съвместното му прилагане с Тау-теста за определяне на влиянието на стюдентизираните поправки (респ. измервания), чиито стойности попадат в интервала, установен от Тау-теста и допустимите стойности за нормалното разпределение. Едновременно с изложеното до тук може да бъде използван и като средство за поставяне на еднакви изисквания към стюдентизираните поправки, получени от повече от един гравиметър.
Литература
- Костадинов К., В. Вълчинов
- Мостельер Ф., Дж. Тьюки
- Baarda W.
- Banaś M. Surveying, Geomatics and environmental engineering, Vol. 6, N.4
- Caspary W.E.
- Csapo G., Kis M., Völgyesi L.
- Draper N.R., H. Smithd edition, John Waley&Sons, Inc.
- Jorgensen P.C., P. Frederiksen, K. Kubik, W. Weng, (1984). Ah, Robust Estimation, XV Congress of the International Society for Photogrammetry and Remote Sensing, Commission III, Rio de Janeiro
- J V Geotechengineering & Zenit
- 10.Hampel
- Heck, B.
- Hella H.
- Huber P. J. (1981). Robust Statistics, John Wiley and Sons
- Karlgaard C. D.
- Kenyeres A., G. Boedecker, O. Francis
- Klein I., M. Grottke
- Knight N. L., J. Wang
- Krakiwsky E.J., D.J. Szabo, P. Vanicek
- Krarup T., J. Jul, K. Kubik
- McConneilAdjustment and Analyses of Data for IGSN 7, BIGNET no4, Appendix IV to the International Gravity Standardization Net 1971 (IGSZ 71), IAG
- Martín A., A. B. Anquela, J. Padín and J. L. Berné
- Pope A. J.
- Rousseeuw P. J, A. M. Leroy
[1]Превод на автора от англ.longertailed[10] или widetаildistributions[14]. Hampel[10] пояснява, че това са разпределения с по-голям ексцес от този на нормалното разпределение. Karlgaardформулира понятието в [14], като пояснява, че на по-големите грешки се установяват по-големи вероятности в сравнение с тези на нормалното разпределение.