/ / Логистичка регресија: модел и методе

Логистичка регресија: модел и методе

Методе логистичке регресије и дискриминантне анализе се користе,када је потребно јасно раздвојити испитанике по циљним категоријама. У овом случају, саме групе представљају нивои јединственог јединственог параметра. Размотримо детаљно модел логистичке регресије, и такође сазнајте зашто је то потребно.

регресиона логистика

Опште информације

Пример проблема у решењу којих је регресиона логистика, према класификацији испитаникагрупе које купују и не купују сенф. Диференцијација се врши у складу са социо-демографским карактеристикама. Међу њима, посебно, укључују старост, пол, број рођака, приход, итд. У операцијама постоје критеријуми диференцијације и варијабли. Ова последња кодира циљне категорије, што у ствари треба да раздвоји испитанике.

Нуанце

Треба напоменути да је опсег случајева у којима регресиона логистика, много је ужа него за дискриминантаанализа. У том погледу, сматра се да је употреба другог као универзални метод диференцирања. Штавише, стручњаци препоручују почетак класификационих студија са дискриминантном анализом И само у случају неизвесности за резултате можемо користити логистичку регресију. Ова потреба долази због неких фактора. Логистичка регресија Користи се када постоји јасно разумевањетип независних и зависних варијабли. У складу са тим, изабрана је једна од 3 могуће процедуре. Са дискриминантном анализом, истраживач се увек бави једном статичком операцијом. Укључује једну зависну и неколико независних категорисаних променљивих са скалом било које врсте.

Врсте

Задатак статистичког истраживања, који користи регресиона логистикаје да одреди вероватноћу да је тоодређени испитаник ће бити додељен одређеној групи. Диференцијација се врши према одређеним параметрима. У пракси, према вредностима једног или више независних фактора, могуће је распоређивање испитаника у двије групе. У овом случају, бинарна логистичка регресија. Такође, наведени параметри се могу користитикада се поделе на групе више од два. У овој ситуацији постоји мултиномијална логистичка регресија. Добијене групе су изражене нивоима једне променљиве.

логистичка регресија

Пример:

Претпоставимо да постоје одговори испитаника на питањеда ли су заинтересовани за приједлог за куповину земљишта у предграђу Москве. Опције су "не" и "да". Неопходно је сазнати који фактори врше примарни утицај на одлуку потенцијалних купаца. За ову испитаник постављају питања о инфраструктури територије, удаљеност до капитала, земљишта, присуство / одсуство стамбених објеката и тако даље. Бинарним регресију, може да се дистрибуира у две групе испитаника. Први ће обухватити оне који су заинтересовани за куповину - потенцијалних купаца, а други, односно, они који нису заинтересовани за такву понуду. За сваког испитаника, поред тога, израчунава се вероватноћа да ће бити додељена категорији.

Упоредне карактеристике

Разлика од две горе поменуте опције,састоји се од различитог броја група и врсте зависних и независних варијабли. У бинарној регресији, на пример, испитује се зависност дихотомног фактора на једном или више независних услова. Ово друго може имати било коју врсту скале. Мултиномијална регресија се сматра варијацијом ове опције класификације. У њему зависна варијабла има више од 2 групе. Независни фактори морају имати или редовну или номиналну скалу.

Логистичка регресија у спсс

У Статистичком пакету 11-12, новиваријанта анализе - ред. Овај метод се користи у случају када се зависни фактор односи на исту (ординалну) скалу. У овом случају, независне варијабле се бирају из једне специфичне врсте. Они морају бити или редни или номинални. Класификација по неколико категорија сматра се најобухватнијом. Овај метод се може користити у свим студијама у којима логистичка регресија. Побољшати квалитет модела, међутим, то је могуће само уз помоћ све три технике.

контролу квалитета адекватности и логистичке регресије

Редовна класификација

Вреди поменути да је раније у статистичком пакетуније пружена типична могућност извођења специјализоване анализе за зависне факторе са редном скалом. За све варијабле са бројем група веће од 2 кориштена је мултиномијална варијанта. Релативно недавно уведен, редовна анализа има низ карактеристика. Они узимају у обзир специфичности скале. У међувремену у методичким приручницима, ред логистичка регресија често се не сматрају засебним уређајем. Ово је због следеће: редовна анализа нема значајне предности у односу на мултиномијалну. Истраживач може добро користити другу ако постоји и редовна и номинална зависна варијабла. Истовремено, сами процеси класификације се не разликују много један од другог. То значи да спровођење редовне анализе неће изазвати никакве потешкоће.

Опција анализе

Размотрите једноставан случај - бинарну регресију. Претпоставимо да се у процесу маркетиншког истраживања процењује значај дипломаца одређеног универзитета у главном граду. У упитнику испитаници су постављана питања, укључујући:

  1. Радиш ли? (кл).
  2. Навести годину дипломирања (к 21).
  3. Која је просечна тачка дипломирања (авер).
  4. Секс (к22).

Логистичка регресија ће процијенити утицај независних фактораавер, к 21 и к 22 до променљиве кл. Једноставно речено, сврха анализе ће бити да се утврди вјероватно запошљавање дипломираних студената на основу информација о терену, години дипломирања и просјека.

индикатор логистичке сигмоидне регресије

Логистичка регресија

Да подесите параметре помоћу бинарнихрегресије, требало би да користите Анализе►Регрессион►Бинари Логистиц мени. У прозору Логистиц Регрессион, потребно је да изаберете зависни фактор у левој листи доступних варијабли. Он је кл. Ова варијабла мора бити постављена у зависно поље. Након тога, независни фактори треба уносити на локацију Цовариатес - к 21, к 22, вв. Затим морате одабрати начин укључивања у анализу. Ако је број независних фактора већи од 2, онда се не користи метод истовременог увођења свих варијабли, који се инсталира подразумевано, али корак по корак. Најпопуларнији начин се сматра Бацквард: ЛР. Помоћу дугмета Селецт не можете укључити све испитанике у студију, већ само одређену циљну категорију.

Дефинишите категоричне варијабле

Дугме категоризирано треба користити услучај, када је једна од независних променљивих номинална са бројем категорија већих од 2. У овој ситуацији, у прозору Дефини категоризоване варијабле, овај параметар се налази у одељку Категорије категоријама. У овом примеру нема такве променљиве. Након тога, у падајућој листи Цонтраст, изаберите Девиатион и притисните дугме Цханге. Као резултат, неколико зависних варијабли ће се формирати из сваког номиналног фактора. Њихов број одговара броју категорија првобитног стања.

Сачувај нове варијабле

Користите дугме Сачувај у главном дијалошком оквируистраживање ствара нове параметре. Они ће садржати индикаторе израчунате у регресијском процесу. Конкретно, можете креирати варијабле које дефинишу:

  1. Припада специфичној категорији класификације (чланство у групи).
  2. Вероватноћа додељивања испитаника свакој студијској групи (вјероватноћа).

Када користите дугме Опције, истраживач неприма било какве значајне могућности. Сходно томе, може се занемарити. Након што кликнете на дугме "ОК", резултати анализе ће бити приказани у главном прозору.

коефицијент логистичке регресије

Контрола квалитета адекватности и логистичке регресије

Размотрите таблу Омнибус Тестсоф моделаКоефицијенти. Приказује резултате анализе квалитета апроксимације модела. У вези с чињеницом да је специфицирана корак по корак, потребно је погледати резултате последње фазе (корак2). Позитиван резултат ће се узети у обзир, што доводи до повећања показатеља Цхи-квадрата када идете у сљедећу фазу са високим степеном важности (Сиг. <0,05). Квалитет модела оцјењује се у линији модела. Ако се добије негативна вриједност, али се не сматра значајним за општу велику важност модела, она се може сматрати практично корисном.

Табеле

Сажетак модела даје прилику да процени индикаторагрегатне варијансе коју описује конструисан модел (индикатор Р Скуаре). Препоручљиво је користити вриједност Нагелкер-а. Позитиван индикатор је параметар Нагелкерке Р Скуаре, ако је изнад 0,50. Након тога се процењују резултати класификације у којима се стварни индекси припадности једној или другој од студираних категорија упоређују са онима које су предвиђене на основу регресијског модела. Да бисте то урадили, користите класификациону табелу. Такође дозвољава извлачење закључака о исправности диференцијације за сваку групу која се разматра.

логистички модел регресије
У следећој табели дат је прилика да се појасни статистички значај независних фактора који се уносе у анализу, као и свако нестандардизовано коефицијент логистичке регресије. На основу ових индикатора, можетепредвиђати идентитет сваког испитаника у узорку одређеној групи. Помоћу дугмета "Сачувај" можете унети нове променљиве. Они ће садржати информације о припадности одређеној класификационој категорији (предвиђеном категоријом) и вјеројатности укључивања у ове групе (предвиђена вјероватноћа чланства). Након што кликнете на "ОК", резултати прорачуна се појављују у главном прозору Мултиномијалне логистичке регресије.

Прва табела, у којој су важнеподаци о истраживању, - информације о моделу за монтажу. Висок ниво статистичке значајности указује на висок квалитет и погодност коришћења модела у решавању практичних проблема. Још једна важна табела је Псеудо Р-Скуаре. Он нам омогућава да процијенимо удио укупне варијансе у зависном фактору, који је одређен независним варијаблама одабраним за анализу. Према табеларном прегледу односа вероватноће можете извући закључке о статистичком значају другог. У процјенама параметара се одражавају не-стандардизовани коефицијенти. Користе се у конструкцији једначине. Поред тога, за сваку комбинацију варијабли утврђен је статистички значај њиховог ефекта на зависни фактор. У међувремену, у маркетиншким истраживањима, често постоји потреба за разликом по категоријама испитаника, не појединачно, већ као део циљне групе. Да бисте то урадили, користите таблицу Обсервед анд Предицтед Фрекуенциес.

Практична примена

Распрострањен метод анализе се широко користиу раду трговаца. 1991. године развијен је индикатор логистичке сигмоидне регресије. То је једноставан за кориштење и ефикасан алат с којим можете предвидјети вјероватне цијене прије него што се "прегреју". Индикатор је приказан на графикону у облику канала који се формира са две линије које раде паралелно. Оне су равномерно размакнуте од тог тренда. Ширина коридора зависиће искључиво од временског оквира. Индикатор се користи при раду са готово свим средствима - од валутних парова до племенитих метала.

логистичка регресија у спсс

У пракси су развијене двије кључне стратегијепримена алата: на распаду и на окрету. У другом случају, трговац ће се управљати динамиком промене цена унутар канала. Пошто се трошкови приближавају линији подршке или отпора, улог се прави на вероватноћу да ће кретање почети у супротном смеру. Ако се цена блиско приближава горњој граници, онда се средство може уклонити. Ако је на доњој граници, онда је вриједно размишљати о аквизицији. Стратегија распада укључује употребу налога. Постављени су изван граница релативно мале удаљености. Узимајући у обзир да цена у одређеном броју случајева крши на кратко време, требало би да сте позајмљени и инсталирате стоп-губитак. Истовремено, наравно, без обзира на изабрану стратегију, трговац мора бити што хладнији и хладнији како би се сагледала и процијенила ситуација која се појавила на тржишту.

Закључак

Дакле, примена логистичке регресијеомогућава брзо и једноставно класификовање испитаника у категорије у складу са одређеним параметрима. У анализи можете користити било који посебан метод. Конкретно, мултиномијална регресија је свестрана. Међутим, стручњаци препоручују коришћење свих горе наведених метода у комплексу. То је због чињенице да ће у овом случају квалитет модела бити много већи. Ово ће, заузврат, проширити опсег његове примјене.

Прочитајте више: