Ақпарат

Квантильді түсіну: анықтамалары мен қолданылуы

Квантильді түсіну: анықтамалары мен қолданылуы

Медиана, бірінші квартиль және үшінші квартиль сияқты жиынтық статистика позицияны өлшеу болып табылады. Себебі, бұл сандар мәліметтерді үлестірудің белгілі бір бөлігі жатқан жерді көрсетеді. Мысалы, медиан - бұл зерттеліп жатқан деректердің орташа позициясы. Деректердің жартысында медианнан аз мән бар. Сол сияқты, мәліметтердің 25% -ы бірінші квартильге қарағанда аз мәнге ие, ал деректердің 75% -ы үшінші квартильге қарағанда аз мәнге ие.

Бұл тұжырымдаманы жалпылауға болады. Мұны істеудің бір тәсілі - процентильдерді қарастыру. 90-шы процентилль деректердің 90% -ында осы саннан аз мәндер болатын нүктені көрсетеді. Жалпы алғанда, бмың пайыз - бұл сан n ол үшін б% деректер аз n.

Үздіксіз кездейсоқ шамалар

Орташа, бірінші квартильдік және үшінші квартильдік тапсырыс статистикасы әдетте белгілі бір мәліметтер жиынтығы бар жерде енгізілгенімен, бұл статистиканы кездейсоқ шамалар үшін де анықтауға болады. Біз үздіксіз таратумен жұмыс істейтіндіктен интегралды қолданамыз. The бмың пайыз - бұл сан n мысалы:

-₶n е ( х ) dx = б/100.

Мұнда е ( х ) ықтималдық тығыздығының функциясы. Осылайша, біз үнемі бөлу үшін қалаған кез-келген пайызды ала аламыз.

Квантильдер

Бұдан әрі жалпылау - бұл тапсырыс статистикасы біз жұмыс істейтін дистрибуцияны бөлу болып табылады. Медиана мәліметтерді жартыға бөледі, ал үздіксіз үлестірімнің медианасы немесе 50-ші процентилясы бөлу көлемін аудан бойынша жартысына бөледі. Бірінші квартильдік, медианалық және үшінші квартильдік мәліметтер біздің әрқайсымыз бірдей есептелген төрт бөлікке бөледі. Жоғарыда келтірілген интегралды 25-ші, 50-ші және 75-ші процентильді алу үшін қолдана аламыз және үздіксіз үлестірімді төрт аймаққа тең бөлікке бөлеміз.

Бұл процедураны жалпылауға болады. Біз бастай алатын сұраққа натурал сан беріледі n, айнымалыны бөлуді қалай бөлуге болады? n бірдей өлшемді бөліктерді? Бұл тікелей квантилар идеясына қатысты.

The n Деректер жиынтығы үшін кванильдер шамамен деректерді ретке келтіріп, содан кейін осы ранжирлеу арқылы табылады n - интервал бойынша 1 бірдей нүкте.

Егер бізде кездейсоқ шаманың ықтималдық тығыздығы функциясы болса, квантильдерді табу үшін жоғарыдағы интегралды қолданамыз. Үшін n квантильдер, біз қалаймыз:

  • Бірінші болып 1 /n сол жаққа таралу аймағының
  • Екінші - 2 /n сол жаққа таралу аймағының
  • The рболуы керек р/n сол жаққа таралу аймағының
  • Соңғысы (n - 1)/n сол жаққа таралу аймағының

Мұны кез келген натурал сан үшін көреміз n, n кванттар 100-ге сәйкес келедір/nмың пайыз, қайда р 1-ден кез-келген натурал сан болуы мүмкін n - 1.

Жалпы квантилар

Белгілі бір атауларға ие болу үшін кванттардың белгілі бір түрлері жиі қолданылады. Төменде мыналардың тізімі берілген:

  • 2 квадраты медиан деп аталады
  • 3 квантты териллес деп атайды
  • 4 квантты квартильдер деп атайды
  • 5 квантиль квантиль деп аталады
  • 6 квантиль сектиль деп аталады
  • 7 квантильді септилдер деп атайды
  • 8 квантильді деп аталады октильдер
  • 10 квантты декильдер деп атайды
  • 12 квантильді қосарланған деп атайды
  • 20 квантильді вигилтил деп атайды
  • 100 квантильді процессор деп атайды
  • 1000 квантты пермилль деп атайды

Әрине, басқа квантилдар жоғарыда көрсетілгендерден тыс бар. Пайдаланылған нақты кванттың үлгіні үздіксіз үлестіру мөлшерінен бірнеше рет сәйкес келеді.

Квантильдерді қолдану

Деректер жиынтығының позициясын көрсетумен қатар, квиляция басқа жолдармен де пайдалы. Бізде популяциядан қарапайым кездейсоқ таңдау бар делік, ал популяцияның таралуы белгісіз. Қалыпты үлестіру немесе Weibull үлестірімі сияқты модель біз таңдаған популяцияға сәйкес келетін-келмейтінін анықтауға көмектесу үшін, біз мәліметтеріміздің квантиліне және моделіне қарай аламыз.

Үлгілі деректердің квантилдерін белгілі бір ықтималдылықтың бөлінуінен квантильдерге сәйкестендіру нәтижесінде нәтиже жұптастырылған мәліметтер жиынтығы болып табылады. Біз бұл деректерді квантилді-кванттық сюжет немесе q-q сюжеті деп аталатын шашыратқышта орналастырамыз. Егер алынған шашыраңқы сызық сызықты болса, онда модель біздің деректерімізге жақсы сәйкес келеді.