Reiknið útreikninga

Höfundur: Charles Brown
Sköpunardag: 8 Febrúar 2021
Uppfærsludagsetning: 1 Júlí 2024
Anonim
Reiknið útreikninga - Ráð
Reiknið útreikninga - Ráð

Efni.

A útlagi eða útlagi í tölfræði er gagnapunktur sem er verulega frábrugðinn öðrum gagnapunktum í úrtaki. Oft benda utangarðsfólk á misræmi eða villur í mælingum til tölfræðinga og eftir það geta þeir fjarlægt útúrsnúninginn úr gagnasafninu. Ef þeir kjósa í raun að fjarlægja frávikin úr gagnasafninu gæti það valdið verulegum breytingum á ályktunum sem dregnar voru úr rannsókninni. Þetta er ástæðan fyrir því að mikilvægt er að reikna út og ákvarða útreikninga ef þú vilt túlka tölfræðileg gögn rétt.

Að stíga

  1. Lærðu hvernig á að koma auga á mögulega afbrigði. Áður en við getum ákveðið hvort fjarlægja skuli frávik frá tilteknu gagnasafni verðum við auðvitað að bera kennsl á möguleg útúrsnúning í gagnasettinu. Almennt eru afbrigðilegar gagnapunktar sem víkja verulega frá þróuninni sem myndar önnur gildi í menginu - með öðrum orðum, þau skjóta út af hinum gildunum. Það er venjulega auðvelt að þekkja þetta í töflum og (sérstaklega) í myndritum. Ef gagnasafnið er myndritað sjónrænt, þá eru útlagarnir „langt“ frá öðrum gildum. Til dæmis, ef flestir punktar í gagnasafni mynda beina línu, verða útúrskarendur ekki í samræmi við þessa línu.
    • Lítum á gagnamengi sem sýnir hitastig 12 mismunandi hluta í herbergi. Ef hitastig 11 hlutanna sveiflast um nokkrar gráður í mesta lagi um 21 ° C, meðan einn hlutur, ofn, hefur hitastigið 150 ° C, sérðu í fljótu bragði að ofninn er líklega útúrsnúningur.
  2. Raða öllum gagnapunktum frá lægsta til hæsta. Fyrsta skrefið við útreikning á útreikningum er að finna miðgildið (eða miðgildið) gagnasafnsins. Þetta verkefni verður mun auðveldara ef gildin í menginu eru í röðinni frá lægsta til hæsta. Svo áður en þú heldur áfram, flokkaðu gildin í gagnapakkanum þínum svona.
    • Höldum áfram með dæmið hér að ofan. Hér er gagnasafnið okkar sem sýnir hitastig í gráðum Fahrenheit á mismunandi hlutum í herbergi: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Ef við flokkum gildin í menginu frá lægsta í hæsta verður þetta nýja mengið okkar: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. Reiknið miðgildi gagnasafnsins. Miðgildi gagnapakkans er gagnapunkturinn þar sem helmingur gagnanna er fyrir ofan hann og helmingur gagnanna er fyrir neðan það - það er í raun „miðja“ gagnapakkans. Ef gagnasafnið inniheldur stakan fjölda stiga er miðgildi auðvelt að finna - miðgildið er punkturinn með eins mörg stig að ofan og hér að neðan. Ef það er jafn fjöldi punkta, vegna þess að það er ekki ein miðja, verður þú að taka meðaltal miðpunktanna tveggja til að finna miðgildi. Þegar útreikningar eru reiknaðir er venjulega vísað til miðgildisins með breytunni Q2 - vegna þess að það liggur á milli Q1 og Q3, fyrsta og þriðja fjórðungsins. Við munum ákvarða þessar breytur síðar.
    • Ekki rugla saman við gagnasett með jafnan fjölda punkta - meðaltal tveggja miðpunkta er oft tala sem er ekki í gagnapakkanum sjálfum - þetta er í lagi. Hins vegar, ef miðjupunktarnir tveir eru eins, þá mun að meðaltali auðvitað líka vera þessi tala - líka þetta er allt í lagi.
    • Í dæminu okkar höfum við 12 stig. Miðju tvö hugtökin eru lið 6 og 7 - 70 og 71. Svo að miðgildi gagnasafnsins er meðaltal þessara tveggja punkta: ((70 + 71) / 2) =70,5.
  4. Reiknið fyrsta fjórðunginn. Þessi punktur, sem við táknum með breytunni Q1, er gagnapunkturinn þar sem 25 prósent (eða fjórðungur) athugana liggja. Með öðrum orðum, þetta er miðpunktur allra punkta í gagnasettinu þínu hér að neðan miðgildi. Ef jafnmörg gildi eru undir miðgildinu verður þú aftur að taka meðaltal tveggja miðgildanna til að finna Q1, eins og þú gætir hafa gert til að ákvarða miðgildi sjálfur.
    • Í dæminu okkar eru sex stig fyrir ofan miðgildi og sex stig fyrir neðan það. Svo til að finna fyrsta fjórðunginn verðum við að taka meðaltal tveggja miðpunkta í neðstu sex stigunum. Punktar 3 og 4 af sex neðstu sætunum eru báðir 70, þannig að meðaltal þeirra er ((70 + 70) / 2) =70. Þannig að gildi okkar fyrir Q1 er 70.
  5. Reiknið þriðja fjórðunginn. Þessi punktur, sem við táknum með breytunni Q3, er gagnapunkturinn sem 25 prósent gagnanna liggja yfir. Að finna Q3 er nánast það sama og að finna Q1, nema við erum að skoða stigin í þessu tilfelli hér að ofan miðgildi.
    • Höldum við áfram með dæmið hér að ofan sjáum við að tveir miðpunktar sex stiganna fyrir ofan miðgildi eru 71 og 72. Meðaltal þessara tveggja punkta er ((71 + 72) / 2) =71,5. Þannig að gildi okkar fyrir 3. ársfjórðung er 71,5.
  6. Finndu millisveitasviðið. Nú þegar við höfum ákvarðað Q1 og Q3 verðum við að reikna fjarlægðina milli þessara tveggja breytna. Þú getur fundið fjarlægðina milli Q1 og Q3 með því að draga Q1 frá Q3. Gildið sem þú færð fyrir millisveitasviðið skiptir sköpum til að ákvarða mörkin fyrir stig sem ekki eru frávik í gagnasafninu þínu.
    • Í dæminu okkar eru gildin fyrir Q1 og Q3 70 og 71,5. Til að finna millisvefnsviðið reiknum við Q3 - Q1: 71,5 - 70 =1,5.
    • Þetta virkar jafnvel þó að Q1, Q3 eða báðar tölurnar séu neikvæðar. Til dæmis, ef gildi okkar fyrir Q1 væri -70, þá væri millisveitasviðið 71,5 - (-70) = 141,5, sem er rétt.
  7. Finndu „Inner Limits“ gagnapakkans. Þú getur viðurkennt útrásarmenn með því að ákvarða hvort þeir falli innan fjölda tölulegra marka; hin svokölluðu „innri mörk“ og „ytri mörk“. Punktur sem fellur utan innri marka gagnapakkans er flokkaður sem einn vægt útúrsnúningur, og punktur utan ytri marka er flokkaður sem einn öfgafullur útúrsnúningur. Til að finna innri mörk gagnasafnsins, margfaldaðu fyrst millisveitasviðið með 1,5. Bæta niðurstöðunni við Q3 og draga hana frá Q1. Þessar tvær niðurstöður eru innri mörk gagnasafnsins.
    • Í dæminu okkar er millisveitasviðið (71,5 - 70), eða 1,5. Margfaldaðu þetta með 1,5 til að fá 2,25. Við bætum þessari tölu við Q3 og drögum hana frá Q1 til að finna innri mörkin sem hér segir:
      • 71,5 + 2,25=73,75
      • 70 - 2,25=67,75
      • Svo eru innri landamærin 67,75 og 73,75.
    • Í gagnasettinu okkar er aðeins ofnhiti - 300 gráður á Fahrenheit - utan þessa sviðs. Svo að þetta getur verið vægt útúrsnúningur. Við eigum hins vegar eftir að ákvarða hvort þetta hitastig er öfgafyllt, svo við skulum ekki draga ályktanir ennþá.
  8. Finndu „ytri mörk“ gagnapakkans. Þú gerir þetta á sama hátt og með innri mörkin, með þeim eina mun sem þú margfaldar fjarlægð milli fjórsiða með 3 í stað 1,5. Þú bætir síðan niðurstöðunni við Q3 og dregur frá Q1 til að finna ytri viðmiðunarmörkin.
    • Í dæminu okkar margföldum við fjarlægð milli fjórsiða með 3 til að fá (1,5 * 3) eða 4,5. Við getum nú fundið ytri mörkin á sama hátt og innri mörkin:
      • 71,5 + 4,5=76
      • 70 - 4,5=65,5
      • Svo ytri mörkin eru 65,5 og 76.
    • Gagnapunktar sem liggja utan ytri marka eru álitnir öfgafullir útúrsnúningar. Í dæminu okkar er ofnhitinn, 300 gráður á Fahrenheit, langt yfir ytri mörk. Svo ofnhitinn er vissulega öfgakenndur útúrsnúningur.
  9. Notaðu eigindlegt mat til að ákvarða hvort þú ættir að „henda út“ útlimum. Með ofangreindri aðferð er hægt að ákvarða hvort tilteknir punktar eru vægir afbrigðilegar, öfgafullir útúrsnúningar eða alls engir. En ekki gera mistök - að viðurkenna punkt sem útúrskarandi gerir það að einu frambjóðandi að fjarlægja úr gagnapakkanum og ekki strax punkt sem er fjarlægður verður breytast í. The ástæða af hverju frávik er frábrugðið restinni af punktunum í menginu skiptir sköpum við að ákvarða hvort fjarlægja eigi útlagið. Almennt eru afbrigði af völdum einhverrar villu - villa í mælingum, í upptökum eða tilraunahönnun, til dæmis - fjarlægð. Aftur á móti verða venjulega frávik sem ekki stafa af villum og afhjúpa nýjar, óútreiknaðar upplýsingar eða þróun ekki eytt.
    • Önnur viðmiðun sem þarf að hafa í huga er hvort útilokanir hafi áhrif á meðaltal gagnasafns á skekktan eða villandi hátt. Þetta er sérstaklega mikilvægt ef þú ætlar að draga ályktanir af meðaltali gagnasafnsins.
    • Dæmum dæmi okkar. Þar sem hæsta Það er ólíklegt að ofninn náði hitanum 300 ° F vegna einhvers ófyrirséðs náttúruafls, í dæmi okkar getum við ályktað með næstum 100% vissu að ofninn hafi verið kveiktur fyrir tilviljun og valdið óeðlilega miklum hitamælingum. Að auki, ef við fjarlægjum ekki útlagið, þá kemur meðaltal gagnasafnsins út á (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 ° F, meðan meðaltalið án útlaginn kemur út í (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 ° F.
      • Þar sem útlínan var af völdum mannlegra mistaka og vegna þess að það er rangt að segja að meðalherbergishitinn hafi verið nálægt 32 ° C, verðum við að velja að nota útlagið okkar. fjarlægja.
  10. Skilja mikilvægi þess að (stundum) halda jöfnum höndum. Þó að fjarlægja ætti einhverjir frávik úr gagnapakkanum vegna þess að þeir eru afleiðing af villum eða vegna þess að þeir skekkja niðurstöðurnar á villandi hátt, þá ætti að varðveita önnur afbrigði. Til dæmis, ef fráleitni hefur verið rétt náð (og því ekki afleiðing villu) og / eða ef útlaginn býður upp á nýja innsýn í fyrirbærið sem á að mæla, ætti ekki að fjarlægja það strax. Vísindalegar tilraunir eru sérstaklega viðkvæmar aðstæður þegar kemur að því að takast á við afbrigðileika - með því að fjarlægja óviðeigandi rangt getur það þýtt að henda mikilvægum upplýsingum um nýja þróun eða uppgötvun.
    • Ímyndaðu okkur til dæmis að við séum að hanna nýtt lyf til að láta fisk í fiskeldi stækka. Notum gamla gagnasafnið okkar ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), með mismuninum að hver punktur táknar nú massa fisksins (í grömmum ) eftir meðferð með öðru tilraunalyfi frá fæðingu. Með öðrum orðum, fyrsta lyfið gaf einum fiski 71 grömm, seinni gaf öðrum fiski 70 grömm o.s.frv. Í þessum aðstæðum, 300 ennþá risastórt útúrsnúningur en við ættum ekki að fjarlægja það núna. Vegna þess að ef við gefum okkur að útúrsnúningurinn sé ekki afleiðing villu, þá er það mikill árangur í tilraun okkar. Lyfið sem framleiddi 300 gramma fisk virkaði betur en nokkur önnur lyf, svo þetta er það flestir mikilvægur gagnapunktur í setti okkar, í stað þess síst mikilvægur gagnapunktur.

Ábendingar

  • Ef þú finnur afbrigði skaltu reyna að útskýra þau áður en þú fjarlægir þau úr gagnapakkanum; þau geta gefið til kynna mæliskekkjur eða frávik í dreifingunni.

Nauðsynjar

  • Reiknivél