محاسبه خط چگالی توزیع

ساخت وبلاگ

متغیر کمی ، ص. 3

اکنون ما یک کیت از ابزارهای گرافیکی و عددی برای توصیف توزیع ها داریم. علاوه بر این ، ما یک استراتژی روشنی برای کاوش داده ها در مورد یک متغیر کمی واحد داریم:

  1. همیشه داده های خود را ترسیم کنید: یک نمودار ، معمولاً یک هیستوگرام یا stemplot درست کنید.
  2. به دنبال الگوی کلی (شکل ، مرکز ، گسترش) و انحراف چشمگیر مانند Outliers باشید.
  3. یک خلاصه عددی را برای توصیف خلاصه مرکز و گسترش محاسبه کنید.

در اینجا یک قدم دیگر برای افزودن به این استراتژی وجود دارد:

  1. بعضی اوقات الگوی کلی تعداد زیادی از مشاهدات به حدی منظم است که می توانیم آن را با یک منحنی صاف توصیف کنیم.

مدل ریاضی

منحنی چگالی یک مدل ریاضی برای توزیع یک متغیر کمی است. مدل های ریاضی توضیحات ایده آل هستند. آنها به ما این امکان را می دهند که به راحتی اظهارات زیادی را در دنیای ایده آل بیان کنیم. اظهارات زمانی مفید است که دنیای ایده آل شبیه به دنیای واقعی باشد. منحنی های چگالی که ما مطالعه می کنیم تصویری جمع و جور از الگوی کلی داده ها را نشان می دهد. آنها بی نظمی های جزئی و همچنین Outliers را نادیده می گیرند. برای برخی از شرایط ، ما قادر به ضبط تمام خصوصیات اساسی توزیع با منحنی چگالی هستیم. برای سایر شرایط ، مدل ایده آل ما برخی از خصوصیات مهم را از دست می دهد. همانطور که در مورد بسیاری از موارد در آمار ، قضاوت دقیق شما برای تصمیم گیری در مورد آنچه مهم است و چقدر نزدیک به اندازه کافی خوب است ، لازم است.

مثال 1. 28 راندمان سوخت

image

شکل 1. 17 یک هیستوگرام از راندمان سوخت است که به عنوان مایل در گالن (MPG) برای رانندگی در بزرگراه بیان شده است ، برای 1067 وسیله نقلیه موتوری (سال مدل 2014) گزارش شده توسط منابع طبیعی کانادا. 25 قرار داده شده در هیستوگرام یک منحنی چگالی است. هیستوگرام نشان می دهد که چند وسیله نقلیه با راندمان سوخت بسیار خوب وجود دارد. اینها در توزیع بسیار زیاد هستند. این توزیع تا حدودی به سمت راست است ، و این نشان دهنده تلاش های موفقیت آمیز صنعت خودرو برای تولید وسایل نقلیه با سوخت بالا است. مرکز توزیع حدود 38 مگاپیکسل است. یک قله واحد وجود دارد ، و هر دو دم کاملاً هموار می افتند. منحنی چگالی در شکل 1. 17 متناسب با توزیع توصیف شده توسط هیستوگرام نسبتاً خوب است.

برخی از این وسایل نقلیه در مثال ما برای ارائه راندمان عالی سوخت طراحی شده اند. یک کمپین بازاریابی مبتنی بر این عملکرد برجسته می تواند برای فروش وسایل نقلیه در اقتصاد با قیمت بالا سوخت بسیار مؤثر باشد. در مورد نحوه برخورد با Outliers مراقب باشید. آنها ممکن است خطاهای داده باشند یا ممکن است مهمترین ویژگی توزیع باشند. نرم افزار رایانه نمی تواند این قضاوت را انجام دهد. فقط شما می توانید.

image

شکل 1. 18: شکل 1. 17 هیستوگرام راندمان سوخت بزرگراه در مایل در گالن برای وسایل نقلیه مدل 2014 ، مثال 1. 28.

در اینجا چند جزئیات در مورد منحنی چگالی آورده شده است. ما برای درک بقیه این فصل به این ایده های اساسی احتیاج داریم.

منحنی چگالی منحنی است که

  • همیشه در محور افقی یا بالاتر از آن است
  • مساحت دقیقاً 1 در زیر آن وجود دارد.

یک منحنی چگالی الگوی کلی توزیع را توصیف می کند. منطقه زیر منحنی و بالاتر از هر طیف وسیعی از مقادیر ، نسبت تمام مشاهداتی است که در آن محدوده قرار می گیرند.

میانگین و میانگین منحنی چگالی

اقدامات مرکز و گسترش ما در مورد منحنی های چگالی و همچنین مجموعه های واقعی مشاهدات اعمال می شود. میانه و کوارتل ها آسان هستند. مناطقی که تحت یک منحنی چگالی قرار دارند ، نسبت هایی از تعداد کل مشاهدات را نشان می دهد. میانه نقطه ای با نیمی از مشاهدات در هر طرف است. بنابراین میانه منحنی چگالی نقطه مساوی با منطقه است-نقطه ای با نیمی از مساحت زیر منحنی سمت چپ آن و نیمی از باقی مانده منطقه در سمت راست آن. کوارتل ها منطقه را زیر منحنی به چهارم تقسیم می کنند. یک چهارم منطقه زیر منحنی در سمت چپ کوارتیل اول قرار دارد و سه چهارم منطقه در سمت چپ کوارتیل سوم قرار دارد. تقریباً می توانید با تقسیم ناحیه زیر منحنی به چهار قسمت مساوی ، میانگین و کوارتل های هر منحنی چگالی را با چشم قرار دهید.

مثال 1. 29 منحنی چگالی متقارن

از آنجا که منحنی های چگالی الگوهای ایده آل هستند ، یک منحنی چگالی متقارن دقیقاً متقارن است. بنابراین ، یک منحنی چگالی متقارن ، بنابراین ، در مرکز آن است. شکل 1. 18 (a) میانگین منحنی متقارن را نشان می دهد.

image

اوضاع برای منحنی های چگالی کمرنگ متفاوت است. به عنوان مثال.

به عنوان مثال 1. 30 منحنی چگالی چسبان

این بسیار آسان نیست که نقطه مساحت مساوی را روی یک منحنی چسبان مشاهده کنید. روشهای ریاضی برای یافتن مدی برای هر منحنی چگالی وجود دارد. ما این کار را انجام دادیم تا در شکل 1. 18 (ب) مدیان را روی منحنی skewed علامت گذاری کنیم.

image

دانش خود را اعمال کنید

سوال 1. 70

1. 70 یک منحنی پر پیچ و خم دیگر.

منحنی مشابه شکل 1. 18(b) را برای منحنی چگالی به سمت چپ ترسیم کنید. حتما محل میانگین و میانه را علامت بزنید.

در مورد میانگین چطور؟میانگین مجموعه ای از مشاهدات، میانگین حسابی آن است. اگر مشاهدات را به عنوان وزنه هایی در امتداد یک میله نازک در نظر بگیریم، میانگین نقطه ای است که میله در آن تعادل برقرار می کند. این واقعیت در مورد منحنی های چگالی نیز صادق است. میانگین نقطه ای است که در آن منحنی متعادل می شود اگر از مواد جامد ساخته شود.

مثال 1. 31 میانگین و میانه

شکل 1. 19 این واقعیت را در مورد میانگین نشان می دهد. یک منحنی متقارن در مرکز آن تعادل برقرار می کند زیرا دو طرف یکسان هستند. میانگین و میانه منحنی چگالی متقارن مانند شکل 1. 18(a) برابر است. می دانیم که میانگین توزیع اریب به سمت دم بلند کشیده می شود. شکل 1. 18(b) نشان می دهد که چگونه میانگین منحنی چگالی اریب بیشتر از حد وسط به سمت دم بلند کشیده می شود. تعیین نقطه تعادل با چشم روی یک منحنی کج دشوار است. روش های ریاضی برای محاسبه میانگین برای هر منحنی چگالی وجود دارد، بنابراین می توانیم میانگین و همچنین میانه را در شکل 1. 18(b) علامت گذاری کنیم.

image

میانه و میانگین منحنی چگالی

میانه منحنی چگالی نقطه مساحت مساوی است، نقطه ای که ناحیه زیر منحنی را به نصف تقسیم می کند.

میانگین منحنی چگالی نقطه تعادلی است که در آن منحنی اگر از ماده جامد ساخته شده باشد متعادل می شود.

میانه و میانگین برای منحنی چگالی متقارن یکسان هستند. هر دو در مرکز منحنی قرار دارند. میانگین یک منحنی اریب در جهت دم بلند از میانه دور می شود.

ما تقریباً می توانیم میانگین، میانه و چارک هر منحنی چگالی را با چشم تعیین کنیم. این در مورد انحراف معیار صادق نیست. در صورت لزوم، می‌توانیم یک بار دیگر از ریاضیات پیشرفته‌تر استفاده کنیم تا ارزش انحراف معیار را بیاموزیم. مطالعه روش های ریاضی برای انجام محاسبات با منحنی چگالی بخشی از آمار نظری است. اگرچه ما بر روی تمرین آماری تمرکز می کنیم، اما اغلب از نتایج مطالعات ریاضی استفاده می کنیم.

از آنجا که منحنی چگالی یک توصیف ایده آل از توزیع داده ها است، ما باید بین میانگین و انحراف استاندارد منحنی چگالی و میانگین و انحراف استاندارد محاسبه شده از مشاهدات واقعی تمایز قائل شویم. نماد معمولی برای میانگین توزیع ایده آل شده (حرف یونانی mu) است. انحراف معیار منحنی چگالی را به صورت (حرف یونانی سیگما) می نویسیم.

منظور داشتن

انحراف معیار

دانش خود را اعمال کنید

سوال 1. 71

1. 71 منحنی متقارن.

منحنی چگالی را که متقارن است اما شکلی متفاوت از منحنی در شکل 1. 18 (a) (صفحه 40) دارد.

سوال 1. 72

1. 72 توزیع یکنواخت.

شکل 1. 20 منحنی چگالی توزیع یکنواخت را نشان می دهد. منحنی مقدار ثابت 1 را بیش از فاصله از 0 تا 1 می گیرد و در خارج از آن محدوده مقادیر 0 است. این بدان معنی است که داده های توصیف شده توسط این توزیع مقادیر را به طور یکنواخت بین 0 تا 1 پخش می کنند. از مناطقی تحت این منحنی چگالی برای پاسخ به سؤالات زیر استفاده کنید.

توزیع یکنواخت

  1. چه درصد از مشاهدات بالاتر از 0. 7 است؟
  2. چه درصد از مشاهدات زیر 0. 4 قرار دارد؟
  3. چه درصد از مشاهدات بین 0. 45 تا 0. 70 است؟
  4. چرا مساحت کل زیر این منحنی برابر با 1 است؟
  5. میانگین این توزیع چیست؟

image

image

سوال 1. 73

1. 73 سه منحنی.

شکل 1. 21 سه منحنی چگالی را نشان می دهد که هر یک با سه نقطه مشخص شده است. در کدام یک از این نقاط در هر منحنی میانگین و میانگین سقوط می کنند؟

(الف) میانگین در نقطه C است ، میانه در نقطه B. (ب) میانگین و میانگین هر دو در نقطه A. (ج) میانگین در نقطه A است ، میانه در نقطه B است.

یک کلاس مهم از منحنی های چگالی در حال حاضر در شکل 1. 18 (a) ظاهر شده است. این منحنی های چگالی متقارن ، تک قضیه و زنگ شکل هستند. به آنها منحنی های عادی گفته می شود و توزیع های عادی را توصیف می کنند. تمام توزیع های عادی شکل کلی یکسان دارند. منحنی چگالی دقیق برای یک توزیع طبیعی خاص با ارائه میانگین و انحراف استاندارد آن شرح داده شده است. میانگین در مرکز منحنی متقارن واقع شده و همان میانه است. تغییر بدون تغییر ، منحنی طبیعی را در امتداد محور افقی بدون تغییر گسترش آن حرکت می دهد. انحراف استاندارد گسترش یک منحنی طبیعی را کنترل می کند. شکل 1. 22 دو منحنی طبیعی با مقادیر مختلف را نشان می دهد. منحنی با انحراف استاندارد بزرگتر بیشتر پخش می شود.

توزیع عادی

انحراف استاندارد اندازه گیری طبیعی گسترش برای توزیع های عادی است. نه تنها شکل یک منحنی طبیعی را انجام داده و کاملاً تعیین کنید ، بلکه می توانیم با چشم روی منحنی قرار بگیریم. در اینجا چگونه استتصور کنید که شما در حال اسکی کوهی هستید که شکل یک منحنی معمولی را دارد. در ابتدا ، با بیرون رفتن از قله ، با زاویه ای همیشه تندتر فرود می آیید:

image

نقاطی که این تغییر انحنا در آنها اتفاق می افتد در امتداد محور افقی در فاصله دو طرف میانگین قرار دارند. به یاد داشته باشید که و به تنهایی شکل اکثر توزیع ها را مشخص نمی کند و شکل منحنی های چگالی را به طور کلی آشکار نمی کند. اینها ویژگی های ویژه توزیع های عادی هستند.

image

image

چرا توزیع های نرمال در آمار مهم هستند؟در اینجا سه دلیل وجود دارد. اولاً، توزیع‌های عادی توصیف خوبی برای برخی از توزیع‌های داده‌های واقعی هستند. توزیع هایی که اغلب نزدیک به نرمال هستند شامل نمرات تست های انجام شده توسط بسیاری از افراد (مانند آزمون های GMAT)، اندازه گیری های دقیق مکرر از همان مقدار (مانند اندازه گیری های گرفته شده از فرآیند تولید) و ویژگی های جمعیت های بیولوژیکی (مانند بازدهذرت). دوم، توزیع‌های نرمال، تقریب‌های خوبی برای نتایج بسیاری از پیامدهای شانسی هستند، مانند پرتاب کردن چندین بار یک سکه. سومین و مهم‌تر از همه، بسیاری از روش‌های استنتاج آماری که در فصل‌های بعدی مطالعه می‌کنیم بر اساس توزیع‌های نرمال هستند.

قانون 68-95-99. 7

اگرچه منحنی های نرمال زیادی وجود دارد، اما همه آنها ویژگی های مشترکی دارند. به ویژه، همه توزیع‌های Normal از قانون زیر پیروی می‌کنند.

قانون 68-95-99. 7

در توزیع نرمال با میانگین و انحراف معیار:

  • 68 درصد مشاهدات در حد میانگین قرار دارند.
  • 95 درصد از مشاهدات در محدوده .
  • 99. 7 درصد از مشاهدات در محدوده .

شکل 1. 23 قانون 68-95-99. 7 را نشان می دهد. با به خاطر سپردن این سه عدد، می توانید بدون انجام محاسبات دقیق، به توزیع های عادی فکر کنید.

مثال 1. 32 با استفاده از قانون 68-95-99. 7

image

توزیع وزن کیسه های 9 اونسی یک مارک خاص چیپس سیب زمینی تقریباً عادی با اونس میانگین و انحراف استاندارد است. شکل 1. 24 نشان می دهد که قانون 68-95-99. 7 در مورد این توزیع چه می گوید.

image

شکل 1. 26: شکل 1. 24 قانون 68-95-99. 7 برای توزیع وزن کیسه های چیپس سیب زمینی اعمال می شود، مثال 1. 32.

دو انحراف استاندارد برای این توزیع 0. 3 اونس است. بخش 95 قانون 68-95-99. 7 می گوید که 95 درصد وسط کیسه های 9 اونس بین و اونس وزن دارند، یعنی بین 8. 82 اونس تا 9. 42 اونس. این واقعیت دقیقاً برای یک توزیع کاملاً عادی صادق است. این تقریباً برای وزن کیسه های 9 اونس چیپس درست است زیرا توزیع این وزن ها تقریباً نرمال است.

5 ٪ دیگر کیسه ها دارای وزن خارج از 8. 82 تا 9. 42 اونس هستند. از آنجا که توزیع های عادی متقارن هستند ، نیمی از این کیسه ها در سمت سنگین قرار دارند. بنابراین سنگین ترین 2. 5 ٪ از کیسه های 9 اونس سنگین تر از 9. 42 اونس است.

بخش 99. 7 از قانون 68-95-99. 7 می گوید که تقریباً تمام کیسه ها (7. 7 ٪ از آنها) دارای وزن بین و هستند. این محدوده وزن 8. 67 تا 9. 57 اونس است.

از آنجا که ما اغلب به توزیع های عادی اشاره خواهیم کرد ، یک علامت کوتاه مفید است. ما توزیع عادی را با میانگین و انحراف استاندارد به هم می آوریم. به عنوان مثال ، توزیع وزن در مثال قبلی است.

دانش خود را اعمال کنید

سوال 1. 74

1. 74 ارتفاع مردان جوان.

طراحان محصول اغلب باید ویژگی های فیزیکی جمعیت هدف خود را در نظر بگیرند. به عنوان مثال ، توزیع ارتفاعات مردان 20 تا 29 ساله تقریباً با میانگین 69 اینچ و انحراف استاندارد 2. 5 اینچ طبیعی است. یک منحنی طبیعی بکشید که این میانگین و انحراف استاندارد به درستی قرار دارد.(اشاره: ابتدا منحنی را بکشید ، نقاطی را پیدا کنید که انحنای آن تغییر کند ، سپس محور افقی را علامت گذاری کنید.)

سوال 1. 75

1. 75 مورد دیگر در مورد ارتفاعات مردان جوان.

توزیع ارتفاعات مردان جوان تقریباً طبیعی است با میانگین 69 اینچ و انحراف استاندارد 2. 5 اینچ. برای پاسخ به سؤالات زیر از قانون 68-95-99. 7 استفاده کنید.

  1. چه درصد از این مردان از 74 اینچ بلندتر هستند؟
  2. بین چه ارتفاعی 95 ٪ از مردان جوان سقوط می کنند؟
  3. چه درصد از مردان جوان کوتاهتر از 66. 5 اینچ هستند؟

(الف) 2. 5 ٪.(ب) بین 64 تا 74 اینچ.(ج) 16 ٪.

سوال 1. 76

1. 76 نمرات آزمون.

بسیاری از ایالت ها برنامه هایی برای ارزیابی مهارت های دانش آموزان در نمرات مختلف دارند. آزمایش در سراسر کشور ایندیانا برای پیشرفت آموزشی (ISTEP) یکی از این برنامه ها است. 26 در سال اخیر 76،531 ، دانشجویان کلاس دهم ایندیانا امتحان هنرهای انگلیسی/زبان را گرفتند. میانگین نمره 572 و انحراف استاندارد 51 نفر بود. با فرض اینکه این نمرات تقریباً به طور عادی توزیع شده اند ، از قانون 68-95-99. 7 استفاده کنید تا طیف وسیعی از نمرات را ارائه دهید که شامل 95 ٪ از این دانش آموزان است.

سوال 1. 77

1. 77 از قانون 68-95-99. 7 استفاده کنید.

به تمرین قبلی مراجعه کنید. از قانون 68-95-99. 7 استفاده کنید تا طیف وسیعی از نمرات را ارائه دهید که شامل 99. 7 ٪ از این دانشجویان است.

99. 7 ٪ از دانش آموزان نمرات بین 419 تا 725 دارند.

توزیع عادی استاندارد

همانطور که قانون 68-95-99. 7 نشان می دهد ، کلیه توزیع های عادی بسیاری از خصوصیات مشترک را به اشتراک می گذارند. در حقیقت ، اگر در واحدهای با اندازه در مورد میانگین مرکز اندازه گیری کنیم ، تمام توزیع های عادی یکسان هستند. تغییر در این واحدها استاندارد سازی نامیده می شود. برای استاندارد سازی یک مقدار ، میانگین توزیع را کم کنید و سپس با انحراف استاندارد تقسیم کنید.

استاندارد و-ساکرها

اگر مشاهده ای از توزیع است که دارای انحراف متوسط و استاندارد است ، مقدار استاندارد IS است

یک مقدار استاندارد اغلب به عنوا ن-صفحه نامیده می شود.

A-score به ما می گوید که مشاهده اصلی چند انحراف استاندارد از میانگین دور می شود و در کدام جهت قرار می گیرد. مشاهدات بزرگتر از میانگین در هنگام استاندارد بودن مثبت هستند و مشاهدات کوچکتر از میانگین در هنگام استاندارد بودن منفی هستند.

مثال 1. 33 استاندارد کردن وزن کیسه های تراشه سیب زمینی

وزن کیسه های تراشه سیب زمینی 9 اونس تقریباً با اونس و اونس طبیعی است. وزن استاندارد است

وزن استاندارد کیسه تعداد انحرافات استاندارد است که وزن آن با میانگین وزن همه کیسه ها متفاوت است. به عنوان مثال ، یک کیسه با وزن 9. 3 اونس دارای وزن استاندارد است

یا 1. 2 انحراف استاندارد بالاتر از میانگین. به همین ترتیب ، یک کیسه با وزن 8. 7 اونس دارای وزن استاندارد است

یا 2. 8 انحراف استاندارد زیر وزن متوسط کیسه.

اگر متغیری که ما استاندارد می کنیم توزیع عادی داشته باشد ، استاندارد سازی بیشتر از ارائه مقیاس مشترک است. این همه توزیع های عادی را به یک توزیع واحد تبدیل می کند و این توزیع هنوز طبیعی است. استاندارد سازی یک متغیر که هر توزیع عادی دارد ، متغیر جدیدی را تولید می کند که دارای توزیع عادی استاندارد است.

image

شکل 1. 27: شکل 1. 25 نسبت تجمعی برای یک مقدار نسبت کلیه مشاهدات از توزیع که کمتر از یا مساوی است. این منطقه سمت چپ زیر منحنی طبیعی است.

توزیع عادی استاندارد

توزیع عادی استاندارد توزیع عادی با میانگین 0 و انحراف استاندارد 1 است.

اگر یک متغیر دارای توزیع عادی با میانگین و انحراف استاندارد باشد ، متغیر استاندارد شده

توزیع عادی استاندارد دارد.

دانش خود را اعمال کنید

سوال 1. 78

1. 78 SAT در مقابل عمل.

امیلی در قسمت ریاضیات SAT 650 به ثمر می رساند. توزیع نمرات SAT در یک جمعیت مرجع طبیعی است ، با میانگین 500 و انحراف استاندارد 100. مایکل آزمون ریاضیات آزمون کالج آمریکایی (ACT) را می گیرد و نمرات 28. نمرات ACT به طور معمول با میانگین 18 و انحراف استاندارد توزیع می شود. نمرات استاندارد برای هر دو دانش آموز. با فرض اینکه هر دو آزمون همان توانایی را اندازه گیری می کنند ، چه کسی نمره بالاتری دارد؟

محاسبات توزیع عادی

مناطقی که تحت یک منحنی طبیعی قرار دارند ، نسبت هایی از مشاهدات از آن توزیع عادی را نشان می دهد. هیچ فرمول آسانی برای مناطقی که تحت یک منحنی عادی قرار دارند وجود ندارد. برای یافتن زمینه های مورد علاقه ، یا از نرم افزاری که مناطق را محاسبه می کند یا می توان از جدول مناطق استفاده کرد. جدول و بیشتر نرم افزار یک نوع منطقه را محاسبه می کند: نسبت های تجمعی. نسبت تجمعی نسبت مشاهدات در توزیع است که در یک مقدار مشخص یا زیر آن قرار دارد. هنگامی که توزیع توسط یک منحنی چگالی داده می شود ، نسبت تجمعی ناحیه زیر منحنی سمت چپ یک مقدار معین است. شکل 1. 25 ایده را واضح تر از کلمات نشان می دهد.

نسبت تجمعی

نکته اصلی محاسبه نسبت های طبیعی ، مطابقت با منطقه مورد نظر شما با مناطقی است که نشان دهنده نسبت های تجمعی است. سپس مناطقی را برای نسبت های تجمعی بدست آورید. مثالهای زیر روشها را نشان می دهد.

مثال 1. 34 استاندارد NCAA برای نمرات SAT

انجمن ملی دو و میدانی دانشگاهی (NCAA) به ورزشکاران بخش I نیاز دارد تا حداقل 820 را در ریاضیات SAT و تست های کلامی کسب کنند تا در سال اول دانشگاه خود به رقابت بپردازند.(نمرات بالاتر برای دانش آموزان با نمرات ضعیف دبیرستان لازم است.) نمرات 1. 4 میلیون دانش آموز که SAT را در دست گرفتند با میانگین 1026 و انحراف استاندارد 209 تقریباً طبیعی بودند. چه نسبت از همه دانش آموزان حداقل 820 نمره SAT داشته اند؟

در اینجا محاسبه در تصاویر آمده است: نسبت نمرات بالاتر از 820 منطقه زیر منحنی سمت راست 820 است. این مساحت کل در زیر منحنی (که همیشه 1 است) منهای نسبت تجمعی تا 820 است.

image

یعنی نسبت کلیه افراد SAT که مقدماتی NCAA هستند 0. 8379 یا حدود 84 ٪ است.

هیچ منطقه ای تحت یک منحنی صاف و دقیقاً بیش از نقطه 820 وجود ندارد. در نتیجه ، منطقه در سمت راست 820 (نسبت نمرات) همان منطقه در سمت راست این نقطه است (نسبت نمرات)بشرداده های واقعی ممکن است حاوی دانشجویی باشد که دقیقاً 820 را در SAT به دست آورد. اینکه نسبت نمرات دقیقاً برابر با 820 برای توزیع عادی 0 است ، نتیجه ای از هموار سازی ایده آل توزیع های عادی برای داده ها است.

مثال 1. 35 صلاحیت های جزئی NCAA

NCAA دانش آموز را "صلاحیت جزئی" می داند - واجد شرایط برای تمرین و دریافت بورس تحصیلی ورزشی ، اما رقابت نمی کند - اگر نمره SAT ترکیبی حداقل 720 باشد. یعنی چه نسبت بین 720 تا 820 نمرات دارد؟در اینجا تصاویر وجود دارد:

image

حدود 9 ٪ از کل دانش آموزانی که SAT را می گیرند ، بین 720 تا 820 امتیاز دارند.

چگونه می توانیم مقادیر عددی مناطق را در مثالهای 1. 34 و 1. 35 پیدا کنیم؟اگر از نرم افزار استفاده می کنید ، کافی است میانگین 1026 و انحراف استاندارد 209 را وصل کنید. سپس نسبت های تجمعی را برای 820 و برای 720 بخواهید. (احتمالاً نرم افزار شما از اینها به عنوان "احتمالات تجمعی" یاد می کند. به احتمال زیاد متناسب است.) اگر طرح منطقه مورد نظر خود را بسازید ، به ندرت اشتباه خواهید کرد.

برای یافتن نسبت های طبیعی می توانید از اپلت منحنی معمولی در وب سایت متن استفاده کنید. اپلت از بیشتر نرم افزار انعطاف پذیرتر است - هر نسبت عادی و نه فقط نسبت های تجمعی را پیدا می کند. اپلت یک روش عالی برای درک منحنی های طبیعی است. اما ، به دلیل محدودیت مرورگرهای وب ، اپلت به اندازه نرم افزار آماری دقیق نیست.

اگر از نرم افزار استفاده نمی کنید ، می توانید نسبت های تجمعی را برای منحنی های عادی از یک جدول پیدا کنید. همانطور که اکنون توضیح می دهیم ، این یک قدم اضافی است.

با استفاده از جدول عادی استاندارد

گام اضافی در یافتن نسبت های تجمعی از یک جدول این است که ما ابتدا باید استاندارد کنیم تا مشکل را در مقیاس استاندار د-scores بیان کنیم. این به ما اجازه می دهد تا فقط با یک جدول ، یک جدول از نسبت های تجمعی عادی استاندارد را بدست آوریم. جدول A در پشت کتاب نسبت های تجمعی برای توزیع عادی استاندارد ارائه می دهد. جدول A همچنین روی پوشش جلوی داخل ظاهر می شود. تصاویر در بالای جدول به ما یادآوری می کند که ورودی ها نسبت های تجمعی ، مناطقی زیر منحنی سمت چپ یک مقدار هستند.

مثال 1. 36 نسبت z را پیدا کنید

چه نسبت مشاهدات در مورد متغیر عادی استاندارد مقادیر کمتر از آن را می گیرد؟

برای یافتن منطقه سمت چپ 1. 47 ، 1. 4 را در ستون سمت چپ جدول A پیدا کنید ، سپس رقم باقیمانده 7 را به عنوان 0. 07 در ردیف بالا قرار دهید. ورودی مقابل 1. 4 و زیر 0. 07 0. 9292 است. این نسبت تجمعی است که ما به دنبال آن هستیم. شکل 1. 26 این منطقه را نشان می دهد.

image

شکل 1. 28: شکل 1. 26 ناحیه زیر منحنی معمولی استاندارد در سمت چپ نقطه 0. 9292 است ، به عنوان مثال 1. 36.

اکنون که می بینید چگونه جدول A کار می کند ، اجازه دهید نمونه های NCAA 1. 34 و 1. 35 را با استفاده از جدول دوباره تنظیم کنیم.

مثال 1. 37 نسبت x را پیدا کنید

چه نسبت از دانش آموزانی که SAT را می گیرند حداقل 820 امتیاز دارند؟تصویری که منجر به پاسخ می شود دقیقاً مشابه در مثال 1. 34 است (صفحات 46 - 47). مرحله اضافی این است که ما ابتدا به منظور خواندن نسبت های تجمعی از جدول A ، استاندارد می شویم. اگر نمره SAT باشد ، ما می خواهیم نسبت دانش آموزانی که برای آنها وجود دارد.

مرحله 1. استاندارد سازیمیانگین را کم کنید ، سپس بر اساس انحراف استاندارد تقسیم کنید تا مشکل در مورد یک مشکل در مورد یک Z معمولی استاندارد را تبدیل کنید:

گام 2 . از جدول استفاده کنید. به تصاویر در مثال 1. 34 نگاه کنید. از جدول A ، می بینیم که نسبت مشاهدات کمتر ا ز-0. 99 0. 1611 است. بنابراین ، منطقه در سمت راس ت-0. 99 است. این حدود 84 ٪ است.

منطقه از جدول در مثال 1. 37 (0. 8389) کمی دقیق تر از منطقه از نرم افزار در مثال 1. 34 (0. 8379) است زیرا وقتی از جدول A استفاده می کنیم باید به دو مکان دور شویم. تفاوت در عمل به ندرت مهم است.

مثال 1. 38 نسبت مقدماتی جزئی

چه نسبت از همه دانش آموزانی که SAT را می گیرند ، می توانند از نظر NCAA صعودهای جزئی باشند؟یعنی چه نسبت دانش آموزان بین 720 تا 820 نمرات SAT دارند؟ابتدا مناطق را دقیقاً مانند مثال 1. 35 ترسیم کنید. ما دوباره به عنوان کوتاه برای نمره SAT استفاده می کنیم.

مرحله 1. استاندارد سازی.

مرحله 2. از جدول استفاده کنید.

همانطور که در مثال 1. 35 ، حدود 9 ٪ دانش آموزان مقدماتی جزئی هستند.

بعضی اوقات با مقدار شدیدتر از کسانی که در جدول A ظاهر می شوند روبرو می شویم. به عنوان مثال ، منطقه سمت چپ مستقیم در جدول آورده نشده است. مقادیر موجود در جدول A فقط مساحت 0. 0002 را در هر دم بدون حساب برای آن مرخصی می دهد. برای اهداف عملی ، می توانیم طوری عمل کنیم که گویی منطقه صفر در خارج از محدوده جدول A وجود دارد.

دانش خود را اعمال کنید

سوال 1. 79

1. 79 نسبت را پیدا کنید.

از این واقعیت استفاده کنید که نمرات ISTEP از تمرین 1. 76 (صفحه 44) تقریباً طبیعی است. نسبت دانش آموزانی که نمرات کمتر از 620 دارند را پیدا کنید. نسبت دانش آموزانی که نمرات بیشتری از یا مساوی با 620 دارند ، پیدا کنید. رابطه بین این دو محاسبه را با استفاده از تصاویر منحنی های عادی شبیه به نمونه های ذکر شده در مثال 1. 34 نشان دهید (صفحه 46).

سوال 1. 80

1. 80 نسبت را پیدا کنید.

از این واقعیت استفاده کنید که نمرات ISTEP تقریباً طبیعی است. نسبت دانش آموزانی که بین 500 تا 650 نمره دارند ، پیدا کنید. از تصاویر منحنی های معمولی مشابه موارد ذکر شده در مثال 1. 35 (صفحه 47) برای نشان دادن محاسبات خود استفاده کنید.

محاسبات طبیعی معکوس

مثال 1. 34 تا 1. 37 استفاده از توزیع های عادی را برای یافتن نسبت مشاهدات در یک رویداد معین ، مانند "نمره SAT بین 720 تا 820" نشان می دهد. در عوض ، ما ممکن است بخواهیم مقدار مشاهده شده مربوط به یک نسبت معین را پیدا کنیم.

نرم افزار آماری این کار را مستقیماً انجام می دهد. بدون نرم افزار ، از جدول به عقب استفاده کنید ، نسبت مورد نظر را در بدنه جدول پیدا کنید و سپس خواندن مربوط به ستون سمت چپ و ردیف بالا را بخوانید.

مثال 1. 39 برای 10 ٪ برتر چقدر بالا است؟

نمرات در آزمون کلامی SAT در سالهای اخیر تقریباً توزیع را دنبال می کند. نمره دانشجویی چقدر باید در 10 ٪ برتر دانش آموزانی باشد که SAT را می گیرند؟

باز هم ، کلید مشکل ترسیم یک تصویر است. شکل 1. 27 نشان می دهد که ما می خواهیم نمره با مساحت بالاتر از آن 0. 10 باشد. این همان مساحت زیر برابر با 0. 90 است.

نرم افزار آماری عملکردی دارد که به شما هر نسبت تجمعی را که مشخص می کنید به شما می دهد. این عملکرد اغلب دارای نامی مانند "احتمال تجمعی معکوس" است. به میانگین 505 ، انحراف استاندارد 110 و نسبت تجمعی 0. 9 وصل شوید. این نرم افزار این را به شما می گوید. ما می بینیم که یک دانش آموز باید حداقل 646 امتیاز کسب کند تا در بالاترین 10 ٪ قرار بگیرد.

image

شکل 1. 29: شکل 1. 27 قرار دادن نقطه روی یک منحنی طبیعی با مساحت 0. 10 در سمت راست ، مثال 1. 39. نتیجه یا در مقیاس استاندارد است.

بدون نرم افزار ، ابتدا نمره استاندارد را با نسبت تجمعی 0. 9 پیدا کنید ، سپس "غیر استاندارد" کنید تا پیدا کنید. در اینجا روند دو مرحله ای است:

  1. از جدول استفاده کنید. برای ورود نزدیک به 0. 9 در بدنه جدول A جستجو کنید. 0. 8997 است. این ورودی مربوط به آن است. مقدار استاندارد با مساحت 0. 9 در سمت چپ آن نیز وجود دارد.
  2. برای تبدیل راه حل از بازگشت به مقیاس اصلی ، بدون استاندارد سازی کنید. ما می دانیم که مقدار استاندارد ناشناخته است. بنابراین خود راضی می کند

حل این معادله برای ارائه

این معادله باید منطقی باشد: این موارد را پیدا می کند که 1. 28 انحراف استاندارد بالاتر از میانگین این منحنی طبیعی خاص است. این معنای "غیر استاندارد" است. قاعده کلی برای عدم استاندارد سازی A-Score است

دانش خود را اعمال کنید

سوال 1. 81

1. 81 برای حضور در 25 ٪ برتر چه نمره ای لازم است؟

نمرات ISTEP را که تقریباً طبیعی هستند ، در نظر بگیرید. برای حضور در 25 ٪ برتر دانش آموزانی که این امتحان را انجام می دهند ، چقدر امتیاز بالایی دارد؟

سوال 1. 82

1. 82 نمره ای را پیدا کنید که 70 ٪ دانش آموزان از آن فراتر می روند.

نمرات ISTEP را که تقریباً طبیعی هستند ، در نظر بگیرید. هفتاد درصد دانش آموزان در این امتحان بالاتر از این امتیاز کسب می کنند. پیدا کردن .

ارزیابی نرمال بودن داده ها

توزیع های عادی مدل های خوبی را برای برخی از توزیع داده های واقعی ارائه می دهد. مثالها شامل مایل در هر رتبه بندی گالن وسایل نقلیه ، میانگین حقوق و دستمزد تیم های اصلی لیگ بیس بال و نرخ بیکاری در سراسر کشور است. توزیع برخی از متغیرهای متداول دیگر معمولاً کم رنگ و بنابراین کاملاً غیر طبیعی است. مثالها شامل درآمد شخصی ، فروش ناخالص بنگاه های تجاری و طول عمر خدمات قطعات مکانیکی یا الکترونیکی است. در حالی که تجربه می تواند نشان دهد که آیا یک مدل عادی در یک مورد خاص قابل قبول است یا خیر ، فرض بر این است که فرض کنید توزیع بدون بررسی در واقع داده ها طبیعی است.

تصمیم برای توصیف توزیع توسط یک مدل عادی ممکن است مراحل بعدی در تجزیه و تحلیل داده ها را تعیین کند. محاسبات نسبت ها ، همانطور که قبلاً انجام داده ایم ، و استنتاج آماری بر اساس چنین محاسباتی از انتخاب یک مدل ناشی می شود. چگونه می توانیم قضاوت کنیم که آیا داده ها تقریباً طبیعی هستند؟

یک هیستوگرام یا stemplot می تواند ویژگی های کاملاً غیر عادی یک توزیع را نشان دهد ، مانند Outliers ، Skewness تلفظ شده یا شکاف ها و خوشه ها. اگر stemplot یا هیستوگرام تقریباً متقارن و تک قضیه به نظر برسد ، با این حال ، ما به یک روش حساس تر برای قضاوت در مورد کفایت یک مدل عادی نیاز داریم. مفیدترین ابزار برای ارزیابی نرمال بودن ، نمودار دیگر ، طرح کمی است. 27

طرح کمیت طبیعی

در اینجا ایده یک نسخه ساده از یک طرح کمی معمولی آورده شده است. ساخت توطئه های کمی معمولی با دست امکان پذیر نیست ، اما نرم افزار با استفاده از نسخه های پیچیده تر این ایده اساسی ، آنها را برای ما رقم می زند.

  1. مقادیر داده های مشاهده شده را از کوچکترین به بزرگترین مرتب کنید. ثبت کنید که هر مقدار چه درصدی از داده ها را اشغال می کند. به عنوان مثال، کوچکترین مشاهده در یک مجموعه 20 تایی در نقطه 5٪، دومین کوچکترین مشاهده در نقطه 10٪ و غیره است.
  2. با استفاده از جدول A یا نرم افزار آماری، صدک های مشابهی را برای توزیع نرمال بیابید. درصدهای توزیع نرمال استاندارد را اغلب نمرات نرمال می نامند. به عنوان مثال، نقطه 5 درصد توزیع نرمال استاندارد است و امتیاز 10 درصد است.

نمرات عادی

هر توزیع نرمال یک خط مستقیم را در نمودار ایجاد می کند زیرا استانداردسازی هر توزیع عادی را به یک توزیع عادی استاندارد تبدیل می کند. استانداردسازی تبدیلی است که می تواند شیب و قطع خط را در طرح ما تغییر دهد اما نمی تواند یک خط را به یک الگوی منحنی تبدیل کند.

استفاده از پلات های معمولی کوانتیل

اگر نقاط یک نمودار چندک نرمال نزدیک به یک خط مستقیم قرار گیرند، نمودار نشان می دهد که داده ها نرمال هستند. انحرافات سیستماتیک از یک خط مستقیم نشان دهنده توزیع غیر نرمال است. نقاط پرت به عنوان نقاطی ظاهر می شوند که از الگوی کلی طرح فاصله زیادی دارند.

شکل 1. 28 تا شکل 1. 31 (صفحات 52 - 54) نمودارهای کمی معمولی برای داده هایی هستند که قبلاً ملاقات کرده ایم. داده ها به صورت عمودی در برابر نمرات نرمال مربوطه که به صورت افقی رسم شده اند رسم می شوند. برای مجموعه داده های کوچک، محور z از 3- تا 3 گسترش می یابد زیرا تقریباً تمام منحنی نرمال استاندارد بین این مقادیر قرار دارد. با اندازه‌های نمونه بزرگ‌تر، مقادیر در نهایت محتمل‌تر هستند و محور z از صفر دورتر خواهد بود. این شکل‌ها نشان می‌دهند که نمودارهای کمیت نرمال چگونه رفتار می‌کنند.

مثال 1. 40 نمرات IQ نرمال است

در مثال 1. 19 (صفحه 18) توزیع نمرات IQ را برای نمونه ای متشکل از 60 دانش آموز کلاس پنجم بررسی کردیم. شکل 1. 28 نمودار کمی معمولی را برای این داده ها نشان می دهد. توجه کنید که نقاط دارای الگوی بسیار نزدیک به یک خط مستقیم هستند. این الگو نشان می دهد که توزیع تقریباً نرمال است. هنگامی که ما یک هیستوگرام از داده ها را در شکل 1. 11 ساختیم (صفحه 19)، متوجه شدیم که توزیع دارای یک قله منفرد است، تقریباً متقارن است و دارای دم هایی است که به روشی صاف کاهش می یابد. اکنون می‌توانیم با بیان اینکه توزیع تقریباً نرمال است، به آن توضیحات اضافه کنیم.

image

شکل 1. 30: شکل 1. 28 نمودار کمی معمولی برای داده های IQ، مثال 1. 40. این الگو نشان می دهد که داده ها تقریباً نرمال هستند.

شکل 1. 28 البته مقداری انحراف از یک خط مستقیم را نشان می دهد. داده های واقعی تقریباً همیشه مقداری انحراف از مدل نرمال نظری را نشان می دهند. مهم است که بررسی خود را از نمودار چندک نرمال به جستجوی اشکالی محدود کنید که انحرافات واضحی از نرمال بودن را نشان می دهند. به تکان های جزئی در طرح واکنش بیش از حد نشان ندهید. هنگامی که در مورد روش های آماری مبتنی بر مدل نرمال بحث می کنیم، به حساسیت هر روش نسبت به انحراف از نرمال بودن توجه خواهیم کرد. بسیاری از روش‌های متداول تا زمانی که داده‌ها به طور منطقی متقارن باشند و مقادیر پرت وجود نداشته باشند، به خوبی کار می‌کنند.

خبرهای فارکس...
ما را در سایت خبرهای فارکس دنبال می کنید

برچسب : نویسنده : شهره لرستانی بازدید : 46 تاريخ : يکشنبه 7 خرداد 1402 ساعت: 23:56