Adak Research Group
کیفیت تبلیغ کار ماست

آدرس:

تهران - چهار راه ولیعصر

تلفن:

09921256955 09104908504

روش‌های آماری

روش های آماری

روش های آماریStatistical Methods

یعنی روش های آماری ازون مطالب ممنوعه هست که هیچ تحلیلگر آماری نمیخواد شما اینجوری که من میخوام بهتون توضیح بدم،بفهمین .پس بازم مثل همیشه قرمز برنده 🤪

اشتباه شد LET’S  GOOOOO

گروه تحقیقاتی آداک میزبان اظلاعاتی شما خواهد بود.

روش‌های آماری: سفری در دنیای داده‌ها

روش‌های آماری ابزارهای قدرتمندی هستند که به ما کمک می‌کنند تا داده‌ها را جمع‌آوری، سازماندهی، تفسیر و تحلیل کنیم. از این روش‌ها در همه‌ی زمینه‌های علمی، از علوم اجتماعی و پزشکی گرفته تا مهندسی و تجارت، استفاده می‌شود.

روش های آماری دو دسته کلی داره:

  1. آمار توصیفی:
  • به خلاصه‌سازی و توصیف ویژگی‌های داده‌ها می‌پردازد.
  • از معیارهایی مانند میانگین، مد، میانه، واریانس، انحراف معیار، دامنه و فاصله بین‌کوارتیلی برای این کار استفاده می‌کند.
  • به ما کمک می‌کند تا بفهمیم داده‌ها چه شکلی هستند و در کجا متمرکز شده‌اند.
2. آمار استنباطی:
  • از نمونه‌ای از داده‌ها برای استنباط در مورد کل جامعه استفاده می‌کند.
  • از روش‌هایی مانند آزمون فرض و رگرسیون برای این کار استفاده می‌کند.
  • به ما کمک می‌کند تا در مورد روابط بین متغیرها، و همچنین در مورد اینکه آیا نتایج یه نمونه می‌تونه به کل جامعه تعمیم داده بشه یا نه، نتیجه‌گیری کنیم.

حالا اینجا قشنگ میشه .بریم دل و رودشو 🫀🔪بریزیم تو مغزمون

آمار توصیفی (Descriptive Statistics):
  • معیارهای مرکزی (Measures of Central Tendency): این معیارها شامل میانگین (Average)، مد (Mode)، و میانه (Median) هستند که نشان‌دهنده نقطه مرکزی داده‌ها می‌باشند.
  • معیارهای پراکندگی (Measures of Dispersion): این معیارها شامل واریانس (Variance)، انحراف معیار (Standard Deviation)، دامنه (Range)، و فاصله بین‌کوارتیلی (Interquartile Range) هستند که نشان‌دهنده میزان پراکندگی داده‌ها در اطراف مرکز می‌باشند.
آمار استنباطی (Inferential Statistics):
  • آزمون فرض (Hypothesis Testing): این روش‌ها برای تعیین اینکه آیا یک فرض آماری در مورد جامعه آماری صحت دارد یا خیر به کار می‌روند. آزمون‌های رایج شامل t-test، ANOVA، و chi-square هستند.
  • رگرسیون (Regression Analysis): این تکنیک برای مدل‌سازی و تحلیل روابط بین متغیرهای وابسته و مستقل استفاده می‌شود. رگرسیون خطی (Linear Regression) و رگرسیون لجستیک (Logistic Regression) دو نمونه از این نوع تحلیل هستند.

میخوای بیشتر بازش کنم؟
فکرت جای بدی نره 😜

در ادامه به توضیح کامل‌تر در مورد معیارهای مرکزی و پراکندگی می‌پردازیم:
  1. معیارهای مرکزی (Measures of Central Tendency):

میانگین (Mean): حاصل جمع تمام مقادیر تقسیم بر تعداد آن‌ها. نشان‌دهنده مرکز ثقل داده‌ها است.

مد (Mode): پرتکرارترین مقدار در یک مجموعه داده. می‌تواند بیش از یک مد داشته باشد.

میانه (Median): مقداری که داده‌ها را به دو نیمه تقسیم می‌کند به طوری که نصف داده‌ها کمتر و نصف دیگر بیشتر از آن باشند.

2. معیارهای پراکندگی (Measures of Dispersion):

واریانس (Variance): متوسط مجذور اختلافات هر داده از میانگین. نشان‌دهنده پراکندگی داده‌ها است.

انحراف معیار (Standard Deviation): ریشه دوم واریانس و نشان‌دهنده پراکندگی داده‌ها به صورت واحدهای اصلی.

دامنه (Range): تفاوت بین بزرگترین و کوچکترین مقادیر در یک مجموعه داده.

فاصله بین‌کوارتیلی (Interquartile Range – IQR): تفاوت بین کوارتیل سوم و اول، نشان‌دهنده پراکندگی 50% وسط داده‌ها.

این معیارها به تحلیلگران کمک می‌کنند تا درک بهتری از توزیع و خصوصیات کلیدی یک مجموعه داده به دست آورند.

این وضع نشد منم حوصلم سر رفت.
بیا مثال بزنم برات ایندفعه بره تو گوشتت😂

در ادامه به توضیح بیشتر در مورد آزمون فرض و رگرسیون می‌پردازیم:
  1. آزمون فرض (Hypothesis Testing):

هدف از آزمون فرض، تصمیم‌گیری در مورد صحت یک فرضیه آماری بر اساس داده‌های نمونه است.

فرض صفر (Null Hypothesis – H0): این فرض بیان می‌کند که هیچ تفاوت یا اثر خاصی وجود ندارد.

فرض مقابل (Alternative Hypothesis – H1): این فرض بیان می‌کند که تفاوت یا اثر خاصی وجود دارد.

سطح معناداری (Significance Level – α): احتمال رد کردن فرض صفر وقتی که واقعاً صحت دارد.

آزمون‌های رایج: t-test برای مقایسه میانگین دو گروه، ANOVA برای مقایسه میانگین‌های چند گروه، و chi-square برای تحلیل جدول توافق.

2. رگرسیون (Regression Analysis):

  • رگرسیون رابطه بین متغیر وابسته (Dependent Variable) و یک یا چند متغیر مستقل (Independent Variables) را برآورد می‌کند.
  • رگرسیون خطی (Linear Regression) یک مدل ساده است که رابطه خطی بین متغیر وابسته و متغیر مستقل را مدل‌سازی می‌کند.
  • ضرایب رگرسیون (Regression Coefficients) شدت و جهت تأثیر هر متغیر مستقل بر روی متغیر وابسته را نشان می‌دهند.
  • R-squared درصد تغییرات در متغیر وابسته را که توسط متغیرهای مستقل تبیین شده است، مشخص می‌کند.
  • محققان با استفاده از نرم‌افزارهای آماری، داده‌ها را تحلیل کرده و نتایج را تفسیر می‌کنند.

فرض کنید یه گروه از دانش‌آموزان داریم و می‌خواییم نمراتشون توی درس ریاضی رو بررسی کنیم. تو قسمت قبلی با مفاهیم پایه آشنا شدیم، حالا می‌خواییم یه کم عمیق‌تر بهشون بپردازیم.

معیارهای مرکزی:

  • میانگین: مثل یه وزنه‌ی تعادله که دقیقاً وسط داده‌ها قرار می‌گیره. مجموع نمرات رو تقسیم بر تعداد دانش‌آموزان می‌کنیم و به یه عدد میانگین می‌رسیم.
  • مد: نمره‌ای که بیشترین تکرار رو داره. مثلاً اگه توی یه کلاس 10 نفره، 5 نفر نمره 15 بگیرن، 15 میشه مد نمرات.
  • میانه: دقیقاً وسط ستون نمرات قرار می‌گیره. جوری که نیمی از دانش‌آموزان نمره‌شون کمتر از میانه و نیمی دیگه بیشتر از اون باشه.

معیارهای پراکندگی:

  • واریانس: نشون می‌ده که نمرات چقدر از میانگین دور شدن. واریانس میانگینِ مربعاتِ اختلافِ هر نمره با میانگین کل نمرات هست.
  • انحراف معیار: ریشه دوم واریانسه. یه جورایی واریانس رو به واحدهای نمره‌ای (مثلاً نمره) تبدیل می‌کنه. هر چقدر انحراف معیار بیشتر باشه، نشون می‌ده که نمرات بیشتر از هم دور شدن.
  • دامنه: فاصله بین بالاترین و پایین‌ترین نمره. یه بازه‌ی کلی از نمرات رو بهمون می‌ده.
  • فاصله بین‌کوارتیلی: 25 درصد وسط نمرات رو در بر می‌گیره. مثلاً اگه فاصله بین‌کوارتیلی 10 باشه، یعنی 25 درصد دانش‌آموزان نمره‌شون بین 0 تا 10، 25 درصد بین 10 تا 20 و 50 درصد باقی‌مونده بین 20 تا 30 هست.

کاربرد این معیارها:

  • مقایسه گروه‌های مختلف: مثلاً می‌تونیم میانگین نمرات دانش‌آموزان دختر و پسر رو با هم مقایسه کنیم.
  • شناسایی ناهنجاری‌ها: یه نمره خیلی بالا یا خیلی پایین می‌تونه نشانه‌ی اشتباه در ثبت نمرات یا یه اتفاق خاص باشه.
  • پیش‌بینی: با بررسی پراکندگی نمرات می‌تونیم حدس بزنیم که نمره یه دانش‌آموز جدید توی چه بازه‌ای خواهد بود.

نکته:

  • هیچ کدوم از این معیارها به تنهایی کافی نیستن و باید در کنار هم استفاده بشن.
  • انتخاب معیار مناسب به نوع داده‌ها و سوالی که می‌خوایم بهش پاسخ بدیم بستگی داره.

آزمون فرض مثل یه قاضی می‌مونه که می‌خواد بفهمه یه فرضیه درسته یا غلط.

 

  • فرض صفر (H0) مثل یه متهم بی‌گناهه. تا وقتی که خلافش ثابت نشه، فرض بر اینه که درسته.
  • فرض مقابل (H1) مثل یه شاکیه. می‌گه که متهم بی‌گناه نیست و یه جرمی مرتکب شده.
  • سطح معناداری (α) مثل یه شاهد عادله. یه عددیه که نشون می‌ده چقدر به شهادت این شاهد می‌تونیم اعتماد کنیم. هر چی α کوچیک‌تر باشه، به شهادت شاهد بیشتر اعتماد می‌تونیم بکنیم.

آزمون‌های رایج مثل یه سری ابزار کار قاضی هستن:

  • t-test: برای مقایسه قد و وزن دو گروه از بچه‌ها به کار می‌ره. مثلاً می‌تونیم ببینیم که بچه‌های گروه مدرسه‌ای به طور میانگین از بچه‌های گروه مهدکودک قد بلندتر و سنگین‌تر هستن یا نه.
  • ANOVA: برای مقایسه قد و وزن چند گروه از بچه‌ها به کار می‌ره. مثلاً می‌تونیم ببینیم که به طور میانگین، قد و وزن بچه‌های گروه مدرسه‌ای، مهدکودک و پیش‌دبستانی با هم چه فرقی داره.
  • chi-square: برای بررسی این موضوع که بین دو دسته‌بندی یه رابطه معنادار وجود داره یا نه به کار می‌ره. مثلاً می‌تونیم ببینیم که آیا بین درس‌خون بودن و ‍ قبولی در دانشگاه یه رابطه معنادار وجود داره یا نه.

رگرسیون مثل یه پیشگو می‌مونه که می‌خواد بفهمه چه عواملی روی یه چیز دیگه تاثیر می‌ذارن.

فرض کن می‌خوای نمره ریاضی دانش‌آموزا رو پیش‌بینی کنی. اینجا:

  • نمره ریاضی اون چیزیه که می‌خوای پیش‌بینی کنی؛ پس متغیر وابسته‌ست.
  • تعداد ساعت مطالعه اون چیزیه که فکر می‌کنی روی نمره تاثیر می‌گذاره؛ پس متغیر مستقل‌ست.

رگرسیون خطی مثل کشیدن یه خط صاف بین نمره ریاضی و تعداد ساعت مطالعه‌ست. این خط بهمون نشون می‌ده که اگه یه دانش‌آموز یه ساعت بیشتر بخونه، به طور میانگین نمره‌ش چقدر تغییر می‌کنه.

ضریب رگرسیون شیب این خط صافه. هرچی شیب تندتر باشه، یعنی تعداد ساعت مطالعه تاثیر بیشتری روی نمره داره.

R-squared بهمون می‌گه که از تغییرات نمره ریاضی، چقدرشو می‌تونیم با تعداد ساعت مطالعه توضیح بدیم. مثلاً اگه R-squared برابر با 0.7 باشه، یعنی 70 درصد تغییرات نمره به خاطر تغییرات در تعداد ساعت مطالعه‌ست.

  • متغیرهای مستقل مثل چیزهایی هستن که فکر می‌کنیم روی متغیر وابسته تاثیر می‌ذارن. مثلاً تعداد ساعت مطالعه دانش‌آموزان.
  • رگرسیون خطی مثل یه خط صافه که بین متغیر وابسته و مستقل رسم میشه. این خط نشون می‌ده که به ازای هر واحد افزایش توی متغیر مستقل، به طور میانگین چقدر متغیر وابسته تغییر می‌کنه.
  • ضرایب رگرسیون مثل شیب این خط صاف هستن. هر چی ضریب رگرسیون یه متغیر مستقل بیشتر باشه، نشون‌دهنده اینه که تاثیر اون متغیر روی متغیر وابسته بیشتره.
  • R-squared مثل یه درصدیه که نشون می‌ده چه درصدی از تغییرات متغیر وابسته توسط متغیرهای مستقل تبیین میشه. مثلاً R-squared بالا نشون می‌ده که متغیرهای مستقل نقش مهمی در تبیین نمره ریاضی دانش‌آموزان دارن.

اگه مشکلی برات پیش اومد از مشاوره رایگان ما استفاده کن⬅︎ تماس با ما

گروه تحقیقاتی آداک شمارا در تمام مراحل پشتیبانی میکند.