تجزیه و تحلیل رگرسیون یکی از متداول ترین روش های تحقیق آماری است. با استفاده از آن می توانید میزان تاثیر متغیر مستقل بر متغیر وابسته را تعیین کنید. مایکروسافت اکسل دارای ابزارهایی برای انجام این نوع تحلیل است. بیایید به آنچه که دارند نگاه کنیم و از آنها استفاده کنیم.
بسته تجزیه و تحلیل اتصال
اما، برای استفاده از یک تابع که به تجزیه و تحلیل رگرسیون اجازه می دهد، ابتدا باید بسته Analyze را فعال کنید. فقط پس از آن ابزار مورد نیاز برای این روش بر روی نوار اکسل ظاهر می شود.
- به تب بروید "پرونده".
- به بخش بروید "گزینه ها".
- پنجره گزینه های Excel باز می شود. به زیر بخش بروید افزودنیها.
- در پایین پنجره ای که باز می شود، کلید را در بلوک قرار دهید "مدیریت" در موقعیت افزودنیهای اکسلاگر در جایگاه دیگری قرار دارد ما دکمه را فشار می دهیم "برو".
- پنجره افزودنیهای اکسل باز می شود. یک تیک کنار آیتم قرار دهید "تجزیه و تحلیل بسته". روی دکمه "OK" کلیک کنید.
حالا وقتی به برگه برویم "داده ها"، بر روی یک نوار در یک بلوک ابزار "تجزیه و تحلیل" ما یک دکمه جدید خواهیم دید "تجزیه و تحلیل داده ها".
انواع تحلیل رگرسیون
انواع مختلف رگرسیون وجود دارد:
- پارابولیک؛
- قدرت؛
- لگاریتمی؛
- نمایشی؛
- نمایشی؛
- هیپربولیک؛
- رگرسیون خطی
ما بیشتر در مورد اجرای آخرین نوع تجزیه و تحلیل رگرسیون در اکسل صحبت خواهیم کرد.
رگرسیون خطی در اکسل
در زیر، به عنوان مثال، یک جدول ارائه شده است که میانگین دمای روزانه هوا در خارج و تعداد خریداران فروشگاه را برای روز کاری مربوطه نشان می دهد. بیایید با کمک تجزیه و تحلیل رگرسیون، نحوه دقیق بودن شرایط آب و هوایی در قالب دمای هوا بر حضور شرکت بازرگانی تأثیر بگذاریم.
معادله رگرسیون کلی نوع خطی به شرح زیر است:Y = a0 + a1x1 + ... + akhk
. در این فرمول ی به معنی یک متغیر، تأثیر عوامل که ما در حال تلاش برای مطالعه است. در مورد ما این تعداد خریداران است. معنای x - اینها عوامل مختلفی هستند که بر متغیر تأثیر می گذارند. پارامترها a ضرایب رگرسیون هستند. به عبارت دیگر، آنها اهمیت یک عامل خاص را تعیین می کنند. فهرست ک تعداد کل عوامل این عوامل را مشخص می کند.
- روی دکمه کلیک کنید "تجزیه و تحلیل داده ها". این در زبانه قرار داده شده است. "خانه" در بلوک ابزار "تجزیه و تحلیل".
- یک پنجره کوچک باز می شود. در آن، آیتم را انتخاب کنید "رگرسیون". ما دکمه را فشار می دهیم "خوب".
- پنجره تنظیمات رگرسیون باز می شود. در آن، فیلدهای مورد نیاز هستند "فاصله ورودی Y" و "فاصله ورودی X". همه تنظیمات دیگر را می توان به صورت پیش فرض کنار گذاشت.
در حوزه "فاصله ورودی Y" ما آدرس محدوده سلول هایی را که داده های متغیر در آنها قرار دارد تعیین می کنیم، تأثیر عوامل که ما در حال تلاش برای ایجاد آن هستیم. در مورد ما این سلول ها در ستون Number of Buyers خواهند بود. آدرس را می توانید به صورت دستی از صفحه کلید وارد کنید، یا می توانید به سادگی ستون دلخواه را انتخاب کنید. گزینه دوم بسیار ساده تر و راحت تر است.
در حوزه "فاصله ورودی X" آدرس طیف وسیعی از سلول ها را وارد کنید، جایی که داده های عامل، تأثیر آن بر متغیری که می خواهیم تنظیم کنیم، قرار گرفته است. همانطور که در بالا ذکر شد، ما باید اثر دما را بر تعداد مشتریان فروشگاه تعیین کنیم و بنابراين آدرس سلول ها را در ستون "Temperature" وارد کنید. این را می توان به صورت مشابه در زمینه "تعداد خریداران" انجام داد.
با استفاده از تنظیمات دیگر، می توانید برچسب ها، سطح قابلیت اطمینان، ثابت بودن صفر، نمایش یک نمودار از احتمال طبیعی و انجام اقدامات دیگر را تنظیم کنید. اما، در بیشتر موارد، این تنظیمات نیازی به تغییر ندارد. تنها چیزی که باید توجه داشته باشید پارامترهای خروجی است. به طور پیش فرض، نتایج تجزیه و تحلیل در ورق دیگری خروجی هستند، اما با تنظیم مجدد سوئیچ، شما می توانید خروجی را در محدوده مشخص شده در همان ورق که جدول با داده های اصلی قرار دارد یا در یک کتاب جداگانه، یعنی یک فایل جدید، تنظیم کنید.
پس از تنظیم تمام تنظیمات، بر روی دکمه کلیک کنید. "خوب".
تجزیه و تحلیل نتایج تجزیه و تحلیل
نتایج تجزیه و تحلیل رگرسیون در قالب یک جدول در محل مشخص شده در تنظیمات نمایش داده می شود.
یکی از شاخص های اصلی این است R مربع. این نشان دهنده کیفیت مدل است. در مورد ما این نسبت 0.705 یا حدود 70.5٪ است. این سطح قابل قبولی از کیفیت است. وابستگی کمتر از 0.5 بد است
یکی دیگر از شاخص های مهم در سلول در تقاطع خط قرار دارد. "تقاطع Y" و ستون شانس. این نشان می دهد که ارزش در Y خواهد بود و در مورد ما، این تعداد خریداران است و تمام عوامل دیگر برابر با صفر است. در این جدول این مقدار 58.04 است.
ارزش در تقاطع نمودار "متغیر X1" و شانس سطح وابستگی Y به X را نشان می دهد. در مورد ما این میزان وابستگی تعداد مشتریان فروشگاه به درجه حرارت است. ضریب 1.31 به عنوان یک شاخص نسبتا بالا از نفوذ در نظر گرفته می شود.
همانطور که می بینید، استفاده از مایکروسافت اکسل بسیار آسان است برای ایجاد یک جدول تجزیه و تحلیل رگرسیون. اما فقط یک فرد آموزش دیده می تواند با داده های خروجی کار کند و ماهیت خود را درک کند.