۳٫داده های تلفیقی سری زمانی و مقطعی
۳-۷ داده های ترکیبی (تابلویی) یا panel data
داده های تابلویی، ترکیبی از داده های مقطعی و زمانی می باشند. در داده های سری زمانی مقادیر یک یا چند متغیر را طی یک دوره زمانی مشاهده می‌کنیم. در داده های مقطعی، مقادیر یک یا چند متغیر برای چند واحد یا مورد نمونه ای در یک زمان یکسان جمع آوری می‌شود. در داده های تابلویی، واحد مقطعی یکسان (برای مثال یک خانواده یا یک بنگاه یا یک ایالت) طی زمان بررسی و سنجش می‌شوند. به طور خلاصه، داده های تابلویی دارای ابعاد فضایی (مکانی) و زمانی اند. نام های دیگری برای داده های تابلویی وجود دارد، از قبیل داده های ترکیبی (ترکیبی از مشاهدات سری زمانی و مقطعی)، داده های میکروپانل، داده های طولی (مطالعه زمانی یک متغیر یا گروهی از موضوعات) ،تحلیل تاریخ حادثه (برای مثال، حرکت سوژه ها طی زمان در حالات و شرایط متوالی). تحلیل گروه آماری (برای مثال تعقیب و بررسی سیر شغلی فارغ اتحصیلان سال ۱۹۶۵ یک دبیرستان). اگرچه نامگذاری های جالب توجه دیگری نیز وجود دارد، تمامی این نام ها اصولاً به حرکت واحدهای مقطعی طی زمان اشاره می‌کنند. بنابراین از اصطلاح داده های تابلویی به مفهومی استفاده می‌کنیم که در برگیرنده تمامی این نامگذاری هاست و مدل های رگرسیون مبتنی بر این نوع داده ها را مدل های رگرسیون داده های تابلویی می‌نامیم. (گجراتی،۱۳۸۳، ص. ۱۱۴۱)
پایان نامه
۳-۷-۱ مزایای استفاده از داده های تابلویی (ترکیبی یا پَنل)
مزایای داده های تابلویی نسبت به داده های مقطعی یا سری زمانی چیست؟ بالتاگی[۹۳] مزایای استفاده از داده های تابلویی را چنین برمی شمارد:
از آنجا که داده های تابلویی به افراد، بنگاهها، ایالات، کشورها و از این قبیل واحدها طی زمان ارتباط دارند، وجود ناهمسانی واریانس در این واحدها محدود می شود. تکنیک های تخمین با داده های تابلویی، می توانند این ناهمسانی واریانس را متغیرهای تکی خاص مورد ملاحظه و بررسی قرار دهند. واژه تکی را در مفهوم کلی برای در برگرفتن واحدهای خرد مانند افراد، بنگاهها، ایالات و کشورها استفاده می­ شود.
با ترکیب مشاهدات سری زمانی و مقطعی، داده های تابلویی با اطلاعات بیشتر، تغییر پذیری بیشتر، همخطی کمتر میان متغیرها، درجات آزادی بیشتر و کارایی بیشتر ارائه می نمایند. با مطالعه مشاهدات مقطعی تکراری، داده های تابلویی به منظور مطالعه پویای تغییرات مناسب تر و بهترند.
داده های تابلویی تاثیراتی را که نمی توان به سادگی در داده های مقطعی و سری زمانی مشاهده کرد، بهتر معین می کند. همچنین داده های تابلویی ما را قادر می سازند تا مدل های رفتاری پیچیده تر را مطالعه کنیم.
داده های تابلویی با ارائه داده برای هزاران واحد، می توانند تورشی را که ممکن است در نتیجه لحاظ افراد یا بنگاهها (به صورت جمعی و کلی) حاصل می شود، حداقل سازد.
به طور کلی باید گفت داده های تابلویی تحلیل های تجربی را به شکلی غنی می سازند که در صورت استفاده از داده های سری زمانی یا مقطعی این امکان وجود ندارد. (همان، صص. ۳-۱۱۴۲)
۳-۷-۲ تخمین مدل های رگرسیون با داده های پَنل
تخمین مدل رگرسیونی، به فرض ما درباره عرض از مبدا، ضرایب و جمله خطای  بستگی دارد. روش های چندی در رابطه با این فروض وجود دارد:
- عرض از مبدا و ضرایب در طول زمان و در فضا (مکان) ثابت بوده و جمله خطا در طول زمان و برای عوامل مختلف،‌ متفاوت است.
- ضرایب ثابت بوده، اما عرض از مبدا برای عوامل مختلف،‌ متفاوت است.
- ضرایب ثابت بوده، اما عرض از مبدا برای عوامل مختلف و در طی زمان‌ متفاوت است.
- عرض از مبدا و تمامی ضرایب برای عوامل مختلف،‌ متفاوت است.
- عرض از مبدا و ضرایب برای عوامل مختلف و در طی زمان متفاوت است. (همان، ص.۱۱۴۷)
برای برآورد الگوهای رگرسیون خطی دو متغیره و چند متغیره معمولاً از روش کمترین مجذورات معمولی که به اختصار با OLS[94] نشان داده می شود، استفاده می گردد. این روش دارای ویژگی های مطلوب آماری مانند بدون تورش بودن، بهترین برآوردکننده خطی بدون تورش یا BLUE بودن را دارا می باشد. اما برای رفع مشکلاتی همچون خودهمبستگی[۹۵] جملات پسماند و ناهمسانی واریانس[۹۶] از روش کمترین مجذورات تعمیم یافته[۹۷] یعنی GLS استفاده می شود. (شیرین بخش و خوانساری، ۱۳۸۴، ص.۸۷)
تجزیه و تحلیل به عنوان مرحله ای از روش علمی، از پایه های اساسی هر تحقیق می باشد که بوسیله آن، کلیه فعالیتهای تحقیقی تا رسیدن به نتیجه کنترل و هدایت می شود. به عبارت دیگر، تجزیه و تحلیل نتایج تحقیق عبارت است از روشی که بوسیله آن کل فرایند تحقیق و پژوهش از انتخاب مسأله تا رسیدن به یک نتیجه مورد کنترل قرار می گیرد.
به منظور ایجاد بحث و نتیجه گیری، داده های جمع آوری شده بایستی در عمل، مورد تجزیه و تحلیل قرار گیرند. هدف کلی این فصل پردازش داده ها به منظور دستیابی به نتایج می باشد. ساختار فصل با توجه به فرضیه های مورد بررسی تنظیم گردیده است. نخست آمار توصیفی و پس از آن، نتایج آزمونهای آماری ارائه شده است.
۳-۸ روش های آماری بکار رفته در تحقیق
۳-۸-۱ ضریب همبستگی
ضریب هبستگی با توجه به نوع نمودار رگرسیون و نوع نمودار پراکنش دارای حالات مختلفی است و همواره بین ۱و۱- تعریف می شود و هر چه قدر مطلق ضریب همبستگی به عدد ۱ نزدیک تر باشد، می توان گفت اختلاف مقادیر پیش بینی شده با مقادیر واقعی کمتر خواهد بود، یعنی معادله رگرسیون از خطای کمتر و اعتبار بیشتری برخوردار است. ضریب همبستگی به صورت زیر محاسبه می شود:

۳-۸-۲ ضریب تشخیص یا تبیین
شاخصی است که نشان دهنده اعتبار معادله رگرسیون است به عبارت دیگر این شاخص درصد تغییرات بیان شده توسط معادله رگرسیون را نشان می دهد یعنی آن که مقدار آن، درصد انطباق مقادیر پیش بینی شده با مقادیر واقعی را نشان خواهد داد.
بدیهی است که خطای معادله یا خطای پیش بینی معادله برابر است با  که به ضریب عدم تشخیص یا عدم تبیین معروف است. پس عدم تشخیص که با e(error) نشان داده می شود بیانگر درصد تغییرات y است که توسط x در نظر گرفته شده توسط معادله رگرسیون، بیان نمی گردد. ملاک انتخاب متغیر مستقل مناسب ضریب تشخیص است. چنانچه بخواهیم از بین متغیرهای مستقل مختلف، بهترین آنها را انتخاب کنیم، ملاک را بر بزرگترین ضریب تشخیص خواهیم گذاشت.اگر بهترین متغیر مستقل انتخاب شده از سطح قابل قبول ضریب تشخیص برخوردار نباشد، به آن معنی است که تعمیم روند گذشته و پیش بینی y براساس یک متغیر مستقل امکان پذیر نیست. بلکه باید ترکیبی از متغیرهای مستقل (حداقل دو متغیر) را پیدا نمود تا ضریب تشخیص به حد قابل قبول رساند.
از آنجایی که برای آزمون آماری، دراین تحقیق فرضیه ها به عنوان فرض جایگزین  در نظر گرفته شده اند، زمانی فرضیه تایید می شود که F محاسبه شده از F جدول بزرگتر باشد.
۳-۸-۳ آزمون معنی دار بودن متغیر مستقل
برای بررسی معنی دار بودن ضریب متغیر مستقل در هر مدل از آماره t استفاده شده است. برای محاسبه این آماره از فرمول زیر استفاده می شود:

: ضریب تخمین،  : ضریب مورد آزمون،
: انحراف معیار ضریب تخمین،  : مجذور اختلاف بین مشاهدات واقعی و برآوردی،
: تعداد مشاهدات،  : تعداد پارامترها.
آماره t بدست آمده با t جدول که با درجه آزادی n-k در سطح اطمینان ۹۵% محاسبه شده مقایسه می شود، چنانچه قدر مطلق t محاسبه شده از t جدول بزرگتر باشد، ضریب مورد نظر معنی دار خواهد بود که دلالت بر وجود ارتباط بین متغیر مستقل و وابسته است.
۳-۸-۴ آزمون خود همبستگی
خود همبستگی زمانی رخ می دهد که خطاها با هم رابطه داشته باشند. به بیان دیگر جمله خطای مربوط به یک مشاهده تحت تاثیر جمله خطای یک مشاهده دیگر قرار دارد. اغلب در داده های مقطعی انتظار می رود که متغیر مستقل یک مشاهده فقط بر متغیر وابسته همان مشاهده تاثیر گذارد و با مشاهدات دیگر ارتباطی نداشته باشد. برخی از دلایل وجود آزمون خود همبستگی عبارتند از :
الف) در برخی موارد یک متغیر مهم حذف شده است و همین مساله باعث خود همبستگی می شود.
ب) در مواردی تبدیل داده ها به اجزای مختلف باعث خود همبستگی می شود.
ج) درمواردی که شکل مدل غلط است و دچار تورش تصریح از نوع شکل مدل هستیم خود همبستگی به وجود می آید.
برای تشخیص خود همبستگی از آماره دوربین- واتسون استفاده می شود که طبق فرمول زیر محاسبه می گردد:

: جمله خطا در زمان t

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...