مقاله آمار دانشجویی

همانطور که در فصل 1 گفتیم می‌توان داده ها را به صورت داده رده ای یا کمّی تقسیم بندی بندی کرد. داده رده ای از برچسب‌ها یا نام‌ها برای شناسائی رده‌های آیتم‌ها استفاده می‌کند. داده‌های کمّی هم مقدارهای عددی هستند که نماینده یک مقدار هستند یا نشان می دهند که یک وضعیت چند بار تکرار می‌شود.
این فصل، روش‌های جدولی و گرافیکی که برای خلاصه سازی داده رده ای و کمّی به شکل رایج استفاده می‌شوند را ارائه می‌کند. می‌توان خلاصه‌های جدولی و گرافیکی داده را درگزارش های سالانه، مقالات روزنامه‌ها و تحقیقات علمی مشاهده کرد.. همه ما با این نوع ارائه‌ها مواجه شده ایم. بنابرین لازم است تا بدانیم که چگونه آماده و تفسیر می‌شوند. ما  کارمان را با بررسی روش‌های جدولی و گرافیکی که برای خلاصه سازی داده مرتبط با یک متغیر منفرد استفاده می شوند، شروع می‌کنیم. آخرین بخش نیز روش هایی را با هدف خلاصه سازی داده در هنگامی که رابطه ای بین دو متغیر مورد علاقه وجود دارد، تشریح می‌کند.
بسته‌های نرم افزار آماری مدرن قابلیت‌های گسترده ای را برای خلاصه سازی داده و آماده کردن ارائه‌های گرافیکی در خود دارند. Minitab و Excel دو بسته ای هستند که به شکل وسیع در دسترس هستند. در ضمیمه‌های این فصل برخی از قابلیت‌های آنها را نشان می‌دهیم.
خلاصه سازی داده رده ای
توزیع فراوانی
ما بحث مان درباره اینکه چگونه می‌توان از روشهای جدولی و گرافیکی برای خلاصه کردن داده رده ای استفاده کرد را با تعریف توزیع فراوانی شروع می‌کنیم.
توزیع فراوانی یک خلاصه جدولی از داده است که تعداد ( فراوانی) آیتم‌ها در هر رده  از بین چند رده غیر همپوشان را نشان می‌دهد.

توزیع‌های فراوانی نسبی و فراوانی درصدی
یک توزیع فراوانی به ما تعداد ( فراوانی) آیتم‌های هر کدام از چند رده غیر همپوشان را نشان می‌دهد. به هر حال ما اغلب علاقمند به این هستیم که  نسبت یا درصد آیتم‌های هر رده را بدانیم.. فراوانی نسبی یک رده برابر با کسر یا نسبتی از آیتم‌های متعلق به یک رده است. در یک مجموعه داده با n مشاهده ، فراوانی نسبی هر رده را می‌توان به صورت زیر تعیین کرد :
فراوانی نسبی
فراوانی نسبی یک رده = n/ فراوانی رده
فراوانی درصدی یک رده با ضرب فراوانی نسبی در 100 به دست می‌آید.
یک توزیع فراوانی نسبی یک خلاصه جدولی از داده است که فراوانی نسبی هر رده را نشان می‌دهد. یک توزیع فراوانی درصدی نیز فراوانی درصدی داده هر کلاس را به ما ارائه می‌کند.
نمودارهای میله ای و نمودارهای کیکی
نمودار میله ای یک ابزار گرافیکی با هدف توصیف کردن داده رده ای خلاصه شده در یک فراوانی، فراوانی نسبی یا توزیع فراوانی درصدی است. ما برچسب‌های مورد استفاده برای کلاس‌ها ( رده‌ها ) را در  یک محور نمودار ( معمولا محور افقی) تعیین می‌کنیم. در محور دیگر نمودار ( معمولا محور عمودی) نیز یک فراوانی، یک فراوانی نسبی یا یک مقیاس فراوانی درصدی هم استفاده می‌شود.سپس با استفاده از یک میله با عرض ثابت که بالای برچسب هر کلاس نوشته می‌شود ما طول میله را تا زمانی که به فراوانی، فراوانی نسبی یا درصدی آن رده برسد امتداد می‌دهیم. این میله ها در داده‌های رده ای باید  از هم تفکیک شوند تا بر این حقیقت که هر رده مجزا است تاکید کنیم. شکل 2.1 یک نمودار میله ای توزیع فراوانی مربوط به 50 خرید نوشیدنی غیر‌الکلی نشان می‌دهد.

مترجم سریع آمار همینک آماده انجام فوری و تخصصی ترجمه تان است. کافی است از بخش سفارش ترجمه با ما تماس بگیرید

ترجمه فوری آمار

در داده هایی که شامل زمان‌های حسابرسی انتهای سال می‌شود، بزرگ ترین مقدار داده 33 است و کوچک ترین مقدار داده 12 است. به این دلیل ما تصمیم گرفته ایم تا داده را با پنج کلاس خلاصه کنیم ، استفاده از معادله (2.2) به ما عرض کلاس تقریبی 4.2 = 5/(12-33) را می‌دهد. بنابرین ما تصمیم گرفتیم که از گرد کردن به بالا استفاده کنیم و در توزیع فراوانی از عرض کلاس پنج روز استفاده کنیم.
در عمل تعداد کلاس‌ها و عرض کلاس مناسب  از طریق آزمون و خطا تعیین می‌شود. وقتی یک تعداد احتمالی از کلاس‌ها انتخاب شد، معادله (2.2) برای یافتن عرض کلاس تقریبی استفاده می‌شود. می‌توان این فرایند را برای تعداد متفاوتی از کلاس‌ها تکرار کرد. در نهایت تحلیل گر برای تعیین ترکیب تعداد کلاس‌ها و عرض کلاس از قضاوت شخصیش استفاده می‌کند و بهترین توزیع فراوانی را برای خلاصه سازی داده ارائه می‌کند.
در بررسیداده زمان حسابرسی در جدول 2.4 بعد از اینکه در مورد استفاده از پنج کلاس تصمیم گرفتیم و عرض هر کلاس پنج روز شد،کار جدید ما تعیین حدهای کلاس درهر کلاس است.

هیچ توزیع فراوانی منفردی برای یک مجموعه داده بهترین توزیع محسوب نمی شود. ممکن است افراد متفاوت توزیع فراوانی‌های متفاوتی را بسازند که به یک اندازه قابل قبول باشند. هدف این است که گروه بندی طبیعی و تغییر داده را نشان دهیم.

حدهای کلاس : باید حدهای کلاس را طوری انتخاب کرد که هر آیتم داده متعلق به یک و فقط یک کلاس باشد. حد کلاس پایینی ، کوچک ترین مقدار داده احتمالی تخصیص یافته به کلاس را تعیین می‌کند. حد کلاس بالائی هم بزرگ ترین مقدار داده احتمالی تخصیص یافته به کلاس را تعیین می‌کند. در هنگام ساختن توزیع فراوانی‌ها برای داده کیفی ما نیازی به تعیین حدهای کلاس نداریم چون هر آیتم داده به طور طبیعی در یک کلاس مجزا قرار می‌گیرد. اما در داده  های کمّی مثل زمان‌های حسابرسی در جدول 2.4 ، باید حدهای کلاس در جایی که هر مقدار داده به کلاس تعلق می‌گیرد، تعیین شوند.

 

کیفیت ترجمه : ترجمه نقره ای

 

نکته: کلیه نمونه  ترجمه های سایت ترجمه فوری با کسب اجازه از مشتری در سایت درج می شود یا صرفا با هدف انتشار به عنوان نمونه ترجمه تهیه می شود.

برای سفارش ترجمه تخصصی آمار از بخش سفارش ترجمه در منوی سایت استفاده کنید . لطفا  در بخش موضوع واژه" ترجمه فوری آمار" را ذکر کنید

مقاله هوش مصنوعی

معمولا ما بعد از جمع آوری داده آن را به سه زیر مجموعه تمرین، تایید و تست تقسیم می کنیم . همانطور که در فصل پیش گفتیم، مجموعه تمرین معمولا تقریبا 70% از مجموعه داده کامل را تشکیل می دهد و تایید و تست تقریبا 15% از هر کدام از بخش های داده را تشکیل می دهد . باید هر کدام از این مجموعه ها نماینده مجموعه داده  کامل باشند ، یعنی هر کدام از آنها کار تایید و تست ناحیه مشابهی از فضای ورودی را در مجموعه تمرین انجام دهند. ساده ترین روش برای تقسیم داده ، انتخاب تصادفی همه زیرمجموعه های متعلق به یک مجموعه داده  کامل است. این روش معمولا نتیجه خوبی را خلق می کند اما روش بهتر این است که هر بخش را بررسی کنیم تا تفاوت های اصلی بین مجموعه ها را کنترل کنیم به این صورت تحلیل پس از تمرین برای شناخت مشکلات در تقسیم داده هم امکان پذیر است. ما بعدها در این مورد چیزهای بیشتری خواهیم گفت.
سوال نهایی که باید در مورد انتخاب داده از خودمان باید بپرسیم این است که « آیا ما داده کافی در اختیار داریم؟ » . این سوالی است که خصوصا قبل از اینکه شبکه را تمرین بدهیم. پاسخ دادن به آن دشوار است مقدار داده ای که نیاز داریم بستگی به پیچیدگی تابع زیربنائی دارد یعنی همان داده ای که تلاش می کنیم آن را به شکل تقریبی به دست بیاوریم .اگر تابعی که به طور تقریبی به دست می آِید،خیلی پیچیده باشد، و نقاط انحراف در آن زیاد باشد آنگاه به مقدار زیادی داده نیاز داریم. اگر آن تابع خیلی هموار باشد آنگاه میزان داده مورد به شکل معناداری کاهش پیدا می کند  ( مگر اینکه داده خیلی پر نویز باشد) . انتخاب اندازه مجموعه داده با انتخاب تعداد نورون ها در شبکه عصبی رابطه نزدیکی دارد. این موضوع در بخش « انتخب معماری شبکه» مورد بحث قرار می گیرد. البته ما معمولا قبل از اینکه تمرین شبکه را شروع کنیم، نمی دانیم که تابع زیربنائی  چقدر پیچیده است. به این دلیل همانطور که بعدا خواهیم گفت کل روند تمرین شبکه عصبی تکراری است. ما در حین کامل شدن تمرین عملکرد شبکه را تحلیل خواهیم کرد. نتیجه این تحلیل می تواند در تصمیم گیری در مورد اینکه داده کافی داریم یا خیر به ما کمک کند.

کیفیت ترجمه : ترجمه نقره ای

 

نکته: کلیه نمونه  ترجمه های سایت ترجمه فوری با کسب اجازه از مشتری در سایت درج می شود یا با هدف انتشار به عنوان نمونه ترجمه تهیه می شود.

برای سفارش ترجمه هوش مصنوعی و شبکه عصبی از بخش سفارش ترجمه در منوی سایت استفاده کنید و در بخش موضوع واژه" ترجمه هوش مصنوعی" را ذکر کنید