در این پایان نامه در زمینه الگوریتم های تجزیه و تحلیل داده ها (Analytics) بر روی داده های بزرگ یا داده های حجیم و یا کلان داده ها (Big Data) صحبت شده است. به علت حجم زیاد این داده ها پردازش آنها در حافظه اصلی ممکن نیست و یا زمان زیادی نیاز دارد. برای حل این مشکل از داده ها نمونه برداری (Sampling) انجام میشود. تئوری ها و الگوریتم های مختلف در این پایان نامه بررسی و مورد تجزیه و تحلیل قرار گرفته است. این پایان نامه در سال 2014 برای اخذ مدرک دکترای کامپیوتر از دانشگاه براون (Brown) در رود ...