خانه / آموزش / مه داده ها / معرفی / ۵ اشتباه در مورد مِه داده ها

۵ اشتباه در مورد مِه داده ها

به نام خدا. سلام. هر پدیده ی جدید و نوظهوری اگر به خوبی معرفی نشود و ویژگی های و مشخصات آن به درستی تبیین نشود در معرض تفسیرها و برداشت های اشتباه قرار می گیرد. پدیده ی big data هم از این قضیه مستثنی نیست. در ادامه ی پست های مربوط به معرفی این پدیده (با معادل فارسی مِه داده ها (یا بزرگ داده ها)) می خواهیم در مورد برداشت های اشتباهی که از بزرگ داده ها می شود صحبت کنیم. با ما همراه باشید. (لینک: بالاخره کدام یک؟ معادل فارسی big data)

اولین اشتباه در مورد مه داده ها

اشتباه اول اینکه گمان ‌می‌شود مساله‌ی بزرگ‌داده‌ها فقط با داده‌هایی با حجم کلان سروکار دارد. درحالی‌که حجم فقط یکی از ابعاد چندگانه‌ی این مساله است. سه بُعد دیگر تنوع، سرعت و صحت هستند که در پستی با عنوان مدل ۴V شرکت IBM به تفصیل در مورد آن ها صحبت کردیم. هرچند دیدگاه های متفاوتی در این باره وجود دارد و ریشه ی این دیدگاه های متفاوت را باید در تعریف های متفاوت برای بزرگ داده ها جست و جو کرد.

دومین اشتباه در مورد مه داده ها

اشتباه دوم این است که برخی فکر ‌می‌کنند بزرگ‌داده‌ها به معنی هادوپ[۱] است! درحالی‌که هادوپ چارچوب نرم‌افزاری متن‌بازی برای ذخیره و پردازش بزرگ‌داده‌هاست. این چارچوب از تکنولوژی‌های مورد استفاده‌ی گوگل گرفته شده و در حال حاضر توسط شرکت‌هایی همچون یاهو و بنیاد نرم‌افزاری آپاچی توسعه یافته و پشتیبانی ‌می‌شود. در پست های آتی به‌طور مفصل به معرفی هادوپ و تاریخچه‌ی آن خواهیم پرداخت. آموزش مباحث تئوری و عملی هادوپ بخش مهمی از آموزش های آتی سایت ما خواهد بود.

سومین اشتباه در مورد مه داده ها

اشتباه سوم اینکه گمان ‌می‌شود بزرگ‌داده‌ها صرفا به معنی داده‌های غیرساخت یافته است. در مورد داده های غیرساخت یافته در این پست صحبت کوتاهی داشتیم. اما مانند اشتباه اول، داده‌های غیرساخت‌یافته تنها بخشی از داده‌هایی است که مورد استفاده قرار ‌می‌گیرد. در بحث بزرگ‌داده‌ها، داده‌های ما ممکن است از منابع مختلفی باشند به همین دلیل ممکن است ساختارهای مختلفی هم داشته باشند. برخی ممکن است ساخت یافته، برخی نیمه ساخت یافته[۲] و برخی هم غیرساخت یافته باشند. پس شاید بهتر باشد بگوییم مساله‌ی بزرگ‌داده‌ها با داده‌های چندساختاری[۳] و نه فقط با داده‌های غیرساخت‌یافته، کار ‌می‌کند.

چهارمین اشتباه در مورد مه داده ها

اشتباه چهارم اینکه برخی فکر ‌می‌کنند مساله‌ی بزرگ‌داده ها فقط خاص شرکت‌های بزرگی مثل گوگل، یاهو و یا آمازون است و این مشکل آن هاست و ربطی به سایرین ندارد! درحالی‌که در هر مکان و زمانی ممکن است شما با داده‌هایی سروکار داشته باشید که مطابق با تعریفی باشد که از بزرگ‌داده‌ها ارائه شد. روند رشد نمایی داده ها (لینک) به خوبی نشان می دهد که شرکت های نه چندان بزرگ نیز در آینده ای نزدیک با این پدیده روبه رو خواهند شد. حتی با مقایسه‌ی وضعیت داده‌های خود شما با چند سال پیش ‌می‌توانید به‌راحتی متوجه تغییرات گسترده‌ای که پیرامون محل کار و یا خانه‌ی شما اتفاق افتاده بشوید. به‌عنوان مثال، ظهور گوشی‌های هوشمند، دوربین‌های دیجیتال، تبلت‌ها و داده هایی که تولید می کنند و از طرفی دردسترس بودن انواع حافظه‌های ذخیره‌سازی موجب شده است که حتی شما هم در بروز پدیده‌ی بزرگ‌داده‌ها نقش داشته باشید.

پنجمین اشتباه در مورد مه داده ها

در نهایت اشتباه پنجم و آخر اینکه، در مساله‌ی ذخیره‌سازی بزرگ‌داده‌ها گمان ‌می‌شود که پایگاه‌داده‌های NoSql، به معنی کنارگذاشتن روش‌های سنتی SQL است. درحالی‌که چنین نیست و کلمه‌ی NoSql بیشتر دلالت به این معنا دارد که پایگاه‌داده‌های مبتنی بر SQL به تنهایی پاسخگوی نیازهای جدید ما در عصر داده‌ها نیستند[۴] و برای ذخیره و پردازش چنین داده‌هایی نیازمند ابزارهای جدیدِ ذخیره‌سازی و پردازشی هستیم. در بُعد پردازش که ابزارهایی نظیر هادوپ و در بُعد ذخیره‌سازی هم پایگاه‌داده‌های NoSql موجود به ما کمک می‌کنند. معرفی و آموزش کار با انواع پایگاه داده های NoSQL در برنامه ی کاری سایت ما قرار دارد و ان شاءالله در آینده ای نزدیک مطالب مفیدی را در این باره منتشر خواهیم کرد. اطلاعات مفیدی در مورد انواع پایگاه داده های NoSQL را می توانید در این لینک ببینید.

 

[۱] Hadoop

[۲] Semi-Structured

[۳] Multi-structured

[۴] Not Only SQL 

Related Posts
نگاهی سیاسی اقتصادی به مه داده ها
سلام. بدون مقدمه چند سوال مطرح می کنم: آیا بزرگ داده ها و توانایی تحلیل آن ها برای هر سازمان، شرکت، ارگان، نهاد و یا یک دولت یک قدرت محسوب ...
READ MORE
معادل فارسی Big data
به نام خدا. سلام. عنوان مطلب گویای آنچه قرار است در موردش صحبت کنیم، هست. به کار بردن معادل فارسی Big Data هم برای خودش تبدیل به معضلی شده است! ...
READ MORE
چالش‌های مه‌داده‌ها
در مسائل مرتبط با داده‌های بزرگ (مه‌داده‌ها)، ‌اندازه‌ی داده‌ها یک مفهوم نسبی است و بستگی به نقطه‌ی آغاز تحلیل داده‌ها و نحوه‌ی جمع‌آوری آن‌ها دارد. در نظرسنجی انجام شده توسط ...
READ MORE
domo-infograghic
به نام خدا. سلام. دنیایی که در آن و در کمتر از سی سال پیش حجم یک فلاپی دیسک برای ذخیره تمام داده های یک کاربر کافی بود، دنیایی که ...
READ MORE
مدل 4V شرکت IBM
به نام خدا. سلام. در این پست در مورد تعریف big data از دیدگاه شرکت IBM صحبت خواهیم کرد. همان طور که در این پست در مورد تعاریف مختلف بزرگ ...
READ MORE
نگاهی سیاسی-اقتصادی به مِه داده ها
معادل فارسی Big Data چیست؟
چالش‌های مه‌داده‌ها
نگاهی به آمار در مِه داده ها
مدل ۴V شرکت IBM برای توصیف مه داده

درباره ی songho

دانشجوی دکتری کامپیوتر گرایش نرم افزار دانشگاه آزاد کرمانشاه و علاقمند به مباحث مرتبط با برنامه نویسی توزیع شده، بزرگ داده ها و علوم داده ها، داده کاوی و یادگیری ماشین هستم.

همچنین ببینید

بزرگ داده ها

تعریف بزرگ داده ها (مه داده ها)

به نام خدا. سلام. هدف ما از ذخیره‌سازی داده‌ها نظم‌دادن به دانش‌ خودمان است. پیداکردن …

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

شما می‌توانید از این دستورات HTML استفاده کنید: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>