خانه / داده کاوی / خصوصیات اساسی انباره داده‌ها
خصوصیات اساسی انباره داده‌هاReviewed by عبدالله کشاورز on Jun 22Rating: 4.5خصوصیات اساسی انباره داده‌ها
  • مبتنی بر موضوع (Subject-Oriented).
  • یکپارچه (Integrated).
  • مبتنی بر بازه‌های زمانی متفاوت (Time Variant).
  • غیر فرار (Nonvolatile).

مبتنی بر موضوع:

یعنی داده‌ها از بانکهای اطلاعاتی مختلف بصورت انتخابی به انباره داده منتقل شده و بر اساس موضوعات خاص دسته بندی می‌شوند. بنابراین کاوش داده‌ها در پرس و جوهای خاص با سرعت و دقت بیشتری انجام می گردد.

هر پایگاه داده تحلیلی حول موضوع خاصی سازمان می‌یابد و فعالیتها وپردازش­های ود را برای مدل کردن و تحلیل داده‌های مرتبط با آن موضوع متمرکز می‌نماید و با کنار گذاشتن داده‌هایی که برای تصمیم‌گیری مفید و موثر نباشند, یک دیدگاه دقیق, ساده و متمرکز بر روی موضوع اصلی ایجاد می‌کند. به این ترتیب، موضوع گرایی یک پایگاه داده تحلیلی متأثر از کاربرد آن در دیدگاه کاربر نهایی است و عملیات ایجاد پایگاه داده تحلیلی بر مبنای موضوع خاص با ابزار یکپارچه سازی و پاکسازی آن میسر میشود.

یکپارچگی و یکپارچه سازی:

منابع ایجاد یک پایگاه داده تحلیلی معمولا پایگاه داده‌های عملیاتی هستند که ممکن است نحوه ذخیره اطلاعات در آن­ها متفاوت باشد. علاوه بر آن ممکن است اطلاعات از فایل­های حاوی داده یا رکوردهای حاوی تراکنش برخط نیز تهیه شود. تنوع منابع تولید کننده داده­های مبدأ، منجر به جمع­آوری مجموعه از داده­ها میشود که اگرچه در معنا یکسان هستند، اما قالب ارائه و نمایش آن­ها با یکدیگر متفاوت است. از این رو عملیات پاکسازی و پکپارچه­سازی بر روی داده­ها انجام می­شود تا این مجموعه داده ناسازگار و متفاوت را به داده­های مرتبط و بامعنا تبدیل کند. برای درک مسئله تفاوت داد­ه­ها در منابع، مثال زیر را در نظر بگیرید.

جداولی در دو پایگاه داده عملیاتی متفاوت، دارنده اطلاعات کارمندان یک شرکت هستند که فیلد جنسیت در یکی با ۰ و ۱ و در دیگری با F و M نمایش داده میشود. اگرچه این فیلدها دارای معنای یکسان هستند اما برای قرار گرفتن در پایگاه داده تحلیلی در کنار یکدیگر باید در قالبی استاندارد و یکسان ارائه شوند.

نمایش اطلاعات با معنای یکسان اما تحت قالبهای متفاوت تنها یکی از مصادیق اعمال روشهای پاکسازی و یکپارچه سازی است. پاکسازی و یکپارچه سازی در مواردی دیگر چون

  • سازگارسازی قوانین نامگذاری
  • یکسان سازی واحدهای اندازه­گیری
  • یکسان سازی کدهای رمزگذاری و…

باید اعمال شود تا مجموعه داده حاصل از منابع گوناگون به صورت سازگار و پایدار در کنار یکدیگر قرار گیرند و یکپارچگی پایگاه داده تحلیلی را تضمین نمایند.

مبتنی بر بازه‌های زمانی متفاوت:

از مهم­ترین مشخصات یک پایگاه داده تحلیلی که موجب تفاوت اساسی آن با پایگاه داده عملیاتی شده است، اهمیت بُعد زمان در پرسش­ها و ارزیابی­های کاربران نهایی است. همان­طور که گفته شد، پایگاه داده­های تحلیلی مولد کاربردهای تصمیم­یار و نوع درخواست­ها و پرسش­هایی بود که در این رده از کاربردها مطرح می­شد. بررسی عوامل و حقایق مربوط به موضوع در زمان­های متفاوت و مقایسه آ­ن­ها از جمله­ی اساسی­ترین پرسش­های این دسته کاربردهاست. محدوده و بازه­ی زمانی داده­های ذخیره شده در پایگاه‌های داده تحلیلی نیز،  به مراتب وسیع­‌تر از سیستم‌های عملیاتی رایج است. در پایگاه­‌های داده عملیاتی, داده‌های به­روز ذخیره می­شوند و با مقادیر جاری خود مورد بررسی قرار می‌گیرند در حالیکه در پایگاه‌های داده تحلیلی، داده­ها در بازه­های زمانی متفاوت و به صورت تاریخچه­ایی ذخیره می­شوند و اطلاعات از منظر سوابق زمانی و دوره­های بایگانی مورد بررسی قرار می­گیرند. هر ساختار کلیدی در پایگاه داده تحلیلی, به طور صریح یا ضمنی, شامل عنصر زمان است در حالیکه کلیدهای داده‌های عملیاتی می‌توانند شامل زمان باشند یا نباشند.

 غیرفرار:

در پایگاه داده­های عملیاتی داده­ها به صورت مکرر درج می­شوند، ویرایش می­شوند و ممکن است حذف گردند. اما در مورد پایگاه داده تحلیلی به این صورت نیست. پس از تهیه داده­ها از منابع و پاکسازی و یکپارچه­سازی آن­ها، داده­ها وارد پایگاه داده تحلیلی می­شوند. اما این داده­ها به صورت فقط خواندنی در اختیار کاربران قرار می­گیرند و ویرایش معمول در محیط­های عملیاتی در مورد این پایگاه داده­ها موضوعیت ندارد. اگرچه داده­های موجود در پایگاه داده تحلیلی نیز بروز می­شود اما بروزرسانی آن متفاوت از محیط­های عملیاتی است.

بدون دیدگاه
دیدگاه های در انتظار تایید مدیریت : 0

دیدگاه شما