خانه / ۱۳۹۵ / خرداد

مدل داده رابطه ای بر اساس دو مفهوم اساسی موجودیت و رابطه بنا نهاده شده است. از این رو آن را با نام مدل ER نیز می‌شناسند.

موجودیت: نمایانگر همه چیزهایی که در پایگاه داده وجود خارجی دارند یا به تصور در می‌آیند.

صفت: پدیده‌ها دارای مشخصاتی هستندکه به آن‌ها صفت گفته می‌شود.

رابطه: پدیده‌ها را به هم می‌پیوندد و چگونگی در ارتباط قرار گرفتن آن‌ها با یکدیگر را مشخص می‌کند.

مدل داده چند ‌بُعدی یا MD بر پایه دو ساختار جدولی اصلی بنا نهاده‌ شده‌ است:

  • جدول حقایق یا Fact Table
  • جداول ابعاد‏ یا Dimension Table

این ساختار امکان داشتن یک نگرش مدیریتی و تصمیم گیری به داده‌های موجود در پایگاه داده را تسهیل می کند. Continue reading “مدل‌های داده ای رابطه ای و چند بُعدی”

حتما برای شما هم مواردی پیش آمده است که در میان ابرها شکل شئ را دیده یا با نگاه به آسمان شب در میان انبوه ستارگان، دب اکبر را تشخیص داده باشید. در این میان مغز آدمی‌ از میان هزاران ستاره در فضا، به خطوطی یک بُعدی و با ارتباط آن خطوط با یکدیگر به شکلی دو بُعدی دست یافته است. آدمی‌ میل شدیدی به استخراج الگو یا مدلی از میان انبوه داده‌ها دارد تا از آن معنا و مفهوم خاصی را استنتاج کند. داده کاوی نیز بر همین اساس شکل گرفته است. پاسخ به سوالاتی درباره داده است که با روش‌های عادی جستجو، قابل آدرسی دهی نباشد. پایه و اساس این تکنیک، ریشه در علوم زیر دارد: Continue reading “مقایسه OLAP و DATAMINING”

ابزارهای داده کاوی بدنبال طرحها و گروه بندی‌هایی در داده‌ها می گردد که ممکن است از دید ما پنهان مانده باشد. در داده کاوی این ابزار است که استفاده کننده را هدایت می کند. ابزار فرض می کند که شما خود نیز دقیقا نمی دانید که چه می خواهید. اولین گام داده کاوی هدفدار ، انتخاب مجموعه داده‌ها برای تحلیل است. داده‌ها می تواند از انباره داده‌ها و یا بانک‌های اطلاعاتی عملیاتی استخراج شود. داده‌ها پس از جمع آوری و حذف موارد تکراری در قالب‌های یکسان تجمیع و پاکسازی می‌شوند. سپس با استفاده از منابع مناسب ،اطلاعات ناقص اصلاح و کدگذاری شده و با ساختار جدیدی آماده میشوند. به این ترتیب داده‌ها برای داده کاوی آماده است و می‌توان به سوالات مختلف داده کاوی از بسته‌های نرم افزاری مختلفی همانند Oracle OLAP Server یا DB2 OLAP Server که شامل ابزارهای داده کاوی قدرتمندی هستند پاسخ داد.
Continue reading “داده کاوی”

  • مبتنی بر موضوع (Subject-Oriented).
  • یکپارچه (Integrated).
  • مبتنی بر بازه‌های زمانی متفاوت (Time Variant).
  • غیر فرار (Nonvolatile).

مبتنی بر موضوع:

یعنی داده‌ها از بانکهای اطلاعاتی مختلف بصورت انتخابی به انباره داده منتقل شده و بر اساس موضوعات خاص دسته بندی می‌شوند. بنابراین کاوش داده‌ها در پرس و جوهای خاص با سرعت و دقت بیشتری انجام می گردد.

هر پایگاه داده تحلیلی حول موضوع خاصی سازمان می‌یابد و فعالیتها وپردازش­های ود را برای مدل کردن و تحلیل داده‌های مرتبط با آن موضوع متمرکز می‌نماید و با کنار گذاشتن داده‌هایی که برای تصمیم‌گیری مفید و موثر نباشند, یک دیدگاه دقیق, ساده و متمرکز بر روی موضوع اصلی ایجاد می‌کند. به این ترتیب، موضوع گرایی یک پایگاه داده تحلیلی متأثر از کاربرد آن در دیدگاه کاربر نهایی است و عملیات ایجاد پایگاه داده تحلیلی بر مبنای موضوع خاص با ابزار یکپارچه سازی و پاکسازی آن میسر میشود.
Continue reading “خصوصیات اساسی انباره داده‌ها”

OLAP شامل سه عملیات عمده تحلیل است:

  • Roll-up: حرکت در سطح جزئی‌تر به سمت کلیت این مرحله شامل تجمیع داده‌هایی است که می‌تواند بروی یک یا چند بُعد محاسبه و قرار داده شده باشد. به عنوان مثال می‌توان اطلاعات تمامی‌دفاتر فروش را در واحد فروش انباشته کرد و یا فروش را بر اساس مقدار بیشتر فروش در هر دفتر بخش بندی کرد.
  • Drill-down: حرکت از سطح کلی تر به جزئی تر یک تکنیک است که به کاربران اجازه می‌دهد بر اساس جزئیات حرکت کنند. از موقعیتی با جزئیات داده‌ای کم به جزئیات زیاد می‌رود. این کار با پایین آمدن در ساختار سلسله مراتبی( به سمت جزئیات بیشتر) یا با ایجاد ابعاد اضافی انجام می‌گیرد. به عنوان مثال کاربر مقدار فروش یک محصول خاص را در منطقه مورد نظر خود مشاهده نماید.
  • Slicing and dicing: یک ویژگی است که به کاربران اجازه می‌دهد برخی از اطلاعات یک مکعب OLAP را بر مبنای دیدگاه‌های متفاوت مشاهده نمایند. برخی از بزرگترین تولید کنندگان سیستم‌های OLAP  در دنیا بر اساس میزان فروش به ترتیب عبارتند ازMicrosoft ،Oracle ،IBM  و …