خانه / ۱۳۹۵ / خرداد

تعریف پایگاه داده AdventureworksDW

یک پایگاه داده از شرکتی ساختگی یا خیالی است. یک شرکت ساخت و تولید چند ملیتی که فلز و کامپوزیت دوچرخه برای مراکز فروش در شمال آمریکا ، اروپا و آسیا تولید می کند.

شعبه اصلی آن در واشنگتن قرار دارد جایی که این شرکت ۵۰۰ کارمند در استخدام خود دارد. همچنین این شرکت چندین تیم در نواحی مختلف در سرتاسر بازار نیز استخدام کرده است.

جدول های تشکیل دهنده ی این پایگاه

AdventureWorksDWBuildVersion: جدول ورژن که شامل تاریخ و زمان ساخت این پایگاه است.

DatabaseLog: جدول ثبت وقایع اتفاق افتاده بر روی این پایگاه.

DimAccount: جدول حساب‌ها که شامل توضیح حساب‌ها اعم از دارایی، پول نقد، مطالبات، موجودی، ترازنامه، مواد خام، بیمه، فروش ناخالص، تخفیفات، غذا، تلفن، مالیات، اجاره و…

نوع حساب شامل جاری، مخارج، سود، تراز، دارایی‌ها و…

نوع ارزش، که همگی از نوع پولی هستند. Continue reading “آشنایی با پایگاه داده AdventureworksDW”

مفهوم مکعب

مکعب واحد اصلی ذخیره و آنالیز داده‌ها است. یک مکعب مجموعه ای از داده‌ها است که داده‌ها را از جداول مختلف و با اعمال محدودیت‌های مختلف در یک جا جمع می کند و امکان گرفتن پرس و جو‌های سریع را می دهد. یک مکعب یک ساختار داده ای چند بُعدی است که می توان برای اطلاعات تجاری از آن پرس و جو گرفت. یک مکعب می تواند شامل داده‌های واقعی از یک یا بیشتر از یک جدول واقعی و اغلب شامل چند بُعد باشد.

مفهوم جدول‌های ابعاد

جدول ابعاد شامل سلسله مراتبی از داده‌هایی است که خلاصه ای از آن را می خواهیم. مثلا در جدول سفارشات که ممکن است آن را به ماه و هفته و روز گروه بندی نمود یا جدول کتاب که ممکن است خواسته شود بر اساس عنوان یا دسته گروه بندی شود. Continue reading “عناصر تشکیل دهنده آنالیز سرویس”

قبلا برای بدست آوردن اطلاعات از پایگاه‌های داده از دستورات Sql استفاده می شد. این روند یا روش جایی که یک شخص بخواهد با بخش کوچکی از پایگاه داده کار کند مناسب است. اما روش دیگری برای استفاده از پایگاه داده بویژه پایگاه داده بزرگ وجود دارد. مثلا فرض کنید یک فروشگاه آنلاین کتاب را اجرا می کنید و رکوردهایی برای ۵۰ میلیون کتاب فروخته شده دارید. شاید کتاب‌ها مقدمه ای از خیز بزرگ فروش زیست شناسی در هر سپتامبر را بدهند. در واقع می توان از این مزیت در سفارش بار و ذخیره کردن آن، اگر فقط درباره آن اطلاعات داشت استفاده نمود.

معمولا می خواهید بدانید چه تعداد مردم کتابی خاص را در طول هر ماه از سال سفارش داده اند. برای این منظور می توان یک پرس و جو ساده از Sql نوشت که برای بدست آوردن این اطلاعات ممکن است Sql Server زمان زیادی را بین رکوردهای زیاد طی کند. همچنین اگر اطلاعات درخواستی در یک جدول یا بانک نبود چه اتفاقی می افتد؟ مثلا اطلاعات مشتری‌ها در پایگاه داده ای از نوع Oracle و اطلاعات تولید کننده‌ها در پایگاه داده ای از نوع Access یا  Sql Server بود. چه می شد؟ اگر پس از دیدن اطلاعات ماهانه می خواستید اطلاعات هفتگی هر ماه را مشاهده نمایید؟

جستجو برای الگوهایی مثل این و خلاصه ای از اینها را پردازش تحلیلی آنلاین یا Olap می گویند که شرکت مایکروسافت از طریق برنامه ای به نام Microsoft SQL Server 2008 Analysis Services این امکان را فراهم کرده است.

مدل داده رابطه ای بر اساس دو مفهوم اساسی موجودیت و رابطه بنا نهاده شده است. از این رو آن را با نام مدل ER نیز می‌شناسند.

موجودیت: نمایانگر همه چیزهایی که در پایگاه داده وجود خارجی دارند یا به تصور در می‌آیند.

صفت: پدیده‌ها دارای مشخصاتی هستندکه به آن‌ها صفت گفته می‌شود.

رابطه: پدیده‌ها را به هم می‌پیوندد و چگونگی در ارتباط قرار گرفتن آن‌ها با یکدیگر را مشخص می‌کند.

مدل داده چند ‌بُعدی یا MD بر پایه دو ساختار جدولی اصلی بنا نهاده‌ شده‌ است:

  • جدول حقایق یا Fact Table
  • جداول ابعاد‏ یا Dimension Table

این ساختار امکان داشتن یک نگرش مدیریتی و تصمیم گیری به داده‌های موجود در پایگاه داده را تسهیل می کند. Continue reading “مدل‌های داده ای رابطه ای و چند بُعدی”

حتما برای شما هم مواردی پیش آمده است که در میان ابرها شکل شئ را دیده یا با نگاه به آسمان شب در میان انبوه ستارگان، دب اکبر را تشخیص داده باشید. در این میان مغز آدمی‌ از میان هزاران ستاره در فضا، به خطوطی یک بُعدی و با ارتباط آن خطوط با یکدیگر به شکلی دو بُعدی دست یافته است. آدمی‌ میل شدیدی به استخراج الگو یا مدلی از میان انبوه داده‌ها دارد تا از آن معنا و مفهوم خاصی را استنتاج کند. داده کاوی نیز بر همین اساس شکل گرفته است. پاسخ به سوالاتی درباره داده است که با روش‌های عادی جستجو، قابل آدرسی دهی نباشد. پایه و اساس این تکنیک، ریشه در علوم زیر دارد: Continue reading “مقایسه OLAP و DATAMINING”