خانه / "داده کاوی"

تعریف قسمت‌های مختلف Solution Explorer

پس از ایجاد پروژه آنالیز سرویس برای طراحی یک مکعب، باید برخی از قسمت‌ های پنجره Solution Explorer همانند شکل زیر مقداردهی شود:

تعریف قسمت‌های مختلف Solution Explorer

پنجره Solution Explorer شامل ۸ فولدر به شرح زیر می باشد:

۱- تعریف پایگاه داده مورد استفاده (Data Sources)

در این قسمت پایگاه داده ای که می خواهیم مورد آنالیز قرار بدهیم تعریف می شود. انباره داده‌ها احتمالا از منابع داده ای مختلفی ساخته شده اند نظیر Microsoft SQL Server, Oracle, DB2, Teradata و … آنالایز سرویس به آسانی می تواند داده‌های مرتبط را از انواع بانک‌ های اطلاعاتی رابطه ای بازیابی نماید.

شئ Data source حاوی اطلاعات مورد نیاز برای اتصال به منابع اطلاعاتی مانند نام سرور، کاتالوگ یا نام بانک اطلاعاتی و گواهی نامه ورود است. برقراری ارتباط‌ های شما با سرورهای مرتبط، بوسیله ایجاد یک Data source برای هر یک از آنها امکان پذیر می باشد. Continue reading “آشنایی با بخش‌های مختلف طراحی یک مکعب داده در ویژوال استودیو”

تعریف پایگاه داده AdventureworksDW

یک پایگاه داده از شرکتی ساختگی یا خیالی است. یک شرکت ساخت و تولید چند ملیتی که فلز و کامپوزیت دوچرخه برای مراکز فروش در شمال آمریکا ، اروپا و آسیا تولید می کند.

شعبه اصلی آن در واشنگتن قرار دارد جایی که این شرکت ۵۰۰ کارمند در استخدام خود دارد. همچنین این شرکت چندین تیم در نواحی مختلف در سرتاسر بازار نیز استخدام کرده است.

جدول های تشکیل دهنده ی این پایگاه

AdventureWorksDWBuildVersion: جدول ورژن که شامل تاریخ و زمان ساخت این پایگاه است.

DatabaseLog: جدول ثبت وقایع اتفاق افتاده بر روی این پایگاه.

DimAccount: جدول حساب‌ها که شامل توضیح حساب‌ها اعم از دارایی، پول نقد، مطالبات، موجودی، ترازنامه، مواد خام، بیمه، فروش ناخالص، تخفیفات، غذا، تلفن، مالیات، اجاره و…

نوع حساب شامل جاری، مخارج، سود، تراز، دارایی‌ها و…

نوع ارزش، که همگی از نوع پولی هستند. Continue reading “آشنایی با پایگاه داده AdventureworksDW”

حتما برای شما هم مواردی پیش آمده است که در میان ابرها شکل شئ را دیده یا با نگاه به آسمان شب در میان انبوه ستارگان، دب اکبر را تشخیص داده باشید. در این میان مغز آدمی‌ از میان هزاران ستاره در فضا، به خطوطی یک بُعدی و با ارتباط آن خطوط با یکدیگر به شکلی دو بُعدی دست یافته است. آدمی‌ میل شدیدی به استخراج الگو یا مدلی از میان انبوه داده‌ها دارد تا از آن معنا و مفهوم خاصی را استنتاج کند. داده کاوی نیز بر همین اساس شکل گرفته است. پاسخ به سوالاتی درباره داده است که با روش‌های عادی جستجو، قابل آدرسی دهی نباشد. پایه و اساس این تکنیک، ریشه در علوم زیر دارد: Continue reading “مقایسه OLAP و DATAMINING”

ابزارهای داده کاوی بدنبال طرحها و گروه بندی‌هایی در داده‌ها می گردد که ممکن است از دید ما پنهان مانده باشد. در داده کاوی این ابزار است که استفاده کننده را هدایت می کند. ابزار فرض می کند که شما خود نیز دقیقا نمی دانید که چه می خواهید. اولین گام داده کاوی هدفدار ، انتخاب مجموعه داده‌ها برای تحلیل است. داده‌ها می تواند از انباره داده‌ها و یا بانک‌های اطلاعاتی عملیاتی استخراج شود. داده‌ها پس از جمع آوری و حذف موارد تکراری در قالب‌های یکسان تجمیع و پاکسازی می‌شوند. سپس با استفاده از منابع مناسب ،اطلاعات ناقص اصلاح و کدگذاری شده و با ساختار جدیدی آماده میشوند. به این ترتیب داده‌ها برای داده کاوی آماده است و می‌توان به سوالات مختلف داده کاوی از بسته‌های نرم افزاری مختلفی همانند Oracle OLAP Server یا DB2 OLAP Server که شامل ابزارهای داده کاوی قدرتمندی هستند پاسخ داد.
Continue reading “داده کاوی”

  • مبتنی بر موضوع (Subject-Oriented).
  • یکپارچه (Integrated).
  • مبتنی بر بازه‌های زمانی متفاوت (Time Variant).
  • غیر فرار (Nonvolatile).

مبتنی بر موضوع:

یعنی داده‌ها از بانکهای اطلاعاتی مختلف بصورت انتخابی به انباره داده منتقل شده و بر اساس موضوعات خاص دسته بندی می‌شوند. بنابراین کاوش داده‌ها در پرس و جوهای خاص با سرعت و دقت بیشتری انجام می گردد.

هر پایگاه داده تحلیلی حول موضوع خاصی سازمان می‌یابد و فعالیتها وپردازش­های ود را برای مدل کردن و تحلیل داده‌های مرتبط با آن موضوع متمرکز می‌نماید و با کنار گذاشتن داده‌هایی که برای تصمیم‌گیری مفید و موثر نباشند, یک دیدگاه دقیق, ساده و متمرکز بر روی موضوع اصلی ایجاد می‌کند. به این ترتیب، موضوع گرایی یک پایگاه داده تحلیلی متأثر از کاربرد آن در دیدگاه کاربر نهایی است و عملیات ایجاد پایگاه داده تحلیلی بر مبنای موضوع خاص با ابزار یکپارچه سازی و پاکسازی آن میسر میشود.
Continue reading “خصوصیات اساسی انباره داده‌ها”