تحلیل برای منابع داده‌ی چند جدولی از Relationship

نحوه‌ی عملکرد تحلیل برای منابع داده‌ی چند جدولی که از Relationship استفاده می‌کنند

استفاده از منبع داده‌ای که دارای چندین جدول مرتبط است، بر نحوه عملکرد تحلیل در Tableau تأثیر می‌گذارد. از آنجا که چندین جدول مرتبط، دامنه‌های مستقلی دارند و سطح جزئیات بومی خود را حفظ می‌کنند، وقتی فیلدها را به نمای مورد نظر می‌کشانید:

  • داده‌ها در سطح جزئیات طبیعی خود پرس‌وجو می‌شوند.
  • فقط داده‌هایی که مربوط به یک viz هستند، پرس‌وجو می‌شوند.
  • روابط بین جداول بر نتایج پرس‌وجو تأثیر می‌گذارد. جریان ساخت یک viz می‌تواند بسته به نحوه ارتباط جداول فیلدها با یکدیگر در مدل داده یا عدم ارتباط مستقیم آنها متفاوت باشد.

ملاحظاتی برای تحلیل

  • اعتبارسنجی روابط Relationship

شما گزینه‌های مختلفی برای اعتبارسنجی مدل داده خود برای تحلیل دارید. هنگام ایجاد مدل برای منبع داده خود، توصیه می‌کنیم به یک برگه بروید، آن منبع داده را انتخاب کنید و سپس یک viz برای بررسی تعداد رکوردها، داده‌های مورد انتظار، مقادیر نامتناسب، مقادیر تهی یا مقادیر اندازه‌گیری مکرر بسازید. سعی کنید با فیلدها در جداول مختلف کار کنید تا مطمئن شوید همه چیز همانطور که انتظار دارید به نظر می‌رسد.

به دنبال چه چیزی باشید:

  • آیا روابط شما در مدل داده از فیلدهای تطبیق صحیح برای جداول خود استفاده می‌کنند؟
  • آیا اضافه کردن چندین جفت فیلد تطبیق، رابطه را دقیق‌تر می‌کند؟
  • نتیجه کشیدن ابعاد و معیارهای مختلف به نما چیست؟
  • آیا تعداد ردیف‌های مورد انتظار را می‌بینید؟
  • اگر هر یک از تنظیمات گزینه‌های عملکرد را از تنظیمات پیش‌فرض تغییر داده‌اید، آیا مقادیری که در viz می‌بینید، همان‌هایی هستند که انتظار داشتید؟ اگر اینطور نیست، ممکن است بخواهید تنظیمات را بررسی کنید یا به حالت پیش‌فرض برگردانید.

گزینه‌هایی برای اعتبارسنجی روابط و مدل داده:

  • هر جدول شامل تعداد رکوردهای خود، به عنوان فیلدی به نام TableName(Count)، در سطح جزئیات آن جدول است. برای مشاهده تعداد رکوردهای یک جدول، فیلد Count آن را به داخل نما بکشید. برای مشاهده تعداد رکوردها برای همه جداول، فیلد Count را برای هر جدول در پنجره Data انتخاب کنید و سپس روی Text Table در Show Me کلیک کنید.
  • برای مشاهده تعداد ردیف‌ها و داده‌های هر جدول، روی View Data در پنجره Data کلیک کنید. همچنین، قبل از شروع ایجاد روابط، مشاهده داده‌ها از منبع داده قبل یا در حین تجزیه و تحلیل می‌تواند برای درک دامنه هر جدول مفید باشد. برای اطلاعات بیشتر، به View Underlying Data مراجعه کنید.
  • ابعاد را روی ردیف‌ها بکشید تا تعداد ردیف‌ها را در نوار وضعیت مشاهده کنید. برای مشاهده مقادیر نامتناسب، روی منوی Analysis کلیک کنید و سپس Table Layout > Show Empty Rows یا Show Empty Columns را انتخاب کنید. همچنین می‌توانید معیارهای مختلفی مانند <YourTable>(Count) را از یکی از جداول نمایش داده شده در viz خود به نما بکشید. این تضمین می‌کند که شما تمام مقادیر ابعاد را از آن جدول خواهید دید.

نکته: اگر می‌خواهید کوئری‌هایی که برای Relationship ایجاد می‌شوند را ببینید، می‌توانید از ضبط‌کننده عملکرد در Tableau Desktop استفاده کنید.

  1. روی منوی Help کلیک کنید و سپس Settings and Performance > Start Performance Recording را انتخاب کنید.
  2. فیلدها را به داخل نما بکشید تا Viz خود را بسازید.
  3. روی منوی Help کلیک کنید و سپس Settings and Performance > Stop Performance Recording را انتخاب کنید. Workbook ضبط عملکرد به طور خودکار باز می‌شود.
  4. در داشبورد Performance Summary، در قسمت Events Sorted By Time، روی نوار “Executing Query” کلیک کنید و کوئری زیر را مشاهده کنید.
  • تجسم‌های فقط بُعدی

هنگام استفاده از یک منبع داده چند جدولی با جداول مرتبط: اگر یک viz فقط بُعدی ایجاد کنید، Tableau از اتصالات داخلی استفاده می‌کند و شما دامنه کامل تطبیق نیافته را نخواهید دید.

برای دیدن ترکیب‌های جزئی از مقادیر بُعد (Dimension)، می‌توانید:

  • برای دیدن همه ردیف‌های ممکن از Show Empty Rows/Columns استفاده کنید. روی منوی Analysis کلیک کنید و سپس Table Layout > Show Empty Rows یا Show Empty Columns را انتخاب کنید. توجه داشته باشید که این تنظیم باعث فشرده‌سازی فیلدهای Date و Numeric Bin نیز می‌شود که ممکن است ناخواسته باشد.
  • یک معیار به view اضافه کنید، مانند <YourTable>(Count) از یکی از جداول نمایش داده شده در viz شما. این تضمین می‌کند که شما همه مقادیر ابعاد را از آن جدول خواهید دید.
  • چه زمانی از محاسبات و عبارات LOD استفاده کنیم

از آنجا که Tableau سطح جزئیات (LOD) جداول ورودی شما را درک می‌کند، نیازی به استفاده از محاسبات LOD برای حذف تکرارهای ناخواسته ناشی از اتصال‌ها ندارید.

شما هنوز هم می‌توانید از محاسبات LOD برای موارد زیر استفاده کنید:

  • مدیریت تکرارهای ناخواسته در جداول منبع خود.
  • محاسبه تجمیع‌های چند سطحی (مثلاً میانگین روی یک جمع)
  • برای انجام تجزیه و تحلیل گروهی (مثلاً محاسبه تاریخ اولین سفارش برای هر مشتری)

اگر ابعاد یک محاسبه LOD شامل فیلدهایی از یک جدول واحد باشد، آن محاسبه LOD در جدول مربوط به خود در پنجره Data ظاهر می‌شود.

نمونه‌هایی از تحلیل چند جدولی

مجموعه مثال‌های زیر نشان می‌دهد که چگونه می‌توان داده‌ها را در چندین جدول مرتبط جستجو کرد. این منبع داده چند جدولی شامل فهرست کوتاهی از حضور بازیگران در نقش‌های مختلف فیلم است.

یک ردیف در جدول «Appearances» به این معنی است که یک بازیگر نقش خاصی را در یک فیلم خاص بازی کرده است. در این مجموعه داده، یک بازیگر می‌تواند صفر یا چند حضور داشته باشد.

مثال ۱: تحلیل یک سوال واحد در داده‌های پیوسته در مقابل داده‌های مرتبط

هنگامی که قبل از ۲۰۲۰.۲ به داده‌ها در Tableau متصل می‌شدید، منبع داده شما می‌توانست شامل یک جدول واحد یا چندین جدول باشد که در یک جدول واحد و غیرنرمال شده به هم پیوسته یا متحد شده‌اند. با شروع Tableau 2020.2، Tableau داده‌های نرمال شده را برای منابع داده چند جدولی شناسایی و حفظ می‌کند، جایی که داده‌های جدول جدا از هم باقی می‌مانند و هر جدول سطح جزئیات بومی خود را حفظ می‌کند. مثال‌های زیر نشان می‌دهند که چگونه تحلیل بین منابع داده تک جدولی و چند جدولی متفاوت است.

این مثال سه جدول از داده‌های فیلم را نشان می‌دهد: ظاهر، بازیگران و فیلم‌ها.

تحلیل برای منابع داده‌ی چند جدولی از Relationship

این جداول را می‌توان به هم متصل کرد، جدول Appearances را با جدول Actors در Actor = Actor و جدول Appearances را با جدول Movies در Movie = Movie متصل کرد. اگر اتصال‌ها از نوع اتصال‌های بیرونی کامل باشند، بنابراین هیچ ردیفی از بین نمی‌رود، خروجی نهایی به این شکل خواهد بود. توجه داشته باشید که فیلدهایی که در بندهای اتصال استفاده می‌شوند، دو بار ظاهر می‌شوند.

تحلیل برای منابع داده‌ی چند جدولی از Relationship

داده‌هایی که به این روش در یک جدول واحد گردآوری می‌شوند، غیرنرمال‌سازی شده یا مسطح‌سازی شده نامیده می‌شوند.

این داده‌های پیوسته، داده‌های مسطح‌سازی شده هستند. هر ردیف شامل حضور یک بازیگر به عنوان یک شخصیت در یک فیلم است (بنابراین جان ریس-دیویس دو ردیف برای فیلم بازگشت پادشاه دارد زیرا او دو شخصیت را بازی کرده است)؛ بنابراین جزئیات داده‌ها در سطح یک شخصیت در یک فیلم است. اطلاعاتی که در چندین ردیف مرتبط هستند، کپی می‌شوند. تاریخ نمایش فیلم بازگشت پادشاه دو بار ارائه شده است زیرا دو شخصیت از آن فیلم در مجموعه داده‌ها وجود دارد. قد جان ریس-دیویس پنج بار فهرست شده است زیرا 5 ترکیب منحصر به فرد از شخصیت/فیلم برای او به عنوان یک بازیگر وجود دارد.

datasource multitable analysis

بنابراین، این داده‌های مسطح‌سازی شده دارای ویژگی‌هایی هستند که باید از آنها آگاه باشید. به عنوان مثال، اگر می‌خواستید قد بازیگر را بر اساس میانگین ناخالص فیلم‌هایش رسم کنید، ممکن است فرض کنید که می‌توانیم قد را به ستون‌ها و ناخالص را به ردیف‌ها بیاوریم، سپس میانگین ناخالص را بگیریم. اما اگر این کار را انجام دهید، نمای پیش‌فرض درست به نظر نمی‌رسد. اینجا قرار است قد جان ریس-دیویس ۹۲۵ سانتی‌متر باشد، یعنی بیش از ۹ متر!

تحلیل برای منابع داده‌ی چند جدولی از Relationship

دلیل این امر این است که تجمیع پیش‌فرض SUM است. 5 ردیف در داده‌ها برای او وجود دارد، بنابراین ما قد واقعی او را که 185 سانتی‌متر است، پنج بار به دست می‌آوریم. می‌توانید این مشکل را با تغییر تجمیع روی ارتفاع، مثلاً به میانگین یا حداقل، برطرف کنید. این روش عملاً مقدار فقط یک ردیف را برمی‌گرداند (زیرا همه آنها یکسان هستند).

تحلیل برای منابع داده‌ی چند جدولی از Relationship

وقتی تجمیع را تغییر می‌دهید، ارتفاع‌ها بسیار واقعی‌تر می‌شوند. اما حالا باید به میانگین ناخالص توجه کنید. به یاد داشته باشید که Tableau هر پنج ردیف را برای قد جان ریس-دیویس در نظر می‌گیرد. وقتی به میانگین ناخالص فیلم‌هایی که او در آنها بازی کرده فکر می‌کنید، نباید میانگین پنج ردیف باشد، بلکه باید میانگین سه فیلم باشد. شما نمی‌خواهید ناخالص بازگشت پادشاه را فقط به این دلیل که او در آن دو شخصیت را بازی کرده است، دو بار بشمارید. اما آیا این چیزی است که اتفاق می‌افتد؟

با انجام یک محاسبه سریع، فیلم‌های ارباب حلقه‌ها باید میانگین (869 + 923 + 1119) / 3 یا 970.3 دلار داشته باشند. با این حال، مقدار موجود در نمودار پراکندگی 990.6 دلار است. میانگین فعلی از پنج ردیف (869 + 923 + 923 + 1119 + 1119) / 5 است.

برای خرید لایسنس نرم افزار Tableau ، می‌توانید از خدمات ما استفاده نموده و درخواست خود را از طریق فرم زیر ثبت نمایید.

فرم درخواست لایسنس Tableau

تحلیل چند جدولی

این به آسانی مشکل قد با تغییر تجمیع قابل حل نیست. شما باید از یک عبارت سطح جزئیات (LOD) برای تغییر سطح جزئیاتی که Tableau به آن نگاه می‌کند، استفاده کنید، از حالت پیش‌فرض – ظاهر – تا سطح فیلم. می‌توانید محاسبه‌ای برای LOD Gross به صورت {FIXED [فیلم] : MIN([ناخالص (میلیون دلار آمریکا)])} ایجاد کنید و سپس میانگین آن فیلد جدید LOD Gross را برای نمای خود بگیرید.

عبارت LOD را می‌توان به صورت «برای هر فیلم، حداقل ناخالص آن را برگردانید» خواند. این کار مشکل تکرار را از بین می‌برد زیرا ناخالص همیشه به ازای هر فیلم برگردانده می‌شود، حتی اگر نما با فیلم و بازیگر ساخته شده باشد.

تحلیل برای منابع داده‌ی چند جدولی از Relationship

حالا اعداد درست هستند. قد جان ریس-دیویس ۱۸۵ سانتی‌متر است و میانگین درآمد ناخالص فیلم‌های او در این مجموعه داده ۹۷۰.۳ است. قبل از اینکه بتوانید از صحت مقادیر برگشتی اطمینان حاصل کنید، باید بفهمید که داده‌ها چگونه تکثیر می‌شوند و Tableau چگونه داده‌ها را برای نمایش آنها تجمیع می‌کند.

داده‌های نرمال‌شده در جداول چندگانه

ایجاد روابط بین جداول منطقی ممکن است شبیه به ایجاد پیوندها به نظر برسد، اما به جای مسطح کردن داده‌ها در یک جدول واحد، با تمام تکرارهایی که می‌تواند به همراه داشته باشد، Tableau از روابط بین جداول آگاه می‌ماند. اطلاعات از هر جدول در سطح مناسبی از جزئیات و مرتبط با سایر داده‌ها استخراج می‌شود.

در صفحه منبع داده، نمای شبکه‌ای “کامل” جدول مسطح‌شده را نخواهید دید. چنین چیزی وجود ندارد. Tableau هر سه جدول را همانطور که هستند نگه می‌دارد و صرفاً روابط را برقرار می‌کند و داده‌های مورد نیاز را در صورت نیاز نما، کنار هم قرار می‌دهد.

تحلیل برای منابع داده‌ی چند جدولی از Relationship

برای ایجاد همان نمودار پراکندگی، Height و Gross را به داخل نما بکشید و Gross را روی average تنظیم کنید. همین! Tableau نحوه ارتباط داده‌های هر جدول با داده‌های سایر جداول مرتبط را بررسی می‌کند و نحوه نمایش ارتفاع (بر اساس بازیگر) و نحوه محاسبه میانگین ناخالص (بر اساس فیلم) را استنباط می‌کند.

تحلیل برای منابع داده‌ی چند جدولی از Relationship

مثال ۲: ابعاد از یک جدول واحد

اگر ابعاد در تجسم شما از یک جدول واحد آمده باشند، Tableau فقط از همان جدول پرس و جو می‌کند و نتایج را برای کل دامنه نشان می‌دهد. می‌توانید معیارها را اضافه کنید و همچنان کل دامنه را ببینید.

به عنوان مثال، با استفاده از منبع داده Movie Appearances که در بالا معرفی شد، افزودن فیلد Actor به یک تجسم، تجسم زیر را ایجاد می‌کند:

تحلیل برای منابع داده‌ی چند جدولی از Relationship

از آنجا که تنها بُعد در viz از جدول Actors آمده است، Tableau فقط یک پرس‌وجو را در برابر جدول Actors اجرا می‌کند. تمام بازیگرانی که در جدول Actors ظاهر می‌شوند، صرف نظر از اینکه آیا ظاهری دارند یا خیر، در viz نمایش داده می‌شوند.

تحلیل برای منابع داده‌ی چند جدولی از Relationship

آوردن فیلد Appearance Actor به عنوان یک معیار در نما و سپس اعمال تجمیع COUNT، نمایی ایجاد می‌کند که تعداد حضورها بر اساس بازیگران را نشان می‌دهد. توجه داشته باشید که Sigourney Weaver هیچ حضوری ندارد، اما نام او هنوز در نما وجود دارد.

تحلیل برای منابع داده‌ی چند جدولی از Relationship

مثال ۳: ابعاد از چندین جدول

اگر ابعاد در نما از چندین جدول باشند، Tableau جدولی را پیدا می‌کند که تمام ابعاد را به هم مرتبط می‌کند و دامنه آن جدول را نشان می‌دهد. در نتیجه، برخی از مقادیر ابعادی که در مثال ۱ مشاهده کردید تغییر می‌کنند.

به عنوان مثال، کشیدن یک فیلد از جدول Movies به viz، پرس‌وجو را تغییر می‌دهد. از آنجا که جداول Movies و Actors توسط جدول Appearances مرتبط هستند، پرس‌وجو فقط جفت‌های Actor/Movie موجود در جدول Appearances را برمی‌گرداند.

تحلیل برای منابع داده‌ی چند جدولی از Relationship

از آنجا که سیگورنی ویور هیچ حضور (یا ظاهری) در این مجموعه داده‌ها ندارد (و بنابراین، به هیچ یک از فیلم‌های موجود در مجموعه داده‌ها مرتبط نیست)، نمودار زوج‌های بازیگر/فیلم او را نشان نمی‌دهد:

تحلیل برای منابع داده‌ی چند جدولی از Relationship

مثال ۴: معیارهایی که نمی‌توانند بر اساس یک بُعد تقسیم شوند

اگر یک معیار نتواند بر اساس یک بُعد تقسیم شود، Tableau آن معیار را در آن بُعد تکرار می‌کند.

تصویرسازی بعدی کل مبلغ جمع‌آوری‌شده توسط Movie را نشان می‌دهد. از آنجایی که هر دو فیلد از جدول Movies آمده‌اند، Tableau فقط جدول Movies را جستجو می‌کند.

تحلیل برای منابع داده‌ی چند جدولی از Relationship

جدول فیلم‌ها شامل درآمد ناخالص تجمیع‌شده برای هر فیلم است، همانطور که در تصویرسازی زیر نشان داده شده است (در زمان ایجاد این مجموعه داده‌ها، درآمد ناخالص برای فیلم جنگ ابدیت در دسترس نبود و با عدد صفر نشان داده شده است).

تحلیل برای منابع داده‌ی چند جدولی از Relationship

اگر بازیگر را به این تجسم اضافه کنید، Tableau می‌داند که نمی‌تواند درآمد ناخالص فیلم را بر اساس بازیگر تجزیه کند، زیرا این اطلاعات جزئی‌تر در مدل داده موجود نیست. در عوض، Tableau درآمد ناخالص فیلم را برای هر فیلم نشان می‌دهد که در بین بازیگران تکرار شده است.

تحلیل برای منابع داده‌ی چند جدولی از Relationship

مثال ۵: بُعدی که به صورت سلسله مراتبی به یک معیار مرتبط نیست

حذف بُعد فیلم از تجسم قبلی، مجموع معیار فیلم ناخالص را برای هر بازیگر جستجو می‌کند. نتیجه، مجموع فیلم ناخالص برای هر فیلمی است که بازیگر در آن ظاهر شده است.

در این مورد، رابطه سلسله مراتبی بین بُعد، بازیگر، و معیار، فیلم ناخالص وجود ندارد – ممکن است چندین بازیگر در یک فیلم ظاهر شده باشند. به عنوان مثال، بندیکت کامبربچ و کریس همسورث هر دو در دکتر استرنج ظاهر شدند. در این مورد، Tableau فیلم ناخالص را برای دکتر استرنج در مجموع هر دو بازیگر لحاظ می‌کند.

از آنجا که مقدار فیلم ناخالص یکسانی در مجموع چندین بازیگر گنجانده شده است، Tableau مستقیماً این مقادیر را جمع نمی‌کند.

تحلیل برای منابع داده‌ی چند جدولی از Relationship

با این حال، هنگامی که مجموع‌ها برای این تجسم نشان داده می‌شوند، توجه داشته باشید که Tableau به درستی کل درآمد ناخالص فیلم را بدون احتساب فیلم‌های تکراری محاسبه می‌کند.

تحلیل برای منابع داده‌ی چند جدولی از Relationship

 

برای خرید لایسنس نرم افزار Tableau ، می‌توانید از خدمات ما استفاده نموده و درخواست خود را از طریق فرم زیر ثبت نمایید.

فرم درخواست لایسنس Tableau

 

tableau desktop download

 

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *