استخراج داده‌ ها (Extract Data) در Tableau Desktop

استخراج داده‌ ها (Extract Data)

یک اکسترکت یا استخراج داده (data extract) زیرمجموعه‌ای از اطلاعات است که به طور جداگانه از مجموعه داده اصلی ذخیره می‌شود. این کار دو هدف را دنبال می‌کند: بهبود عملکرد و استفاده از قابلیت‌های Tableau که ممکن است در داده‌های اصلی در دسترس یا پشتیبانی نشوند. با ایجاد یک اکسترکت داده، می‌توانید با اعمال فیلترها و تنظیم محدودیت‌های دیگر، به طور موثری حجم کلی داده‌ها را کاهش دهید.

پس از ایجاد یک استخراج داده، می‌توان آن را با آخرین داده‌ها از منبع اصلی تازه‌سازی کرد. در طول فرآیند تازه‌سازی، شما انعطاف‌پذیری دارید که بین یک تازه‌سازی کامل (full refresh)، که تمام محتوای موجود در اکسترکت را جایگزین می‌کند، یا یک تازه‌سازی افزایشی (incremental refresh)، که فقط ردیف‌های جدید را از آخرین تازه‌سازی شامل می‌شود، یکی را انتخاب کنید.

مزایای Extract ها

مدیریت مجموعه داده‌های بزرگ: Extract ها می‌توانند حجم عظیمی از داده‌ها را، حتی تا میلیاردها ردیف، مدیریت کنند. این به کاربران امکان می‌دهد تا با مجموعه‌های داده گسترده به طور کارآمد کار کنند.
عملکرد بهبود یافته: تعامل با نماهایی که از منابع داده Extract استفاده می‌کنند، در مقایسه با نماهایی که مستقیماً به داده‌های اصلی متصل هستند، عملکرد بهتری دارد. Extract ها عملکرد پرس‌وجو را بهینه می‌کنند و در نتیجه تحلیل و بصری‌سازی سریع‌تر داده‌ها را به همراه دارند.
قابلیت‌های پیشرفته: Extract ها دسترسی به قابلیت‌های اضافی Tableau را فراهم می‌کنند که ممکن است توسط منبع داده اصلی در دسترس یا پشتیبانی نشوند، مانند توابع خاص.
دسترسی آفلاین به داده‌ها (Tableau Desktop): Extract ها امکان دسترسی آفلاین به داده‌ها را فراهم می‌کنند. این بدان معناست که حتی زمانی که منبع داده اصلی در دسترس نیست، کاربران همچنان می‌توانند داده‌ها را به صورت محلی ذخیره، دستکاری و با آن‌ها کار کنند.

ایجاد یک Extract

روش‌های متعددی برای ایجاد یک Extract وجود دارد، اما رویکرد اصلی در ادامه توضیح داده شده است.

پس از اتصال به داده‌های خود و راه‌اندازی منبع داده در صفحه Data Source، در گوشه بالا سمت راست، Extract را انتخاب کرده، و سپس روی لینک Edit کلیک کنید تا کادر محاوره‌ای Extract Data باز شود.

هر بخش را باز کنید تا گزینه‌های آن را ببینید، یا Expand All را انتخاب کنید. اطلاعات بیشتر در مورد هر بخش در ادامه این موضوع ارائه شده است.
- Data Storage (ذخیره‌سازی داده): بین Logical Tables (جداول منطقی) یا Physical Tables (جداول فیزیکی) تغییر دهید.
- Filters (فیلترها): فیلترها را برای محدود کردن میزان داده‌های استخراج شده بر اساس فیلدها و مقادیر آن‌ها تنظیم کنید.
- Aggregation (تجمیع): Aggregate data for visible dimensions (تجمیع داده‌ها برای ابعاد قابل مشاهده) را انتخاب کنید تا معیارهای (measures) را با استفاده از تجمیع پیش‌فرض خود تجمیع کنید. همچنین می‌توانید Roll up dates (تاریخ‌ها را جمع کنید) را به یک سطح تاریخ مشخص مانند سال، ماه و غیره انتخاب کنید.
- Number of Rows (تعداد ردیف‌ها): تعداد ردیف‌هایی که می‌خواهید استخراج کنید را تنظیم کنید. می‌توانید All rows (همه ردیف‌ها)، Sample (نمونه) یا Top N rows (بالاترین N ردیف) را استخراج کنید.
- Incremental refresh (تازه‌سازی افزایشی): یک تازه‌سازی افزایشی را بر اساس یک ستون خاص و محدوده تاریخ تنظیم کنید. همچنین می‌توانید انتخاب کنید که آیا ردیف‌های آخر جایگزین شوند یا اضافه شوند.
پس از اتمام، Save Settings (ذخیره تنظیمات) را انتخاب کنید.
تب Sheet را انتخاب کنید. این کار شروع به ایجاد Extract می‌کند.
سپس، مکانی را برای ذخیره Extract انتخاب کنید.
یک نام فایل برای Extract وارد کنید. Save (ذخیره) را انتخاب کنید. اگر کادر محاوره‌ای Save نمایش داده نمی‌شود.

توضیحات تنظیمات Extract

می‌توانید تنظیمات متعددی را هنگام ایجاد یک Extract پیکربندی کنید.

ذخیره‌سازی داده (Data Storage)

در قسمت Data Storage می‌توانید جداول منطقی یا فیزیکی را انتخاب کنید. جداول منطقی داده‌ها را در یک جدول Extract برای هر جدول منطقی در منبع داده ذخیره می‌کنند. از سوی دیگر، جداول فیزیکی داده‌ها را در یک جدول Extract برای هر جدول فیزیکی در منبع داده ذخیره می‌کنند.

هر دو گزینه جداول منطقی و جداول فیزیکی تنها بر نحوه ذخیره‌سازی داده‌ها در Extract شما تأثیر می‌گذارند. این گزینه‌ها بر نحوه نمایش جداول در Extract شما در صفحه Data Source تأثیری ندارند.

به عنوان مثال، فرض کنید Extract شما از یک جدول منطقی تشکیل شده است که شامل سه جدول فیزیکی است. اگر فایل استخراج (.hyper) را که برای استفاده از گزینه پیش‌فرض، جداول منطقی، پیکربندی شده است، مستقیماً باز کنید، یک جدول در صفحه Data Source مشاهده می‌کنید. با این حال، اگر Extract را با استفاده از فایل منبع داده بسته‌بندی شده (.tdsx) یا فایل منبع داده (.tdsx) با فایل استخراج (.hyper) مربوطه آن باز کنید، هر سه جدول را در صفحه Data Source مشاهده می‌کنید.

جداول منطقی (Logical Tables)

Tableau از جداول منطقی به عنوان ساختار پیش‌فرض برای ذخیره‌سازی داده‌های Extract استفاده می‌کند. Tableau عموماً توصیه می‌کند که هنگام راه‌اندازی و کار با Extracts، از گزینه پیش‌فرض ذخیره‌سازی داده، جداول منطقی، استفاده کنید.

بسیاری از قابلیت‌هایی که ممکن است بخواهید، مانند فیلترهای Extract، تجمیع، Top N، یا توابع pass-through (RAWSQL)، فقط در صورتی در دسترس شما هستند که از گزینه جداول منطقی استفاده کنید. با این حال، نمی‌توانید داده‌ها را به Extract هایی که بیش از یک جدول منطقی دارند، اضافه کنید.

اگر گزینه جدول منطقی را انتخاب کنید و Extract شما شامل جوین‌ها باشد، جوین‌ها هنگام ایجاد Extract اعمال می‌شوند.

جداول فیزیکی (Physical Tables)

این گزینه جوین‌ها را در زمان پرس‌وجو انجام می‌دهد و در صورت برآورده شدن تمام شرایط زیر توسط داده‌های شما، می‌تواند به طور بالقوه عملکرد را بهبود بخشد و اندازه فایل Extract را کاهش دهد:

همه جوین‌ها بین جداول فیزیکی از نوع جوین برابری (=) باشند.
انواع داده ستون‌های استفاده شده برای روابط یا جوین‌ها یکسان باشند.
هیچ تابع pass-through (RAWSQL) استفاده نشده باشد.
هیچ تازه‌سازی افزایشی پیکربندی نشده باشد.
هیچ فیلتر Extract پیکربندی نشده باشد.
هیچ Top N یا نمونه‌گیری پیکربندی نشده باشد.
نیازی به افزودن داده به Extract نباشد.

نکاتی برای کار با جداول فیزیکی

Extract هایی که بزرگتر از حد انتظار هستند: برای تعیین اینکه آیا Extract بزرگتر از حد خود است، مجموع ردیف‌ها در استخراج با استفاده از گزینه Logical Tables باید بیشتر از مجموع ردیف‌های تمام جداول ترکیبی قبل از ایجاد استخراج باشد. اگر با این سناریو مواجه شدید، سعی کنید از گزینه Physical Tables استفاده کنید.
گزینه‌های فیلتر کردن: هنگام استفاده از گزینه Physical Tables، سایر گزینه‌ها برای کمک به کاهش داده‌ها در استخراج شما، مانند فیلترهای Extract، تجمیع، Top N و Sampling غیرفعال می‌شوند. اگر نیاز به کاهش داده‌ها در یک Extract دارید که از گزینه Physical Tables استفاده می‌کند، قبل از وارد کردن داده‌ها به Tableau Desktop با استفاده از یکی از پیشنهادات زیر، داده‌ها را فیلتر کنید:
- تمام جوین‌ها بین جداول فیزیکی از نوع جوین برابری (=) باشند.
- به داده‌های خود متصل شوید و فیلترها را با استفاده از SQL سفارشی تعریف کنید. به جای اتصال به یک جدول پایگاه داده، با استفاده از SQL سفارشی به داده‌های خود متصل شوید. هنگام ایجاد پرس‌وجوی SQL سفارشی خود، مطمئن شوید که شامل سطح مناسبی از فیلترینگ است که برای کاهش داده‌ها در Extract خود به آن نیاز دارید.
- یک نما در پایگاه داده تعریف کنید. اگر دسترسی نوشتن به پایگاه داده خود را دارید، تعریف یک نمای پایگاه داده را در نظر بگیرید که فقط داده‌هایی را که برای Extract خود نیاز دارید، شامل شود و سپس از Tableau Desktop به نمای پایگاه داده متصل شوید.
امنیت در سطح ردیف با Extracts: اگر می‌خواهید داده‌های Extract را در سطح ردیف امن کنید، استفاده از گزینه Physical Tables روش توصیه شده برای دستیابی به این سناریو است.

فیلترها (Filters)

از فیلترها برای محدود کردن میزان داده‌های استخراج شده بر اساس فیلدها و مقادیر آن‌ها استفاده کنید.

نکته: فیلترهای Extract بر روی جداول منطقی برای منابع داده با یک جدول پایه واحد فراگیر (pervasive) هستند (یعنی به کل منبع داده اعمال می‌شوند). برای منابع داده با چندین جدول پایه با استفاده از روابط چندفاکتور (multi-fact relationships)، فیلترهای Extract به ازای هر جدول (per-table) هستند و فقط به خود جدول منطقی اعمال می‌شوند.

تجمیع (Aggregation)

تجمیع به شما امکان می‌دهد تا معیارها را تجمیع کنید. همچنین می‌توانید Roll up dates (تاریخ‌ها را جمع کنید) را به یک سطح تاریخ مشخص مانند سال، ماه و غیره انتخاب کنید. مثال‌ها نحوه استخراج داده‌ها را برای هر گزینه تجمیعی که می‌توانید انتخاب کنید، نشان می‌دهند:

داده‌های اصلی (Original data): هر رکورد به عنوان یک ردیف جداگانه نشان داده می‌شود. هفت ردیف در داده‌های اصلی وجود دارد.
تجمیع داده‌ها برای ابعاد قابل مشاهده (بدون جمع کردن) (Aggregate data for visible dimensions (no roll up)): رکوردهای با تاریخ و حرف یکسان در یک ردیف واحد تجمیع شده‌اند. پنج ردیف در Extract وجود دارد.
تجمیع داده‌ها برای ابعاد قابل مشاهده (تاریخ‌ها را به ماه جمع کنید) (Aggregate data for visible dimensions (roll up dates to Month)): تاریخ‌ها به سطح ماه جمع شده‌اند و رکوردهای با منطقه یکسان در یک ردیف واحد تجمیع شده‌اند. سه ردیف در Extract وجود دارد.

تعداد ردیف‌ها (Number of rows)

می‌توانید همه ردیف‌ها یا بالاترین N ردیف را استخراج کنید. Tableau ابتدا هر فیلتر و تجمیع را اعمال می‌کند و سپس تعداد ردیف‌ها را از نتایج فیلتر شده و تجمیع شده استخراج می‌کند. گزینه‌های تعداد ردیف‌ها به نوع منبع داده‌ای که از آن استخراج می‌کنید بستگی دارد. ممکن است گزینه نمونه‌گیری (sampling) را در کادر محاوره‌ای Extract Data نبینید زیرا برخی از منابع داده از نمونه‌گیری پشتیبانی نمی‌کنند.

نکته(ها): هر فیلدی که ابتدا در صفحه Data Source یا در تب sheet پنهان می‌کنید، از Extract حذف خواهد شد. برای حذف فیلدهای پنهان شده از Extract، روی دکمه Hide All Unused Fields (پنهان کردن تمام فیلدهای استفاده نشده) کلیک کنید.

تازه‌سازی افزایشی (Incremental Refresh)

بیشتر منابع داده از تازه‌سازی افزایشی پشتیبانی می‌کنند. به جای تازه‌سازی کل Extract، می‌توانید یک تازه‌سازی را پیکربندی کنید تا فقط ردیف‌هایی که از آخرین باری که داده‌ها را استخراج کرده‌اید، جدید هستند، اضافه شوند.

بعنوان مثال، ممکن است یک منبع داده داشته باشید که روزانه با تراکنش‌های فروش جدید به‌روز می‌شود. به جای بازسازی کل Extract هر روز، می‌توانید تراکنش‌های جدیدی که در آن روز رخ داده‌اند را اضافه کنید.

نکاتی برای تازه‌سازی افزایشی

تازه‌سازی افزایشی:

در قسمت Number of Rows (تعداد ردیف‌ها)، باید All Rows (همه ردیف‌ها) را انتخاب کنید.
تازه‌سازی افزایشی در صورت فعال کردن Aggregation (تجمیع) در دسترس نیست.

تنظیمات پیشرفته (Advanced Settings):

تنظیمات پیشرفته با فیلترها سازگار نیستند.

نکات مربوط به Extract

ورک‌بوک خود را برای حفظ اتصال به Extract ذخیره کنید

پس از ایجاد یک Extract، ورک‌بوک شروع به استفاده از نسخه Extract شده داده‌های شما می‌کند. با این حال، اتصال به نسخه Extract شده داده‌های شما تا زمانی که ورک‌بوک را ذخیره نکنید، ذخیره نمی‌شود. این بدان معناست که اگر ورک‌بوک را بدون ذخیره کردن آن ببندید، در دفعه بعد که آن را باز می‌کنید، ورک‌بوک به منبع داده اصلی متصل خواهد شد.

جابه‌جایی بین داده‌های نمونه‌برداری شده و Extract کامل

هنگام کار با یک Extract بزرگ، ایجاد یک نمونه کوچکتر از داده‌ها می‌تواند مفید باشد. این به شما امکان می‌دهد نمای خود را بدون نیاز به اجرای پرس‌وجوهای طولانی هر بار که یک فیلد را به تحلیل خود اضافه می‌کنید، تنظیم کنید. می‌توانید به راحتی بین استفاده از داده‌های نمونه و منبع داده کامل با انتخاب گزینه مناسب در منوی Data جابه‌جا شوید.

مستقیماً به Extract متصل نشوید

هنگامی که Extracts را در رایانه خود ذخیره می‌کنید، می‌توانید مستقیماً با استفاده از یک Tableau Desktop جدید به آن‌ها متصل شوید. با این حال، به دلایل زیر توصیه نمی‌شود:

نام جداول ممکن است متفاوت باشد: Extract ها از نام‌گذاری خاصی استفاده می‌کنند تا اطمینان حاصل شود که هر جدول دارای یک نام منحصر به فرد است که ممکن است درک آن دشوار باشد.
نمی‌توانید Extract را به‌روزرسانی یا تازه‌سازی کنید: وقتی مستقیماً به یک Extract متصل می‌شوید، Tableau آن را به عنوان منبع اصلی داده در نظر می‌گیرد، نه یک کپی. این بدان معناست که نمی‌توانید آن را به منبع داده اصلی خود پیوند دهید.
ساختار و روابط بین جداول از بین خواهد رفت: ترتیب و اتصالات بین جداول در فایل .tds ذخیره می‌شوند، نه در فایل .hyper. بنابراین، وقتی مستقیماً به فایل .hyper متصل می‌شوید، این اطلاعات را از دست می‌دهید. اگر از ذخیره‌سازی جداول منطقی برای Extract استفاده می‌کنید، هیچ ارجاعی به جداول فیزیکی اصلی نخواهید دید.

اگر به یک اتصال مجازی با توابع کاربری در سیاست داده متصل هستید، از Extract استفاده نکنید

اگر یک اتصال مجازی دارای یک سیاست داده باشد که شامل توابع کاربری (برای مثال، USERNAME()) است و شما از یک ورک‌بوک یا منبع داده به آن متصل شده و در آنجا یک Extract ایجاد می‌کنید، Extract فقط شامل ردیف‌هایی خواهد بود که با سیاست داده اتصال مجازی در زمان ایجاد Extract مطابقت دارند. برای استفاده از یک اتصال مجازی با توابع کاربری در سیاست داده، به جای Extract، از یک اتصال زنده (live connection) از ورک‌بوک یا منبع داده به اتصال مجازی استفاده کنید.

حذف Extract از ورک‌بوک

می‌توانید در هر زمان یک Extract را از منوی Data با انتخاب منبع داده استخراج شده > Extract > Remove حذف کنید.

هنگام حذف یک Extract، می‌توانید انتخاب کنید که Remove the extract from the workbook only (فقط Extract را از ورک‌بوک حذف کن) یا Remove and delete the extract file (Extract را حذف و فایل آن را پاک کن). گزینه دوم Extract را از هارد دیسک شما حذف می‌کند.

مشاهده تاریخچه Extract (Tableau Desktop)

می‌توانید با انتخاب یک منبع داده در منوی Data و سپس انتخاب Extract > History، زمان آخرین به‌روزرسانی Extract و سایر جزئیات را مشاهده کنید.

اگر ورک‌بوکی را باز کنید که با یک Extract ذخیره شده است و Tableau نتواند Extract را پیدا کند، در کادر محاوره‌ای Extract Not Found (Extract پیدا نشد) هنگام درخواست، یکی از گزینه‌های زیر را انتخاب کنید:

Locate the extract (Extract را پیدا کن): این گزینه را انتخاب کنید اگر Extract وجود دارد اما در مکانی نیست که Tableau در ابتدا آن را ذخیره کرده است. روی OK کلیک کنید تا کادر محاوره‌ای Open File باز شود که در آن می‌توانید مکان جدید فایل Extract را مشخص کنید.
Remove the extract (Extract را حذف کن): اگر دیگر نیازی به Extract ندارید، این گزینه را انتخاب کنید. این معادل بستن منبع داده است. تمام ورک‌شیت‌های باز که به منبع داده اشاره می‌کنند، حذف می‌شوند.
Deactivate the extract (Extract را غیرفعال کن): از منبع داده اصلی که Extract از آن ایجاد شده است، به جای Extract استفاده کنید.
Regenerate the extract (Extract را بازسازی کن): Extract را دوباره ایجاد می‌کند. تمام فیلترها و سایر سفارشی‌سازی‌هایی که در ابتدا هنگام ایجاد Extract مشخص کرده‌اید، به طور خودکار اعمال می‌شوند.

عیب‌یابی Extracts

ایجاد Extract زمان زیادی می‌برد: بسته به اندازه مجموعه داده شما، ایجاد یک Extract ممکن است زمان زیادی طول بکشد. با این حال، پس از اینکه داده‌ها را استخراج کرده و در رایانه خود ذخیره کردید، عملکرد می‌تواند بهبود یابد.
Extract ایجاد نمی‌شود: اگر مجموعه داده شما شامل تعداد زیادی ستون (مثلاً در هزاران) باشد، در برخی موارد Tableau ممکن است نتواند Extract را ایجاد کند. اگر با مشکل مواجه شدید، استخراج ستون‌های کمتر یا تغییر ساختار داده‌های زیرین را در نظر بگیرید.
کادر محاوره‌ای Save نمایش داده نمی‌شود یا Extract از یک .twbx ایجاد نمی‌شود: اگر روش قبل از این را برای استخراج داده‌ها از یک ورک‌بوک بسته‌بندی شده دنبال کنید، کادر محاوره‌ای Save نمایش داده نمی‌شود. هنگامی که یک Extract از یک ورک‌بوک بسته‌بندی شده (.twbx) ایجاد می‌شود، فایل Extract به طور خودکار در بسته فایل‌های مرتبط با ورک‌بوک بسته‌بندی شده ذخیره می‌شود. برای دسترسی به فایل Extract که از ورک‌بوک بسته‌بندی شده ایجاد کرده‌اید، باید ورک‌بوک را از حالت بسته‌بندی خارج کنید.

به‌روزرسانی قابلیت‌های Extract

تازه‌سازی زیرمجموعه برای Extracts افزایشی

در نسخه‌های 2024.2 و جدیدتر Tableau، می‌توانید یک دوره زمانی اضافی را برای استخراج مجدد داده‌های قبلاً استخراج شده و ثبت هرگونه تغییری که ممکن است رخ داده باشد، مشخص کنید.

تازه‌سازی افزایشی

از نسخه 2024.1 به بعد، Tableau قابلیتی را معرفی می‌کند که به کاربران امکان می‌دهد تازه‌سازی‌های افزایشی را بر روی Extracts با استفاده از یک ستون کلید غیر منحصربه‌فرد انجام دهند. یک رابط کاربری جدید وجود دارد که از این تنظیمات پیشرفته پشتیبانی می‌کند.

این به‌روزرسانی همچنین یک گام اضافی را در فرآیند استخراج معرفی می‌کند. در طول یک تازه‌سازی افزایشی، Tableau ابتدا ردیف‌های Extract را که با بالاترین مقدار قبلاً ثبت شده مطابقت دارند، حذف می‌کند. متعاقباً، Tableau تمام ردیف‌هایی را که دارای مقداری بالاتر یا مساوی با بالاترین مقدار قبلی هستند، پرس‌وجو می‌کند. این رویکرد تضمین می‌کند که ردیف‌های حذف شده، همراه با ردیف‌های تازه اضافه شده، در نظر گرفته می‌شوند.

Extracts در وب

از نسخه 2020.4 به بعد، Extracts در وب‌نویسی (web authoring) و سرور محتوا (content server) در دسترس هستند. اکنون، دیگر نیازی به استفاده از Tableau Desktop برای استخراج منابع داده خود ندارید.

Extracts جدول منطقی و فیزیکی

با معرفی جداول منطقی و فیزیکی در مدل داده Tableau در نسخه 2020.2، گزینه‌های ذخیره‌سازی Extract از Single Table و Multiple Tables به Logical Tables و Physical Tables تغییر کرده‌اند. این گزینه‌ها بهتر نحوه ذخیره‌سازی Extracts را توضیح می‌دهند.

منسوخ شدن فرمت .tde

هنگامی که یک Extract ایجاد می‌کنید، از فرمت .hyper استفاده می‌کند. Extracts با فرمت .hyper از موتور داده بهبود یافته بهره می‌برند که از عملکرد تحلیلی و پرس‌وجویی سریع‌تر برای مجموعه‌های داده بزرگتر پشتیبانی می‌کند. از مارس 2023، Extracts با فرمت .tde در Tableau Cloud، Tableau Public و Tableau Server (نسخه 2023.1.0) منسوخ شده‌اند. نسخه 2024.2 آخرین نسخه‌ای است که می‌تواند فایل‌های با فرمت .tde را باز کند.

تغییرات در مقادیر و نشانه‌ها در نما

برای بهبود کارایی و مقیاس‌پذیری Extract، مقادیر در Extracts می‌توانند به صورت متفاوتی از برخی منابع داده محاسبه شوند. تغییرات در نحوه محاسبه مقادیر می‌تواند بر نحوه پر شدن نشانه‌ها در نمای شما تأثیر بگذارد. در برخی موارد نادر، این تغییرات می‌توانند باعث تغییر شکل یا خالی شدن نمای شما شوند. این تغییرات همچنین می‌توانند برای منابع داده چند اتصالی، منابع داده‌ای که از اتصالات زنده به داده‌های مبتنی بر فایل استفاده می‌کنند، منابع داده‌ای که به داده‌های Google Sheets متصل می‌شوند، منابع داده مبتنی بر ابر، منابع داده فقط Extract و منابع داده WDC اعمال شوند.

فرمت مقادیر تاریخ و زمان

Extract ها تابع قوانین ثابت و سخت‌گیرانه‌ای هستند که نحوه تفسیر رشته‌های تاریخ از طریق توابع DATE، DATETIME و DATEPARSE را تعیین می‌کنند. این بر نحوه تجزیه (parsing) تاریخ‌ها، یا فرمت‌ها و الگوهای تاریخ مجاز برای این توابع تأثیر می‌گذارد. به طور خاص، قوانین را می‌توان به شرح زیر تعمیم داد:

تاریخ‌ها بر اساس ستون ارزیابی و سپس تجزیه می‌شوند، نه بر اساس ردیف.
تاریخ‌ها بر اساس لوکال (locale) محل ایجاد ورک‌بوک ارزیابی و سپس تجزیه می‌شوند، نه بر اساس لوکال رایانه‌ای که ورک‌بوک در آن باز می‌شود.

این قوانین به Extract ها امکان می‌دهد کارآمدتر باشند و نتایجی تولید کنند که با پایگاه داده‌های تجاری سازگار است.

علل رایج تغییرات در مقادیر تاریخ/زمان

در جایی که تاریخ مبهم است و می‌تواند به روش‌های مختلفی تفسیر شود، تاریخ بر اساس فرمتی که Tableau برای آن ستون تعیین کرده است، تفسیر خواهد شد. برای برخی مثال‌ها، به سناریو 1 در ادامه مراجعه کنید.
هنگامی که یک تابع باید یک رشته تاریخ با فرمت YYYY-MM-DD (ISO) را تجزیه کند. برای مثالی، به سناریو 2 مراجعه کنید.
هنگامی که یک تابع سال‌ها را تجزیه می‌کند، به صورت زیر تفسیر می‌شود:
- سال “07” به عنوان “2007” تفسیر می‌شود.
- سال “17” به عنوان “2017” تفسیر می‌شود.
- سال “30” به عنوان “2030” تفسیر می‌شود.
- سال “69” به عنوان “2069” تفسیر می‌شود.
- سال “70” به عنوان “1970” تفسیر می‌شود.

علل رایج مقادیر Null

هنگامی که یک تابع باید چندین فرمت تاریخ را در یک ستون واحد تجزیه کند. پس از اینکه Tableau فرمت تاریخ را تعیین کرد، تمام تاریخ‌های دیگر در ستون که از آن فرمت منحرف می‌شوند، مقادیر Null می‌شوند. برای برخی مثال‌ها، به سناریو 1 در ادامه مراجعه کنید.
هنگامی که یک تابع باید یک رشته تاریخ با فرمت YYYY-MM-DD (ISO) را تجزیه کند. مقادیری که از آنچه برای “YYYY”، یا “MM”، یا “DD” مجاز است فراتر می‌روند، باعث مقادیر Null می‌شوند. برای مثالی، به سناریو 2 مراجعه کنید.
هنگامی که یک تابع باید مقادیر تاریخ را که حاوی کاراکترهای دنباله‌دار هستند، تجزیه کند. به عنوان مثال، پسوندهای منطقه زمانی و صرفه‌جویی در روشنایی روز و کلمات کلیدی، مانند “midnight” باعث مقادیر Null می‌شوند.
هنگامی که یک تابع باید یک تاریخ یا زمان نامعتبر را تجزیه کند. به عنوان مثال، 32/3/2024 باعث یک مقدار Null می‌شود. در مثال دیگر، 25:01:61 باعث یک مقدار Null می‌شود.
هنگامی که یک تابع باید ورودی‌های متناقض را تجزیه کند. به عنوان مثال، فرض کنید الگو ‘dd.MM (MMMM) y’ باشد و رشته ورودی ‘1.09 (August) 2024’ باشد، که در آن هم “9” و هم “August” ماه‌ها هستند. نتیجه یک مقدار Null است زیرا مقادیر ماه یکسان نیستند.
هنگامی که یک تابع باید الگوهای متناقض را تجزیه کند. به عنوان مثال، الگویی که ترکیبی از سال میلادی (y) و هفته ISO (ww) را مشخص می‌کند، باعث مقادیر Null می‌شود.

سناریو 1

فرض کنید یک ورک‌بوک دارید که در یک لوکال انگلیسی ایجاد شده و از منبع داده Extract با فرمت .tde استفاده می‌کند. جدول پس از این، یک ستون از داده‌های رشته‌ای موجود در منبع داده Extract را نشان می‌دهد.

بر اساس لوکال انگلیسی خاص، فرمت ستون تاریخ برای پیروی از فرمت MDY (ماه، روز و سال) تعیین شد. جداول زیر نشان می‌دهند که Tableau بر اساس این لوکال چه چیزی را هنگام استفاده از تابع DATE برای تبدیل مقادیر رشته‌ای به مقادیر تاریخ نمایش می‌دهد.

اگر Extract در یک لوکال آلمانی باز شود، موارد زیر را مشاهده می‌کنید:

با این حال، پس از باز شدن Extract در یک لوکال آلمانی با استفاده از نسخه 10.5 و بالاتر، فرمت DMY (روز، ماه و سال) لوکال آلمانی به شدت اعمال می‌شود و باعث یک مقدار Null می‌شود زیرا یکی از مقادیر از فرمت DMY پیروی نمی‌کند.

سناریو 2

فرض کنید یک ستون از داده‌های رشته‌ای در منبع داده دارید.

از آنجا که تاریخ از فرمت ISO استفاده می‌کند، ستون تاریخ همیشه از فرمت YYYY-MM-DD پیروی می‌کند. جداول زیر نشان می‌دهند که Tableau چه چیزی را هنگام استفاده از تابع DATE برای تبدیل مقادیر رشته‌ای به مقادیر تاریخ نمایش می‌دهد.

ترتیب مرتب‌سازی و حساسیت به حروف (Sort order and case sensitivity)

Extract ها از پشتیبانی collation برخوردارند و بنابراین می‌توانند مقادیر رشته‌ای را که دارای اکسان (accents) هستند یا به صورت‌های مختلف حروف‌چینی شده‌اند (case-differently)، به طور مناسب‌تری مرتب کنند.

به عنوان مثال، فرض کنید یک جدول از مقادیر رشته‌ای دارید. از نظر ترتیب مرتب‌سازی، این بدان معناست که یک مقدار رشته‌ای مانند Égypte اکنون به طور مناسب پس از Estonie و قبل از Fidji لیست می‌شود.

در مورد حروف‌چینی (casing)، همان مقادیر رشته‌ای منحصر به فرد در نظر گرفته می‌شوند و بنابراین به عنوان مقادیر فردی ذخیره می‌شوند.

شکستن گره‌ها در پرس‌وجوهای Top N (Breaking ties in Top N queries)

یک پرس‌وجوی Top N در Extract شما می‌تواند مقادیر تکراری را برای یک موقعیت خاص در یک رتبه تولید کند. به عنوان مثال، فرض کنید یک فیلتر Top 3 ایجاد کرده‌اید. موقعیت‌های 3، 4 و 5 مقادیر یکسانی دارند. فیلتر Top 1، 2 و 5 موقعیت را برمی‌گرداند.

دقت مقادیر ممیز شناور (Precision of floating-point values)

Extract ها در بهره‌گیری از منابع سخت‌افزاری موجود در یک رایانه بهتر عمل می‌کنند و بنابراین قادر به انجام عملیات ریاضی به روشی بسیار موازی هستند. به همین دلیل، اعداد حقیقی می‌توانند توسط Extracts با فرمت .hyper به ترتیب‌های مختلفی تجمیع شوند. هنگامی که اعداد به ترتیب‌های مختلفی تجمیع می‌شوند، ممکن است هر بار که تجمیع محاسبه می‌شود، مقادیر متفاوتی را در نمای خود پس از نقطه اعشار مشاهده کنید. این به این دلیل است که جمع و ضرب ممیز شناور لزوماً انجمنی نیستند.

یعنی (a + b) + c لزوماً با a + (b + c) یکسان نیست. همچنین، اعداد حقیقی می‌توانند به ترتیب‌های مختلفی تجمیع شوند زیرا ضرب ممیز شناور لزوماً توزیع‌پذیر نیست. یعنی (a x b) x c لزوماً با a x b x c یکسان نیست. این نوع رفتار گرد کردن ممیز شناور در استخراج ها با فرمت .hyper شبیه رفتار گرد کردن ممیز شناور در پایگاه داده‌های تجاری است.

به عنوان مثال، فرض کنید ورک‌بوک شما شامل یک فیلتر اسلایدر (slider filter) روی یک فیلد تجمیع شده شامل مقادیر ممیز شناور است. از آنجا که دقت مقادیر ممیز شناور تغییر کرده است، ممکن است فیلتر اکنون یک علامت (mark) را که مرز بالا یا پایین محدوده فیلتر را تعریف می‌کند، حذف کند. عدم وجود این اعداد می‌تواند باعث یک نمای خالی شود. برای حل این مشکل، اسلایدر را روی فیلتر حرکت دهید یا فیلتر را حذف کرده و دوباره اضافه کنید.

دقت تجمیع‌ها (Accuracy of aggregations)

استخراج ها با بهره‌گیری بهتر از منابع سخت‌افزاری موجود در یک رایانه برای مجموعه‌های داده بزرگ بهینه‌سازی شده‌اند و بنابراین قادر به محاسبه تجمیع‌ها به روشی بسیار موازی هستند. به همین دلیل، تجمیع‌های انجام شده توسط Extracts با فرمت .hyper می‌توانند نتایجی شبیه به پایگاه داده‌های تجاری داشته باشند تا نتایج نرم‌افزارهایی که در محاسبات آماری تخصص دارند.

اگر با یک مجموعه داده کوچک کار می‌کنید یا به سطح بالاتری از دقت نیاز دارید، انجام تجمیع‌ها را از طریق خطوط مرجع (reference lines)، آمار کارت خلاصه (summary card statistics) یا توابع محاسبات جدول (table calculation functions) مانند واریانس، انحراف معیار، همبستگی یا کوواریانس در نظر بگیرید.

API ها

می‌توانید از Extract API برای ایجاد Extracts با فرمت .hyper استفاده کنید. برای وظایفی مانند انتشار Extracts، می‌توانید از Tableau Server REST API یا کتابخانه Tableau Server Client (Python) استفاده کنید. برای وظایف تازه‌سازی، می‌توانید از Tableau Server REST API نیز استفاده کنید.

برای خرید لایسنس نرم افزار Tableau ، می‌توانید از خدمات ما استفاده نموده و درخواست خود را از طریق فرم زیر ثبت نمایید.

فرم درخواست لایسنس Tableau

tableau desktop download

Tableau-license

تیر 23, 1404

مقالات