سطح پایگاه داده در تبلو

آشنایی با داده‌های خود در سطح پایگاه داده

قابل اجرا برای: Tableau Desktop

درک تأثیر برخی عوامل در طراحی پایگاه داده شما بر عملکرد Tableau ممکن است اطلاعاتی را در اختیار شما قرار دهد که می‌توانید از آن برای همکاری با تیم پایگاه داده خود برای بهینه‌سازی داده‌ها در سطح پایگاه داده استفاده کنید.

فعال کردن پشتیبانی از یکپارچگی ارجاعی (Referential Integrity)

پایگاه‌های داده‌ای که از یکپارچگی ارجاعی پشتیبانی می‌کنند، از قابلیت Assume Referential Integrity (فرض یکپارچگی ارجاعی) در Tableau پشتیبانی می‌کنند که عملکرد inner joins (جوین‌های داخلی) را بهبود می‌بخشد. پردازش جوین‌ها در سرور پایگاه داده زمان و منابع مصرف می‌کند. هنگامی که چندین جدول را در یک منبع داده به هم متصل می‌کنید (join)، Tableau از قابلیتی که به طور کلی برای کاربر نامرئی است، به نام join culling (حذف جوین) استفاده می‌کند. Join culling تنها جداول مرتبط را به جای تمام جداول تعریف شده در جوین شما پرس‌و‌جو می‌کند. Join culling تنها در جایی اتفاق می‌افتد که یکپارچگی ارجاعی بین جداول تعریف شده باشد.

اطمینان حاصل کنید که مجوزهای پایگاه داده از ایجاد جداول موقت پشتیبانی می‌کنند

آیا پایگاه داده شما به کاربران اجازه می‌دهد تا جداول موقت (که به آن‌ها temp tables نیز گفته می‌شود) را ایجاد و حذف کنند، و آیا محیط دارای فضای کافی برای spool space (فضای بافر) برای پرس‌و‌جوهای در حال اجرا است؟ Tableau جداول موقت را برای کمک به بهبود عملکرد و افزودن قابلیت‌ها ایجاد می‌کند. جداول موقت به طور موقت اطلاعات خاصی را برای یک اتصال نگه می‌دارند. اگر ایجاد جداول موقت در پایگاه داده محدود شود، عملکرد کلی ورک‌بوک‌ها و نماها به اندازه‌ای که می‌توانست باشد، سریع نخواهد بود.

ایجاد ایندکس برای جداول

جداول را در پایگاه داده رابطه‌ای خود ایندکس کنید. برای ایندکس کردن موفقیت‌آمیز مجموعه داده خود، فیلدهایی را که به طور مکرر روی آن‌ها فیلتر می‌کنید شناسایی کرده و آن‌ها را به ایندکس اضافه کنید. اگر فیلدی دارید که اغلب از آن به عنوان فیلتر متنی استفاده می‌کنید، آن را به عنوان ایندکس اصلی خود در نظر بگیرید. اگر با جداول Access کار می‌کنید که بیش از 200,000 ردیف داده دارند، ایندکس‌گذاری جداول را در نظر بگیرید. می‌توانید نحوه انجام این کار را با جستجوی “index” در راهنمای آنلاین Access بیاموزید. می‌توانید به طور رسمی 2 گیگابایت داده (تقریباً 1-2 میلیون ردیف) را در یک پایگاه داده Access ذخیره کنید، اما عملکرد آن بسیار کمتر از این حد ضعیف است.

بسیاری از محیط‌های سیستم مدیریت پایگاه داده (DBMS) دارای ابزارهای مدیریتی هستند که یک پرس‌و‌جو را بررسی کرده و ایندکس‌هایی را که می‌توانند کمک کنند، پیشنهاد می‌دهند.

داده‌های خود را تقسیم کنید

اغلب می‌توانید عملکرد را بهبود بخشید اگر یک جدول بزرگ پایگاه داده را به چندین جدول کوچکتر تقسیم کنید (partition). به عنوان مثال، می‌توانید یک مجموعه از جداول Access ایجاد کنید که زیرمجموعه‌های خاصی از داده‌های شما را پوشش می‌دهد.

از یک سرور پایگاه داده استفاده کنید

اگر داده‌های زیادی دارید، ممکن است نگهداری آن‌ها در یک سرور پایگاه داده مانند Oracle، MySQL یا Microsoft SQL Server را در نظر بگیرید. نسخه Professional Edition نرم‌افزار Tableau می‌تواند به این سرورهای پایگاه داده بزرگتر متصل شود.

تست داده‌های خود و استفاده از Extract ها

شما احتمالاً هیچ کنترلی بر سخت‌افزار، قدرت پردازش، و فضای دیسک که پایگاه داده شما بر روی آن اجرا می‌شود، ندارید. یا اینکه چه تعداد افراد در هر زمان معین به پایگاه داده دسترسی دارند، چه تعداد سرویس در حال اجرا هستند، یا شبکه چقدر قوی است. اما می‌توانید عملکرد خام (raw performance) داده‌ها را قبل از شروع به ساختن یک ورک‌بوک آزمایش کنید، تا محیطی را که در آن کار می‌کنید درک کنید. و کارهایی وجود دارد که می‌توانید برای تأثیرگذاری بر عملکرد ورک‌بوک‌هایی که ایجاد می‌کنید، انجام دهید، که از نحوه اتصال به داده‌هایتان شروع می‌شود: درایورهایی که استفاده می‌کنید، و اینکه آیا نوع اتصال شما زنده (live) است یا Extract (استخراج شده).

آزمایش تا حد امکان نزدیک به داده‌ها

یک راه خوب برای آزمایش عملکرد خام داده‌ها، نصب Tableau Desktop بر روی رایانه‌ای است که داده‌ها در آن قرار دارند و اجرای برخی پرس‌وجوها است. این کار عوامل خارجی مانند پهنای باند شبکه و تأخیر را از نتایج عملکرد حذف می‌کند و به شما کمک می‌کند تا عملکرد خام پرس‌وجو را در منبع داده درک کنید.

علاوه بر این، می‌توانید از نام localhost برای داده‌ها به جای نام DNS استفاده کنید تا به تعیین اینکه آیا عوامل محیطی مانند وضوح نام کند یا سرورهای پروکسی باعث کاهش عملکرد می‌شوند، کمک کنید.

اتصال با درایورهای بومی پایگاه داده

هنگامی که با درایورهای بومی پایگاه داده به داده‌ها متصل می‌شوید، اغلب عملکرد بسیار سریع‌تری را نسبت به زمانی که با درایورهای ODBC به همان داده‌ها متصل می‌شوید، تجربه خواهید کرد. هنگامی که از درایورهای بومی پایگاه داده استفاده می‌کنید، مطمئن شوید که از آخرین نسخه استفاده می‌کنید. فروشندگان پایگاه داده همیشه در تلاش برای بهبود درایورهای خود هستند.

کار با Extracts به جای داده‌های زنده (Live Data)

بسته به داده‌های شما، می‌توانید بین اتصال زنده (live) یا Extract در صفحه منبع داده انتخاب کنید. اتصال زنده (live) یک اتصال مستقیم به داده‌های شماست. Extract داده Tableau یک عکس فوری فشرده از داده‌ها است که به صورت محلی ذخیره می‌شود و در صورت نیاز برای ارائه بصری‌سازی Tableau در حافظه بارگذاری می‌شود. Extract ها به گونه‌ای طراحی شده‌اند که از تمام بخش‌های حافظه رایانه شما به طور بهینه استفاده کنند.

دلایل متعددی برای استفاده از Extract وجود دارد، اما دلیل اصلی مرتبط با عملکرد این است که اجرای پرس‌وجوی شما کند است. فرمت داده Extract برای ارائه پاسخ سریع به پرس‌وجوهای تحلیلی طراحی شده است. در این حالت، می‌توانید Extract را به عنوان یک کش (cache) تسریع‌کننده پرس‌وجو در نظر بگیرید.

کاهش میزان داده‌ها

هنگامی که یک Extract ایجاد می‌کنید، از فیلترها برای حذف داده‌هایی که به آن‌ها نیاز ندارید، استفاده کنید. همچنین، از خود بپرسید که آیا به تمام رکوردهای موجود در یک منبع داده نیاز دارید، یا اینکه می‌توانید Extract را به یک نمونه نماینده (representative sample) محدود کنید.

پنهان کردن فیلدهای استفاده نشده

فیلدهای پنهان شده هنگام ایجاد یک Extract شامل نمی‌شوند. از گزینه Hide All Unused Fields (پنهان کردن تمام فیلدهای استفاده نشده) برای پنهان کردن فیلدهای غیرضروری قبل از ایجاد Extract استفاده کنید. این کار Extract را کوچکتر می‌کند که عملکرد را بهبود می‌بخشد.

بهینه‌سازی Extracts

گزینه Compute Calculations Now (اکنون محاسبات را محاسبه کن) محاسبات را در Extract شما مادی می‌کند (materializes)، به این معنی که برخی محاسبات از قبل محاسبه شده و مقادیر آن‌ها در Extract ذخیره می‌شوند. بسته به پیچیدگی محاسبات استفاده شده در Extract شما، این کار می‌تواند به طور بالقوه پرس‌وجوهای آینده را سرعت بخشد.

برای مادی کردن محاسبات، یک منبع داده را در منوی Data انتخاب کرده و سپس Extract > Compute Calculations Now را انتخاب کنید.

استفاده از Extracts برای داده‌های مبتنی بر فایل

به طور کلی بهترین روش این است که داده‌های مبتنی بر فایل — فایل‌های متنی مانند CSV، صفحات گسترده Microsoft Excel و فایل‌های Microsoft Access، و همچنین فایل‌های آماری مانند SPSS، SAS و R — را به Tableau وارد کنید. این کار باعث می‌شود پرس‌وجوها بسیار سریع‌تر اجرا شوند و همچنین منجر به فایلی بسیار کوچکتر برای ذخیره مقادیر داده می‌شود.

اگر داده‌های شما یک فایل متنی یا اکسل بزرگ است، استفاده از Extract نه تنها عملکرد را بهبود می‌بخشد بلکه قابلیت‌های بیشتری را نیز در اختیار شما قرار می‌دهد. توجه داشته باشید که اگر Tableau را به یک فایل متنی بزرگ متصل کنید، اگر Tableau تشخیص دهد که فایل برای عملکرد خوب بسیار بزرگ است، از شما خواسته می‌شود که داده‌ها را استخراج کنید.

اجتناب از استفاده از SQL سفارشی (Custom SQL)

در بیشتر موارد، SQL سفارشی کندتر از پرس‌وجوهای ایجاد شده توسط Tableau اجرا می‌شود. Tableau نمی‌تواند بهینه‌سازی پرس‌وجو را روی SQL سفارشی انجام دهد. اما در مواردی که مجبور به استفاده از SQL سفارشی هستید، از یک Extract استفاده کنید تا پرس‌وجو فقط یک بار اجرا شود.

 

برای خرید لایسنس نرم افزار Tableau ، می‌توانید از خدمات ما استفاده نموده و درخواست خود را از طریق فرم زیر ثبت نمایید.

فرم درخواست لایسنس Tableau

 

tableau desktop download

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *