آشنایی با دادههای خود در سطح پایگاه داده
قابل اجرا برای: Tableau Desktop
درک تأثیر برخی عوامل در طراحی پایگاه داده شما بر عملکرد Tableau ممکن است اطلاعاتی را در اختیار شما قرار دهد که میتوانید از آن برای همکاری با تیم پایگاه داده خود برای بهینهسازی دادهها در سطح پایگاه داده استفاده کنید.
فعال کردن پشتیبانی از یکپارچگی ارجاعی (Referential Integrity)
پایگاههای دادهای که از یکپارچگی ارجاعی پشتیبانی میکنند، از قابلیت Assume Referential Integrity (فرض یکپارچگی ارجاعی) در Tableau پشتیبانی میکنند که عملکرد inner joins (جوینهای داخلی) را بهبود میبخشد. پردازش جوینها در سرور پایگاه داده زمان و منابع مصرف میکند. هنگامی که چندین جدول را در یک منبع داده به هم متصل میکنید (join)، Tableau از قابلیتی که به طور کلی برای کاربر نامرئی است، به نام join culling (حذف جوین) استفاده میکند. Join culling تنها جداول مرتبط را به جای تمام جداول تعریف شده در جوین شما پرسوجو میکند. Join culling تنها در جایی اتفاق میافتد که یکپارچگی ارجاعی بین جداول تعریف شده باشد.
اطمینان حاصل کنید که مجوزهای پایگاه داده از ایجاد جداول موقت پشتیبانی میکنند
آیا پایگاه داده شما به کاربران اجازه میدهد تا جداول موقت (که به آنها temp tables نیز گفته میشود) را ایجاد و حذف کنند، و آیا محیط دارای فضای کافی برای spool space (فضای بافر) برای پرسوجوهای در حال اجرا است؟ Tableau جداول موقت را برای کمک به بهبود عملکرد و افزودن قابلیتها ایجاد میکند. جداول موقت به طور موقت اطلاعات خاصی را برای یک اتصال نگه میدارند. اگر ایجاد جداول موقت در پایگاه داده محدود شود، عملکرد کلی ورکبوکها و نماها به اندازهای که میتوانست باشد، سریع نخواهد بود.
ایجاد ایندکس برای جداول
جداول را در پایگاه داده رابطهای خود ایندکس کنید. برای ایندکس کردن موفقیتآمیز مجموعه داده خود، فیلدهایی را که به طور مکرر روی آنها فیلتر میکنید شناسایی کرده و آنها را به ایندکس اضافه کنید. اگر فیلدی دارید که اغلب از آن به عنوان فیلتر متنی استفاده میکنید، آن را به عنوان ایندکس اصلی خود در نظر بگیرید. اگر با جداول Access کار میکنید که بیش از 200,000 ردیف داده دارند، ایندکسگذاری جداول را در نظر بگیرید. میتوانید نحوه انجام این کار را با جستجوی “index” در راهنمای آنلاین Access بیاموزید. میتوانید به طور رسمی 2 گیگابایت داده (تقریباً 1-2 میلیون ردیف) را در یک پایگاه داده Access ذخیره کنید، اما عملکرد آن بسیار کمتر از این حد ضعیف است.
بسیاری از محیطهای سیستم مدیریت پایگاه داده (DBMS) دارای ابزارهای مدیریتی هستند که یک پرسوجو را بررسی کرده و ایندکسهایی را که میتوانند کمک کنند، پیشنهاد میدهند.
دادههای خود را تقسیم کنید
اغلب میتوانید عملکرد را بهبود بخشید اگر یک جدول بزرگ پایگاه داده را به چندین جدول کوچکتر تقسیم کنید (partition). به عنوان مثال، میتوانید یک مجموعه از جداول Access ایجاد کنید که زیرمجموعههای خاصی از دادههای شما را پوشش میدهد.
از یک سرور پایگاه داده استفاده کنید
اگر دادههای زیادی دارید، ممکن است نگهداری آنها در یک سرور پایگاه داده مانند Oracle، MySQL یا Microsoft SQL Server را در نظر بگیرید. نسخه Professional Edition نرمافزار Tableau میتواند به این سرورهای پایگاه داده بزرگتر متصل شود.
تست دادههای خود و استفاده از Extract ها
شما احتمالاً هیچ کنترلی بر سختافزار، قدرت پردازش، و فضای دیسک که پایگاه داده شما بر روی آن اجرا میشود، ندارید. یا اینکه چه تعداد افراد در هر زمان معین به پایگاه داده دسترسی دارند، چه تعداد سرویس در حال اجرا هستند، یا شبکه چقدر قوی است. اما میتوانید عملکرد خام (raw performance) دادهها را قبل از شروع به ساختن یک ورکبوک آزمایش کنید، تا محیطی را که در آن کار میکنید درک کنید. و کارهایی وجود دارد که میتوانید برای تأثیرگذاری بر عملکرد ورکبوکهایی که ایجاد میکنید، انجام دهید، که از نحوه اتصال به دادههایتان شروع میشود: درایورهایی که استفاده میکنید، و اینکه آیا نوع اتصال شما زنده (live) است یا Extract (استخراج شده).
آزمایش تا حد امکان نزدیک به دادهها
یک راه خوب برای آزمایش عملکرد خام دادهها، نصب Tableau Desktop بر روی رایانهای است که دادهها در آن قرار دارند و اجرای برخی پرسوجوها است. این کار عوامل خارجی مانند پهنای باند شبکه و تأخیر را از نتایج عملکرد حذف میکند و به شما کمک میکند تا عملکرد خام پرسوجو را در منبع داده درک کنید.
علاوه بر این، میتوانید از نام localhost برای دادهها به جای نام DNS استفاده کنید تا به تعیین اینکه آیا عوامل محیطی مانند وضوح نام کند یا سرورهای پروکسی باعث کاهش عملکرد میشوند، کمک کنید.
اتصال با درایورهای بومی پایگاه داده
هنگامی که با درایورهای بومی پایگاه داده به دادهها متصل میشوید، اغلب عملکرد بسیار سریعتری را نسبت به زمانی که با درایورهای ODBC به همان دادهها متصل میشوید، تجربه خواهید کرد. هنگامی که از درایورهای بومی پایگاه داده استفاده میکنید، مطمئن شوید که از آخرین نسخه استفاده میکنید. فروشندگان پایگاه داده همیشه در تلاش برای بهبود درایورهای خود هستند.
کار با Extracts به جای دادههای زنده (Live Data)
بسته به دادههای شما، میتوانید بین اتصال زنده (live) یا Extract در صفحه منبع داده انتخاب کنید. اتصال زنده (live) یک اتصال مستقیم به دادههای شماست. Extract داده Tableau یک عکس فوری فشرده از دادهها است که به صورت محلی ذخیره میشود و در صورت نیاز برای ارائه بصریسازی Tableau در حافظه بارگذاری میشود. Extract ها به گونهای طراحی شدهاند که از تمام بخشهای حافظه رایانه شما به طور بهینه استفاده کنند.
دلایل متعددی برای استفاده از Extract وجود دارد، اما دلیل اصلی مرتبط با عملکرد این است که اجرای پرسوجوی شما کند است. فرمت داده Extract برای ارائه پاسخ سریع به پرسوجوهای تحلیلی طراحی شده است. در این حالت، میتوانید Extract را به عنوان یک کش (cache) تسریعکننده پرسوجو در نظر بگیرید.
کاهش میزان دادهها
هنگامی که یک Extract ایجاد میکنید، از فیلترها برای حذف دادههایی که به آنها نیاز ندارید، استفاده کنید. همچنین، از خود بپرسید که آیا به تمام رکوردهای موجود در یک منبع داده نیاز دارید، یا اینکه میتوانید Extract را به یک نمونه نماینده (representative sample) محدود کنید.
پنهان کردن فیلدهای استفاده نشده
فیلدهای پنهان شده هنگام ایجاد یک Extract شامل نمیشوند. از گزینه Hide All Unused Fields (پنهان کردن تمام فیلدهای استفاده نشده) برای پنهان کردن فیلدهای غیرضروری قبل از ایجاد Extract استفاده کنید. این کار Extract را کوچکتر میکند که عملکرد را بهبود میبخشد.
بهینهسازی Extracts
گزینه Compute Calculations Now (اکنون محاسبات را محاسبه کن) محاسبات را در Extract شما مادی میکند (materializes)، به این معنی که برخی محاسبات از قبل محاسبه شده و مقادیر آنها در Extract ذخیره میشوند. بسته به پیچیدگی محاسبات استفاده شده در Extract شما، این کار میتواند به طور بالقوه پرسوجوهای آینده را سرعت بخشد.
برای مادی کردن محاسبات، یک منبع داده را در منوی Data انتخاب کرده و سپس Extract > Compute Calculations Now را انتخاب کنید.
استفاده از Extracts برای دادههای مبتنی بر فایل
به طور کلی بهترین روش این است که دادههای مبتنی بر فایل — فایلهای متنی مانند CSV، صفحات گسترده Microsoft Excel و فایلهای Microsoft Access، و همچنین فایلهای آماری مانند SPSS، SAS و R — را به Tableau وارد کنید. این کار باعث میشود پرسوجوها بسیار سریعتر اجرا شوند و همچنین منجر به فایلی بسیار کوچکتر برای ذخیره مقادیر داده میشود.
اگر دادههای شما یک فایل متنی یا اکسل بزرگ است، استفاده از Extract نه تنها عملکرد را بهبود میبخشد بلکه قابلیتهای بیشتری را نیز در اختیار شما قرار میدهد. توجه داشته باشید که اگر Tableau را به یک فایل متنی بزرگ متصل کنید، اگر Tableau تشخیص دهد که فایل برای عملکرد خوب بسیار بزرگ است، از شما خواسته میشود که دادهها را استخراج کنید.
اجتناب از استفاده از SQL سفارشی (Custom SQL)
در بیشتر موارد، SQL سفارشی کندتر از پرسوجوهای ایجاد شده توسط Tableau اجرا میشود. Tableau نمیتواند بهینهسازی پرسوجو را روی SQL سفارشی انجام دهد. اما در مواردی که مجبور به استفاده از SQL سفارشی هستید، از یک Extract استفاده کنید تا پرسوجو فقط یک بار اجرا شود.
برای خرید لایسنس نرم افزار Tableau ، میتوانید از خدمات ما استفاده نموده و درخواست خود را از طریق فرم زیر ثبت نمایید.
بدون دیدگاه