برنامهریزی منبع داده در تبلو
منبع داده Data Source
در مرکز Tableau، دادههای شما قرار دارند. میزان موفقیت شما در کاوش دادهها، پاسخ به سوالات و ساخت مصورسازی برای استفاده خودتان یا دیگران، همگی به دادههای زیربنایی بستگی دارد.
اگر هدف شما انجام کاوش سریع یا تحلیل موردی است، ممکن است بتوانید وارد شوید، به برخی دادهها متصل شوید، کمی بکشید و رها کنید تا چند Vizz بسازید و با اطلاعات مورد نیاز خود خارج شوید. اما اگر هدف شما ایجاد یک تحلیل یا منبع داده است که بیش از یک بار استفاده خواهد شد، بهتر است منبع داده خود را به طور کامل بررسی و برنامهریزی کنید.
منابع داده Tableau
یک منبع داده Tableau، پیوند بین دادههای منبع شما و Tableau است. اساساً مجموع دادههای شما (چه به عنوان یک اتصال زنده یا یک استخراج)، اطلاعات اتصال، نام جداول یا برگههای حاوی دادهها و سفارشیسازیهایی است که شما روی دادهها انجام میدهید تا با آنها در Tableau کار کنید. این سفارشیسازیها شامل مواردی مانند نحوه ترکیب دادهها و ابردادههایی مانند محاسبات، تغییر نام فیلدها و قالببندی پیشفرض است.
یک منبع داده Tableau ممکن است شامل چندین اتصال داده به پایگاههای داده یا فایلهای مختلف باشد. اطلاعات اتصال شامل محل قرارگیری دادهها، مانند نام فایل و مسیر یا مکان شبکه، و جزئیاتی در مورد نحوه اتصال به دادههای شما، مانند نام سرور پایگاه داده و اطلاعات ورود به سرور است.
توجه: اصطلاحات منبع داده و اتصال داده در گذشته به طور نامحسوس استفاده شدهاند و ممکن است در مطالب قدیمیتر تمایز روشنی نداشته باشند.
همچنین مهم است که تفاوت بین منبع داده Tableau (دسترسی Tableau به دادههای شما و تمام سفارشیسازیهایی که ممکن است در آن دخیل باشد) و خود دادههای منبع (مانند یک پایگاه داده یا صفحه گسترده اکسل) را در نظر داشته باشید. برنامهریزی یک منبع داده به معنای طراحی یک پایگاه داده، محدوده این مبحث نیست.
منابع داده Tableau میتوانند در ورکبوکی که در ابتدا ایجاد شدهاند، جاسازی شوند یا میتوانند جداگانه منتشر شوند. منابع داده منتشر شده امکان تمرکز و مقیاسبندی منابع داده گردآوری شده را فراهم میکنند. برای اطلاعات بیشتر به بهترین شیوهها برای منابع داده منتشر شده مراجعه کنید.
Combine Data
ترکیب دادهها
اگر دادههای شما از یک جدول میآیند، میتوانید برای ایجاد منبع داده به دادههای خود متصل شوید، جدول را روی بوم بکشید و سپس شروع به ساخت نمای خود کنید. اما اگر دادههای شما در چندین جدول – یا در چندین پایگاه داده – پخش شده است، باید آنها را ترکیب کنید. ترکیب دادهها در صفحه منبع داده اتفاق میافتد.
Single database | Multiple databases |
|
|
ترکیب دادهها
برای مرتبط کردن جداول در پایگاههای داده مختلف، آنها باید به عنوان اتصالات داده در همان منبع داده اضافه شوند، نه به عنوان یک منبع داده جدید. اتصالات داده از طریق لینک Add در پنل سمت چپ اضافه میشوند. منابع داده جدید را میتوان از طریق منوی Data یا منوی کشویی از آیکون کنار نام منبع داده، همانطور که در تصویر زیر مشاهده میکنید، ایجاد کرد.
روشهای ترکیب داده
روابط، روش پیشفرض ترکیب دادهها در Tableau هستند. روابط، روشی پویا و انعطافپذیر برای ترکیب دادهها از چندین جدول برای تجزیه و تحلیل هستند. در صورت لزوم، جداول را میتوان به هم متصل یا متحد کرد. منابع داده را نیز میتوان با هم ترکیب کرد. بیایید نگاهی به گزینههای نحوه ترکیب دادهها در Tableau و برخی از موقعیتهایی که هر روش مفید است، بیندازیم.
combining data
Relationships | امکان اتصال بین دو جدول را بر اساس فیلدهای مرتبط ایجاد میکند. دادهها را برای ایجاد یک جدول جدید و ثابت با هم ادغام نمیکند. در حین تجزیه و تحلیل، جداول مربوطه را به طور خودکار با استفاده از اتصالات متناسب با متن جستجو میکند تا یک جدول سفارشی از دادهها برای آن تجزیه و تحلیل ایجاد کند.
سطح مناسبی از جزئیات را حفظ میکند، دادهها را از دست نمیدهد، تجمیعهای مناسب را نگه میدارد و مقادیر تهی را مدیریت میکند. |
Joins | دو جدول داده را بر اساس یک بند اتصال و نوع اتصال ادغام کنید تا یک جدول داده جدید و ثابت تشکیل دهید. اغلب برای اضافه کردن ستونهای جدید داده در همان ساختار ردیف پایه استفاده میشود.
اگر فیلدها در همه جداول وجود نداشته باشند، ممکن است باعث از دست رفتن دادهها با برخی از انواع اتصال شود. اگر جداول در سطوح مختلف جزئیات باشند، ممکن است باعث تکرار دادهها شود. |
Unions | دو یا چند جدول داده را برای تشکیل یک جدول داده جدید و ثابت ادغام میکند. برای افزودن (اضافه کردن ردیفهای جدید) داده در یک ساختار ستونی پایه استفاده میشود. |
Blends | روی دو یا چند منبع داده Tableau جداگانه کار کنید. دادهها جداگانه باقی میمانند. Tableau منابع داده را به طور مستقل جستجو میکند و نتایج را بر اساس فیلدهای پیوند ایجاد شده برای آن برگه، در نما به صورت یکپارچه نمایش میدهد. رفتار یک اتصال چپ را تقلید میکند و ممکن است دادهها را از منابع داده ثانویه فیلتر کند. |
لایسنس تبلو
همچنین میتوان دادهها را با SQL سفارشی ترکیب کرد. در بیشتر مواقع، بهتر است دادهها را مستقیماً در بوم یا با ترکیب دادهها ترکیب کنید. این به Tableau بیشترین انعطافپذیری را برای بهینهسازی میدهد. با این حال، در سناریوهای خاص، ممکن است دلایلی برای استفاده از SQL سفارشی وجود داشته باشد. به خاطر داشته باشید که انجام این کار میتواند پیامدهای عملکردی داشته باشد زیرا Tableau مجبور است دستور SQL سفارشی را همانطور که نوشته شده است اجرا کند.
روابط (Relationships)
ارتباط روشی برای کار با دادههای چندین جدول بر اساس فیلدهای مشترک – ستونها – بین آن جداول است. ایجاد یک رابطه، Tableau را مطلع میکند که چگونه ردیفها میتوانند در جداول به هم متصل شوند. Tableau این اطلاعات را نگه میدارد اما ردیفها را مانند یک اتصال کدگذاری شده، بلافاصله به هم متصل نمیکند. در عوض، هنگامی که یک تجسم ایجاد میشود، فیلدهای درگیر در تجزیه و تحلیل از طریق رابطه ردیابی میشوند و اتصالات مناسب برای بازگرداندن دادههای صحیح ایجاد میشوند.
از آنجا که دادهها هرگز خارج از چارچوب تجسم به یک جدول واحد منتقل نمیشوند، روابط زمانی مفید هستند که دادهها در سطوح مختلف جزئیات یا دانهبندی باشند. به عنوان مثال، اگر نیاز دارید با دادههای مربوط به بارندگی روزانه در یک جدول اما دمای ساعتی در جدول دیگری کار کنید،
در نسخه 2024.2 و بالاتر نرمافزار Tableau، مدل داده Tableau از تحلیل چند واقعیتی و ابعاد مشترک از طریق روابط چند واقعیتی پشتیبانی میکند.
اتصال (Join)
اتصال روشی برای ترکیب جداول مرتبط با فیلدهای مشترک است. نتیجه ترکیب دادهها با استفاده از اتصال، جدولی است که با اضافه کردن ستونهای داده به صورت افقی گسترش مییابد.
ترکیب داده (Data blending)
وقتی از ترکیب دادهها برای ترکیب دادههای خود استفاده میکنید، دادهها را در چیزی که منبع داده اصلی نامیده میشود با فیلدهای مشترک از یک یا چند منبع داده ثانویه ترکیب میکنید.
ترکیب دادهها زمانی مفید است که نیاز به تغییر نحوه پیکربندی منبع داده به صورت صفحه به صفحه داشته باشید، زمانی که میخواهید پایگاههای دادهای را که اجازه روابط یا پیوندها را نمیدهند مانند منابع داده مکعبی یا منابع داده منتشر شده ترکیب کنید.
نتیجه ترکیب دادهها با استفاده از ترکیب دادهها، یک جدول مجازی است که با اضافه کردن ستونهایی از دادهها به صورت افقی گسترش مییابد. دادههای هر منبع داده قبل از نمایش با هم در تجسم، در یک سطح مشترک جمع میشوند.
اتحادیه (Union)
اتحاد روشی برای اضافه کردن مقادیر (ردیفها) به جداول است. اگر جداول ستونهای یکسانی داشته باشند، میتوانید آنها را اتحادیه کنید. نتیجه ترکیب دادهها با استفاده از اتحادیه، یک جدول مجازی است که ستونهای یکسانی دارد اما با اضافه کردن ردیفهای داده به صورت عمودی گسترش مییابد.
شما میتوانید جداول را به یکی از دو روش زیر متحد کنید: دستی یا با استفاده از جستجوی wildcard.
ملاحظات مربوط به منبع داده Tableau
قبل از هر چیز دیگری، مطمئن شوید که هدف منبع داده را به روشنی میدانید. اگر در حال ایجاد یک منبع داده جامع برای طیف وسیعی از کاربران با سوالات گسترده هستید، باید متفاوت از زمانی که یک منبع داده خاص بهینه شده برای عملکرد ایجاد میکنید، عمل کنید. مهم است که از ابتدا هدف خود را بدانید.
با در نظر گرفتن این هدف، قبل از ساخت یک منبع داده در Tableau، چندین مورد وجود دارد که باید در نظر گرفته و برنامهریزی شوند:
- Location and access
- Shape and cleanliness
- The data model and combining data
- Metadata and customization
- Scalability, security, and discoverability
- Performance and freshness
1.مکان و دسترسی
مکان دادههای شما میتواند به سادگی یک فایل اکسل در رایانه شما یا یک برگه گوگل که ایجاد کردهاید باشد، یا به پیچیدگی چندین پایگاه داده با استفاده از فناوریهای مختلف. دسترسی همچنین میتواند شامل درایورها یا رابطهای خاصی برای یک پایگاه داده یا اطلاعات ورود به سیستم برای یک سرور پایگاه داده باشد.
سوالاتی که باید در نظر گرفته شوند:
- آیا کاربران صحیح Tableau به دادهها و Tableau دسترسی و مجوز دارند؟
- از چه حساب کاربری باید برای ورود به پایگاه داده استفاده شود؟
- آیا فیلتر کردن کاربر یا امنیت سطح ردیف مورد نیاز است؟
- آیا دادههای منبع در محل هستند یا در فضای ابری؟
- اگر دادهها در Tableau Cloud منتشر شوند، این ممکن است پیامدهایی داشته باشد.
- آیا کانکتورهای پشتیبانیشدهای وجود دارد؟
- آیا محدودیتهایی برای آن پایگاه داده وجود دارد (آیا از تمام عملکردهایی که امیدوارید استفاده کنید پشتیبانی میکند)؟
2.شکل و تمیزی
سازمان شما ممکن است از قبل دادههای ساختاریافتهای داشته باشد که بتوانید به آنها متصل شوید یا فرآیندهای ETL قابل استفادهای داشته باشد، یا ممکن است برای انجام عملیات پاکسازی و شکلدهی به دادههای خود و تبدیل آنها به فرمتی مفید، نیاز به استفاده از Tableau Prep Builder داشته باشید.
سوالاتی که باید در نظر گرفته شوند:
- آیا دادهها برای استفاده با Tableau به خوبی ساختار یافتهاند؟
- آیا باید از Tableau Prep Builder و Tableau Prep Conductor برای پاکسازی و خودکارسازی جریانهای آمادهسازی دادهها استفاده شود؟
- چه محاسبات یا دستکاریهایی بهتر است به صورت بومی در Tableau انجام شوند؟
- آیا هیچ یک از این دادهها غیرضروری هستند؟ آیا دادهای از دست رفته است؟
3.مدل داده و combining data
Tableau باید بداند که چگونه دادهها را پرسوجو کند، که این کار توسط مدل داده Tableau انجام میشود. اگر دادهها از چندین جدول میآیند، باید دادهها ترکیب شوند. روشهای ترکیب دادهها شامل روابط، پیوندها، اتحادها و ترکیبها است.
سوالاتی که باید در نظر گرفته شوند:
- آیا دادهها در چندین سیستم پخش شدهاند؟
- بهترین راه برای ترکیب هر جدول از دادهها چیست؟
4. فراداده و سفارشیسازی
دادهها اغلب به گونهای ذخیره میشوند که استفاده راحت از آنها برای یک فرد آسان نیست. به عنوان مثال، نامهای پیشفرض فیلدها میتوانند دست و پا گیر باشند، قالببندی سفارشی ممکن است مورد نظر باشد، تعاریف اختصارات یا کدها ممکن است وجود نداشته باشند، یا محاسبات رایج ممکن است در دادههای اساسی وجود نداشته باشند. ایجاد یک لایه معنایی با آن دسته از اطلاعات میتواند درک و استفاده از دادهها را بسیار آسانتر کند.
سوالاتی که باید در نظر گرفته شوند:
- چه محاسباتی باید اضافه شود؟
- آیا نام جدول و فیلدها قابل فهم است؟
- آیا تنظیمات پیشفرض برای فیلدها مفید است یا باید سفارشیسازی شوند؟
- آیا تنظیماتی وجود دارد که باید برای پشتیبانی از Tableau Catalog انجام شود؟
- توجه داشته باشید که Explain Data در حال حاضر از منابع داده چند جدولی پشتیبانی نمیکند.
5. مقیاسپذیری، امنیت و قابلیت کشف
یک منبع داده ممکن است در همان ورکبوکی که ایجاد شده است – یک منبع داده تعبیهشده – باقی بماند یا ممکن است مستقل از هرگونه تحلیلی به عنوان یک دارایی محتوایی کاملاً مستقل، در Tableau Server یا Tableau Cloud منتشر شود. این متمرکزسازی منابع داده منتشر شده، مزیت امنیتی و مقیاسپذیری بیشتری دارد و به چندین کاربر اجازه میدهد تا به یک منبع داده سازگار دسترسی داشته باشند. منابع داده منتشر شده همچنین میتوانند از کاتالوگ و توصیههای Tableau بهرهمند شوند و یک منبع واحد از حقیقت را برای یک سازمان فراهم کنند.
سوالاتی که باید در نظر گرفته شوند:
- آیا منبع داده باید در فایل اکسل باقی بماند؟
(سوالات زیر فرض میکنند که منبع داده منتشر شده است)
- منبع داده کجا منتشر خواهد شد؟
- چه کسی مالک منبع داده خواهد بود؟
- چه احراز هویت و مجوزهایی باید داشته باشد؟
- آیا گواهینامه دریافت خواهد کرد؟
6. عملکرد و تازگی
علاوه بر این، منابع داده Tableau میتوانند به صورت اتصال زنده به دادههای منبع باشند یا دادهها میتوانند به صورت یک عصاره قابل تجدید کپی شوند. عصارهها میتوانند عملکرد تحلیل را افزایش دهند یا از هدر رفتن منابع در سیستمهای پایگاه داده جلوگیری کنند.
سوالاتی که باید در نظر گرفته شوند:
- اتصال داده باید زنده باشد یا یک extract؟
در صورت استخراج، آیا برنامه بهروزرسانی وجود خواهد داشت؟ (سرور Tableau | Tableau Cloud) - در صورت انتشار در Tableau Cloud، آیا باید از Tableau Bridge استفاده شود؟
منابع داده با کیفیت بسازید
یک منبع داده با طراحی خوب و عملکرد خوب، عوامل زیادی دارد. لازم نیست اولین تلاش خود را منتشر کنید. مانند ایجاد یک تجسم خوب، ساخت یک منبع داده میتواند یک فرآیند مداوم باشد. سعی کنید دادههایی را که فکر میکنید نیاز دارید ترکیب کنید و سپس ببینید که آیا میتوانید تصویری را که میخواهید بسازید یا خیر. همیشه میتوانید برگردید و یک محاسبه جدید بنویسید یا جدول دادههای دیگری را وارد کنید. کمی آزمایش کاربر انجام دهید و از یک همکار بپرسید که آیا میتواند نام فیلدهای شما را پیدا کند یا خیر.
البته، بهتر است فقط منابع دادهای را منتشر کنید که به آنها اطمینان دارید و فقط آنهایی را که تضمین کیفیت را پشت سر گذاشتهاند، تأیید کنید. تا زمانی که منبع داده شما در مقابل کاربران قرار گیرد، آنها باید بتوانند به آن اعتماد کنند.
برای خرید لایسنس نرم افزار Tableau ، میتوانید از خدمات ما استفاده نموده و درخواست خود را از طریق فرم زیر ثبت نمایید.
بدون دیدگاه