منبع داده Data Source در تبلو

برنامه‌ریزی منبع داده در تبلو

منبع داده Data Source

در مرکز Tableau، داده‌های شما قرار دارند. میزان موفقیت شما در کاوش داده‌ها، پاسخ به سوالات و ساخت مصورسازی برای استفاده خودتان یا دیگران، همگی به داده‌های زیربنایی بستگی دارد.

اگر هدف شما انجام کاوش سریع یا تحلیل موردی است، ممکن است بتوانید وارد شوید، به برخی داده‌ها متصل شوید، کمی بکشید و رها کنید تا چند Vizz بسازید و با اطلاعات مورد نیاز خود خارج شوید. اما اگر هدف شما ایجاد یک تحلیل یا منبع داده است که بیش از یک بار استفاده خواهد شد، بهتر است منبع داده خود را به طور کامل بررسی و برنامه‌ریزی کنید.

منابع داده Tableau

یک منبع داده Tableau، پیوند بین داده‌های منبع شما و Tableau است. اساساً مجموع داده‌های شما (چه به عنوان یک اتصال زنده یا یک استخراج)، اطلاعات اتصال، نام جداول یا برگه‌های حاوی داده‌ها و سفارشی‌سازی‌هایی است که شما روی داده‌ها انجام می‌دهید تا با آنها در Tableau کار کنید. این سفارشی‌سازی‌ها شامل مواردی مانند نحوه ترکیب داده‌ها و ابرداده‌هایی مانند محاسبات، تغییر نام فیلدها و قالب‌بندی پیش‌فرض است.

یک منبع داده Tableau ممکن است شامل چندین اتصال داده به پایگاه‌های داده یا فایل‌های مختلف باشد. اطلاعات اتصال شامل محل قرارگیری داده‌ها، مانند نام فایل و مسیر یا مکان شبکه، و جزئیاتی در مورد نحوه اتصال به داده‌های شما، مانند نام سرور پایگاه داده و اطلاعات ورود به سرور است.

توجه: اصطلاحات منبع داده و اتصال داده در گذشته به طور نامحسوس استفاده شده‌اند و ممکن است در مطالب قدیمی‌تر تمایز روشنی نداشته باشند.

همچنین مهم است که تفاوت بین منبع داده Tableau (دسترسی Tableau به داده‌های شما و تمام سفارشی‌سازی‌هایی که ممکن است در آن دخیل باشد) و خود داده‌های منبع (مانند یک پایگاه داده یا صفحه گسترده اکسل) را در نظر داشته باشید. برنامه‌ریزی یک منبع داده به معنای طراحی یک پایگاه داده، محدوده این مبحث نیست.

منابع داده Tableau می‌توانند در ورک‌بوکی که در ابتدا ایجاد شده‌اند، جاسازی شوند یا می‌توانند جداگانه منتشر شوند. منابع داده منتشر شده امکان تمرکز و مقیاس‌بندی منابع داده گردآوری شده را فراهم می‌کنند. برای اطلاعات بیشتر به بهترین شیوه‌ها برای منابع داده منتشر شده مراجعه کنید.

Combine Data

ترکیب داده‌ها

اگر داده‌های شما از یک جدول می‌آیند، می‌توانید برای ایجاد منبع داده به داده‌های خود متصل شوید، جدول را روی بوم بکشید و سپس شروع به ساخت نمای خود کنید. اما اگر داده‌های شما در چندین جدول – یا در چندین پایگاه داده – پخش شده است، باید آنها را ترکیب کنید. ترکیب داده‌ها در صفحه منبع داده اتفاق می‌افتد.

Single database Multiple databases
  1. به داده‌های خود متصل شوید. این یک منبع داده ایجاد می‌کند.
  2. یک جدول یا برگه داده را به canvas بکشید و رها کنید.
  3. یک جدول یا برگه دوم را به canvas بکشید و رها کنید. یا یک noodle تشکیل می‌شود که نشان می‌دهد یک رابطه خودکار شکل گرفته است، یا کادر محاوره‌ای ویرایش رابطه باز می‌شود و از شما می‌خواهد به Tableau بگویید کدام فیلد آن جداول، دو جدول را به هم مرتبط می‌کند.
  4. به افزودن جداول ادامه دهید.
  1. به داده‌های خود متصل شوید. این یک منبع داده ایجاد می‌کند.
  2. یک جدول یا برگه داده را به canvas بکشید و آن را رها کنید.
  3. پس از نمایش اولین جدول داده، روی پیوند «Add» در سمت راست عنوان «Connections» در پنل سمت چپ کلیک کنید.
  4. بین اتصالات داده در پنل سمت چپ جابجا شوید، سپس جدول مورد نظر را به بوم بکشید و رها کنید. یا یک noodle تشکیل می‌شود که نشان می‌دهد یک رابطه خودکار شکل گرفته است، یا کادر محاوره‌ای «Edit Relationship» باز می‌شود و از شما می‌خواهد به Tableau بگویید کدام فیلد این جداول، دو جدول را به هم مرتبط می‌کند.
  5. به افزودن جداول ادامه دهید و در صورت لزوم بین اتصالات داده جابجا شوید.

ترکیب داده‌ها

برای مرتبط کردن جداول در پایگاه‌های داده مختلف، آنها باید به عنوان اتصالات داده در همان منبع داده اضافه شوند، نه به عنوان یک منبع داده جدید. اتصالات داده از طریق لینک Add در پنل سمت چپ اضافه می‌شوند. منابع داده جدید را می‌توان از طریق منوی Data یا منوی کشویی از آیکون کنار نام منبع داده، همانطور که در تصویر زیر مشاهده می‌کنید، ایجاد کرد.

منبع داده Data Source در تبلو

روش‌های ترکیب داده

روابط، روش پیش‌فرض ترکیب داده‌ها در Tableau هستند. روابط، روشی پویا و انعطاف‌پذیر برای ترکیب داده‌ها از چندین جدول برای تجزیه و تحلیل هستند. در صورت لزوم، جداول را می‌توان به هم متصل یا متحد کرد. منابع داده را نیز می‌توان با هم ترکیب کرد. بیایید نگاهی به گزینه‌های نحوه ترکیب داده‌ها در Tableau و برخی از موقعیت‌هایی که هر روش مفید است، بیندازیم.

combining data

Relationships امکان اتصال بین دو جدول را بر اساس فیلدهای مرتبط ایجاد می‌کند. داده‌ها را برای ایجاد یک جدول جدید و ثابت با هم ادغام نمی‌کند. در حین تجزیه و تحلیل، جداول مربوطه را به طور خودکار با استفاده از اتصالات متناسب با متن جستجو می‌کند تا یک جدول سفارشی از داده‌ها برای آن تجزیه و تحلیل ایجاد کند.

سطح مناسبی از جزئیات را حفظ می‌کند، داده‌ها را از دست نمی‌دهد، تجمیع‌های مناسب را نگه می‌دارد و مقادیر تهی را مدیریت می‌کند.

Joins دو جدول داده را بر اساس یک بند اتصال و نوع اتصال ادغام کنید تا یک جدول داده جدید و ثابت تشکیل دهید. اغلب برای اضافه کردن ستون‌های جدید داده در همان ساختار ردیف پایه استفاده می‌شود.

اگر فیلدها در همه جداول وجود نداشته باشند، ممکن است باعث از دست رفتن داده‌ها با برخی از انواع اتصال شود. اگر جداول در سطوح مختلف جزئیات باشند، ممکن است باعث تکرار داده‌ها شود.

Unions دو یا چند جدول داده را برای تشکیل یک جدول داده جدید و ثابت ادغام می‌کند. برای افزودن (اضافه کردن ردیف‌های جدید) داده در یک ساختار ستونی پایه استفاده می‌شود.
Blends روی دو یا چند منبع داده Tableau جداگانه کار کنید. داده‌ها جداگانه باقی می‌مانند. Tableau منابع داده را به طور مستقل جستجو می‌کند و نتایج را بر اساس فیلدهای پیوند ایجاد شده برای آن برگه، در نما به صورت یکپارچه نمایش می‌دهد. رفتار یک اتصال چپ را تقلید می‌کند و ممکن است داده‌ها را از منابع داده ثانویه فیلتر کند.

لایسنس تبلو

همچنین می‌توان داده‌ها را با SQL سفارشی ترکیب کرد. در بیشتر مواقع، بهتر است داده‌ها را مستقیماً در بوم یا با ترکیب داده‌ها ترکیب کنید. این به Tableau بیشترین انعطاف‌پذیری را برای بهینه‌سازی می‌دهد. با این حال، در سناریوهای خاص، ممکن است دلایلی برای استفاده از SQL سفارشی وجود داشته باشد. به خاطر داشته باشید که انجام این کار می‌تواند پیامدهای عملکردی داشته باشد زیرا Tableau مجبور است دستور SQL سفارشی را همانطور که نوشته شده است اجرا کند.

 

روابط (Relationships)

ارتباط روشی برای کار با داده‌های چندین جدول بر اساس فیلدهای مشترک – ستون‌ها – بین آن جداول است. ایجاد یک رابطه، Tableau را مطلع می‌کند که چگونه ردیف‌ها می‌توانند در جداول به هم متصل شوند. Tableau این اطلاعات را نگه می‌دارد اما ردیف‌ها را مانند یک اتصال کدگذاری شده، بلافاصله به هم متصل نمی‌کند. در عوض، هنگامی که یک تجسم ایجاد می‌شود، فیلدهای درگیر در تجزیه و تحلیل از طریق رابطه ردیابی می‌شوند و اتصالات مناسب برای بازگرداندن داده‌های صحیح ایجاد می‌شوند.

از آنجا که داده‌ها هرگز خارج از چارچوب تجسم به یک جدول واحد منتقل نمی‌شوند، روابط زمانی مفید هستند که داده‌ها در سطوح مختلف جزئیات یا دانه‌بندی باشند. به عنوان مثال، اگر نیاز دارید با داده‌های مربوط به بارندگی روزانه در یک جدول اما دمای ساعتی در جدول دیگری کار کنید،

در نسخه 2024.2 و بالاتر نرم‌افزار Tableau، مدل داده Tableau از تحلیل چند واقعیتی و ابعاد مشترک از طریق روابط چند واقعیتی پشتیبانی می‌کند.

اتصال (Join)

اتصال روشی برای ترکیب جداول مرتبط با فیلدهای مشترک است. نتیجه ترکیب داده‌ها با استفاده از اتصال، جدولی است که با اضافه کردن ستون‌های داده به صورت افقی گسترش می‌یابد.

منبع داده Data Source در تبلو

ترکیب داده (Data blending)

وقتی از ترکیب داده‌ها برای ترکیب داده‌های خود استفاده می‌کنید، داده‌ها را در چیزی که منبع داده اصلی نامیده می‌شود با فیلدهای مشترک از یک یا چند منبع داده ثانویه ترکیب می‌کنید.

ترکیب داده‌ها زمانی مفید است که نیاز به تغییر نحوه پیکربندی منبع داده به صورت صفحه به صفحه داشته باشید، زمانی که می‌خواهید پایگاه‌های داده‌ای را که اجازه روابط یا پیوندها را نمی‌دهند مانند منابع داده مکعبی یا منابع داده منتشر شده ترکیب کنید.

نتیجه ترکیب داده‌ها با استفاده از ترکیب داده‌ها، یک جدول مجازی است که با اضافه کردن ستون‌هایی از داده‌ها به صورت افقی گسترش می‌یابد. داده‌های هر منبع داده قبل از نمایش با هم در تجسم، در یک سطح مشترک جمع می‌شوند.

منبع داده Data Source در تبلو

اتحادیه (Union)

اتحاد روشی برای اضافه کردن مقادیر (ردیف‌ها) به جداول است. اگر جداول ستون‌های یکسانی داشته باشند، می‌توانید آنها را اتحادیه کنید. نتیجه ترکیب داده‌ها با استفاده از اتحادیه، یک جدول مجازی است که ستون‌های یکسانی دارد اما با اضافه کردن ردیف‌های داده به صورت عمودی گسترش می‌یابد.

منبع داده Data Source در تبلو

شما می‌توانید جداول را به یکی از دو روش زیر متحد کنید: دستی یا با استفاده از جستجوی wildcard.

ملاحظات مربوط به منبع داده Tableau

قبل از هر چیز دیگری، مطمئن شوید که هدف منبع داده را به روشنی می‌دانید. اگر در حال ایجاد یک منبع داده جامع برای طیف وسیعی از کاربران با سوالات گسترده هستید، باید متفاوت از زمانی که یک منبع داده خاص بهینه شده برای عملکرد ایجاد می‌کنید، عمل کنید. مهم است که از ابتدا هدف خود را بدانید.

با در نظر گرفتن این هدف، قبل از ساخت یک منبع داده در Tableau، چندین مورد وجود دارد که باید در نظر گرفته و برنامه‌ریزی شوند:

  1. Location and access
  2. Shape and cleanliness
  3. The data model and combining data
  4. Metadata and customization
  5. Scalability, security, and discoverability
  6. Performance and freshness

 

1.مکان و دسترسی

مکان داده‌های شما می‌تواند به سادگی یک فایل اکسل در رایانه شما یا یک برگه گوگل که ایجاد کرده‌اید باشد، یا به پیچیدگی چندین پایگاه داده با استفاده از فناوری‌های مختلف. دسترسی همچنین می‌تواند شامل درایورها یا رابط‌های خاصی برای یک پایگاه داده یا اطلاعات ورود به سیستم برای یک سرور پایگاه داده باشد.

سوالاتی که باید در نظر گرفته شوند:

  • آیا کاربران صحیح Tableau به داده‌ها و Tableau دسترسی و مجوز دارند؟
  • از چه حساب کاربری باید برای ورود به پایگاه داده استفاده شود؟
  • آیا فیلتر کردن کاربر یا امنیت سطح ردیف مورد نیاز است؟
  • آیا داده‌های منبع در محل هستند یا در فضای ابری؟
    • اگر داده‌ها در Tableau Cloud منتشر شوند، این ممکن است پیامدهایی داشته باشد.
  • آیا کانکتورهای پشتیبانی‌شده‌ای وجود دارد؟
  • آیا محدودیت‌هایی برای آن پایگاه داده وجود دارد (آیا از تمام عملکردهایی که امیدوارید استفاده کنید پشتیبانی می‌کند)؟

2.شکل و تمیزی

سازمان شما ممکن است از قبل داده‌های ساختاریافته‌ای داشته باشد که بتوانید به آنها متصل شوید یا فرآیندهای ETL قابل استفاده‌ای داشته باشد، یا ممکن است برای انجام عملیات پاکسازی و شکل‌دهی به داده‌های خود و تبدیل آنها به فرمتی مفید، نیاز به استفاده از Tableau Prep Builder داشته باشید.

سوالاتی که باید در نظر گرفته شوند:

  • آیا داده‌ها برای استفاده با Tableau به خوبی ساختار یافته‌اند؟
  • آیا باید از Tableau Prep Builder و Tableau Prep Conductor برای پاکسازی و خودکارسازی جریان‌های آماده‌سازی داده‌ها استفاده شود؟
  • چه محاسبات یا دستکاری‌هایی بهتر است به صورت بومی در Tableau انجام شوند؟
  • آیا هیچ یک از این داده‌ها غیرضروری هستند؟ آیا داده‌ای از دست رفته است؟

3.مدل داده و combining data

Tableau باید بداند که چگونه داده‌ها را پرس‌وجو کند، که این کار توسط مدل داده Tableau انجام می‌شود. اگر داده‌ها از چندین جدول می‌آیند، باید داده‌ها ترکیب شوند. روش‌های ترکیب داده‌ها شامل روابط، پیوندها، اتحادها و ترکیب‌ها است.

سوالاتی که باید در نظر گرفته شوند:

  • آیا داده‌ها در چندین سیستم پخش شده‌اند؟
  • بهترین راه برای ترکیب هر جدول از داده‌ها چیست؟

4. فراداده و سفارشی‌سازی

داده‌ها اغلب به گونه‌ای ذخیره می‌شوند که استفاده راحت از آنها برای یک فرد آسان نیست. به عنوان مثال، نام‌های پیش‌فرض فیلدها می‌توانند دست و پا گیر باشند، قالب‌بندی سفارشی ممکن است مورد نظر باشد، تعاریف اختصارات یا کدها ممکن است وجود نداشته باشند، یا محاسبات رایج ممکن است در داده‌های اساسی وجود نداشته باشند. ایجاد یک لایه معنایی با آن دسته از اطلاعات می‌تواند درک و استفاده از داده‌ها را بسیار آسان‌تر کند.

سوالاتی که باید در نظر گرفته شوند:

  • چه محاسباتی باید اضافه شود؟
  • آیا نام جدول و فیلدها قابل فهم است؟
  • آیا تنظیمات پیش‌فرض برای فیلدها مفید است یا باید سفارشی‌سازی شوند؟
  • آیا تنظیماتی وجود دارد که باید برای پشتیبانی از Tableau Catalog انجام شود؟
  • توجه داشته باشید که Explain Data در حال حاضر از منابع داده چند جدولی پشتیبانی نمی‌کند.

5. مقیاس‌پذیری، امنیت و قابلیت کشف

یک منبع داده ممکن است در همان ورک‌بوکی که ایجاد شده است – یک منبع داده تعبیه‌شده – باقی بماند یا ممکن است مستقل از هرگونه تحلیلی به عنوان یک دارایی محتوایی کاملاً مستقل، در Tableau Server یا Tableau Cloud منتشر شود. این متمرکزسازی منابع داده منتشر شده، مزیت امنیتی و مقیاس‌پذیری بیشتری دارد و به چندین کاربر اجازه می‌دهد تا به یک منبع داده سازگار دسترسی داشته باشند. منابع داده منتشر شده همچنین می‌توانند از کاتالوگ و توصیه‌های Tableau بهره‌مند شوند و یک منبع واحد از حقیقت را برای یک سازمان فراهم کنند.

سوالاتی که باید در نظر گرفته شوند:

  • آیا منبع داده باید در فایل اکسل باقی بماند؟

(سوالات زیر فرض می‌کنند که منبع داده منتشر شده است)

  • منبع داده کجا منتشر خواهد شد؟
  • چه کسی مالک منبع داده خواهد بود؟
  • چه احراز هویت و مجوزهایی باید داشته باشد؟
  • آیا گواهی‌نامه دریافت خواهد کرد؟

6. عملکرد و تازگی

علاوه بر این، منابع داده Tableau می‌توانند به صورت اتصال زنده به داده‌های منبع باشند یا داده‌ها می‌توانند به صورت یک عصاره قابل تجدید کپی شوند. عصاره‌ها می‌توانند عملکرد تحلیل را افزایش دهند یا از هدر رفتن منابع در سیستم‌های پایگاه داده جلوگیری کنند.

سوالاتی که باید در نظر گرفته شوند:

  • اتصال داده باید زنده باشد یا یک extract؟
    در صورت استخراج، آیا برنامه به‌روزرسانی وجود خواهد داشت؟ (سرور Tableau | Tableau Cloud)
  • در صورت انتشار در Tableau Cloud، آیا باید از Tableau Bridge استفاده شود؟

 

منابع داده با کیفیت بسازید

یک منبع داده با طراحی خوب و عملکرد خوب، عوامل زیادی دارد. لازم نیست اولین تلاش خود را منتشر کنید. مانند ایجاد یک تجسم خوب، ساخت یک منبع داده می‌تواند یک فرآیند مداوم باشد. سعی کنید داده‌هایی را که فکر می‌کنید نیاز دارید ترکیب کنید و سپس ببینید که آیا می‌توانید تصویری را که می‌خواهید بسازید یا خیر. همیشه می‌توانید برگردید و یک محاسبه جدید بنویسید یا جدول داده‌های دیگری را وارد کنید. کمی آزمایش کاربر انجام دهید و از یک همکار بپرسید که آیا می‌تواند نام فیلدهای شما را پیدا کند یا خیر.

البته، بهتر است فقط منابع داده‌ای را منتشر کنید که به آنها اطمینان دارید و فقط آنهایی را که تضمین کیفیت را پشت سر گذاشته‌اند، تأیید کنید. تا زمانی که منبع داده شما در مقابل کاربران قرار گیرد، آنها باید بتوانند به آن اعتماد کنند.

 

 

برای خرید لایسنس نرم افزار Tableau ، می‌توانید از خدمات ما استفاده نموده و درخواست خود را از طریق فرم زیر ثبت نمایید.

فرم درخواست لایسنس Tableau

 

tableau desktop download

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *