Bookshop data set in tableau

مجموعه داده‌های Bookshop در تبلو (Bookshop data set)

مجموعه داده‌های Bookshop برای Tableau Desktop 2020.2 ایجاد شده است تا روابط – قابلیت‌های جدید مدل‌سازی داده برای ترکیب داده‌ها – را نشان دهد.

فایل‌ها را دانلود کنید

می‌توانید داده‌های خام را دانلود کنید و از ابتدا شروع به ساخت مدل داده خود کنید، یا یکی از منابع داده از پیش ساخته شده را دانلود کنید تا مستقیماً به تجزیه و تحلیل با روابط بپردازید.

  • داده‌های خام (xlsx)
    • Bookshop.xlsx – داده‌های خام به صورت فایل .xlsx
    • BookshopLibraries.xlsx – جداول کتابخانه‌ای اضافی که روابط چند به چند را معرفی می‌کنند (فقط شامل جداول کتابخانه‌ای اضافی است)
  • فایل‌های منبع داده بسته‌بندی شده (tdsx)
    • Bookshop.tdsx – یک فایل .tdsx بسته‌بندی شده با منبع داده مرتبط که از قبل ساخته شده و برخی سفارشی‌سازی‌های فراداده اضافه شده است
    • MinimalBookshop.tdsx – همان جداول Bookshop.tdsx اما بدون هیچ فراداده یا پاکسازی
    • Bookshop_libraries.tdsx – یک فایل .tdsx بسته‌بندی شده که جداول کتابخانه را به Bookshop.tdsx اضافه می‌کند (شامل همه جداول).

 

برای اتصال به فایل .tdsx دانلود شده

  1. Tableau Desktop را باز کنید.
  2. در پنل Connect در سمت چپ، گزینه More… را در زیر عنوان To a File انتخاب کنید.
  3. به جایی که فایل .tdsx را دانلود کرده‌اید بروید و روی آن دوبار کلیک کنید (یا آن را انتخاب کنید و سپس روی Open کلیک کنید).

مجموعه داده‌ها

Bookshop شامل ۱۳ جدول است که به روش زیر ترکیب شده‌اند:

bookshop data set in tableau

توجه: مفهوم اصلی این مجموعه داده، ایده کتاب در مقابل ویرایش است. کتاب مفهومی با ویژگی‌هایی مانند نویسنده، عنوان و ژانر است. ویرایش، نسخه فیزیکی کتاب است که ویژگی‌هایی مانند قالب (جلد سخت، جلد کاغذی)، تاریخ انتشار و تعداد صفحات دارد.

فرهنگ داده‌ها

برخی از فیلدها ممکن است نیاز به کمی توضیح داشته باشند.

  • فیلد رتبه‌بندی در جدول رتبه‌بندی‌ها در مقیاس ۱ تا ۵ است که ۵ بالاترین رتبه را دارد.
  • فیلد قالب، تجزیه و تحلیل دقیقی از قالب است. هر چیزی غیر از «جلد سخت» می‌تواند «جلد کاغذی» در نظر گرفته شود.
  • شابک (ISBN) مخفف شماره استاندارد بین‌المللی کتاب است و یک شناسه ۱۳ رقمی منحصر به فرد است که به هر ویرایش از یک کتاب داده می‌شود. شابک در بارکد نمایش داده می‌شود و به قیمت گره خورده است.
  • فیلدهای شناسه کالا (ItemID) و شناسه سفارش (OrderID) سلسله مراتبی هستند. یک سفارش ممکن است شامل چندین مورد باشد.
  • فیلد نظر کارکنان شامل خلاصه‌ها و نقدهایی برای برخی از کتاب‌ها است.

data source

اگر منبع داده خودتان را می‌سازید

  • جدول‌های ناشر و فروش باید به جدول نسخه (Vediation) مرتبط باشند.
  • جدول‌های کتاب (Book) و اطلاعات (Info) می‌توانند مرتبط یا به هم متصل شوند، اما باید در محاسبه BookID = [BookID1]+[BookID2] باشند.
    • یک اتصال داخلی پیشنهاد می‌شود.
    • جدول سری‌ها فقط زمانی قابل استفاده است که جدول اطلاعات بخشی از منبع داده باشد.

اختیاری:

  • توصیه می‌کنیم نام جدول منطقی Book که با اطلاعات ترکیب شده است را به «Book» یا چیزی شبیه به آن تغییر دهید.
  • چهار جدول Sales را می‌توان به طور مستقل تجزیه و تحلیل کرد، اما اگر با هم متحد شده باشند، توصیه می‌کنیم نام اتحاد را به «Sales» یا چیزی شبیه به آن تغییر دهید.
    • بیشتر فیلدهای مورد استفاده برای تشکیل روابط، برای تجزیه و تحلیل مورد نیاز نیستند و می‌توانند پس از ساخت مدل داده پنهان شوند.
    • هر فیلدی که به شناسه ختم می‌شود را می‌توان پنهان کرد (تنها فیلدهای «شناسه» که این قابلیت را دارند، ReviewID و ReviewerID از Ratings و ItemID و OrderID از Sales هستند).
    • ISBN باید، در حالت ایده‌آل، از جدول Edition، به عنوان شناسه هر نسخه نگه داشته شود. فیلد ISBN در جدول Unioned Sales می‌تواند پنهان شود.
    • فیلد Title در جدول Award می‌تواند پنهان شود.
    • فیلدهای Sheet و Table از Union نیز حاوی اطلاعات منحصر به فرد نیستند و می‌توانند پنهان شوند.
  • برای ساده‌سازی مدل داده، جداول اصلی عبارتند از کتاب، نویسنده و نسخه. ساده‌ترین جداولی که می‌توان با حداقل تأثیر حذف کرد، جداول «پرداخت‌ها و رتبه‌بندی‌ها» و پس از آن «جایزه»، «ناشر»، «فروش» یا «اطلاعات» و «مجموعه» هستند.

کتابخانه‌های Bookshop

فایل BookshopLibraries.xlsx جداول جدیدی را در مورد کتابخانه‌ها به منظور پشتیبانی از روابط چند به چند معرفی می‌کند. جدول Catalog به جدول Editions در ISBN مربوط می‌شود. جدول Library Profiles به جدول Catalog به عنوان یک رابطه چند به چند (n:n) در LibraryID مربوط می‌شود.

bookshop data set in tableau

فرهنگ لغت داده‌ها

مشخصات کتابخانه

  • فیلد کتابخانه نام کتابخانه است.
  • فیلد شناسه کتابخانه، یک شناسه است که در جدول کاتالوگ نیز استفاده می‌شود.
  • فیلد عضو کنسرسیوم یک فیلد بله/خیر است که نشان می‌دهد آیا کتابخانه بخشی از شبکه بزرگتر کتابخانه‌هایی است که امانت بین کتابخانه‌ای ارائه می‌دهند و سایر خدمات را به اشتراک می‌گذارند.
  • فیلد خصوصی یک فیلد بله/خیر است که نشان می‌دهد آیا این یک کتابخانه فقط برای اعضا است یا یک موسسه دولتی.
  • نوع و تعداد کارکنان با هم نشان می‌دهند که چه تعداد کتابدار، دستیار کتابخانه و تکنسین کتابخانه برای هر کتابخانه کار می‌کنند.

کاتالوگ

  • شناسه امانت یک شناسه منحصر به فرد برای ترکیب شابک و کتابخانه است که برای ردیابی تعداد نسخه‌های یک کتابخانه استفاده می‌شود. به عنوان مثال، اگر کتابخانه ساعات بیکاری دو نسخه جلد شومیز و یک نسخه جلد گالینگور از یک عنوان داشته باشد، دو شناسه امانت وجود خواهد داشت.
  • فیلد شناسه کتابخانه یک شناسه است که در جدول نمایه کتابخانه نیز استفاده می‌شود.

ساختار جدول مشخصات کتابخانه

جدول مشخصات کتابخانه در ابتدا به صورت یک جدول بدون محور با یک ستون برای هر نوع کارمند، در زیر، قالب‌بندی شده بود.

Library LibraryID Consortium Member Private Librarians Library Technicians Library Assistants
Idle Hour Library L-IHL Yes No 53 61 16
The Bibliophile’s Shelves L-BS Yes Yes 4 3 0
Armchair Athanaeum L-AA No Yes 6 0 0
Old Friend Library L-OFL Yes No 3 5 17
Bide Awhile L-BA Yes No 9 20 6
IndieUnBound L-IUB Yes No 7 2 47
Page Station Book Exchange L-PS No Yes 3 1 4

جدول روی ستون‌های کتابداران، تکنسین‌های کتابخانه و دستیاران کتابخانه، محوربندی شد. قالب نهایی دارای یک ستون برای نوع کارکنان و یک ستون برای تعداد کارکنان است. با این حال، این بدان معناست که برای هر کتابخانه بیش از یک ردیف وجود دارد. بنابراین، مقادیر شناسه کتابخانه منحصر به فرد نیستند و نسخه محوربندی شده جدول باید به صورت چند به چند به جدول کاتالوگ مرتبط باشد.

اگرچه این مزیت را دارد که امکان رابطه چند به یک بین کاتالوگ و پروفایل را فراهم می‌کند، اما ساختار ایده‌آلی برای تحلیل داده‌ها نیست.

 

کاوش کنید

این مجموعه داده‌ها، اگرچه تخیلی است، اما از سناریوهای تحلیلی مختلف و کاوش‌های فراوان پشتیبانی می‌کند. برخی از پیشنهادات عبارتند از:

  • کدام کتاب‌ها محبوب‌ترین هستند؟ کم‌طرفدارترین؟ آیا این بر اساس فروش، نقدها، پرداخت‌ها یا معیار دیگری است؟
  • جوان‌ترین نویسنده‌ی کتاب اول چه کسی بود؟ مسن‌ترین چه کسی بود؟
  • آیا به نظر می‌رسد برخی از ناشران به نوعی تخصص دارند؟
  • طولانی‌ترین زمان بین چاپ‌های یک کتاب چقدر بود؟
  • آیا روند فصلی برای فروش وجود دارد؟ در مورد پرداخت‌ها چطور؟ آیا عناوین یا ژانرهایی نوسانات فصلی دارند؟
  • آیا همبستگی بین پرداخت‌ها، اندازه‌ی تیراژ چاپ، رتبه‌بندی نقد کتاب و حجم فروش وجود دارد؟
  • آیا نویسندگانی که بیشترین زمان را صرف نوشتن می‌کنند، موفق‌ترین کتاب‌ها را دارند؟ آیا بیشترین تعداد صفحه را دارند؟
  • بیشتر کتاب‌ها چه زمانی منتشر می‌شوند؟ آیا ناهنجاری‌هایی وجود دارد؟
  • آیا روندی برای ژانر، قالب و قیمت وجود دارد؟
  • رتبه‌بندی‌ها چه نوع توزیع‌هایی دارند؟ آیا این توزیع‌ها بر اساس کتاب متفاوت است؟ بر اساس ژانر؟ آیا به نظر می‌رسد که با جوایز همسو هستند؟
  • با توجه به اینکه گاهی اوقات – اما نه همیشه – تخفیفی در زمان فروش داده می‌شود، چگونه قیمت فروش را محاسبه می‌کنید؟
  • آیا فروش‌ها تقریباً از اصل پارتو پیروی می‌کنند؟
  • آیا الگویی در تخفیف‌ها وجود دارد؟
  • آیا به طور خاص جدولی وجود دارد که داده‌های نادرستی داشته باشد؟

 

برای خرید لایسنس نرم افزار Tableau ، می‌توانید از خدمات ما استفاده نموده و درخواست خود را از طریق فرم زیر ثبت نمایید.

فرم درخواست لایسنس Tableau

 

tableau desktop download

 

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *