مجموعه دادههای Bookshop در تبلو (Bookshop data set)
مجموعه دادههای Bookshop برای Tableau Desktop 2020.2 ایجاد شده است تا روابط – قابلیتهای جدید مدلسازی داده برای ترکیب دادهها – را نشان دهد.
فایلها را دانلود کنید
میتوانید دادههای خام را دانلود کنید و از ابتدا شروع به ساخت مدل داده خود کنید، یا یکی از منابع داده از پیش ساخته شده را دانلود کنید تا مستقیماً به تجزیه و تحلیل با روابط بپردازید.
- دادههای خام (xlsx)
- Bookshop.xlsx – دادههای خام به صورت فایل .xlsx
- BookshopLibraries.xlsx – جداول کتابخانهای اضافی که روابط چند به چند را معرفی میکنند (فقط شامل جداول کتابخانهای اضافی است)
- فایلهای منبع داده بستهبندی شده (tdsx)
- Bookshop.tdsx – یک فایل .tdsx بستهبندی شده با منبع داده مرتبط که از قبل ساخته شده و برخی سفارشیسازیهای فراداده اضافه شده است
- MinimalBookshop.tdsx – همان جداول Bookshop.tdsx اما بدون هیچ فراداده یا پاکسازی
- Bookshop_libraries.tdsx – یک فایل .tdsx بستهبندی شده که جداول کتابخانه را به Bookshop.tdsx اضافه میکند (شامل همه جداول).
برای اتصال به فایل .tdsx دانلود شده
- Tableau Desktop را باز کنید.
- در پنل Connect در سمت چپ، گزینه More… را در زیر عنوان To a File انتخاب کنید.
- به جایی که فایل .tdsx را دانلود کردهاید بروید و روی آن دوبار کلیک کنید (یا آن را انتخاب کنید و سپس روی Open کلیک کنید).
مجموعه دادهها
Bookshop شامل ۱۳ جدول است که به روش زیر ترکیب شدهاند:
توجه: مفهوم اصلی این مجموعه داده، ایده کتاب در مقابل ویرایش است. کتاب مفهومی با ویژگیهایی مانند نویسنده، عنوان و ژانر است. ویرایش، نسخه فیزیکی کتاب است که ویژگیهایی مانند قالب (جلد سخت، جلد کاغذی)، تاریخ انتشار و تعداد صفحات دارد.
فرهنگ دادهها
برخی از فیلدها ممکن است نیاز به کمی توضیح داشته باشند.
- فیلد رتبهبندی در جدول رتبهبندیها در مقیاس ۱ تا ۵ است که ۵ بالاترین رتبه را دارد.
- فیلد قالب، تجزیه و تحلیل دقیقی از قالب است. هر چیزی غیر از «جلد سخت» میتواند «جلد کاغذی» در نظر گرفته شود.
- شابک (ISBN) مخفف شماره استاندارد بینالمللی کتاب است و یک شناسه ۱۳ رقمی منحصر به فرد است که به هر ویرایش از یک کتاب داده میشود. شابک در بارکد نمایش داده میشود و به قیمت گره خورده است.
- فیلدهای شناسه کالا (ItemID) و شناسه سفارش (OrderID) سلسله مراتبی هستند. یک سفارش ممکن است شامل چندین مورد باشد.
- فیلد نظر کارکنان شامل خلاصهها و نقدهایی برای برخی از کتابها است.
data source
اگر منبع داده خودتان را میسازید
- جدولهای ناشر و فروش باید به جدول نسخه (Vediation) مرتبط باشند.
- جدولهای کتاب (Book) و اطلاعات (Info) میتوانند مرتبط یا به هم متصل شوند، اما باید در محاسبه BookID = [BookID1]+[BookID2] باشند.
- یک اتصال داخلی پیشنهاد میشود.
- جدول سریها فقط زمانی قابل استفاده است که جدول اطلاعات بخشی از منبع داده باشد.
اختیاری:
- توصیه میکنیم نام جدول منطقی Book که با اطلاعات ترکیب شده است را به «Book» یا چیزی شبیه به آن تغییر دهید.
- چهار جدول Sales را میتوان به طور مستقل تجزیه و تحلیل کرد، اما اگر با هم متحد شده باشند، توصیه میکنیم نام اتحاد را به «Sales» یا چیزی شبیه به آن تغییر دهید.
- بیشتر فیلدهای مورد استفاده برای تشکیل روابط، برای تجزیه و تحلیل مورد نیاز نیستند و میتوانند پس از ساخت مدل داده پنهان شوند.
- هر فیلدی که به شناسه ختم میشود را میتوان پنهان کرد (تنها فیلدهای «شناسه» که این قابلیت را دارند، ReviewID و ReviewerID از Ratings و ItemID و OrderID از Sales هستند).
- ISBN باید، در حالت ایدهآل، از جدول Edition، به عنوان شناسه هر نسخه نگه داشته شود. فیلد ISBN در جدول Unioned Sales میتواند پنهان شود.
- فیلد Title در جدول Award میتواند پنهان شود.
- فیلدهای Sheet و Table از Union نیز حاوی اطلاعات منحصر به فرد نیستند و میتوانند پنهان شوند.
- برای سادهسازی مدل داده، جداول اصلی عبارتند از کتاب، نویسنده و نسخه. سادهترین جداولی که میتوان با حداقل تأثیر حذف کرد، جداول «پرداختها و رتبهبندیها» و پس از آن «جایزه»، «ناشر»، «فروش» یا «اطلاعات» و «مجموعه» هستند.
کتابخانههای Bookshop
فایل BookshopLibraries.xlsx جداول جدیدی را در مورد کتابخانهها به منظور پشتیبانی از روابط چند به چند معرفی میکند. جدول Catalog به جدول Editions در ISBN مربوط میشود. جدول Library Profiles به جدول Catalog به عنوان یک رابطه چند به چند (n:n) در LibraryID مربوط میشود.
فرهنگ لغت دادهها
مشخصات کتابخانه
- فیلد کتابخانه نام کتابخانه است.
- فیلد شناسه کتابخانه، یک شناسه است که در جدول کاتالوگ نیز استفاده میشود.
- فیلد عضو کنسرسیوم یک فیلد بله/خیر است که نشان میدهد آیا کتابخانه بخشی از شبکه بزرگتر کتابخانههایی است که امانت بین کتابخانهای ارائه میدهند و سایر خدمات را به اشتراک میگذارند.
- فیلد خصوصی یک فیلد بله/خیر است که نشان میدهد آیا این یک کتابخانه فقط برای اعضا است یا یک موسسه دولتی.
- نوع و تعداد کارکنان با هم نشان میدهند که چه تعداد کتابدار، دستیار کتابخانه و تکنسین کتابخانه برای هر کتابخانه کار میکنند.
کاتالوگ
- شناسه امانت یک شناسه منحصر به فرد برای ترکیب شابک و کتابخانه است که برای ردیابی تعداد نسخههای یک کتابخانه استفاده میشود. به عنوان مثال، اگر کتابخانه ساعات بیکاری دو نسخه جلد شومیز و یک نسخه جلد گالینگور از یک عنوان داشته باشد، دو شناسه امانت وجود خواهد داشت.
- فیلد شناسه کتابخانه یک شناسه است که در جدول نمایه کتابخانه نیز استفاده میشود.
ساختار جدول مشخصات کتابخانه
جدول مشخصات کتابخانه در ابتدا به صورت یک جدول بدون محور با یک ستون برای هر نوع کارمند، در زیر، قالببندی شده بود.
| Library | LibraryID | Consortium Member | Private | Librarians | Library Technicians | Library Assistants |
| Idle Hour Library | L-IHL | Yes | No | 53 | 61 | 16 |
| The Bibliophile’s Shelves | L-BS | Yes | Yes | 4 | 3 | 0 |
| Armchair Athanaeum | L-AA | No | Yes | 6 | 0 | 0 |
| Old Friend Library | L-OFL | Yes | No | 3 | 5 | 17 |
| Bide Awhile | L-BA | Yes | No | 9 | 20 | 6 |
| IndieUnBound | L-IUB | Yes | No | 7 | 2 | 47 |
| Page Station Book Exchange | L-PS | No | Yes | 3 | 1 | 4 |
جدول روی ستونهای کتابداران، تکنسینهای کتابخانه و دستیاران کتابخانه، محوربندی شد. قالب نهایی دارای یک ستون برای نوع کارکنان و یک ستون برای تعداد کارکنان است. با این حال، این بدان معناست که برای هر کتابخانه بیش از یک ردیف وجود دارد. بنابراین، مقادیر شناسه کتابخانه منحصر به فرد نیستند و نسخه محوربندی شده جدول باید به صورت چند به چند به جدول کاتالوگ مرتبط باشد.
اگرچه این مزیت را دارد که امکان رابطه چند به یک بین کاتالوگ و پروفایل را فراهم میکند، اما ساختار ایدهآلی برای تحلیل دادهها نیست.
کاوش کنید
این مجموعه دادهها، اگرچه تخیلی است، اما از سناریوهای تحلیلی مختلف و کاوشهای فراوان پشتیبانی میکند. برخی از پیشنهادات عبارتند از:
- کدام کتابها محبوبترین هستند؟ کمطرفدارترین؟ آیا این بر اساس فروش، نقدها، پرداختها یا معیار دیگری است؟
- جوانترین نویسندهی کتاب اول چه کسی بود؟ مسنترین چه کسی بود؟
- آیا به نظر میرسد برخی از ناشران به نوعی تخصص دارند؟
- طولانیترین زمان بین چاپهای یک کتاب چقدر بود؟
- آیا روند فصلی برای فروش وجود دارد؟ در مورد پرداختها چطور؟ آیا عناوین یا ژانرهایی نوسانات فصلی دارند؟
- آیا همبستگی بین پرداختها، اندازهی تیراژ چاپ، رتبهبندی نقد کتاب و حجم فروش وجود دارد؟
- آیا نویسندگانی که بیشترین زمان را صرف نوشتن میکنند، موفقترین کتابها را دارند؟ آیا بیشترین تعداد صفحه را دارند؟
- بیشتر کتابها چه زمانی منتشر میشوند؟ آیا ناهنجاریهایی وجود دارد؟
- آیا روندی برای ژانر، قالب و قیمت وجود دارد؟
- رتبهبندیها چه نوع توزیعهایی دارند؟ آیا این توزیعها بر اساس کتاب متفاوت است؟ بر اساس ژانر؟ آیا به نظر میرسد که با جوایز همسو هستند؟
- با توجه به اینکه گاهی اوقات – اما نه همیشه – تخفیفی در زمان فروش داده میشود، چگونه قیمت فروش را محاسبه میکنید؟
- آیا فروشها تقریباً از اصل پارتو پیروی میکنند؟
- آیا الگویی در تخفیفها وجود دارد؟
- آیا به طور خاص جدولی وجود دارد که دادههای نادرستی داشته باشد؟
برای خرید لایسنس نرم افزار Tableau ، میتوانید از خدمات ما استفاده نموده و درخواست خود را از طریق فرم زیر ثبت نمایید.



بدون دیدگاه