مجموعه داده‌ها و مدیریت داده‌ها

دستنامه کتابدار دداه ها

فهرست مطالب...

مدیریت داده‌ها (از داده‌های سازمانی تا داده‌های پژوهشی نویسندگان/ محققان/ دانشجویان) موضوعی برجسته در حوزه‌ها و حرفه‌های مختلف است. کتابداری داده‌ها، کتابخانه داده‌ها و مدیریت داده‌های پژوهشی از جمله موارد مهمی است که به وظایف سنتی کتابخانه‌ها و کتابداران و ظرفیت بزرگ آنها در مدیریت اطلاعات مربوط است. «دستنامه کتابداری داده‌ها» عنوان کتابی است که به تازگی از رابین رایس و جان ساوتال منتشر شده است. این کتاب را ثریا زنگنه ترجمه کرده است در ادامه فصل ۴ این کتاب خواهید خواند که حاوی مطالب مهمی درباره مدیریت داده‌های دیجیتال است. کلمه دستنامه/ هندبوک در عنوان کتاب گویای رویکرد آموزشی نویسنده در نگارش کتاب است. در نوشته‌های بعدی مطالب بیشتری از این کتاب مهم منتشر خواهد شد. این کتاب را نشر کتابدار به زودی منتشر خواهد کرد. (حمید محسنی)

سیاست و داده

یکی از وظایف بسیاری از کتابداران داده‌ها مجموعه‌سازی و توسعه منابع دیجیتال در همان کتابخانه بزرگی است که حاوی منایع چاپی است. این کار را می‌توان با اقتباس از طیفی از رویه‌ها انجام داد، اما داشتن یک سیاست مکتوب و رسمی مزایای خاصی دارد. یک توصیف رسمی نشان می‌دهد که یک سیاست، فراتر از ابزاری برای انتخاب مواد، عملکردهای متعددی را برآورده می‌کند. علاوه بر توصیف مجموعه‌های فعلی، این سیاست کارکنان را تشویق می‌کند تا اهداف و مقاصد سازمان، چه بلندمدت و چه کوتاه‌مدت، و اولویت‌های مربوط به فعالیت‌های مختلف را (دوباره) بررسی کنند. این سیاست به بودجه‌بندی کمک می‌کند، یک کانال ارتباطی درون کتابخانه و بین کتابخانه و ذینفعان خارجی خواهد بود، از توسعه مجموعه‌های مشارکتی پشتیبانی می‌کند، مانع سانسور خواهد شد و به فعالیت‌های کلی مدیریت مجموعه کمک می‌کند (ایفلا[1]، ۲۰۰۱).

به عبارت دیگر، یک سیاست مکتوب نه تنها به انتخاب منابع کمک می‌کند، بلکه راهنمای بهبود مدیریت مجموعه، تقویت ارتباطات و تضمین شفافیت در فرآیندهای کتابخانه‌ای خواهد بود.

بهتر است یک سیاست رسمی تدوین شود. جنین سیاستی باید شامل طیف کامل فعالیت‌های کتابدار داده‌ها باشد. این سیاست البته شامل انتخاب مواد خواهد بود، اما به همان اندازه بر روابط با خوانندگان درون یک بخش و کتابخانه، سازوکار‌های ترویج منابع و دریافت بازخورد، و ارتقای جایگاه کار شما در سازمان بزرگ‌تر نیز تأکید خواهد کرد. این سیاست باید به این موضوع توجه کند که توسعه مجموعه داده‌ها متفاوت خواهد بود.

داده­ ها به عنوان منبعی برای مجموعه‌سازی

چه مسائل مختلفی باید در نظر گرفته شوند؟ بسیاری از موضوعات سنتی مرتبط با مجموعه‌های چاپی کتابخانه‌ها برای توسعه مجموعه‌ داده‌های تحقیقاتی دیجیتال هم کاربرد دارد. برخی مؤسسات ممکن است این مسئولیت را بیشتر بر عهده خدمات فناوری اطلاعات یا آرشیو‌ها بدانند، به ویژه اگر پروژه‌ای برای دیجیتالی‌سازی انجام شده باشد، اما تحول مستمر کتابخانه‌های دانشگاهی اهمیت ادعای مسئولیت در این حوزه را نشان می‌دهد. در کتاب مبانی داده‌ها، یک اثر مهم در مورد توسعه کتابخانه‌های داده و خدمات پشتیبانی، جراسی، هامفری و جیکوبز[2] استدلال می‌کنند: «نقش کتابخانه این است که اطلاعات را انتخاب، گردآوری، سازماندهی و حفظ کند و دسترسی و خدمات را برای آن اطلاعات فراهم کند. اگرچه برخی کتابداران این نقش‌ها را در دنیای دیجیتال زیر سوال می‌برند. این فعالیت‌ها هستند که یک کتابخانه را تعریف می‌کنند. اگر سازمانی همه این نقش‌ها را انجام دهد، چه نامی جز «کتابخانه» می‌توانیم روی آن بگذاریم؟» (جراسی، هامفری و جیکوبز، ۲۰۱۲، ۶۵).

مجموعه‌های داده‌ها به طور فزاینده‌ای به عنوان منابعی در نظر گرفته می‌شوند که باید به عنوان بخشی از مجموعه‌های گسترده‌تر کتابخانه و به شیوه‌ای مشابه مواد چاپی مدیریت شوند. برخی از وظایف مرتبط با این امر ممکن است مختص رسانه‌های چاپی و فیزیکی باشند مانند صحافی، مدیریت فیزیکی موجودی یا وجین. یک نکته کلیدی که باید در نظر گرفت این است که بسیاری از مجموعه‌سازی‌های دیجیتال شامل اشیاء فیزیکی یا حتی مالکیت فایل‌های دیجیتال نمی‌شوند. آنچه اغلب مجموعه‌سازی می‌شود، نوعی دسترسی- یا عضویت در یک گروه دسترسی – به عنوان بخشی از توافق با یک فروشنده است. دسترسی رایگان به منابع داده دولتی نیز از الگوی مشابهی پیروی می‌کند و برخی از مسائل مشابه را در مورد کنترل و راحتی دارد. ارائه دسترسی ممکن است آسان باشد، اما این به معنای نگهداری یا کنترل داده‌ها به گونه‌ای نیست که از قطع خدمات یا تغییرات در محتوا در آینده جلوگیری کند. این موضوع مجموعه‌ای جدید از تصمیمات مدیریتی را ایجاد می‌کند. با این حال، برخی از وظایف مدیریتی برای مجموعه‌های چاپی و دیجیتال مشابه هستند، مانند انتخاب، ترویج و نظارت بر استفاده.

مجموعه ­سازی مجموعه‌های داده‌ها به خودی خود یک فعالیت کلیدی است که ممکن است شامل طیفی از مجموعه‌های داده­ها باشد که مانند بسیاری از منابع دیگر کتابخانه نیاز به تأمین بودجه یا اشتراک سالانه دارند. بنابراین بودجه‌ها باید تخصیص داده شده و هزینه شوند. درباره اینکه چه مجموعه‌داده‌هایی باید مجموعه‌سازی شوند، انتخاب و تصمیم درستی باید گرفته شود و این تصمیم‌گیری باید بر اساس درک نیازهای فوری خواننده و درک روندهای موجود در رشته‌های خاص باشد. در واقع، این نیاز را می‌توان نتیجه تمایزات اساسی بین گرایش‌های تحقیقاتی نظری و تجربی دانست، به ویژه در بخش‌های کلیدی مانند اقتصاد، علوم سیاسی، جامعه‌شناسی و همچنین پزشکی، کسب‌وکار و سایر رشته‌ها. بسیاری از کتابداران داده ممکن است الزامات خاص خود را در سیاست مجموعه‌سازیشان داشته باشند، که متناسب با سیاست‌های خود یا مؤسسه‌شان باشد. همچنین ممکن است منابع کلیدی که برای یک رشته ضروری تلقی می‌شوند یا به عنوان دارایی‌های اساسی در هر مجموعه در نظر گرفته می‌شوند، مدنظر قرار گیرند. اگر برخی از این منابع فراتر از بودجه شما باشند، گاهی ممکن است مشکلاتی بوجود آید.

منابع اشتراکی که به دانشگاه‌ها و بخش تجاری فروخته می‌شوند – مانند پایگاه‌های داده اطلاعات شرکت‌ها و هوش تجاری – معمولاً گران‌ترین هستند، حتی با قیمت‌های تخفیف‌دار برای استفاده‌های دانشگاهی. بنابراین، غیرمعمول نیست که فهرستی از منابع مورد نظر تهیه کنید و به تدریج با تأمین بودجه، به دنبال تهیه تک‌تک این منابع باشید. یک رویکرد جایگزین این است که بررسی کنید چه منابعی در حال حاضر توسط مؤسسه شما تأمین می‌شود و سپس به دنبال موارد کمبود بگردید یا منابعی را جستجو کنید که ممکن است به صورت محدود در دسترس باشند. به عنوان مثال، ممکن است داده‌هایی توسط یک دانشکده، بخش یا مرکز تحقیقاتی خاص خریداری شده باشد که دسترسی به آن‌ها فقط برای دانشجویان و کارکنان آن بخش مجاز است. اخبار مربوط به چنین منابعی به سرعت درون مؤسسه پخش می‌شود – به ویژه زمانی که داده‌ها در انتشارات مورد استناد قرار می‌گیرند – و انتظارات مربوط به دسترسی باید با تدبیر مدیریت شوند.

یک مثال اخیر در دانشگاه آکسفورد شامل یک پایگاه داده ثبت اختراع بود که در یک ارائه مورد اشاره قرار گرفت. این موضوع درخواستی را به کتابخانه برای دسترسی به این پایگاه داده و سوالی درباره اینکه چرا در هیچ یک از فهرست‌ها ذکر نشده است، ایجاد کرد. بررسی بیشتر نشان داد که این پایگاه داده در یک مرکز تحقیقاتی خاص مورد استفاده قرار می‌گیرد، امکان دسترسی گسترده‌تر به آن وجود ندارد و در واقع توسط یک مؤسسه دیگر که در یک پروژه همکاری می‌کند، پرداخت شده است. پس از بحث‌هایی، توافق شد که کتابخانه می‌تواند یک اشتراک برای دسترسی گسترده‌تر تهیه کند. هر زمان که امکان‌پذیر باشد، عاقلانه است که این اشتراک‌ها را در کتابخانه قرار دهید تا همه دانشجویان، اعضای هیئت علمی و کارکنان مؤسسه بتوانند به آن‌ها دسترسی داشته باشند. در نهایت، تقریباً همیشه این منابع از طریق بودجه دانشگاه‌ها تأمین می‌شوند، بنابراین دسترسی به آن‌ها نباید محدود شود. چنین محدودیت‌هایی به معنای کمبود امکانات برای افرادی است که به این منابع دسترسی ندارند. بنابراین بخشی از توسعه مجموعه در واقع به فکر کردن درباره شکاف‌های فعلی و آینده در تأمین منابع و چگونگی رفع آن‌ها تبدیل می‌شود.

ترویج دسترسی به منابع

همه مجموعه‌های داده ­ها یا منابع بر اساس مدل اشتراک پولی نیستند، اگرچه این مدل برای کتابداران آشناتر به نظر می‌رسد. از آنجایی که داده‌های با کیفیت زیادی از طریق پرتال‌های داده­های دسترسی آزاد در دسترس قرار می‌گیرند و ممکن است بخشی از مجموعه را تشکیل دهند، بنابراین لازم است ضمن اطلاع­رسانی لازم به خوانندگان؛ دسترسی به آنها ترویج شود. این واقعیت که این داده‌ها بدون هزینه در دسترس هستند، یک مزیت اضافی است. در موارد دیگر، ممکن است مؤثرتر باشد که داده‌ها را دانلود کرده و به صورت محلی در مؤسسه خود در دسترس قرار دهید. به ویژه اگر داده‌ها ارتقاء یافته باشند مانند ارائه فایل‌های دستوری، قالب‌های جایگزین، یا حتی یک خدمت تحلیل آنلاین. این کار مستلزم داشتن مواد دیجیتال واقعی روی سرور شما با مسئولیت مدیریت و نظارت بر استفاده است. هر رویکردی که انتخاب کنید، گام‌های مهمی در توسعه مجموعه داده‌های اصلی شما خواهند بود، مجموعه‌ای از دارایی‌های داده که نقش مهمی در تعریف کار، علایق و به احتمال زیاد خدمات پشتیبانی شما خواهند داشت.

همانند توسعه مجموعه‌های سنتی کتابخانه‌ها، اغلب لازم است بین موارد قدیمی و آشنا در مجموعه و مجموعه‌سازی مواد جدید تعادل برقرار کنید. سازوکار‌هایی (مانند فرم‌های وب) که درخواست‌ها برای منابع جدید را ثبت کرده و سپس به شما امکان ارزیابی آن‌ها را می‌دهند، ضروری خواهند بود و به نوعی به عنوان جنبه دیگری از ترویج دسترسی عمل می‌کنند.

چنین سازوکار‌هایی ممکن است ترویج این موضوع باشند که درخواست‌ها با روی باز پذیرفته می‌شوند. این نوع ترویج می‌تواند شامل دعوت از افراد برای ارسال ایمیل، افزودن بخش‌هایی مانند «پیشنهادات شما پذیرفته می‌شود» به وب‌سایت‌ها، یا حتی چیزی ساده مانند گذاشتن یک دفتر نظرات و پیشنهادات در مناطق عمومی باشد. هدف دوگانه است: اولاً به خوانندگان اطلاع داده شود که داده‌ها – یا دسترسی به داده‌ها – می‌توانند به همان شیوه‌ای که سایر منابع به دست می‌آیند، توسط کتابخانه تهیه شوند، و ثانیاً این که کتابدار داده‌ها شخصی است که باید با او تماس گرفت. درخواست‌ها می‌توانند از مجموعه‌های داده‌ای که با هزینه کم یا بدون هزینه به دست می‌آیند، تا منابعی که ممکن است هزینه‌های اشتراک سالانه‌شان به ده‌ها هزار دلار برسد، متغیر باشند. نباید انتظارات را به طور غیرواقع‌بینانه بالا برد و اغلب مهم است که تأکید شود اگرچه درخواست­ها پذیرفته می‌شوند، اما هیچ تضمینی وجود ندارد که، مورد درخواستی حتماً تهیه شود.

راه‌های مختلفی برای ارزیابی درخواست‌های مجموعه‌داده‌های جدید وجود دارد پس از آن‌که مجموعه‌ها ایجاد شده‌اند. یک سیاست توسعه مجموعه ممکن است قبلاً نقاط ضعف مجموعه‌ای را که نیاز به توجه دارد شناسایی کرده باشد و درخواست‌های جدید می‌توانند از این منظر مورد بررسی قرار گیرند. از طرف دیگر، تعداد درخواست‌هایی که یک منبع خاص جذب می‌کند ممکن است در طول زمان ثبت شود. در برخی موارد، حتی یک درخواست ممکن است برای منجر شدن به تهیه یک منبع کافی باشد – به‌ویژه اگر هزینه آن کم باشد یا در حوزه‌ای باشد که قبلاً به توسعه مجموعه خود فکر کرده‌اید. همچنین ممکن است نگرانی‌هایی وجود داشته باشد که مجموعه‌داده‌ای که برای یک خواننده تهیه شده است، در آینده توسط دیگران استفاده نشود. اگر چیزی به‌طور مکرر درخواست شود، موضوع روشن‌تر است و این قطعاً موقعیت آن را به عنوان منبعی قابل توجه تقویت می‌کند.

اگر تهیه یک منبع همراه با هزینه در نظر گرفته شده است، معمولاً توصیه می‌شود یک دوره آزمایشی یا دسترسی محدود ترتیب داده شود تا مشخص شود آیا مورد استفاده قرار می‌گیرد و چگونه توسط خوانندگان پذیرفته می‌شود. انجام این کار می‌تواند مزایای اضافی مانند بهبود روابط با بخش‌های مختلف و ارائه نمونه‌ای از ابتکار عمل در حمایت از نیازهای داده‌ای آن‌ها داشته باشد. تجربه راه‌اندازی دوره آزمایشی به خودی خود می‌تواند آموزنده باشد، زیرا می‌توانید کیفیت خدمات ارائه‌شده توسط تأمین‌کننده داده را ارزیابی کنید. این می‌تواند عامل دیگری در تصمیم‌گیری برای تهیه یک مجموعه داده­ها باشد. با این حال، دوره‌های آزمایشی خطراتی نیز به همراه دارند. زمان و تلاش برای ترویج منبع مورد نیاز است و اغلب ممکن است دوره آزمایشی نتیجه‌گیری قطعی نداشته باشد. گاهی پیش می‌آید که برای محصولی با استقبال اولیه بالا، دسترسی آزمایشی فراهم می‌شود، اما در عمل بازخورد چندانی درباره عملکرد یا نحوه استفاده از آن دریافت نمی‌گردد. انجام دوره‌های آزمایشی یک سازوکار است که این روش نیز به تنهایی نمی‌تواند استدلال قطعی برای خرید یک محصول داده‌ای ارائه دهد. کتابدار داده‎ها باید تصمیم نهایی را بر اساس نتایج دوره آزمایشی، بودجه موجود، تطابق آن با حوزه‌های حمایت از تحقیقات که نیاز به بهبود دارند، یا به سادگی این که آیا به‌روزرسانی مجموعه‌ها مفید خواهد بود، اتخاذ کند. اغلب، جست‌وجوی نظرات سایر متخصصان داده‎ها که تجربه بیشتری با محصول دارند می‌تواند مفید باشد. (به عنوان مثال، لیست ایمیل اعضای آی‌اسیست برای این عملکرد جامعه به خوبی شناخته شده و بسیار مورد احترام است، اما لیست‌های ایمیل تخصصی دیگر نیز می‌توانند مفید باشند.)

داده به عنوان منبعی که باید مدیریت شود

هر مجموعه‌سازی باید به عنوان دارایی در نظر گرفته شود که در آینده نیاز به مدیریت و نگهداری خواهد داشت. اشاره شده است که «در مورد داده‌های دیجیتال، چیزی به نام «بی‌توجهی خوش‌خیم» دوران چاپی وجود ندارد، جایی که کتاب‌های قدیمی می‌توانستند پس از سال‌ها در انبارهای پر از گرد و غبار به طور معجزه‌آسایی دوباره کشف شوند. اطلاعات دیجیتال کاملاً وابسته به یک محیط سخت‌افزاری و نرم‌افزاری است که به‌درستی عمل کند»(آنجوار[3]،2009، ص4). بنابراین، توانایی حفظ دسترسی در طول زمان اهمیت خواهد داشت. وظایفی که حول محور استفاده متمرکز هستند نیز در مدیریت منابع دیجیتال به همان اندازه مجموعه‌های چاپی ارزشمندند. به عنوان مثال، باید به این فکر کرد که مجموعه‌های موجود با چه فراوانی مورد استفاده قرار می‌گیرند. متأسفانه، نحوه انجام این کار، گاهی اوقات مشکل‌ساز است.

فراوانی امانت‌دادن رسانه‌های فیزیکی قابل ردیابی است و حرکت منابع از قفسه‌ها قابل شمارش است. درخواست‌ها برای یک نسخه یا حتی چندین نسخه از کتاب‌های موجود در فهرست‌های مطالعه درسی می‌تواند جمع‌آوری شود. ماهیت مجازی مجموعه‌داده‌های دیجیتال، جمع‌آوری آمار استفاده را به همان روش دشوار می‌کند. برخی داده‌ها ممکن است از طریق یک پلتفرم ناشر یا رابط ایجاد‌شده توسط تأمین‌کننده داده قابل دسترسی باشند. از طرف دیگر، برخی ممکن است شامل یک پایگاه داده مجزا باشند که توسط کتابخانه ذخیره شده و در صورت درخواست در دسترس قرار می‌گیرند – مانند یک دی. وی. دی.[4] یا یک منبع آنلاین محلی. هر سازوکارِ دسترسی که استفاده شود، نیازی به نگرانی در مورد تعداد نسخه‌هایی که باید تهیه شود یا اینکه کدام نسخه‌ها عادی و کدام‌ها امانت کوتاه‌مدت خواهند بود، وجود ندارد. یک پایگاه داده ممکن است در طول یک ترم یا نیمسال بی‌شمار بار مورد استفاده قرار گیرد بدون اینکه درخواستی برای نسخه‌های اضافی برای پاسخگویی به تقاضا ایجاد شود. برخلاف یک نسخه واحد از یک منبع چاپی، حتی ممکن است به طور همزمان توسط چندین کاربر مورد دسترسی قرار گیرد. به طور کلی، جمع‌آوری اطلاعات درباره استفاده، به‌ویژه در مورد منابع دیجیتال آنلاین دور، می‌تواند چالش‌برانگیزتر باشد.

در برخی موارد، دسترسی به آمار استفاده از مجموعه‌داده‌ها ممکن است اگر فروشندگان یک منبع این را به عنوان بخشی از خدمات اشتراک ارائه دهند. آن‌ها ممکن است تعداد کاربران یا بازدیدکنندگان وب‌سایت خود را جمع‌آوری کرده و اطلاعات مفیدی درباره فعالیت ارائه دهند. با این حال، چنین ارقامی ممکن است به صورت پراکنده باشند و ارزش دارد که در مورد دسترسی، روش دسترسی و فراوانی آن‌ها بررسی شود. پوشش کامل طیف وسیعی از منابع به ندرت امکان‌پذیر است، مگر اینکه داده‌ها توسط یک فروشنده واحد تأمین شوند. حتی در این موارد نیز آمار ممکن است محدود باشد و فاقد جزئیات لازم برای برنامه‌ریزی باشد. به عنوان مثال، واکنش به این شواهد که یک پایگاه داده ۲۰۰ بار توسط کاربران مورد دسترسی قرار گرفته است، ممکن است خوب، بد یا بی‌تفاوت باشد، در صورتی که اطلاعاتی درباره تعداد کاربران تکراری یا مدت زمان استفاده وجود نداشته باشد. بنابراین، در جایی که آمار استفاده توسط فروشندگان ارائه می‌شود، ممکن است ارزش محدودی داشته باشند، مگر اینکه گسترده باشند. اگر در ترکیب با معیارهای دیگر استفاده شوند، ممکن است شواهد اضافی مفیدی برای حفظ یا لغو اشتراک یک مجموعه داده ارائه دهند. در عمل، چنین آمارهایی عموماً بیشتر به عنوان آخرین تأیید و تأیید نهایی مفید هستند که اشتراک یک مجموعه داده­ها می‌تواند لغو شود.

خوشبختانه گزینه‌های دیگری برای ارزیابی استفاده از مجموعه‌داده‌ها وجود دارد که کمبودهای برخی آمارهای استفاده ارائه‌شده توسط فروشندگان را جبران می‌کند. منابع داده ماهیت مجازی دارند و در نتیجه معمولاً به صورت مجازی از طریق وب‌سایت‌ها، ورودی‌های مبتنی بر مرورگر در فهرست‌ها و راهنماهای کتابخانه‌ای مبتنی بر وب ترویج می‌شوند. ابزارهایی مانند گوگل آنالیتیکس[5] به کتابدار داده اجازه می‌دهند تا آمار مربوط به صفحات وب در دسترس و لینک‌های انتخاب‌شده را در مقایسه با بقیه جمع‌آوری کنند. این ممکن است با سایر شاخص‌های مفید استفاده مانند ترافیک ایمیل و درخواست‌های مستقیم کاربران یا بخش‌ها ترکیب شود. پاسخ به سوالات درباره دسترسی به مجموعه‌داده‌های خاص که قبلاً در فهرست کتابخانه وجود دارند، یا دسترسی به مجموعه‌داده‌های موجود در جای دیگر، بخش رایجی از کار کتابدار داده است (به بخش «مصاحبه‌های مرجع داده» در فصل ۳ مراجعه کنید). این ممکن است به عنوان اطلاعات حیاتی درباره تقاضای بالقوه برای منابع و همچنین نیازهای داده‌ای یک محقق واحد دیده شود. این موضوع تأکید می‌کند که مسائل مربوط به منابع داده و تأمین منابع اغلب می‌توانند با ترتیب دسترسی به داده مرتبط باشند.

ترویج و تداوم استفاده از یک مجموعه

هر روز کتاب‌ها، مجلات و مقالات کنفرانس‌های جدید به صورت چاپی در دسترس قرار می‌گیرند. فهرست‌های هفتگی انتشارات کتاب‌های دانشگاهی به کتابخانه‌های دارای حق قانونی[6] در بریتانیا ارائه می‌شود. کتابخانه بودلین[7] در دانشگاه آکسفورد یکی از این کتابخانه‌هاست و این فهرست‌های هفتگی به طور متوسط شامل ۷۰۰ عنوان هستند. در برخی زمان‌های سال، این عدد می‌تواند به چهار رقم برسد. بنابراین، باید به این موضوع ترویج منابع پس از تهیه و همچنین در طول زمان، هنگامی که به بخشی ثابت از مجموعه تبدیل می‌شوند و در خطر نادیده گرفته شدن به دلیل اضافه‌شدن منابع جدید قرار می‌گیرند، توجه کرد. حجم فهرست‌های هفتگی امانت قانونی نشان می‌دهد که افزون بر سیلاب عظیم داده‌ها (هی و ترفتن[8]، 2003; لتل[9]، 2012; وتسن[10]، 2015)  شاهد طغیان کتاب‌ها و مجلات دانشگاهی نیز هستیم .در نتیجه، ترویج مجموعه‌داده‌ها و منابع داده‌ی فعلی یا تازه ‌تهیه ‌شده می‌تواند حتی چالش‌برانگیزتر باشد، زیرا آن‌ها برای جلب توجه با خروجی‌های سنتی‌تر رقابت می‌کنند. با این حال، ترویج، یک فعالیت مهم است.

به جای فکر کردن به روش‌های جدید برای بازاریابی مجموعه‌داده‌ها، بهتر است از کانال‌های ترویجی موجود استفاده شود. اگر فهرست‌های عناوین چاپی تازه‌ تهیه‌شده توزیع می‌شوند، مجموعه‌داده‌ها نیز می‌توانند به آن‌ها اضافه شوند. اگر جلسات بخش‌ها برای ترویج کار کتابخانه استفاده می‌شود، یک بخش یا آیتم ثابت در دستور کار می‌تواند به بروزرسانی‌های جدید داده اختصاص یابد. در مواردی که محققان موفق شده‌اند برای اضافه شدن یک مجموعه داده­ها خاص به مجموعه‌های موجود تلاش کنند، این مجموعه‌سازی می‌تواند اطلاع‌رسانی شود و تعاملات مشابه در آینده تشویق شود. با این حال، علیرغم این تلاش‌ها، یک کتابدار داده‎ها ممکن است به سرعت به شنیدن این جمله عادت کند: «بخش ما نمی‌دانست شما چنین چیزی می‌خرید!» با این وجود، تلاش برای مدیریت و ترویج مجموعه‌داده‌ها به همان اندازه مهم است که تأمین بودجه و تهیه آن‌ها اهمیت دارد.

کیفیت مستندات و فهرست‌نویسی‌هایی که مجموعه‌داده‌ها را توصیف می‌کنند نیز به عنوان بخشی از مدیریت کلی و ترویج یک مجموعه نیاز به توجه دارد. این کار گاهی اوقات در سیستم‌هایی که برای توصیف اشیاء فیزیکی بر اساس مکان سازمان‌دهی شده‌اند، دشوار است. با این حال، تلاش برای هماهنگی بهتر از ایجاد فهرست‌های جداگانه است. در حالت ایده‌آل، مستندات باید سازگار و هم‌تراز با فراداده‌هایی باشند که برای مواد چاپی ایجاد می‌شوند. این مستندات باید از همان زبان استفاده کنند تا امکان مرور و کشف فراهم شود. به عبارت دیگر، مجموعه‌های دیجیتالی باید به همان شیوه‌ای که هر منبع دیگری فهرست‌نویسی می‌شود، سازمان‌دهی شوند. اما همیشه اینطور نیست. برخی منابع داده – به ویژه آن‌هایی که ریشه در برنامه‌های نرم‌افزاری دارند – به عنوان ابزارهای تحلیلی در نظر گرفته می‌شوند و بنابراین ممکن است در فهرست کتابخانه‌ها گنجانده نشوند. با این حال، به طور فزاینده‌ای رایج است که چنین ابزارهایی با تفسیرها یا مرورها و گزارش‌های تحلیلی تکمیل شوند. در نتیجه، آن‌ها به منابع اطلاعاتی کاملی تبدیل شده‌اند که باید به همان شیوه‌ای که سایر دارایی‌های دانشگاهی ترویج می‌شوند، معرفی شوند.

مثال‌هایی در حوزه اقتصاد، تصویر خوبی از تحول از ابزار به منبع ارائه می‌دهند و شامل محصولاتی مانند دیتاستریم[11]، ایکون[12] و بلومبرگ پروفشنال[13] هستند که نرم‌افزارهای کلاینت-سرور برای دسترسی به داده‌های مالی فراهم می‌کنند. (معمولاً در یک تنظیمات کلاینت-سرور، یک سرور یا هاست، یک یا چند برنامه را اجرا می‌کند که خدمات و محتوای خود را با رایانه‌های کاربران به عنوان کلاینت‌های جداگانه، معمولاً از طریق یک مرورگر وب، به اشتراک می‌گذارند.) در علوم زمین، نرم‌افزارهایی مانند ابزار داده‌های ژئو‌فضایی آرک جی. آی. اس.[14] و جایگزین‌های غیرانحصاری آن وجود دارند که به عنوان یک ابزار تحلیلی عمل می‌کنند و همچنین نقشه‌ها و تصویرسازی‌های پیشرفته تولید می‌کنند. کتابخانه‌های داده‌ها، دسته‌بندی‌های داده‌ها را به روش‌های مختلف در حضور آنلاین خود تقسیم و سازمان‌دهی می‌کنند. برای دو ارائه بین‌المللی به صفحه داده‌ها و آمار کتابخانه ال. اس. ایی.[15] در آدرس [16] و صفحه داده‌های کتابخانه‌ دانشگاه آلبرتا[17] مراجعه کنید.

اهمیت بازیابی و دسترسی

چه اهداف دیگری می‌توانند کار یک کتابدار داده را مشخص کنند؟  یکی از این اهداف، بهبود پروفایل مجموعه‌های دیجیتال و افزایش قابلیت بازیابی آنها به اندازه مواد متنی منتشر شده است. فرآیند بازیابی می‌تواند به دلیل قالب‌های مختلفی که ممکن است درگیر باشند، پیچیده شود. برخی از مجموعه‌های داده­ها ممکن است به صورت فایل‌های قابل دانلود مستقیم داده و مستندات ارائه شوند، مانند آنچه توسط اتحادیه بین‌المللی دانشگاه‌ها برای پژوهش‌های سیاسی و اجتماعی، در ایالات متحده یا، «موسسه لایبنیز برای علوم اجتماعی»[18] در آلمان عرضه می‌شود. با این حال، برخی دیگر ممکن است به عنوان محتوای قابل دانلود تنها در اتاق‌های مطالعه خاص یا روی دستگاه‌های خاص و بر اساس محدودیت‌های اعمال شده توسط تامین‌کنندگان داده ارائه شوند.

نمونه‌هایی در این زمینه شامل محصولات اطلاعاتی مبتنی بر اطلاعات مشتق شده هستند که توسط شرکت‌هایی مانند پروکوئست[19] یا بیورو وان دک[20] توسعه یافته‌اند. این شرکت‌ها اطلاعات را در رابط‌های کاربری یا داشبوردهای خود بسته‌بندی می‌کنند تا منابعی مانند کتابشناسی بین‌المللی علوم اجتماعی[21]،  اوربیس[22] و بنک اسکوپ[23] ایجاد کنند. علاوه بر این، توافق‌نامه‌های مجوز با برخی ناشران یا تامین‌کنندگان داده، مشاهده مطالب را به دستگاه‌ها یا مکان‌های خاصی محدود می‌کنند، مثلاً از طریق محدوده‌ای از آدرس‌های آی. پی.[24] ( شیوه‌نامه اینترنت ).

با توجه به روش‌های مختلف دسترسی به منابع اشتراکی که توسط شرایط مجوز اعمال می‌شوند، ممکن است لازم باشد رویکردی ترکیبی برای توسعه مجموعه‌ها و ایجاد فهرستگان در نظر گرفته شود. با وجود توصیه قبلی ما در مورد عدم ایجاد سازوکار‌های جدید فهرست‌نویسی و بازیابی، گاهی اوقات ممکن است سازش ضروری باشد. در دانشگاه آکسفورد، کتابخانه داده‌های بودلیان[25] به عنوان یک ابزار بازیابی مبتنی بر وب جدید ایجاد شد که ماهیت داده‌های موجود و روش‌های مختلف یافتن و دسترسی به آنها را تشریح می‌کند. این ابزار همچنین یک ابزار مفید برای مدیریت مجموعه است، زیرا در طول توسعه خود، محدوده‌های مجموعه را تعیین کرد، به شکل‌دهی آن کمک کرد و شکاف‌های احتمالی در ارائه را برجسته ساخت. این وب‌سایت با هدف استفاده همزمان با ابزارهای جستجوی قدیمی‌تر و محلی‌تر در آکسفورد (به نام‌های سُلو[26] [جستجوی آنلاین کتابخانه‌های آکسفورد] و اکس لیپ پلاس[27]) طراحی شده است، اما همچنین عملکرد مفیدی در زمینه حمایت و دریافت بازخورد در مورد مسائل مرتبط با داده‌ها از مخاطبان هدف خود دارد.

در عمل، نحوه تعامل واقعی کاربران با مجموعه‌های داده­ها یا برخورد با محدودیت‌های استفاده بسیار متفاوت است و ممکن است برای افرادی که به ایده در دسترس بودن منابع دیجیتال به صورت درخواستی یا در طیف وسیعی از دستگاه‌ها عادت دارند، ناامیدکننده باشد. کتابداران داده‌ها باید از نارضایتی احتمالی کاربران آگاه باشند و خود را برای مدیریت مجموعه‌ها به گونه‌ای آماده کنند که تأثیر محدودیت‌ها را کاهش دهند. این یکی از اهداف فرعی کتابخانه داده‌های بودلیان[28] هنگام توصیف طیف گسترده‌ای از مجموعه‌های موجود بود. هنگامی که محققان در مورد منابع داده‌ای ارائه شده مطلع می‌شوند، باید این کار به گونه‌ای انجام شود که این تفاوت‌ها به حداقل برسد و تمام منابع – حداقل در سطح بازیابی – به عنوان بخشی از یک مجموعه منسجم و توسعه‌یافته، به عنوان یکی از دارایی‌های یکپارچه و هماهنگ ارائه شوند.

توسعه همکاری با پژوهشگران

چه عناصر دیگری می توانند در ایجاد مجموعه داده‌ها کمک کنند؟ جمع‌آوری اطلاعات از طریق مشارکت با پژوهشگران (چه به صورت فردی و چه در سطح گروهی) یک فن مفید دیگر در توسعه مجموعه داده‌ها است. همانطور که قبلاً اشاره شد، جمع‌آوری آمار استفاده از مجموعه‌های دیجیتال می‌تواند دشوار باشد، بنابراین ارزیابی نیازها به شکل گفتگو با پژوهشگران در مورد آنچه که در حال حاضر استفاده می‌کنند یا مایل به دریافت آن در آینده هستند، می‌تواند برای سنجش تقاضای فعلی و بالقوه مورد استفاده قرار گیرد. این کار را می‌توان با مشاوره موضوعی سنتی و ارتباط با گروه‌ها برای حمایت از نیازهای پژوهشی ترکیب کرد. در تحلیل یک نظرسنجی در مورد پشتیبانی موجود از داده‌های دیجیتال که برای انجمن کتابخانه‌های تحقیقاتی انجام شد، ذکر شد: «خدمات مشاوره‌ای مانند شناسایی مجموعه داده‌ها، ارائه دسترسی به داده‌ها و بیان استانداردهای فعلی برای سازماندهی داده‌ها در حوزه‌های موضوعی خاص، به نظر می‌رسد که برای کتابداران موضوعی مناسب هستند که خدمات مشابهی را برای سایر انواع اطلاعات ارائه می‌دهند (سانر، استیوز، وارد[29]، 2010، 16). »

ارتباط با محققان این مزیت اضافی را دارد که استفاده از منابع را در یک زمینه تحقیقاتی واقعی قرار می‌دهد. اطلاعاتی که جمع‌آوری می‌شود نه تنها شامل این است که چه مجموعه‌ داده‌ها یا منابع داده‌ای استفاده می‌شوند، بلکه چرا انتخاب شده‌اند نیز می‌تواند مورد توجه قرار گیرد.  ممکن است این منابع تنها منبع اطلاعات موجود در یک موضوع باشند یا دارای رابط کاربری محبوبی باشند که به خوبی با سایر ابزارها ادغام می‌شود. همچنین ممکن است سایر محققان در یک دپارتمان یا مرکز تحقیقاتی از این منابع استفاده کنند و یک گروه پشتیبانی غیررسمی ایجاد کرده باشند. ترکیبی از آشنایی کاربران و توصیه‌های شفاهی اغلب نقش مهمی در استفاده از منابع داده ایفا می‌کند. درک این عوامل کیفی می‌تواند به اندازه آمارهای استفاده مهم باشد.

درخواست‌ها برای مجموعه‌داده‌های جدید نیز از نظر اهمیت و جزئیات می‌توانند برای خوانندگان متفاوت باشند. برخی ممکن است در پاسخ به برخی مطالب بازاریابی که دیده‌اند یا اشاره‌ای در یک مجله علمی که کنجکاو شده‌اند درباره آنچه ارائه می‌شود، درخواست دهند. دیگران ممکن است مجموعه‌ای دقیق از دلایل داشته باشند که با یک نیاز تحقیقاتی قوی همخوانی دارد. بخشی از نقش کتابدار داده‌ها، ارزیابی درخواست‌های جدید و تعامل  با گروه تخصصی مربوطه برای بررسی این جزئیات است تا مشخص شود آیا نیاز به یک مجموعه داده­های خاص به اندازه‌ای که مطرح شده، قوی است یا خیر. با روشن‌تر شدن جزئیات درباره آنچه مورد نیاز است، ممکن است مشخص شود که مجموعه‌داده‌هایی در مجموعه شما وجود دارند که به همان اندازه برای آنها مفید خواهند بود. از طرف دیگر، با ارائه اطلاعات بیشتر درباره نحوه استفاده از داده‌ها، ممکن است مشخص شود که مجموعه داده­های درخواستی برای هدف مورد نظر مناسب نیست. همه اینها نشان می‌دهد که این تعامل چه ارزشی در آموزش بیشتر شما به عنوان کتابدار داده درباره نیازهای محققان دارد.

بروزرسانی و وجین مجموعه

بروزرسانی و وجین مجموعه‌ها می‌تواند مرحله‌ای مهم در توسعه مجموعه‌های سنتی کتابخانه‌ها باشد. اگرچه این فرآیند در مجموعه‌های دیجیتال ممکن است به اندازه مجموعه‌های فیزیکی زمان‌بر نباشد – به ویژه زیرا در بیشتر موارد با اقلام فیزیکی سر و کار نداریم – اما همچنان جایگاه خود را حفظ کرده است. دلایل این کار می‌تواند متفاوت باشد. برخی از مجموعه‌های داده ممکن است به قالب‌هایی تبدیل شوند که با گذشت زمان منسوخ شده و قابل بروزرسانی نباشند. تامین‌کنندگان داده ممکن است به روش‌های جدید انتشار روی آورند، محصولات قدیمی را حذف کنند یا به سادگی از بین بروند. همچنین، منابع همیشه به اندازه‌ای که برخی تامین‌کنندگان ادعا می‌کنند، منحصر به فرد نیستند و این امکان را فراهم می‌کنند تا خدمات مختلف را با هم مقایسه و جایگزین کرد. این به این دلیل است که…

برخلاف کتاب‌ها و نشریه‌ها، بیشتر داده‌ها «منتشر» نمی‌شوند، در فهرست‌های ناشران قرار نمی‌گیرند یا حتی به فروش نمی‌رسند. به عنوان مثال، داده‌های جمع‌آوری شده توسط دولت ایالات متحده اغلب از طریق چندین فروشنده در دسترس هستند، زیرا در بیشتر موارد، فروشندگان می‌توانند چنین داده‌هایی را بدون پرداخت حق امتیاز به دولت، مجدداً توزیع کنند. این موضوع شرایطی را ایجاد می‌کند که در آن فروشندگان مختلف همان داده‌ها را از دولت دریافت می‌کنند، آن‌ها را به روش‌های متفاوت بسته‌بندی می‌کنند و سپس محصول خود را برای فروش یا اجاره ارائه می‌دهند.

(جراسی، هامفری و جیکوبز[30]، ۲۰۱۲، ص ۱۶۰)

وجین مجموعه ممکن است همچنین نتیجه یک تصمیم آگاهانه توسط کتابدار داده برای اضافه کردن محصولات جدید یا استفاده بهتر از بودجه باشد. ممکن است وجین در صورتی ضروری باشد که یک مجموعه داده­ها بر اساس اشتراک مداوم به دست آمده باشد که دیگر به نظر نمی‌رسد ارزش داشته باشد برایش هزینه کرد. این منبع ممکن است هزینه جاری داشته باشد اما ممکن است محبوبیت آن کاهش یافته باشد، به نظر می‌رسد استفاده کمی داشته باشد یا به سادگی پتانسیل کمتری نسبت به منابع رقیب جدیدتر داشته باشد. وجین مجموعه نیازمند رویکردی مدبرانه و مشارکتی با کاربران است. ضروری است که قبل از وجین هر منبعی، نظرات و دیدگاه‌های کاربران در خصوص تغییرات پیش رو اخذ گردد. برای این منظور می‌توان از همان کانال‌های ارتباطی که جهت جمع‌آوری نظرات در مورد منابع داده جدید مورد استفاده قرار می‌گیرند، بهره برد. این امر به ارزیابی دقیق‌تر تأثیرات اجتماعی و علمی وجین منابع بر جامعه کاربران کمک شایانی خواهد کرد. راهبرد‌های دیگری نیز وجود دارد، از جمله اطلاع‌رسانی قبلی در مورد قصد وجین یک مجموعه داده­ها و دعوت به اظهار نظر. اگر نظرات دریافتی از طریق ایمیل، جلسات بخش، وبلاگ‌ها و غیره به شدت مخالف وجین باشند، باید این نظرات مورد توجه قرار گیرند. این نیز مثالی دیگر از چگونگی تقویت ارتباط بین کتابخانه و بخش‌های مختلف است و فراتر از صرفاً مدیریت مجموعه داده‌ها عمل می‌کند. ممکن است همچنان در صورت وجود مخالفت بتوان به پیش رفت، اما دلایل قوی باید ارائه شود. تغییرات زمانی آسان‌تر هستند که علاقه‌ی کمی به تغییر ابراز شود، اما دلایل همچنان باید به وضوح بیان شوند.

کاهش بازده و حفاظت از داده ها

این فرض اشتباه است که برای اطمینان از دستیابی به داده‌ها و استفاده زیاد از آنها، لازم است مجموعه‌ها به طور مداوم ارزیابی یا به‌روزرسانی شوند،. این لزوماً در همه موارد صدق نمی‌کند. مجموعه داده‌های کلیدی وجود خواهند داشت که به‌طور مکرر استفاده می‌شوند، اما در واقع ممکن است تعداد آنها کم باشد. اصل پارتو[31] (پارتو، 1971)، که قبلاً در فصل 1 ذکر شد، به ما یادآوری می‌کند که اکثر چیزها توزیع و تأثیر نابرابری دارند. بنابراین از بین ده مجموعه داده­ها، شاید فقط دو یا سه مجموعه محبوب باشند. ممکن است لازم باشد تصمیمات مربوط به تخصیص زمان، منابع و تلاش بر اساس این اصل اتخاذ شود. علاوه بر این، ارزش برخی از اقلام در یک مجموعه ممکن است نه در استفاده زیاد، بلکه در منحصر به فرد بودن، غیرقابل تکرار بودن یا اهمیت آنها باشد. آنها ممکن است دارایی‌های مهمی باشند که به مجموعه غنا می‌بخشند یا برای پاسخگویی به تغییرات در علایق تحقیقاتی وجود دارند.

می‌توان گام‌های فعالی برای برانگیختن علاقه جدید به مجموعه موجود برداشت، به جای آنکه صرفاً به تغییرات بیرونی واکنش نشان داد. توسعه مجموعه اغلب شامل شناسایی بخشی از مجموعه داده‌ها است که می‌توان آن‌ها را به گونه‌ای نگهداری و پردازش کرد که استفاده بیشتری داشته باشد. این کار را می‌توان با برجسته‌سازی آن‌ها در فعالیت‌های تبلیغاتی یا ایجاد مواد آموزشی در ارتباط با آن‌ها انجام داد. فعالیت‌های تکمیلی نظیر افزودن مستندات یا فعالیت‌های نگهداری تخصصی مانند توسعه مدخل‌های فهرست‌نویسی یا تهیه مطالعات موردی گسترده، مجموعه‌داده‌ها را برای خوانندگان دسترس‌پذیرتر و جذاب‌تر می‌سازد. اقداماتی همچون ایجاد مصورسازی داده‌ها، توسعه فایل‌های دستوری (در صورت عدم وجود)، نشانه‌گذاری داده‌ها برای تجزیه و تحلیل آنلاین، یا طراحی نمودارها و اینفوگرافیک‌های اختصاصی، روش‌های دیگری برای افزایش جذابیت و کاربردپذیری مجموعه‌های داده­ها محسوب می‌شوند. یکی از مفاهیم اصلی اصل پارتو را می‌توان به عنوان قانون بازده نزولی خلاصه کرد. این قانون بیان می‌کند که به جای توجه به تمام حوزه‌ها، تمرکز بر حوزه‌های کلیدی انتخاب شده نیازمند صرف زمان، تلاش و توجه بیشتری است. بنابراین، یکی از اهداف ممکن، افزایش کارایی و دسترس‌پذیری این مجموعه داده‌های منتخب است.

یکی دیگر از حوزه‌های مهم در سیاست‌گذاری توسعه مجموعه‌ها، حفاظت از داده‌های محرمانه و نظارت بر رعایت توافق‌نامه‌های استفاده محدود است. ارائه دسترسی به مجموعه داده‌هایی که نیازمند محافظت بیشتر هستند، می‌تواند یکی از فعالیت‌های اصلی اکثر کتابداران داده باشد و به تعریف نقش آن‌ها در محیط گسترده‌تر کتابخانه کمک کند. ضرورت تدوین سیاست‌ها و رویه‌های رسمی که کتابدار داده­ها را به عنوان مرجع  اصلی در هنگام جستجوی داده‌های با دسترسی محدود یا نیاز به کمک در فرآیند درخواست تعیین می‌کند، امری حیاتی است. اکثر تأمین‌کنندگان داده‌های محدود – مانند آمار کانادا، اتحادیه بین‌المللی دانشگاه‌ها برای پژوهش‌های سیاسی و اجتماعی، مرکز روپر[32] یا یوروستات که دسترسی به داده‌های اقتصادی- اجتماعی را فراهم می‌کنند – نیازمند تعیین یک فرد مشخص به عنوان نماینده رسمی در سازمان و ارائه «امضای سازمانی» هستند.

در دانشگاه آکسفورد، مدرسه اقتصاد لندن[33]، موسسه دانشگاهی اروپا و سایر مراکز، کتابدار داده به عنوان مسئول تعیین و اعمال محدودیت‌های دسترسی به داده‌ها معرفی می‌شود. تضمین رعایت محدودیت‌های دسترسی توسط یک فرد مشخص، نه تنها بخشی از پشتیبانی کلی پژوهش محسوب می‌شود، بلکه سیاستی آگاهانه برای امکان افزودن مجموعه‌های داده­ها با محدودیت دسترسی به موجودی فعلی کتابخانه‌ها نیز محسوب می‌شود. این امر امکان انجام فعالیت‌هایی در جهت ترویج دسترسی به چنین داده‌هایی را فراهم می‌آورد.

این امر همچنین محققان را به تفکر در مورد مسئولیت‌های خود در هنگام دسترسی و استفاده از داده‌ها تشویق می‌کند. مقررات دسترسی محدود ممکن است به راحتی توسط دانشگاهیان علاقمندی که مشتاق پیشرفت در تحقیقات خود هستند نادیده گرفته شود، اما الزامات توافقنامه‌های دسترسی – یا شرایط مجوز اشتراک – باید همیشه مورد تاکید و اجرای دقیق قرار گیرند. یکی از مسئولیت‌های کتابدار داده‌ها نشان دادن این است که اقدامات معقولی برای انتقال این پیام انجام داده است. اگر امکان اشتراک‌گذاری داده‌ها بین بخش‌ها یا ایجاد نسخه‌های اضافی برای استفاده شخصی وجود نداشته باشد، باید این موضوع به وضوح مشخص شود. هنگامی که دسترسی اعطا می‌شود اما هیچ حقی برای تکثیر یا اصلاح جداول داده‌ای، داده نمی‌شود، چنین محدودیت‌هایی باید به اطلاع کاربران برسد. تأخیر در تکمیل پایان‌نامه‌ها به دلیل حذف محتوای استناد شده اما متأسفانه غیرقابل تکثیر، امری غیرمعمول نیست. بنابراین، در مواردی که مجموعه داده‌ها محدودیت‌هایی در مورد استفاده خود دارند، باید این محدودیت‌ها به درستی برای کاربران توضیح داده شود.

جاسازی داده‌ها درون کتابخانه

خدمات کتابخانه‌ای برای پاسخگویی به نیازهای دانشگاهیان در زمینه انتشار دسترسی آزاد، ارائه دسترسی به منابع دیجیتال و حفظ پشتیبانی سنتی برای بازیابی و استفاده از کتاب‌ها و مجلات توسعه یافته‌اند. این موارد به کتابخانه به عنوان کانون این فعالیت متکی هستند، اما نباید از تخصص نهفته در آن به عنوان یک عنصر حیاتی غافل شد. «اهمیت حوزه‌هایی مانند دسترسی آزاد، حق نشر، فراداده و بایگانی آشکار است. دانش موضوعی مربوط به مجموعه‌های داده­های مختلف، اگرچه کمتر آشکار است، اما به همان اندازه اهمیت دارد. این پیش‌نیاز نه تنها برای توصیف مناسب داده‌ها، بلکه برای درک نیازهای پژوهشگران و تبدیل آنها به راه‌حل‌های فنی مناسب است» (کروز و تستروپ[34]، 2014، ص 331).

همچنین شباهت‌هایی در ایجاد تعهدات مربوط به داده‌هایی که استفاده می‌شوند با تعهدات سنتی وجود دارد که خوانندگان هنگام عضویت در یک کتابخانه با آن موافقت می‌کنند. یکی از اهداف کتابخانه داده‌ای بودلیان، برجسته کردن مسئولیت‌هایی بود که کاربران داده­ها اغلب می‌پذیرند اما به راحتی از آن غافل می‌شوند.[35] آرشیو داده‌های بریتانیا[36] از یک «مجوز کاربر نهایی» استفاده می‌کند تا این مسئولیت‌ها را در پنج صفحه مشخص کند.[37]چنین نگرانی‌هایی جدید نیستند. قوانین مربوط به استفاده از کتاب‌ها و مجموعه‌ها در کتابخانه اصلی دانشگاه آکسفورد – کتابخانه بودلیان – تا حدی کوتاه‌تر است. در قلب این قوانین، «سوگند بودلی» اصلی قرار دارد که هنوز هم استفاده می‌شود.

مقایسه با توافقنامه‌های کتابخانه سنتی: به طور سنتی، کاربران کتابخانه هنگام امانت گرفتن کتاب یا محمل‌های اطلاعاتی با قوانین خاصی موافقت می‌کنند. این قوانین ممکن است شامل محدودیت‌هایی در زمینه کپی‌برداری، امانت دادن یا آسیب رساندن به مواد باشد. سوگندنامه بودلیان که هنوز در کتابخانه بودلیان دانشگاه آکسفورد استفاده می شود، نمونه‌ای از چنین توافقنامه‌هایی است.

به طور خلاصه، هر دو توافقنامه کتابخانه داده و توافقنامه‌های کتابخانه سنتی، استفاده مسئولانه را ترویج می‌کنند، از منابع محافظت می‌کنند و اطمینان می دهند که کاربران به اطلاعات مورد نیاز خود دسترسی داشته باشند.

«سوگند می‌خورم که هیچ کتاب، سند یا شیء دیگری که متعلق به کتابخانه است یا به امانت در آن نگهداری می‌شود، را از کتابخانه خارج نکنم، آسیب نرسانم، کثیف نکنم، یا به هر شکل دیگر تخریب نکنم؛  همچنین متعهد می‌شوم که هیچ آتش یا شعله‌ای را به کتابخانه وارد نکرده یا در آن روشن نکنم و در کتابخانه سیگار یا هر نوع دخانیات دیگری مصرف نکنم؛ همچنین قول می‌دهم که همیشه تمام قوانین مربوط به کتابخانه بودلیان را رعایت کنم.»[38]

نیاز به حمایت از استفاده مناسب و آگاهی دادن به خوانندگان در مورد تعهدات آن‌ها، در مورد داده‌های آزادانه در دسترس دولت، داده‌های خریداری شده تجاری، داده‌های ذخیره شده محلی، داده‌های خرد دسترسی محدود و در واقع هر چیزی که به عنوان بخشی از یک مجموعه داده­های دیجیتال تبلیغ می‌شود، اعمال می‌شود. همچنین یادآوری می‌کند که بسیاری از این فعالیت‌های مدیریت داده و توسعه خدمات با فعالیت‌های کتابخانه گسترده‌تر همپوشانی خواهد داشت – فرآیندی که به عنوان «گام برداشتن به عنوان یک پشتیبانی طبیعی برای نیازهای مربوط به داده» توصیف شده است (لِوین[39]، 2014، ص 143).

توسعه یک مجموعه داده­ها شامل ادغام آن در سازمان بزرگ‌تر است. در حال حاضر اگر پیشنهادات قبلی درباره استفاده از سازوکار‌های موجود فهرست‌نویسی و بازیابی یا پر کردن شکاف‌ها در خدمات دنبال شود، این موضوع ممکن است اتفاق بیفتد. حتی در مواردی که یک کتابخانه دانشگاهی تازه شروع به در نظر گرفتن داده‌های تحقیقاتی دیجیتال به عنوان بخشی از سیاست مجموعه‌سازی خود کرده است، وظیفه ساخت مجموعه و مدیریت آن باید به عنوان یک فرصت هیجان‌انگیز دیده شود. همان‌طور که شِیلا کورال[40] استدلال می‌کند: «کتابخانه‌هایی که از قبل در توسعه کتابخانه دیجیتال، خدمات داده ثانویه و پشتیبانی تخصصی تحقیقات مشارکت داشته‌اند، در موقعیت خوبی قرار دارند.کتابخانه‌ها و کتابدارانی که تجربه کمتری دارند، چیزهای بیشتری برای یادگیری خواهند داشت اما اعتبار، شهرت و اقتدار بیشتری در محیط دانشگاهی به دست خواهند آورد» (کورال[41]، ۲۰۱۲، ص. ۱۲۷). گنجاندن مجموعه‌های دیجیتال می‌تواند شامل پیش رفتن بیشتر و دیدن چگونگی قرار دادن پشتیبانی داده‌ها در کنار سایر فعالیت‌های کتابخانه باشد. می‌توان به پرسنل پشتیبانی موجود در مورد سیاست مجموعه داده‌ها و کارهایی که در این زمینه انجام می‌شود، اطلاع‌رسانی کرد تا با آن بیشتر آشنا شوند. همچنین ممکن است فرصت‌هایی برای ارائه آموزش‌های اضافی دنبال شود. بازخورد و نظرات حاصل از انجام این کار نیز بسیار ارزشمند است. اگر این کار موفقیت‌آمیز تلقی شود، گام دیگری در جهت تثبیت و روشن کردن نقش کتابدار داده­ها برای کاربران داده و همکارانی که در کتابخانه کار می‌کنند، خواهد بود.

نکات کلیدی

  • مدیریت منابع داده دیجیتال باید در خدمات کتابخانه گنجانده شود.
  • مجموعه داده‌ای که ایجاد می‌کنید، کار شما، جهت توسعه آینده و خدمات پشتیبانی‌تان را تعریف خواهد کرد.
  • مجموعه‌های داده­ها ممکن است شامل نسخه‌های فیزیکی خریداری‌شده یا دسترسی‌های خریداری‌شده باشند.
  • فنونی مانند آزمایش فروشندگان، توصیه‌های محققان و آمار استفاده می‌توانند در انتخاب مجموعه‌ها کمک‌کننده باشند، اما ممکن است به تنهایی قطعی نباشند.
  • دانش داخلی درباره علایق بخش‌های مختلف که توسط متخصصان موضوعی ارائه می‌شود، می‌تواند در تصمیم‌گیری‌ها محوری باشد.
  • مجموعه‌ها باید به‌طور فعال از طریق کانال‌های ارتباطی موجود یا کانال‌های جدید ترویج شوند.
  • مجموعه‌های داده گسترده ممکن است به‌جای دسترسیفوری، سازوکار‌های دسترسی متفاوتی داشته باشند.
  • تغییرات در مجموعه‌ها باید مانند مجموعه‌های سنتیمدیریت شوند تا پشتیبانی از محققان حفظ شود.
  • تسهیل دسترسیبه منابع داده محدودشده، می‌تواند یک فعالیت اصلی باشد.

سوالات تاملی

  1. آیا باید به فکر یک لیست داغ منابع دیجیتال باشید؟ چه معیارهایی را استفاده خواهید کرد؟
  2. آیا مجموعه داده‌هایی که در داخل گروه‌های علمی استفاده می‌شوند بهتر است توسط کتابخانه نگهداری شوند؟
  3. مزایا و معایب استفاده از درخواست‌های دسترسیبه عنوان راهی برای نظارت بر تقاضا چیست؟
  4. اگر داده‌ها مشابه باشند، بهتر است یک محقق را به سمت یک منبع اشتراکی پولییا یک منبع رایگان هدایت کنید؟
  5. آیا منابع کلیدی وجود دارند که باید در خدمات خود بگنجانید تا به تعریف آن کمک کند؟
  6. آیا محققان در صورت تمایل به مشاوره در مورد داده‌ها، مسیر روشنی برای رسیدن به کتابخانه دارند یا به بخش‌های مختلف دیگر نیز مراجعه می‌کنند؟

[1] . IFLA

[2] . Geraci, Humphrey and Jacobs

[3] . Angevaare

[4] . DVD

[5] . Google Analytics

[6] . Legal Deposit

[7] . Bodleian

[8]  . Hey and Trefethen

[9] . Little

[10] . Wootson

[11] . Datastream

[12] . Eikon

[13] . Bloomberg Professional

[14] . ArcGIS

[15] . London School of Economics and Political Science

[16].www.lse.ac.uk/library/collections/featuredCollections/dataAndStatistics.aspx

[17].http://guides.library.ualberta.ca/data

[18] . GESIS

[19] . Proquest

[20] . Bureau van Dijk

[21] . IBSS

[22] . Orbis

[23] . Bankscope

[24] . IP

[25] . www.bodleian.ox.ac.uk/data

[26] . SOLO

[27] . Oxlip+

[28] . Bodleian Data Library

[29] . Soehner, Steeves and Ward

[30] . Geraci, Humphrey and Jacobs

[31] . Pareto

[32] . Roper

[33] . LSE

[34] . Kruse and Thestrup

[35].www.bodleian.ox.ac.uk/data/using-data/data-obligations.

[36] . UKDA

[37].http://data-archive.ac.uk/media/381244/ukda137-enduserlicence.pdf.

 

[38]. www.bodleian.ox.ac.uk/about-us/ policies/ regulations

[39] . Levine

[40] . Sheila Corrall

[41] . Corrall

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مقالات مرتبط با نویسنده