پایگاه داده

مجموعه سازماندهی‌شده از داده‌ها در محاسبات
(تغییرمسیر از دیتابیس)

پایگاهِ داده یا داده‌پایگاه (به انگلیسی: database) (اختصاری پادا)[۱] یا دادگان[۲] که بانکِ داده، بانکِ اطلاعات، و پایگاهِ اطلاعاتی هم گفته می‌شود، یک مجموعه منظم و سازمان یافته از داده‌های ذخیره‌شده و الکترونیکی از سیستم رایانه‌ای برای محاسبات است. وقتی که پایگاه داده‌ها پیچیده‌تر هستند، اغلب با استفاده از تکنیک‌های طراحی رسمی و مدل‌سازی توسعه می‌یابند. سیستم مدیریت پایگاه داده (DBMS) نرم‌افزاری است که با کاربران نهایی، برنامه‌ها و خود پایگاه داده برای گرفتن و تجزیه و تحلیل داده‌ها در تعامل است. نرم‌افزار DBMS علاوه بر این، امکانات اصلی ارائه‌شده برای مدیریت پایگاه داده را نیز دربر می‌گیرد. از مجموع پایگاه داده، DBMS و برنامه‌های مرتبط می‌توان به عنوان «سیستم پایگاه داده» نام برد. غالباً از اصطلاح «پایگاه داده» برای اشاره آزادانه به هر یک از DBMS، سیستم پایگاه داده یا برنامه مرتبط با پایگاه داده استفاده می‌شود. دانشمندان کامپیوتر ممکن است سیستم‌های مدیریت پایگاه داده را بر اساس مدل‌های پایگاه داده‌ای که پشتیبانی می‌کنند، طبقه‌بندی کنند. پایگاه‌های داده رابطه‌ای در دهه ۱۹۸۰ غالب شدند. این داده‌ها به صورت سطر و ستون در مجموعه‌ای از جداول مدل می‌شوند و اکثریت قریب به اتفاق از SQL برای نوشتن و پرس‌وجو از داده‌ها استفاده می‌کنند. در دهه ۲۰۰۰، پایگاه داده‌های غیر رابطه‌ای محبوب شدند که به آنها NoSQL گفته می‌شود زیرا از زبانهای مختلف پرس‌وجو استفاده می‌کنند.

یک دستور «انتخاب» SQL و نتیجه آن

تعریف

ویرایش

در اصطلاح‌نامه کتابداری[۳] در تعریف پایگاه اطلاعاتی آمده‌ است: واحدی است از سوابق و بایگانی‌های قابل خواندن با ماشین که برای یک کاربرد واحد تعبیه نشده، بلکه به منزله یک مجموعه متجانس برای مقاصد مختلف به کار می‌رود. در فرهنگ کاربران کامپیوتر[۴] تعریف پایگاه داده‌ها چنین آمده‌است: مجموعه‌ای از اطلاعات مرتبط دربارهٔ یک موضوع که به صورتی مفید سازمان یافته‌اند و پایگاهی برای روال‌هایی چون بازیابی اطلاعات، تصمیم‌گیری و نتیجه‌گیری در اختیار قرار می‌دهد. اصطلاح پایگاه داده‌ها در فرهنگ تشریحی کامپیوتری مایکروسافت[۵] به شرح زیر توصیف شده‌ است: مجموعه‌ای از داده‌ها، فایلی شامل تعدادی رکورد (یا جدول) متشکل از چند نوع فیلد (ستون)، در کنار عملگرهایی که جستجو، مرتب‌سازی و عملیات مشابه را سهولت می‌بخشد. پایگاه اطلاعاتی به سیستم نگهداری مجموعه‌ای از داده‌ها به هم گفته می‌شود که هدف آن حفظ اطلاعات و اشاعه آن در مواقع لزوم است۰ اطلاعات مورد اشاره به آن چیزی گفته می‌شود که فرد با سازمان برای گردش امور جاری خود به آن نیازمند است.

اصطلاحات و بررسی اجمالی

ویرایش

پایگاه داده به مجموعه‌ای از داده‌های مرتبط، ساختارمند یا سازمان‌یافته گفته می‌شود که دسترسی به این اطلاعات معمولاً از طریق سیستم مدیریت پایگاه داده[الف] یا (DBMS) صورت می‌گیرد. سیستم مدیریت پایگاه داده متشکل از مجموعهٔ یکپارچه از نرم‌افزارهای رایانه‌ای است که به کاربران اجازه می‌دهد با یک یا چند پایگاه داده ارتباط یافته و به اطلاعات موجود در پایگاه داده دسترسی یابند؛ هرچند که این دسترسی می‌تواند کامل باشد یا در صورت وجود محدودیت به بخشی از اطلاعات دسترسی پیدا کنند. DBMS عملکردهای مختلفی را برای ورود[ب]، ذخیره‌سازی[پ] و بازیابی[ت] مقادیر زیادی از اطلاعات فراهم و راه‌های متنوعی برای مدیریت چگونگی سازمان‌یابی اطلاعات ارائه می‌کند. از آنجا که بین پایگاه داده و سیستم مدیریت پایگاه داده قرابت بسیاری وجود دارد بعضی اوقات اصطلاح پایگاه داده برای اشاره به هر دو بکار می‌رود.

خارج از دنیای فناوری اطلاعات حرفه‌ای، پایگاه داده مدتی است که اغلب برای اشاره به هر مجموعه‌ای از داده‌های مرتبط (مانند یک صفحه گسترده یا یک کارت شاخص) استفاده می‌شود. در این مقاله تنها با پایگاه داده‌ای که در آن اندازه و شرایط ضروری استفاده از سیستم مدیریت پایگاه داده مهم است، سروکار داریم.

موجودیت دی.بی.ام.اس. عملکردهای مختلفی را برای مدیریت یک پایگاه داده در اختیار قرار می‌دهد؛ و داده‌های موجود در پایگاه که می‌توانند طبقه‌بندی[ث] شوند به چهار دسته اصلی عملیاتی دسته‌بندی می‌شوند:

  • تعریف داده‌ها: ایجاد، اصلاح و حذف تعاریفی که سازمان یک داده با آن تعریف می‌شود.
  • به روزرسانی: درج، اصلاح و حذف داده‌های واقعی.
  • بازیابی: ارائه اطلاعات در یک قالب به صورتی که به‌طور مستقیم قابل استفاده یا قابل پردازش برای برنامه‌های کاربردی دیگر باشد. داده‌های بازیابی شده ممکن است در یک قالب که اساساً همانند آن چیزی که در پایگاه داده ذخیره شده‌ است ساخته شود یا در قالب جدیدی ناشی از تغییر و ترکیب اطلاعات موجود در پایگاه به وجود آید.
  • مدیریت: ثبت‌نام و نظارت بر کاربران، اجرای امنیت داده‌ها، نظارت بر عملکرد، حفظ تمامیت داده‌ها، خرید و فروش با کنترل همزمانی و دوره نقاهت بعد از اطلاعات است که توسط برخی از حوادث مانند خطای غیرمنتظره سیستم به وجود آید.

هم پایگاه داده و هم DBMS مطابق با اصول مدل پایگاه داده خاص هستند. «سیستم پایگاه داده» اشاره جمعی به مدل پایگاه داده، سیستم مدیریت پایگاه داده و پایگاه داده‌ است. از لحاظ فیزیکی، سرورهای پایگاه داده کامپیوتر به برگزاری پایگاه‌های داده واقعی اختصاص داده شده‌ است و اجرا تنها DBMS و نرم‌افزارهای مرتبط است. سرورهای پایگاه داده معمولاً از چند کامپیوتر، با حافظه و دیسک RAID مورد استفاده برای ذخیره‌سازی پایدار تشکیل شده‌اند.RAID برای بازیابی داده‌ها استفاده می‌شود. اگر هر کدام از دیسک‌ها و یا سخت‌افزار شتاب‌دهنده پایگاه داده، از طریق یک کانال با سرعت بالا به یک یا چند سرویس دهنده متصل شود، در محیط‌های پردازش تراکنش با حجم زیادی استفاده می‌شوند. دی.بی.ام.اس در قلب اکثر برنامه‌های کاربردی پایگاه داده یافت می‌شود. دی.بی.ام.اس ممکن است در اطراف یک هسته چندوظیفه‌ای سفارشی ساخته‌شده برای حمایت از شبکه ساخته شده‌ باشد، اما دی.بی.ام.اس. اس مدرن به‌طور معمول در یک سیستم عامل استاندارد وجود دارد. دی.بی.ام.اس. اس شامل یک بازار اقتصادی قابل توجه برای فروشندگان کامپیوتر و ذخیره‌سازی الزامات DBMS در برنامه‌های توسعه داده‌ است. پایگاه داده‌ها و دی.بی.ام.اس. اس را می‌توان با توجه به مدل پایگاه داده (بازدیدکنندگان) که آن‌ها را پشتیبانی می‌کند (مانند رابطه یا XML)، نوع (بازدیدکنندگان) کامپیوترهایی که آن‌ها را اجرا می‌کند (از یک خوشه سرور به یک تلفن همراه) طبقه‌بندی کرد.

تاریخچه پایگاه داده

ویرایش

مفهوم پایگاه داده

ویرایش

مفهوم پایگاه داده از دههٔ ۱۹۶۰ برای کاهش مشکلات فزاینده در طراحی، ساخت و نگهداشت سامانه‌های اطّلاعاتی (معمولاً با تعداد زیادی کاربرِ نهایی همزمان، و با تعداد زیادی دادهٔ مختلف) ایجاد شده‌ است. این مفهوم به همراه مفهوم سیستم‌های مدیریت پایگاه داده که دستکاری مؤثر و کارا به پایگاه داده‌ها را ممکن می‌کند، رشد کرده‌است.

اولین کاربردهای اصطلاح پایگاه داده به ژوئن ۱۹۶۳ بازمی‌گردد، یعنی زمانی که شرکت System Development Corporation مسئولیت اجرایی یک طرح به نام «توسعه و مدیریت محاسباتی یک پایگاه داده‌ای مرکزی» را بر عهده گرفت. پایگاه داده به عنوان یک واژه واحد در اوایل دهه ۷۰ در اروپا و در اواخر دهه ۷۰ در خبر نامه‌های معتبر آمریکایی به کار رفت. (بانک داده‌ای یا در اوایل سال ۱۹۶۶ در روزنامه واشینگتن پست به کار رفت)

اولین سیستم مدیریت پایگاه داده در دهه ۶۰ گسترش یافت. از پیشگامان این شاخه چارلز بکمن است. مقالات بکمن نشان داد که فرضیات او برای دسترسی به وسایل ذخیره‌سازی بسیار مؤثرتر و کاربردی‌تر هستند. در آن زمان‌ها پردازش داده بر پایه کارت‌های منگنه و نوارهای مغناطیسی بود که پردازش سری اطلاعات را مهیا می‌کند. دو نوع مدل داده‌ای در آن زمان‌ها ایجاد شد:CODASYL موجب توسعه مدل شبکه‌ای شد که ریشه در نظریات بکمن داشت و مدل سلسله مراتبی که توسط North American Rockwell ایجاد شد و بعداً با اقتباس از آن شرکت IBM محصول IMS را تولید نمود.
مدل رابطه‌ای توسط E. F. Codd در سال ۱۹۷۰ ارائه شد. او مدل‌های موجود را مورد انتقاد قرار می‌داد. برای مدتی نسبتاً طولانی، این مدل در مجامع علمی مورد تأیید بود. اولین محصول موفق برای میکرو کامپیوترها dBASE بود که برای سیستم‌عامل‌های CP/M و PC-DOS/MS-DOS ساخته شد. در جریان سال ۱۹۸۰، پژوهش بر روی پایگاه‌های مدل توزیع‌شده و ماشین‌های پایگاهی (database machines) متمرکز شد، اما تأثیر کمی بر بازار گذاشت. در سال ۱۹۹۰ توجهات به طرف مدل شیءگرا جلب شد. این مدل جهت کنترل داده‌های مرکب لازم بود و به‌سادگی بر روی پایگاه داده‌های خاص، مهندسی داده (شامل مهندسی نرم‌افزار منابع) و داده‌های چند رسانه‌ای کار می‌کرد.

در سال ۲۰۰۰ نوآوری تازه‌ای رخ داد و پایگاه اکس‌ام‌ال (XML) به وجود آمد. هدف این مدل از بین بردن تفاوت بین مستندات و داده‌ها است و کمک می‌کند که منابع اطلاعاتی چه ساخت‌یافته باشند یا نه در کنار هم قرار گیرند.

نرم‌افزار

ویرایش

پایگاه داده‌ها برای حمایت از عملیات داخلی سازمان‌ها و زیربنای تعامل آنلاین با مشتریان و تأمین‌کنندگان (نرم‌افزار شرکت مراجعه کنید) استفاده می‌شود. پایگاه داده‌ها برای نگهداری اطلاعات اداری و اطلاعات تخصصی‌تر، مانند داده‌های مهندسی یا مدل‌های اقتصادی استفاده می‌شود. نمونه‌هایی از برنامه‌های کاربردی پایگاه داده شامل سیستم کتابخانه کامپیوتری، سیستم رزرو پرواز و سیستم‌های موجودی computerizedparts.Access نرم‌افزاری است که به کمک آن می‌توانید بانک اطلاعاتی (پایگاه داده) ایجاد کنید. این نرم‌افزار به شما امکان می‌دهد تا اطلاعات خود را در مجموعه‌ای از جدول‌ها ذخیره کنید. با کمک اکسس می‌توانید مقادیر زیادی از داده‌ها را به‌طور مؤثر مدیریت کرده و به اشتراک بگذارید. این نرم‌افزار به شما امکان می‌دهد داده‌ها را از طریق فرم و گزارش‌های حرفه‌ای نمایش دهید و برای هر کاری از پروژه‌های کوچک گرفته تا مشاغل بزرگ مناسب است. اکسس یکی از نرم‌افزارهای مجموعه مایکروسافت آفیس (Microsoft Office) است که همراه با ورد، اکسل، پاورپوینت و وان‌نوت روی سیستم شما نصب می‌شود.

توضیح دی.بی.ام. اس

ویرایش
 
پایگاهِ داده یا داده‌پایگاه

DBMS یک سیستم نرم‌افزار پیچیده تکامل یافته‌است و توسعه آن به‌طور معمول به هزاران نفر و سال تلاش و توسعه نیاز دارد. برخی از دی.بی.ام. اس مانند Adabas، اوراکل و DB2. هدف دی.بی.ام. اس رفع نیازهای برنامه‌های کاربردی ست. با این حال، این واقعیت است که هزینه توسعه می‌تواند مقرون به صرفه تر باشد. با این حال، DBMS همیشه راه حل بهینه‌ای دارد: در برخی مواردDBMS ممکن سربار غیرضروری را معرفی کند. نمونه‌های بسیاری از سیستم‌های که با استفاده از پایگاه داده‌های خاص وجود دارد. یک مثال رایج سیستم ایمیل است: سیستم‌های ایمیل طراحی شده‌است برای بهینه‌سازی مدیریت پیام‌های ایمیل، و نیازی بخش قابل توجهی از قابلیت DBMS است. بسیاری از بانک‌های اطلاعاتی نرم‌افزار برنامه‌ای است برای دسترسی به پایگاه داده از طرف کاربران نهایی، بدون قرار دادن رابط DBMS به‌طور مستقیم. برنامه نویسان نرم‌افزار ممکن است یک پروتکل سیم به‌طور مستقیم، یا به احتمال زیاد از طریق یک رابط برنامه‌نویسی برنامه استفاده کنند. طراحان پایگاه داده و مدیران پایگاه داده با DBMS از طریق رابط‌های اختصاص داده شده برای ساخت و حفظ برنامه‌های کاربردی ' پایگاه‌های داده، و در نتیجه نیاز به برخی از دانش بیشتر و درک در مورد چگونگی عملکرد دی.بی.ام. اس و رابط خارجی و پارامترهای تنظیم دی.بی.ام. اس تعامل می‌کنند.

نمونه

ویرایش

یکی از راه‌های طبقه‌بندی پایگاه‌های داده شامل نوع محتویات آن‌ها است، به عنوان مثال: کتابشناسی، سند متن، اشیاء آماری، یا چند رسانه‌ای. راه دیگر این است که توسط منطقه کاربرد آن‌ها طبقه‌بندی شود، به عنوان مثال: حسابداری، آهنگ موسیقی، فیلم، بانکداری، تولید، یا بیمه. راه سوم این است که توسط برخی از جنبه‌های فنی، مانند ساختار بانک اطلاعاتی یا نوع رابط طبقه‌بندی شود. در این بخش برای توصیف انواع پایگاه داده‌ها از چند صفت استفاده می‌شود.. پایگاه داده‌ها در حافظه یک پایگاه داده‌است که در درجه اول در حافظه اصلی ساکن است، اما به‌طور معمول حمایت کردن توسط حافظهٔ غیر فرار داده‌های کامپیوتر انجام می‌شود. پایگاه‌های داده‌ای که در حافظه اصلی هستند سریع تر از پایگاه داده‌های هستند که در دیسک و غیره قرار دارند؛ که اغلب در تجهیزات شبکه ارتباطات از راه دور مورد استفاده قرار می‌گیرند

پلت فرم SAP HANA موضوع بسیار مهم در حافظه پایگاه داده‌است. تا ماه مه سال ۲۰۱۲، HANA قادر به اجرا بر روی سرور با حافظه اصلی 100TB طراحی شده توسط آی بی ام بود. بنیان‌گذار شرکت ادعا کرد که این سیستم به اندازه کافی بزرگ برای اجرای بزرگترین مشتریان SAP بود.

پایگاه داده فعال شامل رویداد معماری محور است که می‌تواند به شرایط هر دو داخل و خارج از پایگاه داده، پاسخ دهد. استفاده احتمالی عبارتند از نظارت بر امنیت، هشدار، جمع‌آوری آمار و مجوز. بسیاری از بانک‌های اطلاعاتی و ارائه ویژگی‌های پایگاه داده فعال در قالب عوامل پایگاه داده.

پایگاه داده ابر متکی بر فناوری ابر. پایگاه داده و بسیاری از DBMS، «در ابر» در حالی که برنامه‌های کاربردی آن هم توسط برنامه نویسان توسعه یافته و بعد حفظ می‌شود و توسط کاربران نهایی از طریق aweb مرورگر و رابط‌های برنامه کاربردی گسترش می‌یابد. آرشیو داده‌ها از پایگاه داده‌های عملیاتی و اغلب از منابع خارجی است مانند شرکت‌های تحقیقات بازار. انبار منبع اصلی اطلاعات برای استفاده توسط مدیران و دیگر کاربران نهایی است که ممکن است دسترسی به داده‌های عملیاتی نداشته باشند. به عنوان مثال، فروش اطلاعات ممکن است به روز بالغ هفته جمع و تبدیل از کد محصول داخلی به استفاده از UPCs به‌طوری‌که می‌توان آن‌ها را با داده‌های ACNielsen مقایسه شده‌است. • بعضی از اجزای اساسی و ضروری از انبار داده‌ها شامل: بازیابی، تجزیه و تحلیل، و داده کاوی، تبدیل، بارگیری و مدیریت داده‌ها، تا که آن‌ها را برای استفاده بیشتر در دسترس قرار دهد.

پایگاه داده استنتاجی ترکیبی از برنامه‌نویسی منطقی با یک پایگاه داده رابطه‌ای است، به عنوان مثال با استفاده از زبان DATALOG

پایگاه داده توزیع شده که در آن داده و DBMS دهانه چندین کامپیوتر است.

پایگاه داده سند گرا برای ذخیره‌سازی، بازیابی و مدیریت اطلاعات، یا داده‌های نیمه ساخت طراحی شده‌است. پایگاه داده سند گرا یکی از دسته‌بندی‌های اصلی پایگاه داده نواسکیوال است. سیستم پایگاه داده‌های جاسازی شدهDBMS که بانرم‌افزار است.

پایگاه داده‌های کاربر نهایی از داده توسعه یافته توسط کاربران فردی نهایی است. نمونه‌هایی از این مجموعه اسناد، صفحات گسترده، ارائهٔ چند رسانه‌ای، و فایل‌های دیگر است.. برخی از محصولات پایگاه داده‌ها بسیار ساده‌تر از دی.بی.ام. اس کامل است. با قابلیت DBMS ابتدایی تر.

یک سیستم پایگاه داده فدرال شامل چندین پایگاه‌های داده مجزا با DBMS مجزا است. آن را به عنوان یک پایگاه داده واحد که توسط یک سیستم مدیریت پایگاه داده فدرال (FDBMS) مدیریت می‌شود، که از ادغام دی.بی.ام. اس‌های مستقل متعدد از انواع مختلف (که در این صورت آن را نیز یک سیستم پایگاه داده ناهمگن است) به کار گرفته شده‌است، و آن‌ها را با یک دیدگاه مفهومی یکپارچه فراهم می‌کند.

گاهی چند پایگاه داده به عنوان مترادفی از پایگاه داده فدرال استفاده می‌شود، هر چند که ممکن است کمتر اشاره به گروهی از پایگاه داده شود (به عنوان مثال، بدونFDBMS و طرح یکپارچه مدیریت) که در یک برنامه واحد همکاری کنند. این مورد به‌طور معمول برای توزیع استفاده می‌شود، که به‌طور معمول شامل یک پروتکل اتمی مرکب (ACP)است، به عنوان مثال، دو فاز مرکب پروتکل، اجازه می‌دهد تا توزیع (جهانی) معاملات در سراسر پایگاه داده‌های شرکت‌کننده انجام شود.

پایگاه داده نمودار یک نوع پایگاه داده نواسکیوال است که با استفاده از ساختار گراف با گره، لبه، و خواص برای نشان دادن و ذخیره اطلاعات است. پایگاه داده نمودار عمومی است که می‌تواند هر گراف ذخیره‌ای متمایز از پایگاه داده نمودارهای تخصصی مانند triplestores و پایگاه داده شبکه باشد.

آرایه DBMS یک نوع نواسکیوال DBMS است که اجازه می‌دهد تا به مدله فروشگاه و بازیابی (معمولاً بزرگ) arrayssuch چند بعدی به عنوان تصاویر ماهواره‌ای و خروجی شبیه‌سازی آب و هوا تبدیل شود. درhypertext یا hypermedia پایگاه داده، هر کلمه یا یک تکه از متن به نمایندگی یک شی در می‌آید. به عنوان مثال، قطعه دیگری از متن، مقاله، عکس، یا یک فیلم. می‌توان به آن لینکهایی از پایگاه‌های داده ابرمتن به ویژه برای سازماندهی مقادیر زیادی از اطلاعات ناهمگون داده شود. به عنوان مثال، آن‌ها برای سازماندهی دائرةالمعارف آنلاین، مفید هستند که در آن کاربران به راحتی می‌توانند کارهایی مثل پرش اطراف متن را از طریق شبکه جهانی وب دردسترس همه قرار دهند در نتیجه یک پایگاه داده بزرگ توزیع فرامتن به وجود میاورد.

پایگاه دانش یک نوع خاص از پایگاه داده برای مدیریت دانش است، ارائه روشی برای جمع‌آوری، سازمان، و بازیابی دانش کامپیوتری است. همچنین مجموعه‌ای از داده‌های نشان دهنده مشکلات با راه حل‌های خود و تجارب مرتبط با آن است.

پایگاه داده‌های تلفن همراه که در دستگاه رایانه همراه و تلفن‌های همراه قرار دارد.

پایگاه داده عملیاتی ذخیره داده مفصل در مورد عملیات سازمان است. آن‌ها به‌طور معمول پردازش حجم نسبتاً بالایی از به روزرسانی با استفاده از معاملات را بر عهده دارند. مثال‌ها عبارتند از پایگاه داده‌های مشتری که رکورد تماس، اعتبار، و اطلاعات جمعیتی در مورد کسب و کار • مشتریان را بر عهده دارد. پایگاه داده پرسنل که نگهداری اطلاعات مانند حقوق و دستمزد، مزایای، داده مهارت‌های مورد کارکنان، سیستم‌های برنامه‌ریزی منابع سازمانی است که جزئیات رکورد در مورد اجزای محصول، موجودی قطعات، و پایگاه داده مالی که پیگیری پول سازمان، حسابداری و معاملات مالی را بر عهده دارد.

پایگاه داده موازی به دنبال بهبود عملکرد از طریق موازی برای انجام وظایفی مانند: بارگذاری اطلاعات، شاخص ساختمان و ارزیابی نمایش داده‌است. معماری DBMS موازی عمدتاً توسط معماری سخت‌افزار انجام می‌شود که عبارتند از:

  • به اشتراک گذاشتن معماری حافظه، که در آن پردازنده‌های چند گانه را به اشتراک فضای حافظه اصلی، و همچنین به عنوان ذخیره‌سازی داده‌ها دیگر درمی‌آورند.

به اشتراک گذاشتن معماری دیسک، که در آن هر واحد پردازش (به‌طور معمول شامل پردازنده‌های چند گانه) دارای حافظه اصلی خود است، اما همه واحدهای اشتراک ذخیره‌سازی دیگر نیز وجود دارند.

به اشتراک گذاشتن معماری که در آن هر واحد پردازش حافظه اصلی و ذخیره‌سازی دیگر انجام می‌شود.

پایگاه‌های داده احتمالاتی استخدام منطق فازی به منظور جلب استنتاج از داده‌های مبهم.

زمان واقعی معاملات فرایند پایگاه داده برای نتیجه عملیات.

پایگاه داده فضایی می‌تواند داده‌های با ویژگی‌های چند بعدی را ذخیره کند. نمایش در چنین داده‌هایی مبتنی بر مکان نمایش داده‌است. مانند "کجا نزدیکترین هتل در منطقه من است؟ "

پایگاه داده زمانی بر اساس جنبه‌های زمان ساخته شده‌است، به عنوان مثال یک مدل داده زمانی و نسخه زمانی SQL. بیشتر به‌طور خاص جنبه‌های زمانی معمولاً شامل وقت و زمان معامله معتبر است.

پایگاه داده اصطلاحات گرا ایجاد شده بر یک پایگاه داده شی گرا، اغلب برای یک رشته خاص سفارشی است. پایگاه داده داده‌های بدون ساختار در نظر گرفته شده برای ذخیره در راه کنترل و حفاظت اشیاء گوناگون که متناسب نیست در نظر گرفته شده‌اند. به‌طور طبیعی و به راحتی در پایگاه داده‌های مشترک وجود دارند. اکثردی. بی.ام. اس‌ها در حال حاضر برای حمایت از داده‌های بدون ساختار به روش‌های مختلف است، و دی.بی.ام. اس‌های جدید مخصوص در حال ظهور است.

مدل‌های پایگاه داده

ویرایش

الگوی کاری کاربران پایگاه داده‌ها را در سطح منطقی مشخص می‌کند. شگردهای مختلفی برای مدل‌های داده‌ای وجود دارد. برای هر یک از مدل‌های منطقی اجراهای فیزیکی مختلفی قابل پیاده‌سازی است و سطوح کنترل مختلفی در انطباق فیزیکی برای کاربران مهیا می‌کند. این مدل‌ها عبارتند از مدل تخت، مدل سلسله مراتبی، مدل شبکه‌ای و مدل رابطه‌ای. مدل رابطه‌ای اساس کار سامانه مدیریت پایگاه داده‌های امروزی است.

طراحی و مدل‌سازی

ویرایش

اولین وظیفه یک طراح پایگاه داده این است که برای تولید یک مدل داده مفهومی که منعکس‌کننده ساختار اطلاعات در پایگاه داده برگزار می‌شود طرحی پیشنهاد کند. به منظور توسعه یک مدل موجودیت-ارتباط، اغلب با کمک ابزار طراحی. یکی دیگر از روش محبوب زبان مدل‌سازی یکپارچه است. مدل داده موفق به دقت حالت منعکس‌کننده بستگی دارد مدل ممکن از جهان خارج شود: به عنوان مثال، اگر مردم می‌توانند بیش از یک شماره تلفن داشته باشد، در حقیقت اجازه نمی‌دهد که بیش از یک اطلاعات ذخیره شود. طراحی مدل داده مفهومی خوب نیاز به درک خوبی از دامنه کاربرد کاربران دارد. معمولاً شامل پرسیدن سوال‌های عمیق در مورد چیزهایی که یک سازمان به آن علاقه دارد است، مانند " یک مشتری می‌تواند یک عرضه‌کننده کالا باشد؟ "، یا " اگر یک محصول با دو فرم مختلف از بسته‌بندی به فروش می‌رسد، همان محصول یا محصولات مختلف آن است ؟"پرسش تعاریف اصطلاحات برای اشخاص (مشتریان، محصولات، پرواز، بخش پرواز) و روابط آن‌ها و ویژگی‌های ایجاد شده مورد استفاده قرار می‌گیرد. تولید مدل داده مفهومی گاهی شامل ورودی از فرایندهای کسب و کار، یا تجزیه و تحلیل گردش کار در سازمان است. این می‌تواند به ایجاد اطلاعاتی در پایگاه داده مورد نیاز کمک کند. به عنوان مثال، می‌تواند به تصمیم‌گیری پایگاه داده مورد نیاز برای نگهداری داده‌های تاریخی و همچنین داده‌های فعلی کمک کند. پس از تولید یک مدل داده مفهومی کاربران خوشحال هستند.

مرحله بعدی این است که این طرح را ترجمه کنند که پیاده‌سازی ساختمان داده‌های مربوط در پایگاه داده‌است. این فرایند اغلب به نام طراحی پایگاه داده‌های منطقی، و خروجی مدل منطقی داده‌ها بیان شده در قالب یک طرح است. در حالی که مدل داده مفهومی (در تئوری حداقل) مستقل از انتخاب فناوری پایگاه داده‌است، مدل منطقی داده‌ها یک مدل پایگاه داده خاص پشتیبانی شده توسط DBMS را انتخاب می‌کند. (مدل شرایط داده‌ها و مدل پایگاه داده می‌باشد اغلب به جای یکدیگر استفاده می‌شود، اما در این مقاله ما با استفاده از مدل داده برای طراحی یک پایگاه داده خاص، و مدل پایگاه داده برای نماد مدل‌سازی بیان طراحی استفاده می‌کنیم) مدل پایگاه داده محبوب‌ترین پایگاه دادهٔ مدل رابطه‌ای، یا دقیق تر، مدل رابطه‌ای به عنوان زبان SQLنشان داده‌است. روند ایجاد یک طراحی پایگاه داده منطقی با استفاده از این مدل با استفاده از روش روشمند شناخته شده به عنوان روش عادی است. اطمینان حاصل می‌شود که در ابتدا «حقیقت» است که تنها در یک مکان ثبت شده، به‌طوری به روزرسانی و حذف به صورت خودکار برای حفظ انسجام انجام می‌شود. مرحله نهایی از طراحی پایگاه داده این است که تصمیم‌گیری برای عملکرد، مقیاس پذیری، بهبود، امنیت، و مانند آن تأثیر می‌گذارد که اغلب طراحی پایگاه داده‌های فیزیکی نامیده می‌شود. هدف کلیدی در این مرحله استقلال داده‌است، به این معنی که تصمیمات اتخاذ شده برای اهداف بهینه‌سازی عملکرد باید نامرئی باشد که برای پایان دادن به کاربران و برنامه‌های کاربردی است. طراحی فیزیکی عمدتاً توسط عملکرد مورد نیاز رانده می‌شود، و نیاز به دانش خوبی از الگوهای حجم کار و دسترسی انتظار می‌رود، و درک عمیق از ویژگی‌های ارائه شده توسط DBMS انتخاب شده‌است. یکی دیگر از جنبه طراحی پایگاه داده‌های فیزیکی امنیتی است. این شامل هر دو تعریف کنترل دسترسی به اشیاء پایگاه داده و همچنین تعریف سطوح امنیتی و روش برای داده‌ها است.

بحث اجرایی و تخصصی

ویرایش

در زمینه ساخت بانک اطلاعاتی برخی کدنویسان غیرمتخصص هستند که در آغاز زندگی حرفه‌ای خود بدون آشنایی ساختاری با پایه‌های سرور بانک اطلاعاتی اقدام به ساخت جداول یا حتی ایجاد ارتباطات بین جدولی می‌کنند (relations یا RDBMS). در طراحی بانک اطلاعاتی چند بحث ثابت همیشه مطرح است از جمله نرمال‌سازی (اجتناب از تکرار برای صرفه‌جویی در حجم)، نانرمال‌سازی (تلاش برای تکرار برای افزایش سرعت)، آشنایی با indexing یا مرتب‌سازی هدفمند بر اساس حروف شامل کلاسترد ایندکس (تقریباً همان PKs) و ایندکس‌های دوم با مبحث لوک‌آپ دوم (برای مثال ایندکس نام پس از یافتن به کلاستردایندکس ردیف خودش که معمولاً PK است مراجعه می‌کند تا ردیف را استخراج کند) و بحث‌هایی مانند B-tree که برخی به اشتباه آن را با درخت باینری اشتباه می‌گیرند اما در واقع درخت خود-متعادل‌شونده است بدان معنی که خود سرور بر اساس تعداد ردیف‌های جدول اطلاعاتی تصمیم می‌گیرد که تا چند مرحله ایندکس‌ها را دسته دسته کند تا بتواند با مقایسه مقدار مورد جستجو در سریع‌ترین زمان ممکن به داده‌های ردیف مورد نظر برسد. سطوح مختلف این دسته‌بندی‌ها به سه گونه گره ریشه یا روت (تنها دسته‌بندی آغازین)، گره‌های شاخه با برنچ (میانی) و گره‌های برگ یا لیفز که به لیف پیجز شناخته‌می‌شوند (پایانی) وجود دارند. از جمله مباحث مهم افزایش کارایی بانک اطلاعاتی ایجاد ایندکس‌های ترکیبی یا کامپوزیت متناسب با نوع جستجو است که در زمان ایجاد ارتباطات بین جداول از اهمیت مهمی برخوردار است. در بین تمام این مباحث در برخی سرورها مانند مای‌اس‌کیوال اینکه از چه نوع موتور اطلاعاتی MyISAM یا InnoDB استفاده شود از اولین سوالات است زیرا اولی نماینده سرعت در ثبت اطلاعات است (معمولاً بایگانی) و دومی نماینده تعادل در سرعت هم ثبت و هم خواندن به این دلیل در اولی در زمان ثبت داده کل جدول را قفل می‌کند و با عنوان غیر تراکنشی یا غیر ترزاکشن شناخته می‌شود در حالی که دومی برعکس است و ردیف‌ها را قفل می‌کند.

معمولاً فرایند طراحی بانک اطلاعاتی پس از مرحله طوفان فکر یا مغز آغاز می‌شود که مرحله طراحی مدل نیز ممکن است در همان محیطی انجام شود که برای طوفان فکر استفاده شده مانند MS Visio اما معمولاً پس از قطعی شدن تصمیمات دربارهٔ ساختار پروژه، مرحله مدل‌کشی و طراحی پایگاه داده مستقیم در استودیوهای طراحی بانک اطلاعاتی مانند MySQL Workbench یا SQL server management studio انجام می‌شود از این رو چه پروژه تحت RUP یا اجیل اجرا شود تغییرات می‌تواند بلافاصله در مدل اصلی اعمال شود.

طراحی پایگاه باید به گونه‌ای باشد که از پیش با نحوه عملکرد لایه میانی مدل بانک اطلاعاتی روی برنامه استفاده‌کننده هماهنگ باشد (گاهی برعکس برنامه بر اساس بانک اطلاعاتی موجود ساخته می‌شود اما نه زمانی پایگاه داده مختص پروژه در حال طراحی است) برای مثال بسته به میزان وسعت پروژه و تعداد کاربران ممکن است از لایه الگوی نقشه‌کشی داده (Datamapper) با سرعت بالاتر برای پروژه‌های عظیم‌تر نسبت به الگوی ثبت کنشور (AR) که از سرعت‌پایین‌تری برخوردار است استفاده شود حتی در مواردی ممکن است امکان استفاده از هیچ‌گونه لایه ORM وجود نداشته باشد برای مثال به خاطر مسائل امنیتی هر گونه تراکنش بانک اطلاعاتی بواسطه procedureها و روتین‌های از پیش‌نوشته شده ایمن انجام شود و اجازه افزودن یا ویرایش روی سرور بانک اطلاعاتی برای کاربران سرور وجود نداشته باشد. اکثراً توصیه شده‌است که از AR برای پروژه‌هایی که کاربران بسیار دارند استفاده نشود در عوض دیتامپر گزینه بهتر است. در مبحث بانک‌های اطلاعاتی از عبارت دومین یا دامنه برای امور کاملاً متفاوتی استفاده می‌شود یکی از آن‌ها لایه دومین در تضاد با لایه بیزینس[مشکوک ] در دیتامپر است که یکی لایه کنترل‌کننده ثبت و ویرایش و بررسی ریلیشن داده‌هاست و دیگری لایه مدل‌سازی در برنامه که از لایه اول استفاده می‌کند.

منابع اطلاعات

ویرایش
 
یک مثال از یک پایگاه داده SQL پرس و جو.

یک پایگاه داده که یک مجموعه‌ای از اطلاعات سازمان یافته تشکیل شده‌است.[۶]

یک سیستم مدیریت پایگاه داده (DBMS) است که یک نرم‌افزار کامپیوتر، است که تعامل با برنامه‌های کاربردی دیگر و پایگاه داده خود را به تصرف و تجزیه و تحلیل داده‌ها درمی‌آورد. DBMS طراحی شده اجازه می‌دهد تا تعریف ایجاد پرس و جو به روز رسانی و مدیریت پایگاه داده. شناخته شده DBMSs شامل خروجیهای PostgreSQLهای MongoDBهای MariaDBبا مایکروسافت SQL سرورهای اوراکلبا Sybaseهای SAP HANAبا MemSQL و آی بی ام DB2. یک پایگاه داده‌است. سیستم‌های مدیریت پایگاه داده اغلب با توجه به مدل پایگاه داده که آن‌ها پشتیبانی می‌شود طبقه‌بندی شده؛ محبوب‌ترین سیستم‌های پایگاه داده از سال 1980s که همه پشتیبانی‌ها را از مدل رابطهای نشان داده شده توسط زبانSQL می‌کند[مورد مناقشه ]

اصطلاحات و بررسی اجمالی

ویرایش

به‌طور رسمی «پایگاه داده» اشاره به مجموعه‌ای از داده‌های مرتبط که راه آن سازماندهی شده‌است. دسترسی به این اطلاعات معمولاً توسط یک «سیستم مدیریت پایگاه داده» (DBMS) متشکل از یک مجموعه یکپارچه از نرم‌افزارهای کامپیوتری است که به کاربران امکان ارتباط را برای یک یا چند پایگاه داده فراهم می‌کند. دسترسی به تمام داده‌های موجود در پایگاه داده (اگر چه محدودیت ممکن است وجود داشته باشد که محدود کردن دسترسی به داده‌های خاص). از DBMSهای مختلف فراهم می‌کند. توابع امکان این را می‌دهد که تا ذخیره و بازیابی مقادیر زیادی از اطلاعات را فراهم کند.

خارج از دنیای حرفه‌ای فناوری اطلاعاتاصطلاح پایگاه داده اغلب به هر مجموعه‌ای از داده‌های مرتبط (مانند یک صفحه گسترده یا یک شاخص) اشاره می‌کند. [۷]

  • تعریف داده‌ها – ایجاد و اصلاح و حذف از تعاریف که در تعریف سازمان داده‌است.
  • به روز رسانی – فروکردن، اصلاح و حذف داده‌های واقعی.[۸]
  • بازیابی – ارائه اطلاعات در یک فرم به‌طور مستقیم که قابل استفاده می‌باشد یا برای پردازش بیشتر توسط برنامه‌های کاربردی دیگر است. بازیابی داده‌ها ممکن است در دسترس باشد در یک فرم که اساساً همان است که در آن ذخیره شده‌است[۹]
  • اداره – ثبت نام و نظارت بر کاربران، اجرای، امنیت داده‌ها، نظارت بر عملکرد، حفظ تمامیت داده‌ها در برخورد با کنترل همزمانی و بازیابی اطلاعات است که خراب شده‌است توسط برخی از رویداد مانند شکست سیستم غیرمنتظره.[۱۰]

[۱۱] [۱۱]

پایگاه داده‌ها و DBMSs می‌توان طبقه‌بندی شود با توجه به پایگاه داده مدل(s) که آن‌ها پشتیبانی (مانند رابطهای یا XML) نوع(ها) در کامپیوتر که آن‌ها اجرا بر روی (از یک سرور کلاستر به یک تلفن همراه) query language(s) استفاده می‌شود برای دسترسی به پایگاه داده (مانند SQL یا XQuery) و داخلی مهندسی که بر عملکرد و مقیاس پذیری، انعطاف‌پذیری و امنیت است.

برنامه‌های کاربردی

ویرایش

پایگاه‌های داده برای حمایت از عملیات داخلی سازمان و به زیر بنای تعاملات آنلاین با مشتریان و تأمین کنندگان (دیدن Enterprise نرم‌افزار) استفاده می‌شود.

پایگاه‌های داده به نگه داشتن اطلاعات اداری و اطلاعات تخصصی‌تر داده‌ها مانند داده‌های مهندسی یا مدل‌های اقتصادی. نمونه‌هایی از برنامه‌های کاربردی پایگاه داده شامل کامپیوتری کتابخانه، سیستم، پرواز، رزرو، سیستم‌های کامپیوتری قطعات سیستم‌های موجودیو بسیاری از سیستم‌های مدیریت محتوا که ذخیره وب سایت به عنوان مجموعه‌ای از صفحات وب در یک پایگاه داده استفاده می‌شود.

منظوره و خاص منظوره DBMSs

ویرایش

DBMS ممکن است تبدیل به یک مجموعه سیستم نرم‌افزار شود و توسعه آن به‌طور معمول نیاز به هزاران سال دارد. برخی منظوره DBMSs مانند Adabasهای Oracle و DB2 به روز رسانی شده‌است از آنجا که 1970s. منظوره DBMSs با هدف پاسخگویی به نیازهای به عنوان بسیاری از برنامه‌های کاربردی است. . از سوی دیگر یک منظوره DBMS ممکن است.

نرم‌افزار اغلب می‌توانید به دسترسی به یک پایگاه داده از طرف کاربران نهایی بدون افشای رابط DBMS به‌طور مستقیم بینجامد. برنامه نویسان ممکن است استفاده از یک سیم پروتکل به‌طور مستقیم یا به احتمال زیاد از طریق یک رابط کاربردی برنامه‌نویسی به بانک اطلاعاتی طراحان و مدیران پایگاه داده ارتباط برقرار کند

تاریخچه

ویرایش

پس تکنولوژی پیشرفت در زمینه پردازندههای کامپیوتر و حافظههای ذخیره‌سازی کامپیوترو شبکه‌های کامپیوتریبه اندازه قابلیت و عملکرد پایگاه داده‌های مربوط DBMSs در سفارش‌ها رشد کرده‌است. توسعه فناوری پایگاه داده را می‌توان به سه دوره بر اساس داده‌های مدل یا ساختار: ناوبریهای[۱۲] SQL/رابطهایو پس از رابطه‌ای تقسیم کرد.

۱۹۶۰ ناوبری DBMS

ویرایش
 
Basic structure of navigational CODASYL database model

اصطلاح پایگاه داده همزمان با دسترسی مستقیم به ذخیره‌سازی (دیسک و درامز) از اواسط دهه ۱۹۶۰ به بعد معرفی شد.

1970s, relational DBMS

ویرایش

ادگار Codd در IBM در سن خوزه کالیفرنیادر یکی از شاخه دفاتر که عمدتاً درگیر در توسعه سیستم هارد دیسک مشغول به کاربود. او با ناوبری مدل CODASYL رویکرد ویژه فقدان یک «جستجو» مرکزنا راضی بود. در سال ۱۹۷۰ او نوشت: تعدادی از مقالات که مشخص شده‌است که با یک رویکرد جدید به پایگاه داده می‌توان نگاه کرد که در نهایت به اوج خود رسید..[۱۳]

رویکرد یکپارچه

ویرایش

در 1970s و 1980s به ساخت پایگاه داده و سیستم‌های یکپارچه با سخت‌افزار و نرم‌افزار تلاش کردند. فلسفه‌ای شد که از ادغام ارائه عملکرد بالاتر و هزینه کمتر استفاده شود.

در اواخر دهه 1970 SQL DBMS

ویرایش

IBM بر روی یک نمونه اولیه سیستم آزادانه در Codd شروع به کار کرد این مفاهیم را به عنوان سیستم R در اوایل 1970s ارائه شد. اولین نسخه آماده بود در ۱۹۷۴/۵ و کار پس از آن آغاز شده در چند جدول به‌طور سیستمی در آن داده‌ها را می‌توان تقسیم کرد .. پس از آن چند نسخه توسط مشتریان در سال ۱۹۷۸ و ۱۹۷۹ که در آن زمان استاندارد query language – SQL– اضافه شده بود تست شد.

تحقیقات

ویرایش

فناوری پایگاه داده فعال بوده‌است و موضوع تحقیق از دهه ۱۹۶۰در دانشگاها و در تحقیق و توسعه گروهی از شرکت‌ها (به عنوان مثال IBM Research) بوده‌است. فعالیت تحقیقاتی شامل تئوری و توسعه نمونه‌های اولیه است.

یادداشت‌ها

ویرایش
  1. Data Base Management System
  2. Entry
  3. Storage
  4. Retrieval
  5. Classified

اقا ن م یش ه خ ودت ون تن ط یم کن ی د سخ ت ه اک ا ن ت ای م ی ل ا نق در سح ت نب و د ا

منابع

ویرایش
  1. «پایگاه داده، به اختصار: پادا» [رایانه و فنّاوری اطلاعات] هم‌ارزِ «دیتابیس» (database, DB) مترادفِ: «دادگان» هم‌ارزِ واژهٔ بیگانه‌ای دیگر؛ منبع: گروه واژه‌گزینی. جواد میرشکاری، ویراستار. دفتر پانزدهم. فرهنگ واژه‌های مصوب فرهنگستان. تهران: انتشارات فرهنگستان زبان و ادب فارسی (ذیل سرواژهٔ دادگان)
  2. «معنی دادگان | واژه‌های مصوّب فرهنگستان». www.vajehyab.com. دریافت‌شده در ۲۰۲۲-۰۸-۰۴.
  3. سلطانی، پوری؛ اصطلاح‌نامه کتابداری؛ تهران: کتابخانه ملی جمهوری اسلامی ایران، 1365.
  4. فرهنگ کاربران کامپیوتر؛ ترجمه ادیک باغداساریان؛ تهران: کانون نشر علوم، 1372.
  5. مایکروسافت؛ فرهنگ تشریحی اصطلاحات کامپیوتری میکروسافت، ترجمه مجید سماوی، تهران: کانون نشر علوم، 1373.
  6. "Database – Definition of database by Merriam-Webster". merriam-webster.com.
  7. Ullman & Widom 1997, p. 1.
  8. "Update – Definition of update by Merriam-Webster". merriam-webster.com.
  9. "Retrieval – Definition of retrieval by Merriam-Webster". merriam-webster.com.
  10. "Administration – Definition of administration by Merriam-Webster". merriam-webster.com.
  11. ۱۱٫۰ ۱۱٫۱ [[#CITEREF|]].
  12. Bachman 1973.
  13. Codd 1970.