Маалымат базасы


Маалымат базасы (англисче Database, кыргызча маалыматтар базалары деген аталышта дагы колдонулат) - электрондук эсептөөчү машинанын (ЭЭМ) жардамы менен оңой изделип жана иштетүүгө мүмкүн болгон ыкмада системаланган, объективдүү формада берилген өз алдынча материалдардын жыйындысы (макалалар, эсептер, нормативдик актылар, сот чечимдери жан башка материалдар).

Мазмуну

Көптөгөн адистер «маалымат базасын башкаруу система» терминин ордуна «маалымат базасы» терминин колдонуудагы кеңири жайылган катачылыкты көрсөтүшүп, бул эки түшүнүктү бөлүп кароону сунушташат.

Аныктама көйгөйлөрү

Адабияттарда «маалымат базасы» түшүнүгүнүн көптөгөн аныктамалары берилип, тигил же бул авторлордун субъективдүү ойлорун гана чагылдырат, бирок жалпы кабыл алынган формулировка жок.

Эл аралык жана андан чыккан кээ бир өлкөлөрдүн аныктамалары:

Авторитеттүү монографиялардагы аныктамалар:

Аныктамаларда көбүрөөк (атайын же атайын эмес) төмөнкүдөй айырмалануучу белгилер бар:

  1. М.Б. эсептөөчү системада сакталат жана иштетилет. Демек, маалыматты компьютердик эмес сактоо жайлары (архивдер, китепканалар, картотекалар ж. б.) маалымат базасы болбойт деген мааниде.
  2. Маалымат базасында маалыматы эффективдүү издөө жана иштетүү үчүн алар логикалык жактан түзүмдөлгөн (системалаштырылган) болот. Түзүмдөлгөн дегени түзүүчү бөлүктөрүн (элементтерин), алардын ортосундагы байланыштарын, ошондой эле элементтерди жана байланыштарды типтөө дегенди түшүндүрүп, элемент тиби (байланышы) менен белгилүү бир семантика жана мүмкүн болгон операциялар мамилелештирилет.
  3. Маалымат базасы өзүнө анын логикалык түзүмүн формалдуу түрдө баяндаган (кээ бир мета моделге ылайык) схеманы же мета маалыматтарды камтыйт. Орустардын ИСО МЭК ТО 10032-2007 ГОСТуна ылайык өзүнө туруктуу маалыматтар маалымат базасындагы чөйрөдө схеманы жана М. Б. камтыйт. Схема өзүнө маалыматтар базасын түзү жана аны колдоо үчүн колдонулган мазмундун баяндалышын, түзүмдү жана бүтүндүүлүк чектөөсүн камтыйт. Маалыматтар базасы болсо өзүнө схеманын жардамы менен аныкталган турукту сакталуучу маалыматтар топтомун камтыйт. Маалыматтарды башкаруу системасы болсо, маалыматтар базасындагы маалыматтарды башкарууга жана ага мүмкүндүк алууга, схемадагы маалыматтардын аныктамаларын колдонот.

Айтылган белгилердин биринчиси гана так, калгандары түрдүү трактовкаларга (түшүнүк берүүлөргө) жана түрдүү деңгээлдеги баалоолорго мүмкүндүк берет. Маалымат базасына кандайдыр бир туура келүү деңгээлин гана орнотуу мүмкүн.

Мындай учурда жалпы кабыл алынган тажрыйба акыркы ролду ойнобойт. Буга ылайык маалымат базасы деп файл архивдерин, интернет порталдарды же электрондук таблицаларды эсептебейбиз, бирок булар кайсы бир деңгээлде МБ белгилерине ээ. Көп учурда бул деңгээл жетишсиз деп эсептелинет (бирок өзгөчө учурлар болушу мүмкүн).

Тарыхы

Маалымат база технологияларынын пайда болуу жана өнүгүү тарыхы кеңири жана тар аспектиде каралышы мүмкүн.

Кеңири мааниде, маалымат базаларынын тарыхынын түшүнүгү адамзат маалыматтарды сактаган жана иштеткен каражаттардын тарыхына жалпыланат. Бул контекстте, мисалы, байыркы Шумердеги (б.з.ч. 4000-ж.) падышалык казынаны жана салыктарды эсептөөчү каражаттар, Ассирия падышалыгынын документтерин камтыган Инктердин түйүндүү жазуусу - кипу, ж.б. эске түшөт. Бул ыкманын кемчилиги - «маалымат базасы» түшүнүгүнүн бүдөмүктөлүшү жана анын «архив», ал тургай «жазуу» түшүнүктөрү менен айкалышып кетишин эстен чыгарбоо керек.

Тар маанидеги маалымат базасынын тарыхы салтуу (заманбап) МБ түшүнүгүн карайт. Анын тарыхы 1955-жылы жазууларды иштетүүчү программалануучу жабдуу пайда болгондон башталат. Ал убактагы программалык камсыздоо файлдардын негизиндеги жазууларды иштетүү моделин колдонгон. Маалыматтарды сактоо үчүн перфокарталар пайдаланылган.

Оперативдүү тармактык маалымат базалары 1960-жылдардын ортосунда жаралган. Оперативдик маалымат базалары үстүндөгү операциялар интерактивдүү түрдө терминалдардын жардамы менен иштетилген. Жазуулардын жөнөйкөй индекстик-ырааттык уюшуулары тез эле топтомдорго багытталган жазуулардын кубаттуу моделине өсүп жеткен. Чарльз Ульям Бахман (Charles William Bachman) маалыматтарды баяндоо жана аларды башкаруучу стандарттык тилди ойлоп чыгарган Data Base Task Group (DBTG) ишине жетекчилик кылгандыгы үчүн Тьюринг сыйлыгына ээ болгон.

Ошол эле учурда Кобол маалымат базасында маалымат база схемасынын концепциясы жана көз каранды эмес маалыматтардын концепциясы жакшыртылган.

Кийинки маанилүү баскыч Эдгар Коддун (Edgar Frank Codd) жардамы менен 1970-жылдардын башында реляциондук маалыматтар моделинин чыгуусу менен байланыштуу. Эдгар Коддун иштери прикладдык маалымат база технологиясынын математика жана логика менен болгон тыгыз байланышына жол ачкан. Өзүнүн теория жана тажрыйба салымы үчүн Эдгар дагы Тьюринг сыйлыгына татыган.

Маалымат базасы термини 1960-жылдардын башында пайда болуп, SDC компаниясынын 1964 жана 1965-жылдардагы симпозиумдарында колдонууга киргизилген, ошентсе да, ал убакта бул термин жасалма интеллект системасынын контекстинде, тар мааниде түшүндүрүлгөн. Заманбап түшүнүктөгү термин кеңири пайдаланууга 1970-жылдары гана кирген.

Маалымат базасынын түрлөрү

Маалымат базасынын түрдүү критерийлер менен айырмаланган өтө көп түрлөрү бар. Мисалы, «Маалымат базасынын технология энциклопедиясында» базанын 50дөн ашык түрлөрү аныкталган.

Негизги классификациялар төмөндө берилет.

Маалымат модели боюнча классификация

Мисалдар:

Туруктуу сактоо чөйрөсү боюнча классификация

Мазмуну боюнча классификация

Мисалдар:

Бөлүштүрүлгөндүк деңгээли боюнча классификация

МБнын башка түрлөрү

Ири маалымат базалары

Ири маалымат базасы (англисче Very Large Database, VLDB, кыргызча өтө чоң маалымат базасы деген түшүнүк дагы колдонулат) — бул түзүлүштө физикалык түрдө сакталган өтө чоң көлөмдү ээлеген маалымат базасы. Термин маалымат базасынын максималдуу мүмкүн болгон көлөмдөрүн түшүндүрөт, жана алар физикалык маалыматты сактоо жана аны програмдык иштетүү технологиясынын акыркы жетишкендиктери менен аныкталат.

«Өтө чоң көлөм» түшүнүгүнүн сандык аныктамасы убакытта өзгөрүп турат. Мисалы, 1997-жылы дүйнөдөгү эң чоң тексттик маалымат базасынын көлөмү 7 терабайтка жетип Knight Ridder’s DIALOG аталышта болгон. 2001-жылы эң чоң көлөмдөгү маалымат базасы катары 10,5 терабайт болсо, 2003-жылы 25 терабайтты түзгөн. 2005-жылы дүйнөдөгү эң ири көлөмдөгү маалымат базасы катары көлөмү 100 терабайттык базалар эсептелинген. 2006-жылы болсо Google издөө машинасы 850 терабайттык базаны колдонгон.

2010-жылы ири маалымат базанын көлөмү жок дегенде петабайттар (1 петабайт 1000 терабайтка барабар, ал эми 1000 терабайт 1 млн гигабайтка барабар) менен эсептелиниши керек деп саналчу.

2011-жылы Фейсбук компаниясы 2 түйүндөн турган кластерде 21 петабайттык маалыматтарды сактаган, 2012-жылы 100 петабайт, ал эми 2014-жылы — 300 петабайтка жеткен.

2014-жылы кайчылаш баалоолор боюнча Google компаниясы өзүнүн серверлеринде 10—15 эксабайттык (1 эксабайт 1000 петабайтка барабар) маалыматтарга ээ болгон.

Кээ бир баалоолор боюнча 2025-жылы генетиктер 100 миллиондон 2 миллиардга чейин адамдардын геном маалыматтарына ээ болот деген имиштер бар, бул маалыматтарды сактоо үчүн 2ден 40 эксабайтка чейин көлөм зарыл болот.

Жалпысынан IDC компаниясынын баалоосу боюнча «санарип ааламдын» маалыматтарынын суммардык көлөмү ар эки жыл сайын 2 эсеге өсүп, 2020-жылы 44 зетабайтка (1 затебайт = 1000 эксабайт) чейин жетет.

VLDB өтө чоң маалымат базаларын сактоо жана иштетүү чөйрөсүндөгү изилдөөлөр дайыма теория менен тажрыйбанын мизинде десек болот. 1975-жылдан бери жыл сайын «өтө чоң маалымат базалары боюнча Эл аралык конференция» (International Conference on Very Large Data Base) өтүп турат. Көпчүлүк изилдөөлөр VLDB Endowment коммерциялык эмес уюмдун колдоосу менен өтүп, илимий иштердин, өтө чоң маалымат базалары жана өтмө чөйрөлөрдөгү маалымат алмашуу иштерин алга жылуусун камсыздап турат.

2020-10-19 743 Бул ким, ал эмне Жыргалбекова С. 2020-10-19