Sunday, May 3, 2020

8 පාඩම - දත්ත සමුදාය නිර්වචනය හා දත්ත සමුදාය අකෘති


දත්ත සමුදාය නිර්වචනය

දත්ත  සමුදායක් යනු කිසියම් විෂය ක්ෂෂේත්‍ර යට  අදාලව පවතින එකි‍නෙකට සබදකමක් දක්වන දත්ත සමුහයක එකතුවකි දත්ත  සමුදායක් තුල වෙන් වෙන්ව පවතින වගු ගණනාවක් ඇත.

දත්ත සමුදාය භාවිතා කරන අවස්ථාවන්

§ පාසලක සිසු තොරතුරු හා ගුරු තොරතුරු පවත්වා ගැනීම
§ පුස්තකාලයක පොත් පත් පිළිබද තොරතුරු තබා ගැනීම
§ චිත්‍රපට  හෝ ගීත එකතුවක් පිළිබද තොරතුරු තබා ගැනීමට
§ ආයතනයක ගනුදෙනු ,සේවකයින් සහ අනෙකුත් තොරතුරු පිළිබද විස්තර තබා ගැනීම

දත්ත ගොණුව(Data Base)

එකිනෙකට අන්තර් සම්බන්ධතාවයක් සහිත දත්ත වල එකතුවත්  දත්ත පාදකයක්   ලෙස හැදින්වේ.(A data base is a collection of related data)

දත්ත සමුදාය ආකෘති

  පළමු යුගය (1st Generation)
Ø  පැතලි ගොනු ආකෘතිය / ඒක ගොනු පද්ධතීන් (Flat File Model)
Ø  ධූරාවලි ආකෘතිය (Hierarchical Model)
Ø  ජාල ආකෘතිය (Network Model)
 දෙවන යුගය (2nd Generation)
Ø  සම්බන්ධක ආකෘතිය (Relational Model)
  තෙවන යුගය (3rd Generation)
Ø  Object Oriented Model 
Ø  වස්තු සම්බන්ධක ආකෘතිය (Object Relational Model)
Ø  XML දත්ත සමුදාය පද්ධති

ඒක ගොණු පද්ධතිය. (Flat file system)
  මුල්ම යුගයේ පරිගණක වල දත්ත ගබඩා කර තබාගැනීමට යොදාගත් ක්‍රමයයි. මෙහිදී සිදුවූයේ පරිගණකයෙන් සකස් කළ ගොනුවක සියළුම දත්ත යතුරුලියනය කර තිබීමයි. සෑම පේලියක්ම එක්  රෙකෝඩයක් ලෙස හැදින්වීය. එම රෙකෝඩයේ සඳහන් කර තිබූ දත්ත එකිනෙකට වෙන්වූයේ කොමාවලින් හෝ හිස් අවකාශ මගිනි.

   මෙහිදී සම්පූර්ණ දත්ත පාදකයේ තොරතුරු එක් වගුවක ගබඩා කරයි.

සරලතම දත්ත පාදක පද්ධතීය (database system) ලෙස ඒක ගොණු පද්ධතීන් (flat file system) හැදින්විය හැකියි. මෙහි දී දත්ත සමුදාය (database) සඳහා තනි වගුවක් (table) පමණක් භාවිත කරයි. අප එදිනෙදා භාවිතා කරන Libre Calc, Microsoft Excel වැනි පැතුරුම්පත් මෘදුකාංග (spreadsheet software) හා පෙළ සංස්කාරක (text editors) වල මෙබදු ගොණු පද්ධති දක්වන්නට හැක


  • දත්ත ඇතුලත් කිරීමට වැඩිකාලයක් ගතවීම
  • එකම දත්ත නැවත නැවත ලියවීම.(දත්ත සමතිරික්ත තාවය)
  • දත්ත සංශෝධනය කිරීමේ අපහසුතා
  • දත්ත විමසීමේ අපහසුතා
  • එක් දත්තයක් පමනක් තනිව හදුනා ගැනීමට නොහැකිවීම
  • මෙම දත්ත ගොණුවල  ආරක්ෂාව අවමවේ.
1960 දශකයේ මද භාගයේ දී භාවිතා කිරීමට ආරම්භකළ මෙම දත්ත ගොනු ආකෘතීන් මෙහෙයුම් පද්ධතියේ අවශ්‍යය දත්ත රදවා ගැනීමට සදහාද භාවිතා කරනු ලැබේ.

ධූරාවලි  ආකෘතිය. (Hierrchical)
ධූරාවලි ආකෘති යනු ගසක අතු බෙදී යන ආකාරයට (tree structure) සැදුනු ආකෘතින් ය. මෙහිදී ප්‍රධානතම කාරණය/සාධකය වන්නෙ, මාපිය(ජනක) ධාරක සම්බන්ධයක් (parent-child relationship) තිබීම ය. එනම්, ජනකයාට එක් දරුවෙක් හෝ කිහිප දෙනෙකු සිටිය හැක. දරුවෙක් නොමැති වීමට ද හැක. නමුත් දරුවෙකුට සිටිය හැක්කේ එක් ජනකයෙකු පමණි. ගසක අතු බෙදී යන ආකාරයට සම්බන්ධ කිරිමෙන් ඔබට මෙම ආකෘතිය මනාව අවබෝධ කර ගත හැක. මෙම සම්බන්ධය ඒක බහු සම්බන්ධයක් (one-to-many relationship) ලෙස ද හදුන්වයි.


                    

ගසක අතු බෙදී යන ආකාරයට සංවිධානය වී ඇති දත්ත පාදක ව්‍යූහය මගින් දත්ත පාදක කළමනාකරණයේ දී පහත ආකාරයට වාසි , අවාසි හදුනා ගත හැකිය.
වාසි
1.වඩාත් සරලව දත්ත පාදක නිර්මාණය කරහැකිය.
2.දත්ත අතර අන්තර් සම්බන්ධතාවයක් ඇත.
3.අදාල දත්ත ස්වායක්තව ක්‍රියාත්මක වේ.
4.ආරක්ෂකව ක්‍රමවේදයන් විදිමත්වීම. (දත්ත පාදකයේ)
අවාසි
1.ගොඩනැගීම සංකීර්ණ වීම.
2.පරිශීලකයන්ට අදාල දත්ත හැසිරවීම සංකීර්ණබවක් ගනී.
3.අදාළ ව්‍යුහය සදහා සම්මත ආකෘතීන් නොමැති වීම.
4.සීමාවන් පැවතිය හැකි වීම.

ජාල ආකෘතිය (Net work model)

ජාල ආකෘතිය, ධූරාවලි ආකෘතියෙන් තවත් ඉදිරියට ගෙන ආ ආකෘතියකි. ධූරාවලි ආකෘතියේ එක් දරුවෙකුට සිටින්නෙ එක් දෙමාපියෙක් පමණක් වුවත් ජාල ආකෘතියේ එක් දරුවෙකුට දෙමාපියෙකු හො වැඩි ගණනක් සිටිය හැක. මෙනිසා ධූරාවලි ආකෘතිය, ජාල ආකෘතියේ උප කුලකයක් ලෙස ද හැදින්විය හැකි අතර ජාල ආකෘති වල වැඩි ගණනකට වැඩි ගණනක (many to many) සම්බන්ධතා ඇතිවෙ.  ජාල ආකෘතියෙන් සම්බන්ධතා නැවත නැවත යෙදීමෙන් වන දත්ත නැවත නැවත යෙදීම වැලකෙන අතර වඩා සංකීර්ණ දත්ත ගොනු නිර්මාණය කිරීමට හැකියාව ලැබේ.


 


වාසි
  • පහසුවෙන් සිතා ගැනීමෙ හැකියාව.
  • දත්ත පරිශීලනයේ පහසුව.
  • විවිද සම්බන්ධතා පාවිච්චි කිරීමෙ හැකියාව.
  • නිරවැරදි බව / සම්පූර්ණ බව වැඩි වීම.
අවාසි
  • වෙනස් කිරීමට ඇති අපහසුව.
  • ඉතා සංකීර්ණ වීම.

සම්බන්ධක ආකෘතිය (Relational Model)

සම්බන්ධක ආකෘතියක් සම්බන්ධතා කිහිපයක එකතුවකින් සෑදී තිබේ. එක් එක් සම්බන්ධතාවය දත්ත සමුදායක නිරූපණය වන්නේ වගුවක් මාර්ගයෙනි. සම්බන්ධතාවයක ලක්ෂණ වගුවේ තීරු මගින් නිරූපණය වේ (වගුව: සේවකයා | ලක්ෂණ: නම, ක්‍රියාංශය, ලිපිනය, … ). වගුවෙහි පේලි මගින් සම්බන්ධතාවයේ දත්ත නිරූපණය වේ. මෙහිදී යතුරු වර්ග දෙකක් භාවිත වේ. එවා:

 


  • ප්‍රාථමික යතුර (Primary Key) – එක් එක් පේලි වල අනන්‍ය බව ඇති කිරීම. මේ මගින් පහසුවෙන් පේලියක ඇති දත්ත ලබාගැනීම කලහැක.
  • ආගන්තුක යතුර (Foreign Key)- මෙය වෙනත් වගුවක ප්‍රාථමික යතුරක් වේ. මෙමගින් වගු දෙකක් අතර සම්බන්ධතාවය ගොඩනැගීම සිදුකරයි.
 ඉහත රූපයේ පරිදි අපට එක් වගුවකින් විෂයන් පිළිබඳවත් ( වගුව: විෂය | ලක්ෂණ: නම, කාල_පරිච්ඡෙද_ගණන ) තවත් වගුවකින් ගුරුවරයින් පිළිබඳවත් ( වගුව: ගුරුවරයා | නම, උගන්වන_විෂය, ලිපිනය ) නිරූපණය කල හැක. මෙහිදී විෂය වගුවේ ප්‍රාථමික යතුර, ගුරුවරයා වගුවේ උගන්වන_විෂය වෙනුවට ආගන්තුක යතුර ලෙස රැගෙනවිත් තිබේ. එමගින් වගු දෙක අතර සම්බන්ධය ගොඩනැගීම සිදුවේ ( සම්බන්ධය: උගන්වයි ). සම්බන්ධක රූප සටහන් ඇඳීමෙදී  සැලකිලිමත් විය යුතු කරුණු ගණනාවක් ඇති  අතර, පිළිබඳව ඉදිරියේ දී බලාපොරොත්තු වන්න.
වාසි
  • වගු නිසා භාවිතය පහසු වීම.
  • දත්ත විවිධ  ගණිත සංකල්ප යොදා ගනිමින් හැසිරවීමේ හැකියාව. (Join, Intersect, Union, Difference, Product and Project)
  • දත්ත වලට වැඩි ආරක්ෂාවක් ලබා දිය හැකි වීම.
අවාසි
  • දෘඩාංග වල වැඩි ක්‍රියාකාරිත්වයක් අවැසි වීම.
  • දත්ත පිළිබද වැටහීමක් ධූරාවලි ආකෘතියකින් මෙන් බැලූ බැල්මට නොලැබීම.

වස්තු සම්බන්ධක ආකෘතිය (Object Relational Model)


මෙයද සාමාන්‍ය සම්බන්ධක ආකෘතියට බොහෝ සෙයින් සමාන වේ. මෙය විස්තෘත සම්බන්ධක ආකෘතිය ලෙසද හැඳින්වේ. නමුත් මෙහිදී දත්ත සමුදාය කළමනාකරණය සඳහා පයිතන් (Python), ජාවා (Java), C++ වැනි වස්තු නැඹුරු භාෂාවක් භාවිතා කරයි. මුල් ආකෘති වලට ජය ගැනීමට නොහැකි වූ පරිගණක ආශ්‍රිත නිර්මාණකරණය (Computer Aided Drawing), භූගෝලීය තොරතුරු පද්ධති (Geographic Information Systems) බහු මාධ්‍ය ආචයන පද්ධති (Multi Media Storage System) වැනි අංශ ජය ගැනීමට මෙම ආකෘතියට හැකි විය.
 


No comments:

Post a Comment

Thank You..