What is Data in Tamil | தரவு என்றால் என்ன?

உள்ளடக்கம்

  1. தரவு என்றால் என்ன?
  2. தரவு வாழ்க்கை வட்டம்.
  3. தரவு வகைப்படுத்தல்.
  4. தகவல் என்றால் என்ன?
  5. தகவலின் சிறப்பியல்புகள்.
  6. தகவலின் பொன்விதி.
  7. தரவு மற்றும் தகவல் (வேறுபாடுகள்).
  8. பெரிய தரவு பகுப்பாய்வு.

தரவு என்றால் என்ன?

இன்றைய நவீன உலகில் தரவு (Data) எனும் சொல்லானது அனைவருக்கும் பரிட்சையமான ஒன்றாகக் காணப்படுகின்றது. இது “Datum” எனும் இலத்தீன் மொழிச் சொல்லிலிருந்து தோன்றியதாகும். மேலும் இவை முறைவழியாக்கத்திற்கு உட்படுத்தப்படாத தரவுகளைக் குறிப்பதோடு ஆங்கிலத்தில் “Raw Facts” எனவும் அழைக்கபடுகின்றது. இதன்படி தரவுகளை பின்வருமாறு வரையறை செய்யலாம்.



தனித்தனியாக எடுத்து கருத்துக்கள் அளிக்கப்பட முடியாத எண்கள் (Numbers), சொற்கள் (Words), குறியீடுகள் (Symbols) மற்றும் வரைபுகள் (Charts) ஆகியன தரவு (Data) எனப்படும். தரவானது முறைமையொன்றில் முறைவழியாக்கம் செய்தல், தகவல்களை உருவாக்குதல் என்பவற்றிற்கு உள்ளீடாக வழங்கப்படுகின்ற மூல காரணியாகும். தரவானது தேவைக்கேற்ப ஒழுங்கமைக்க கூடிய இலக்கங்கள், சொற்கள், ஒலி மற்றும் உருக்கள் போன்றவற்றைக் கொண்டிருக்கும்.

தரவுகளுக்கான உதாரணங்கள் :-

  1. எழுத்துக்கள் (A, B, C, a, b, c, ...)
  2. இலக்கங்கள் (0, 1, 2, ...)
  3. குறியீடுகள் (+, -, *, /, =, >, <, ...)
  4. விசேட குறியீடுகள் ($, @, #, &, ...)
  5. கட்புல வடிவங்கள் (Image, Video)
  6. ஒலி (Sound)

குறிப்பு :- முறைவழிப்படுத்தப்படாத நிலையில் காணப்படுகின்ற அர்த்தமற்ற விடயங்களே தரவு (Data) எனப்படும்.

தரவுகளுக்கான மேலதிக உதாரணங்கள் :- வகுப்பில் ஒரு மாணவன் பெற்றுக் கொண்ட புள்ளிகள், முகப்பு (Label) இடப்படாத வரைபடம் (Chart), வீட்டு தொலைபேசி இலக்கத்தின் இறுதி நான்கு இலக்கங்கள், கொழும்பு நகரின் மழை வீழ்ச்சி.

தரவு வாழ்க்கை வட்டம்

ஓர் அலகுத் தரவானது (Unit of Data) உருவாக்கப்பட்டதிலிருந்து முற்று முழுதாக நீக்கும் வரைக்குமான தொடரியல் (Sequence) ரீதியான நிலைகள் தரவு வாழ்க்கை வட்டம் (Data Life Cycle) எனப்படும். தரவு வாழ்க்கை வட்டமானது.

  1. தரவு உருவாக்கம்.
  2. தரவு பராமரிப்பு.
  3. தரவு பயன்பாடு.
  4. தரவு வெளியிடுதல்.
  5. தரவு காப்பகப்படுத்தல்.
  6. தரவு நீக்கல்.

என்பவற்றை உள்ளடக்கியதாகும்.

தரவு உருவாக்கம் (Data Generation or Capture or Create) - விளக்கமுள்ள தகவல்ளை உருவாக்குவதற்கு தரவு, முறைமைக்கு உள்ளீடு செய்யப்படல் (Input) அல்லது தரவானது முறைமைக்குள்ளேயே உருவாக்கப்பட வேண்டும். இவ்வாறான தரவானது Data Entry மூலமாகவோ அல்லது உணரிகள் (Sensors) மூலமாகவோ பெறப்பட்டதாக இருக்கலாம்.

இதன் போது தரவு சேகரிப்பானது பிரதானமாக இரண்டு முறைகளில் நடைபெறுகின்றது. ஒன்று கை முறை தரவு சேகரிப்பு முறைமை உதாரணம் அவதானிப்பு, நேர்காணல், வினாக்கொத்து முறைகள். இரண்டு அரைத் தன்னியக்க மற்றும் தன்னியக்க தரவு சேகரிப்பு முறைமை உதாரணம் OMR, MICR, OCR.

தரவு பராமரிப்பு (Data Maintenance or Store) - இது தரவு உருவாக்கப் படிமுறையில் சேகரிக்கப்பட்ட தரவானது முறைவழியாக்கம் செய்யப்பட்டு தேவைக்கேற்ப உபயோகிக்கும் வகையில் மாற்றப்படும் செயன்முறையாகும்.

தரவு பயன்பாடு (Active Use) - இது தரவுப் பராமரிப்பின் போது முறைவழியாக்கம் செய்யப்பட்ட தரவானது ஒரு நிறுவனத்தின் நோக்கங்களையும் செயற்பாடுகளையும் நிறைவேற்றுவதற்கு உதவும் வகையில் பயன்படுத்தப்படும் செயன்முறையாகும்.

தரவு வெளியிடுதல் (Data Publication or Share) - இதன் போது குறித்த தரவானது நிறுவனத்திற்கு வெளியில் உள்ள சிலருக்கு கிடைக்கக் கூடிய வகையில் வெளியிடப்படுகின்றது அல்லது பகிரப்படுகின்றது. மேலும் தரவு வெளியிடுதல் நிலையானது தரவு வாழ்க்கை வட்டத்தின் ஒரு அங்கமாக இல்லாமலும் இருக்கலாம்.

தரவு காப்பகப்படுத்தல் (Data Archiving) - தரவுப் பயன்பாட்டின் போது எவ்வித பயன்பாடுகளும் அற்ற தரவுகள் தற்காலிகமாக நீக்கப்பட்டு பிற்காலத்தில் அவற்றின் தேவை கருதி தேக்கி வைக்கப்படுகின்றது இதுவே தரவு காப்பகப்படுத்தல் எனப்படும்.

தரவு நீக்கல் (Data Purging or Destroy or Delete) - தரவு காலாவதியானதும் இதற்கு மேல் தேவைப்படாது என கருதும் போது அதனை தரவுக் காப்பகத்திலிருந்து முழுமையாக நீக்கும் செயன்முறை தரவு நீக்கல் எனப்படும்.

குறிப்பு - தரவு புதிதாக உருவாக்கப்பட்டதிலிருந்து முற்று முழுதாக நீக்கும் வரைக்குமான தரவின் நிலைகள் தரவு வாழ்க்கை வட்டம் (Data Life Cycle) எனப்படும்.

தரவு வகைப்படுத்தல்

தரவானது எவ்வித அர்த்தமுமற்ற, முறை வழிப்படுத்தப்படாத ஒன்றாகக் காணப்பட்டாலும் அவற்றின் இயல்புகள், தன்மைகள் என்பவற்றினை அடிப்படையாகக் கொண்டு, அளவு சார் (Quantitative) மற்றும் பண்புசார் (Qualitative) தரவு என இரண்டு பிரிவுகளாக வகைப்படுத்தலாம்.

அளவு சார் தரவு (Quantitative Data) - அளவு சார் தரவு எண்சார்புடையதால் அதனை எண்ணுதல் (Counting) அல்லது அளத்தல் (Measuring) மூலம் பெற்றுக்கொள்ளலாம். எண்சார் தரவினை இலக்கங்கள் மூலம் காட்டக்கூடியதாக உள்ளதுடன் அவற்றை இலக்கமுறை வரிசைப் படுத்தல்களுக்கு (Sorting) அல்லது கணித செயற்பாடுகளுக்கு (Arithmetic Operation) உட்படுத்த முடியும். உதாரணம் :- உயரம், அகலம், நீளம், சுற்றளவு, பரப்பளவு, வெப்பம் மற்றும் ஈரப்பதன்.

அளவு சார் தரவானது தனியான தரவு (Discrete Data) மற்றும் தொடர்ச்சியான தரவு (Continuous Data) என இரண்டு வகைகளாக வகைப்படுத்தப்படுகின்றது.

தனியான தரவு (Discrete Data) - இத் தரவு வகையானது வெறுமனே ஒன்று, இரண்டு என எண்ணக்கூடிய (Counting) தரவுகளைக் குறிக்கின்றது. உதாரணம் :- மாணவர்களின் எண்ணிக்கை. குடும்ப உறுப்பினர்களின் எண்ணிக்கை. வீதியில் சென்ற பஸ் வண்டிகளின் எண்ணிக்கை.

தொடர்ச்சியான தரவு (Continuous Data) - இத் தரவு வகையானது எண்ண முடியாத, அளத்தளுடன் (Measuring) தொடர்பு பட்ட தரவுகளைக் குறிக்கின்றது. இதற்கான அளத்தல் அலகுகளாக மில்லிமீட்டர், சென்றிமீட்டார், மீட்டர் மற்றும் கிலோமீட்டர் என்பவற்றைக் குறிப்பிடலாம். உதாரணம் :- குமாரின் உயரம். பாதையின் நீளம் மற்றும் அகலம்.

பண்பு சார் தரவு (Qualitative Data) - பண்பு அடிப்படையிலான தரவானது எண்ணிக்கை அடிப்படையில் முன்வைக்கப்படாத, இயல்புகளை அடையாளம் காணத்தக்க தரவுகளாகும். இங்கு வடிவம், சத்தம், மற்றும் நிறங்கள் என்பன காணப்படும். உதாரணம் :- ஒரு நிறுவனத்தின் நன்மதிப்பு.

தகவல் என்றால் என்ன?

அர்த்தமுள்ள தகவலை உருவாக்குவதை நோக்கமாகக் கொண்ட முறைமையொன்றிற்கு வழங்கப்படும் உள்ளீடாக தரவு காணப்படுவதுடன், அர்த்தமுள்ள வகையில் ஒழுங்கமைக்கப்பட்ட தரவுகளே தகவல்கள் (Information) எனப்படும். தரவுகளை தகவல்களாக மாற்றும் செயற்பாடு தரவு முறைவழியாக்கம் (Data Processing) எனவும் அழைக்கப்படுகின்றது. குறித்த தரவினை முறைவழியாக்கம் செய்வதற்கு அறிவுறுத்தல்கள் (Instructions) அவசியமாகும். அறிவுறுத்தல்களுக்கு அமைய தரவு முறைவழியாக்கம் செய்யப்பட்ட பின் வருவிளைவாகப் (Output) பெறப்படுவதே தகவல் (Information) எனப்படும்.



முறைவழியாக்கத்தின் பின்னர் வருவிளைவாகப் பெறப்படுவது தகவலாக இருப்பினும், அதே தகவல் வேறொரு செயலுக்கு (Process) உட்படுத்தபடும் போது ஒரு தரவாகவே அமைகின்றது. எனவே, குறிப்பிட்ட செயலில் உள்ளீடாகவும் வருவிளைவாகவும் அமைவதை கூர்ந்து ஆராய்ந்து தரவும் தகவலும் தெளிவாக அடையாளம் காணப்பட வேண்டும்.

தகவல்களுக்கான உதாரணங்கள் - வகுப்பில் மாணவர்கள் பெற்ற உயர்ந்தபட்சப் புள்ளிகள், வகுப்பில் மாணவர்கள் பெற்ற சராசரிப் புள்ளிகள், இன்றைய வானிலை அறிக்கை, கண்டி நகரத்தில் இன்று பதிவாகிய சராசரி மழை வீழ்ச்சி, இலங்கையின் வருடாந்த தாய் சேய் இறப்பு வீதம்.

தகவலின் தேவைகள் மற்றும் முக்கியத்துவம் - இன்றைய சமூகத்திற்கு தகவல் என்பது மிகவும் முக்கியமான ஒன்றாகக் காணப்படுகின்றது. இது மனிதனுடைய பல்வேறு நோக்கங்களையும் தேவைகளையும் நிறைவேற்றுவதில் முக்கிய பங்கினை வகிக்கின்றது. அவற்றில் சிலவற்றை பின்வருமாறு பட்டியற்படுத்தலாம்

தீர்மானங்களை மேற்கொள்ளுதல் (Decision Making), கொள்கைகளை வகுத்தல் (Policy Making), போன்றவற்றிற்காக முகாமையாளர்கள் (Managers) மற்றும் கொள்கை வகுப்பாளர்கள் (Policy Makers) என்பவர்களினால் பயன்படுத்தக்கூடிய ஒன்றாகத் தகவல் காணப்படுகின்றது. இவர்கள் தகவல்களினை அடிப்படையாகக் கொண்டே இறுதி தீர்மானங்களை எடுத்தல், எதிர்காலத் திட்டமிடல்களை மேற்கொள்ளல், எதிர்வு கூறல்களை முன்வைத்தல் போன்றவாரான செயல்பாடுகளை மேற்கொள்கின்றனர். எனவே இதன் அடிப்படையில் தகவல் என்பது மிக முக்கியமான ஒரு பங்கினை வகிக்கின்றது.

தகவல் என்பது மனிதனுடைய அறிவுத்திறனில் தாக்கங்களை ஏற்படுத்துவதினால் இது மனிதனுடைய மனங்களிலும் அவனுடைய எண்ணங்களிலும் மற்றும் நடத்தைகளிலும் மாற்றத்தை ஏற்படுத்துகின்றது. தகவல் என்பது தரவுகளை முறை வழியாக்கத்திற்கு உட்படுத்தி தகவல்களை உருவாக்குவதன் மூலம் புதிய அறிவு உருவாக்கப்பட்டு மக்களுக்கு மத்தியில் பரப்பப்படுவதனால் உலகில் புதிய அறிவுத் திறன், புதிய கண்டுபிடிப்புகள், மற்றும் புதிய கோட்பாடுகள் என்பன உருவாகுவதற்கு வழி வகுக்கின்றது.

உதாரணம் - புதிய வகையான மருத்துவ உபகரணங்கள், கைத்தொழிற்சாலைகளுக்கு தேவையான புதிய தொழில்நுட்ப வசதிகளுடன் கூடிய இயந்திரங்கள் (ரோபோடிக் இயந்திரங்கள்), விவசாயத் துறையில் பயன்படுத்தப்படக் கூடிய புதிய தொழினுட்பங்களைக் கொண்ட கருவிகள்.

தகவலின் சிறப்பியல்புகள்

பெறுமதி வாய்ந்த தகவல்கள் அவற்றின் பொருத்தம், காலம், துல்லியம், முழுமை, மற்றும் விளங்கிக்கொள்ளக் கூடிய தன்மை போன்ற பண்புகளைக் கொண்டிருக்க வேண்டும். மேலும் இவைகள் மிகச் சரியான தீர்மானங்களை எடுப்பதற்கும் உதவுகின்றது.

பொருத்தம் தகவலின் பெறுமதியானது குறித்த நபருக்கு அதன் பொருத்தத்தில் தங்கியிருக்கும். உதாரணம்:- ஒருவருடைய உயர் கல்வித் தகைமைகளைக் காட்டத் தேவையான ஒரு சந்தர்ப்பத்தில் முதலாண்டிலிருந்து பெற்ற கல்வி விபரங்களை முன்வைத்தல் அவசியமன்று.

காலம் தகவல்கள் எப்போதும் தற்காலப்படுத்தப்படல் அல்லது இற்றைப் படுத்தப்பட்டிருத்தல் (Update) வேண்டும். இவ்வாறான தகவல்கள் காலத்திற்குப் பொருத்தமான தீர்மானங்களை மேற்கொள்ள உதவுகின்றது. உதாரணம்:- நேற்றைய வானிலை அறிக்கை தொடர்பான தகவல்கள் இன்றைய வானிலை பற்றி தீர்மானிக்க பொருத்தமற்றவையாகும்.

துல்லியம் சரியான தீர்மானங்களை எடுப்பதற்குத் துல்லியமான தகவல்கள் அவசியமாகும். உதாரணம்:- ஒரு நிறுவனத்தின் எதிர்காலப் போக்குகளை திட்டமிட தற்காலத் துல்லியமான தகவல்கள் அவசியமாகும்.

முழுமை தகவலானது எப்பொழுதும் முழுமையானதாக காணப்பட வேண்டும். முழுமை பெறாத தகவல்கள் தீர்மானங்களை மேற் கொள்ளவதற்குப் போதுமானதாக அமையாது.

விளங்கிக்கொள்ளக் கூடிய தன்மை தகவலானது தெளிவானதாகவும் குழப்பமற்றதாகவும் இருக்க வேண்டும்.

தகவலின் பொன்விதி

தகவலின் பொன் விதிக்கமைய (Golden Rule) தகவலின் பெறுமதி அதன் உருவாக்கத்தின் போது அல்லது வெளியீட்டின் போது உச்ச மட்டத்தில் இருப்பதையும் காலம் செல்லச் செல்ல அதன் பெறுமதி குறைந்து செல்வதையும் அவதானிக்கலாம். இதனை பின்வருமாறு வரைபடம் மூலம் காட்டலாம்.



தரவு மற்றும் தகவல் வேறுபாடுகள்

தரவு மற்றும் தகவல்களுக்கிடையிலான வேறுபாடுகளை பின்வருமாறு காட்டலாம் அவையாவன.

1. Data (தரவு) என்ற சொல்லானது ‘Datum’ எனும் சொல்லிலிருந்தும் Information (தகவல்) என்பது ‘Informare’ எனும் இலத்தீன் மொழிச் சொல்லிலிருந்தும் தோன்றியதாகும்.

2. முறைமைக்கு வழங்கப்படுகின்ற சகல உள்ளீடுகளும் (Input) தரவு எனப்படுவதுடன் வெளியீடுகள் (Output) தகவல் எனப்படும்.

3. தரவு என்பது முறைவழியாக்கம் (Process) செய்யப்படாததும் தகவல் முறைவழியாக்கம் செய்யப்பட்டதுமாகும்.

4. தரவானது பிட்ஸ் (Bits) மற்றும் பைட் (Byte) களிலே அளக்கப்படுகிறது ஆனால் தகவல் அர்த்தமுள்ள அலகுகளினால் அளக்கப்படுகிறது. (உதாரணம்:- Time. Quantity).

5. தரவுகளை அடிப்படையாகக் கொண்டு தீர்மானங்கள் மேற்கொள்ள முடியாது ஆனால் தகவல்களை கொண்டு தீர்மானம் மேற்கொள்ளலாம்.

6. தரவு என்பது சொற்கள் (Words), இலக்கங்களைக் (Numbers) கொண்டிருக்கலாம் ஆனால் தகவல் என்பது முறைவழியாக்கம் செய்யப்பட்ட தரவாகும்.

7. தரவு என்பது ஒரு போதும் தகவலில் தங்கியிருப்பதில்லை ஆனால் தகவல் தரவிலே தங்கியிருக்கும்.

8. தரவு என்பது அர்த்தமுள்ளதாக அல்லது இல்லாமலும் இருக்கலாம் ஆனால் தகவல் என்பது அர்த்தமுள்ளதாக இருக்க வேண்டும்.

பெரிய தரவுப் பகுப்பாய்வு

Big Data என்பதனை தமிழில் “அதிகப்படியான தகவல்கள்" எனலாம். அதிகப்படியான தகவல்களை சேகரித்து அதிலிருந்து தகவல்களை பிரித்தெடுத்து பின்னர் அவற்றை ஒருங்கிணைத்து அதிலிருந்து தேவையான புள்ளிவிவரத்தை பெறுவது தான் Big Data தொழில்நுட்பம் எனப்படும். Big Data வில் அதிகப்படியான விவரங்களை சேகரிப்பது (Data Collection), அதனை பாதுகாப்பாக சேமித்து வைப்பது (Storage and Security), அதிலிருந்து தகவல்களை பிரித்தெடுப்பது (Extract Info), மற்றும் இறுதி முடிவுகளை (Statistics) குறைந்த பிழையில் எடுப்பது சவாலான ஒரு விடயமாகும்.

தற்போது பல்வேறு துறைகளில் BIG DATA பயன்படுகிறது அவற்றுள் வங்கி, மருத்துவம், தொழிற்சாலைகள், அரசு, விற்பனை நிறுவனங்கள் மற்றும் கல்வி என்பன முக்கியமானவையாகும்.

குறிப்பு அதிகப்படியான தகவல்களை ஒருங்கிணைத்து எதிர்காலத்திற்கு தேவைப்படுகின்ற அல்லது நாம் தெரிந்துகொள்ள விளைகின்ற முடிவுகளை அறிந்துகொள்வதற்கான தொழில்நுட்பமே Big Data Analysis எனப்படும்.

அதிகப்படியான தரவுகளின் வகைகள்

  1. Structured
  2. Unstructured
  3. Semi-structured
Structured

எவ்வாறான தகவல்களைச் சேகரிக்க வேண்டும் என்பதனை திட்டமிட்டு தகவல்கள் சேகரிக்கப்படுவதனை Structured எனப்படும். உதாரணமாக ஒரு அலுவலகத்தில் வேலை செய்கின்ற நபரின் பெயர், வயது, பணி, சம்பளம் என்ற தகவலை சேமிப்பதனை Structured முறையில் மேற்கொள்ளப்படும் தகவல் சேமிப்பு முறை எனலாம்.

Unstructured

எவ்வித திட்டமிடல்களும் இன்றி கிடைக்கக்கூடிய தரவுகளை அவ்வாறே சேமிக்கின்ற செயல் முறையானது Unstructured எனலாம். உதாரணமாக ஒரு தகவலில் பெயர், வயது என்பனவும் மற்றொரு தகவலில் பெயர், பணி விவரம் என்பனவும் காணப்படும். இம்முறையில் தகவல்களை ஒருங்கிணைப்பது, அவற்றிலிருந்து ஒரு தகவலை பெறுவது என்பது மிகவும் சவாலானதொன்றாகும்.

Semi-structured

Structured மற்றும் Unstructured முறையிலான இரண்டு தகவல்களும் இதில் அடங்கி இருக்கும்.

அதிகப்படியான தரவுகளின் பண்புகள்

அதிகப் படியான தரவு 3 முக்கிய அம்சங்களை கொண்டிருக்கிறது. அவற்றினை 3V என வகைப்படுத்தலாம்.

  1. Variety (பல்வகைமை)
  2. Velocity (வேகம்)
  3. Volume (அளவு)

Variety – Structured, Unstructured, Semi-structured என மூன்று விதமான முறைகளிலும் சேகரிக்கப்பட்ட தகவல்களை இது கொண்டிருக்கும். முன்னர் தகவல்கள் spreadsheets அல்லது databases மூலமாக பெறப்பட்டது. ஆனால் தற்போது பல்வேறு விதமான முறைகளில் (emails, PDFs, photos, videos, audios, SM posts) தகவல்கள் திரட்டப்படுகின்றன.

Velocity – தகவல்கள் Update செய்யப்படும் வேகத்தினை குறிப்பது Velocity எனப்படும். தொடர்ச்சியாக தகவல்கள் Update செய்யப்படுமாயின் துல்லியமான தகவல்களைப் பெற முடியும்.

Volume – நாம் ஏற்கனவே அறிந்தது போன்று Big Data என்பது மிகப்பெரிய அளவிலான தகவல்களைக் குறிக்கின்றது. சமூக வலைத்தளங்கள், நிறுவனங்கள் மற்றும் நேரடியாக பெறப்படும் தகவல்கள் என பல வழிகளில் சேகரிக்கப்படுகின்றன.

அதிகப்படியான தரவுகளின் நன்மைகள்

1. முன்னரே சில விவரங்களை பெறுவதற்கும் கணிப்புகளை மேற்கொள்வதற்கும் BIG DATA பயன்படுகிறது.

2. பல நிறுவனங்கள் முன்கூட்டியே முடிவுகளை மேற்கொள்வதற்கும் புதிய நிறுவனங்கள் உருவாவதற்கும் BIG DATA என்பது உதவியாக இருக்கும்.

3. BIG DATA விலிருந்து பெறப்படும் முடிவுகள் விற்பனையை அதிகரிப்பதற்கும் உதவி புரிகின்றது.

4. BIG DATA விலிருந்து பெறப்படும் தகவல்களைக் கொண்டு பிற போட்டியாளர்களுக்கு முன்கூட்டியே முடிவுகளை எடுக்க முடியும்.


Post a Comment

0 Comments