முகப்பு விரிதரவு

அறிமுகம்

    மிழ்மொழியில் நல்லதொரு மென்பொருள் (software) உருவாக்கப்பட வேண்டும் என்ற எண்ணத்துடனும், தமிழைக் கணினியில் (computer) கொண்டு செல்ல வேண்டும் என்ற முயற்சிக்கு உறுதுணையாக நிற்கும் வகையிலும் மொழியியல் (linguistics) அடிப்படையிலான இலக்கணக்குறிப்புடன் கூடிய தமிழ் விரிதரவு (annotated corpus) தயாரிக்கும் பணி நடந்தேறி வருகிறது.

        இவ்விரிதரவுப் பணிக்காகத் தமிழ் இணையக்கல்விக் கழகம் தனது மின்நூலகத்திலுள்ள அனைத்து நூல்களின் சொற்களுக்கும் மொழியியல் அடிப்படையிலான இலக்கணக்குறிப்பை அளித்து வருகிறது. இவ்விரிதரவினை மாணவர்கள், ஆராய்ச்சியாளர்கள், தமிழுக்கான மென்பொருள் உருவாக்குவோர் எடுத்து கையாளும் வகையில் ஒரு பரந்துபட்டத் தேடுபொறி வசதியுடன் (Advanced search engine) த.இ.க. அமைத்துள்ளது. இது நான்கு வகையாகப் பிரிக்கப்பட்டுள்ளது. அவையாவன:

1. தமிழ் இலக்கியங்களுக்கான இலக்கணக்குறிப்பு
  Annotated corpus for Tamil literature
2. தொடரியல் மற்றும் பொருண்மையியல் விளக்கத்துடன் கூடிய விரிதரவு
  Syntactically and Semantically Annotated Tamil corpus
3. உச்சரிப்புடன் கூடிய மின் அகராதி
  An Electronic Dictionary with Pronunciation
4. வாய்மொழித்தரவு
  Speech Database

        இதுபோன்ற ஒரு விரிதரவு தமிழ்மொழியில் இதுநாள் வரை நடைபெறவில்லை என்பது இங்கு குறிப்பிடத்தக்கதாகும்.

தொடரியல் மற்றும் பொருண்மையியல் விளக்கத்துடன் கூடிய தமிழ் விரிதரவு

Syntactically and Semantically Annotated Tamil corpus

        இவ்விரிதரவு தொடரியல் (syntax) மற்றும் பொருண்மையியல் (semantics) என்ற இரும் பெரிய பிரிவாகப் பிரிக்கப்பட்டு அதற்கு ஏற்றாற்போல் தேடுதல் வசதி அமைக்கப்பட்டுள்ளது.



 1. எழுவாய் - பயனிலை (Subject - Predicate)
     
2. தொடர் (Phrases)
     
  1. பெயர்த் தொடர் (Noun phrase)
  2. சொல்லுருபுத் தொடர் (Postpositional phrase)
  3. பெயரடைத் தொடர் (Adjective phrase)
     
3. எச்சத்தொடர் (Clause)
     
  1. பெயரெச்சத் தொடர் (Adjectival clause)
  2. வினையெச்சத் தொடர் (Verbal participle clause)
  3. குறையெச்சத் தொடர் (Infinitive clause)
  4. நிபந்தனை எச்சத்தொடர் (Conditional clause)
     
I. பொருண்மையியல் (Semantics)
     
  1. உணர்பொருள் (Connotation)
  2. உவமை – உருவகம் (Simile – Metaphor)
  3. ஒருபொருள் பன்மொழி – எதிர்ச்சொல் (Synonym – Antonym)
  4. பலபொருள் ஒருசொல் (Polysemy)

1. தொடரியல் (Syntax)

        இத்தொடரியல் என்ற தலைப்பின் கீழ் ஒரு பத்தியிலோ அல்லது பாடலிலோ எங்கெங்கு எழுவாய் (subject) பயனிலை (predicate) வருகின்றன என்பதைத் தேடிப்பெறலாம்.

        எழுவாய் எவ்வாறு சுட்டிக்காட்டப்பட்டுள்ளது என்றால், ஒரு செயலைச் செய்தது யார், எது, எவை என்ற வினாவிற்கு விடையாக வருவது எழுவாய் எனச் சுட்டிக்காட்டப்பட்டுள்ளது.

எடுத்துக்காட்டு:

எழுவாய் (Subject)

வளி பதி11-1
நெஞ்சு பதி12-6

எடுத்துக்காட்டு:

பயனிலை (Predicate)

        பயனிலை என்பதற்கு ஒரு செயல் முடிவு பெற்றதாக விளக்கும் சொல்லை மட்டும் பயனிலையாகச் சுட்டிக்காட்டப்பட்டுள்ளது.  

ஆண்டோர் பதி.69-12
அல்லேன் பதி.74-23
வந்தனென் பதி.76-9

மேலும் ஒரு சொற்றொடரில் இன்னொரு சொற்றொடர் அமைந்து வரும்போது அதன் வினைகள் குறையெச்சம், வினையெச்சமாக அமைந்துவருகின்றன. அவைகள் முற்றுப் பெறாமல் வருவதால் இங்கு அவ்விலக்கணக்குறிப்புகள் பயனிலையாகக் கொள்ளவில்லை. ஆனால் அவைகள் குறையெச்சம், வினையெச்சமாகவே சுட்டிக்காட்டப்பட்டுள்ளன.

        தொடரியல் என்ற பகுதியில் எழுவாய், பயனிலையைத் தவிர தொடர்களான பெயர்த்தொடர், பெயரடைத்தொடர், சொல்லுருபுத்தொடர் போன்றவைகளும், எச்சத்தொடர்களான பெயரெச்சத்தொடர், வினையெச்சத்தொடர், குறையெச்சத்தொடர், நிபந்தனை எச்சத்தொடர்கள் போன்றவைகளும் அமைந்துள்ளன.

தொடர்

1 பெயர்த்தொடர். (Noun phrase)

        பெயர்த்தொடர் என்பது பெயரும் பெயரும் சேர்ந்து வருவது மட்டும் அல்ல. பெயர்த்தொடரில் பல்வேறுபட்ட இலக்கணக்குறிப்புகள் அடங்கியச் சொற்கள் அமைந்து வருகின்றன. பெயரைத் தலைச்சொல்லாகக் கொண்டு அமைந்தவை எல்லாம் பெயர்த்தொடராக எடுத்துக்கொள்ளலாம். அந்த வகையில் பெயரெச்சம், பெயரடை ஆகியவை அடையாக அமைந்து வருகிற தொடர்கள் எல்லாம் பெயர்த்தொடர்களே

எடுத்துக்காட்டு:

1. வளி
(பதி.11.2)  
பெ.
2. வான் பிசிர்  
பெ.அ. பெ.
3. துஞ்சும் கவரி  
பெ.எச் பெ.
4. தடிந்த பேர் இசை.
பெ.எச் பெ.அ. பெ.

        இத்தேடுதல் வசதியின் மூலம் பெயர்த்தொடர் என்று தேர்வு செய்து நூல் மற்றும் பாடல் எண்ணைத் தேர்வு செய்துத் தேடினால் எங்கெல்லாம் பெயர்த்தொடர்கள் வந்துள்ளன என்பதைப் பெறலாம்.

2. சொல்லுருபுத் தொடர் (Postpositional phrase)

        இதன் மூலம் சொல்லுருபுத் தொடரைத் தேடிப்பெறலாம். சொல்லுருபு என்றால் ஒரு சொற்றொடரில் பெயர்ச்சொல்லுக்கு வினைச்சொல்லோடு உள்ள பொருள் தொடர்பினைத் தனி ஒரு சொல்லாக நின்று விளக்கும் சொல் சொல்லுருபு எனலாம்.:

எடுத்துக்காட்டு:

வீடு வரை ஓடினான் என்றத் தொடரில் வரை என்றச் சொல் தனி ஒரு சொல்லாக நின்று விளக்குகிறது.

எருத்தம் மேல் (பதி. 11-19)

3. பெயரடைத் தொடர் (Adjective phrase)

        இத்தேடுதல் வசதி மூலம் பெயரடைத் தொடரைத் தேடிப் பெறலாம்.

        மிகவும் சின்னப் பெண். இத்தொடரில் பெண் என்றப் பெயர்ச்சொல் சின்ன என்றப் பெயரைடயோடுச் சேர்த்து கூறப்பட்டுள்ளது. மேலும் மிகவும் என்ற அடையைச் சின்ன என்றப் பெயரடைக்கு அடையாகச் சேர்த்துக் கூறுவதால் பெண் என்றப் பெயர்ச்சொல்லை விடச் சின்ன என்ற அடைக்கு முக்கியத்துவம் கிடைக்கிறது. இவ்வாறு பெயரடைக்கு அடைக்கு அடையாக வந்துப் பெயரடையை விவரிப்பதால் பெயரடைத் தொடர் ஆகிறது.

எடுத்துக்காட்டு:

நன் பெரும் பரப்பின் (பதி 17.12).


எச்சத்தொடர் (Clause)

        இவ்வெச்சத்தொடர் என்ற தலைப்பின் கீழ் இயங்கும் தேடுபொறியில் பெயரெச்சத்தொடர், வினையெச்சத்தொடர், குறையெச்சத்தொடர், நிபந்தனை யெச்சத்தொடர் ஆகிய நான்கு வகை எச்சத்தொடர்கள் அறிமுகப்படுத்தப்பட்டுள்ளன.

1. பெயரெச்சத்தொடர் (Adjectival clause)

        இதன் மூலம் பெயரெச்சத்தொடர்களைத் தேடிப்பெறலாம்.

        பெயரெச்சத் தொடர் (Adjective clause) என்பது பெயர்த்தொடரின் (Noun phrase) தலைப்பெயருக்கு (Head name) ஒரு நிரப்பியமாக (Complement) வருவது.

        நேற்று வந்த பையன்

என்னும் சொற்றொடரில் 'பையன்' என்ற சொல் தலைப்பெயராக அமைகிறது. இத்தலைப்பெயருக்கு நேற்று வந்த என்ற தொடர் பெயரெச்சத்தொடராகிறது.

எடுத்துக்காட்டு:

நிறம் திறந்த (பதி 11.8)

2. வினையெச்சத்தொடர் (Verbal participle clause)

        இத்தேடுதல் வசதி மூலம் வினையெச்சத்தொடரைத் தேடிப்பெறலாம்.

        தமிழில் இரு சமநிலை (co-ordination) சொற்றொடர்களை இணைப்பதற்கு ஒரு தனிப்பட்ட இணைப்புச்சொல் (conjunction) ஆங்கில மொழியில் 'and' (co-ordinate conjunction) என்று உள்ளது போல் அமையவில்லை.

1. குமார் வீட்டுக்கு வந்தான்
2. குமார் என்னைக் கூப்பிட்டான்

இவ்விரு சமநிலை சொற்றொடர்களை இணைக்க முதல் சொற்றொடரிலுள்ள வினைமுற்று 'வந்தான்' என்பது 'வந்து' என்று வினையெச்சமாகத் திரிந்து அடுத்து வரும் சொற்றொடரில் உள்ள வினைமுற்றை 'கூப்பிட்டான்' வினைமுற்றாகவே கொள்கிறது.

        குமார் வீட்டுக்கு வந்து என்னைக் கூப்பிட்டான் இத்தொடரில் 'வீட்டுக்கு வந்து' என்ற வினையெச்சத்தொடர் இணைப்பு நிரப்பியமாக (complement) அமைகிறது.

எடுத்துக்காட்டு:

         அவனைத் தேடிப் பார்

1. வளி பாய்ந்து (பதி 11.2)
2. நிறம் பெயர்ந்து (பதி 11.9)

3. குறையெச்சத்தொடர் (Infinitive clause)

        இத்தேடுதல் வசதியின் மூலம் குறையெச்சத் தொடரைத் தேடிப் பெற முடியும்.

        குறையெச்சம் என்பது காலம் காட்டாமல் வரும் வினைச்சொல்லாகும். அவ்வாறு வரும் வினைச்சொல் அகர ஈற்றில் முடியும்.

        'படி' என்னும் வினைச்சொல் குறையெச்சமாக திரிய படிக்க என்ற அகர ஈற்றுடன் முடிகிறது. இதனை குறையெச்சம் என்பர்.

எடுத்துக்காட்டு:

படிக்க

இக்குறையெச்சமானது முழுமையானத் தொடராக முடிய வேறொரு வினைச்சொல்லை எதிர்கொண்டிருக்கும்.

படிக்கப் போ

இத்தொடரில் 'படிக்க' என்பது குறையெச்சத் தொடராகிறது.

எடுத்துக்காட்டு:

படிக்க
புத்தகத்தைப் படிக்க

எதிர்கொண்டு வரும் வினைச்சொல்லுக்கு ஒரு நிரப்பியமாக (complement) அமைந்து வருவது குறையெச்சத் தொடராகும்.

எடுத்துக்காட்டு:

1. வான் பிசிர் உடைய (பதி 11.1)
2. வயவர் வீழ (பதி 12.1)

4. நிபந்தனை எச்சத்தொடர் (Conditional clause)

        இதன் மூலம் நிபந்தனை எச்சத்தொடர்களைத் தேடிக் கண்டறியலாம்.

         நிபந்தனையெச்சம் என்பது முக்கியமான தொடருக்கு இணைப்பு நிரப்பியமாக (complement) அமைகிறது.

        'குமார் வந்தால், நான் வருவேன்' என்ற சொற்றொடரில் 'நான் வருவேன்' என்ற முக்கியமான தொடருக்கு வந்தால் என்ற முடிவுறா வினையாக (non-finite verb) வந்து இணைப்பு நிரப்பியமாகிறது. இத்தொடரில் குமார் வந்தால் என்பது நிபந்தனையெச்சத் தொடராகிறது.

எடுத்துக்காட்டு:

1. எயில் கருதின் (பதி 33.11)
2. மெய் காணின் (பதி 53.16)

2. பொருண்மையியல் (Semantics)

        இப்பெரும் பகுதியின் கீழ் 1. உணர்பொருள், 2. உவமை-உருவகம், 3. ஒருபொருள் பன்மொழி – எதிர்ச்சொல், 4. பலபொருள் ஒருசொல் போன்ற தேடுதல் வசதிகள் அமைந்துள்ளன.

1. உணர்பொருள் (Connotation)

        பொருண்மையிலுள்ள உணர்பொருள் என்பதைத் தேர்வு செய்து நூல், பாடல் எண் இவைகளைத் தேர்வு செய்தால் உணர்பொருள் எங்கெல்லாம் இடம்பெற்றிருக்கின்றது என்பதைத் தேடிப்பெறமுடியும்.

        ஒரு சொல்லை இருவகையாகப் சொல்வது தமிழில் வழக்கம். ஒன்று நேர்பொருளாக சொல்வது மற்றொன்று உணர்ச்சியாகச் சொல்வது. உணர்பொருள் என்பது, 'தண்ணீர், நீர்' என்ற சொற்கள் நேர்பொருளைத் (denotation) தருகின்றன. அச்சொல்லை சில நேரங்களில் 'அமிழ்து, அமிர்தம்' என்று உணர்ச்சியாகக் கூறுவதும் உண்டு. அவ்வாறு கூறும் சொல்லைக் கேட்கும் போது கிடைப்பதற்கு அரிதானது போல் உணரமுடிகிறது. இதுவே உணர்பொருளாகும்.

எடுத்துக்காட்டு

1. மழலை (பதி 15.25)
2. அமிழ்து (பதி 17.11)

உவமை – உருவகம் (Simile – Metaphor)

        இத்தேடுதல் வசதி மூலம் எங்கெல்லாம் உவமை மற்றும் உருவகம் வருகின்றன என்பதைத் தேடிப்பெறலாம்.

         உவமை என்றால் ஒரு பொருளை மற்றொரு பொருள் ஒத்திருப்பதைக் காட்டுவது உவமை ஆகும். மதி போன்ற முகத்தை மதிமுகம் என்பர்.

எடுத்துக்காட்டு:

வரை மருள் புணரி (பதி 11.1)

        உருவகம் என்றால் உவமானத்தையும் (மதி) உவமேயத்தையும் (முகம்) வேறுபடுத்தாது இரண்டும் ஒன்றே என ஒற்றுறமைப்படுத்திக் காட்டுவதே உருவகம்.

எடுத்துக்காட்டு:

முகமதி
பாதமலர்
தமிழ்த்தேன்

3. ஒருபொருள் பன்மொழி – எதிர்ச்சொல் (Synonym – Antonym)

        இத்தேடுபொறி மூலம் ஒருபொருள் பலவிதமான சொற்களால் அழைக்கப்படுவதைத் கண்டறியலாம். எடுத்துக்காட்டாக மலை என்ற பொருளுக்கு என்னென்ன சொற்கள் உள்ளன என்பதைத் தேடிப்பெற முடியும். அதோடுமட்டுமல்லாமல் அச்சொற்களுக்கான இலக்கணக்குறிப்பையும் தேடிக் கண்டறியலாம்.

எடுத்துக்காட்டு:

பொருள்: மலை

  சொல் இலக்கணக்குறிப்பு எதிர்ச்சொல் குறி எதிர்ச்சொல்
1. வரை
பெ
அ.வ.
மடு
2. சிலம்பு
பெ
அ.வ.
மடு
3. கோடு
பெ
அ.வ.
மடு
4. மலை
பெ
எதிர்.சொ.
மடு
5. குன்று
பெ
அ.வ.
மடு
6. கல்
பெ
அ.வ.
மடு
7. விண்டு
பெ
அ.வ.
மடு

இங்கு எதிர்ச்சொல் மூன்று விதமாகப் பிரித்துக் கையாளப்பட்டிருக்கின்றது.

         1. நேரடி எதிர்ச்சொல் (direct antonym) (எதிர்.சொ.) என்றால் ஒரு சொல்லுக்கு நேரடியான எதிர்ப் பொருளைத் தருவது. மலை என்றச் சொல்லுக்கு மடு என்பதை எதிர்ச்சொல்லாக கொள்ளலாம்.

         2. அயல்வழி எதிர்ச்சொல் (indirect via antonym) (அ.வ.) என்பது, ஒரு சொல் வேறொரு சொல்லாக மாறி வந்தால் அச்சொல் அயல்வழிச் சொல் என்று கருதி அதற்கான எதிர்ச்சொல்லைக் கூறுவது. மலை என்றச் சொல் வரை என்று அயல்வழியாக வருவதால் அதற்கு எதிர்ச்சொல் மடு எனக் கூறலாம்.

3. பிற (others) (பிற.) சிறிய – பெரிய
    மெதுவாக – வேகமாக
    மெதுவான - கடினமான

போன்றச் சொற்களைப் பிற என இங்கு கொள்கிறோம்.

4. பலபொருள் ஒருசொல் (Polysemy)

        இங்கு ஒரு சொல்லுக்கு எத்தனைப் பொருள்கள் இருக்கின்றன என்பதைத் சுலபமாகத் தேடிப்பெறலாம். அதோடுமட்டுமல்லாமல் அப்பொருளுக்கானச் சொற்கள் எந்தெந்த வகை இலக்கணக்குறிப்பைச் சார்ந்தவை என்பதையும் தேடிக் கண்டறியலாம்.

        கண் என்ற சொல்லுக்கு

1. இடம் – பெ.
2. விளைநிலம் – பெ.
3. அன்பு – பெ.
4. கூறு – பெ.

மேல்