Thursday, June 23, 2011


கணினிவழித் தமிழ்மொழியாய்வில் பொருள் மயக்கம்
Ambiguities in Computer Assisted Tamil Language Processing
முன்னுரை
கணினியில் தமிழ்மொழியின் பயன்பாடு பெருகியுள்ளது. தமிழ்மொழியின் வளர்ச்சிக்குக் கணினியின் பங்களிப்பு தவிர்க்கமுடியாத ஒன்றாகிவிட்டது. மொழி ஆய்வுக் கருவியாகக் கணினியைப் பயன்படுத்திவருகிற நிலையில் தமிழ்மொழித் தரவுகளை அதற்கு ஓர் ஒழுங்கமைவுடன் கற்றுத்தரவேண்டியுள்ளது. அதாவது கணித அடிப்படையில் மொழியில் உள்ள மொழியியல் கூறுகளைக் கணினிக்கு ஏற்ற வகையில் மாற்றித்தரவேண்டியுள்ளது. இத்தகைய வழிமுறைகளைக் கொடுப்பதே கணினி மொழியியல் என்பதாகும். மொழி செயல்படுவதில் உள்ள ஒழுங்குமுறையின் தொகுப்புதான் இலக்கணம். இத்தகைய ஒழுங்குமுறை நவீன, தொழில்நுட்ப வளர்ச்சிகளினாலும் மொழி உலகமயமாக்கச் சூழலினாலும் சிதைந்தும் மாறுபட்டும் வருகிறது. மொழியை இத்தகைய சிதைவுகளிலிருந்து  மீட்டெடுக்க மொழியியல் கூறுகளை முறையாகக் கற்று, பயன்படுத்தவேண்டிய கட்டாயம் ஏற்பட்டுள்ளது.
பொருள் மயக்கம் தமிழ்மொழிப் பயன்பாட்டில் உருவாக்குகின்ற நிலைப்பாடுகளையும், கணினிவழி ஆய்வு செய்யும்போது ஏற்படுகிற மொழியமைப்புச் சிக்கல்களையும், அவற்றைத் தவிர்ப்பதற்கான வழிமுறைகளையும், மொழியியல் கூறும் வகைப்பாட்டு நெறிமுறைகளையும் எடுத்துக்கூறுவதாக  இக் கட்டுரை அமைகிறது.
இயற்கைமொழியாய்வு; கணினிமொழியியல்; மொழித்தொழில்நுட்பம்:
தமிழ்மொழியின் இயல்புகளைத் தெளிவாக அறிந்துகொள்ள ஒலியனியல், உருபனியல், தொடரியல் மற்றும் பொருண்மையியல் போன்ற மொழியியல் அறிவு இன்றியமையாதன.
மனித மூளையைப் போன்று கணினியையும் இயற்கைமொழி அறிவைப் பெறவைத்து, மொழித் தொடர்களைப் புரிந்துகொள்ளவும், உருவாக்கவும், செய்யவைக்கும் முயற்சியே இயற்கை மொழியாய்வு(Natural Language Processing). இத்தகைய இயற்கைமொழியாய்வை மேற்கொள்ள உருவாக்கப்படுகிற வழிமுறைகளும் முறைப்படுத்தலுமே கணினி மொழியியல் (Computational Linguistics). கணினிமொழியியலின் துணையோடு மொழிக்குத் தேவையான மின்னணு மொழிக் கருவிகளை உருவாக்க உதவும் நுட்பமே மொழித்தொழில்நுட்பம்(Language Technology). இவை மூன்றும்தான் தமிழ் மென்பொருள்களை உருவாக்குவதற்கு மேற்கொள்ளப்படுகிற படிமுறை வளர்ச்சிப் பணிகள்.
கணினித்தமிழ் வளர்ச்சி என்பது தமிழ்த் தொடர்களைப் புரிந்துகொள்ளவும்(Understanding), அவற்றை உருவாக்கவும்(Generate) தேவையான தமிழ்மொழி அறிவைக் கணினிக்கு அளிப்பதற்காக நாம் மேற்கொள்ளவேண்டிய பணிகளைக் குறிக்கிறது. தமிழ்த் தரவுகளைக் கணினி புரிந்துகொள்ளும் வகையில் கொடுப்பதற்கு மொழியியல் விதிகளும் கோட்பாடுகளும் துணைபுரிகின்றன. கணினிமொழியியல் கோட்பாடுகளைக்கொண்டு மொழியின் அமைப்பை, இலக்கணத்தைக் கணினிக்கேற்ற வகையில் நிரலிகளாக(Programs), மின்னணு இலக்கணமாக மாற்றிக் கொடுத்து, தமிழ்மொழியின் தேவையை நிறைவுசெய்ய வேண்டும். இவ்வாறு தமிழ்மொழியின் அமைப்பை ஒழுங்கமைவுடன், விதிகளாக மாற்றும்போது தமிழ்மொழியின் தற்கால எழுத்து வழக்கில் பல்வேறு முறைகள் பயன்படுத்தப்படுவதால் சொற்களைப் பிரிக்கும்போதும்(Parsing) வரிசைப்படுத்தும்போதும் (Sorting) பல்வேறு மொழிப் பயன்பாட்டுச் சிக்கல்கள் எழுகின்றன. இத்தகைய மொழிப் பயன்பாட்டுச் சிக்கல்களில் ஒன்றுதான் பொருள் மயக்கம்(Word Sense Ambiguity).
தமிழில் சந்திப் பிழைதிருத்தி(Sandhi Checker), உருபனியல் பகுப்பாய்வி(Morphological Parser), தொடரியல் பகுப்பாய்வி(Syntactic Parser), அடைவி(Indexing)(சொல்லடைவு, தொடரடைவு, பொருளடைவு), தானியங்கி பேச்சு அறிவான்(Automatic Speech Recognizer-ASR), இயந்திர மொழிபெயர்ப்பு(Machine Translation) ஆகிய மொழியாய்வு மென்பொருள் கருவிகளை உருவாக்குவதில் இத்தகைய பொருள் மயக்கம் இடையூறாக அமைகின்றன. இவற்றைச் சரிசெய்ய, பொருள் மயக்கச் சொல்லகராதியை உருவாக்கவேண்டியது அவசியம்.
பொருள் மயக்கம் - விளக்கம்
‘Word Sense Ambiguity’ என்னும் ஆங்கிலச் சொல் தமிழில் தெளிவின்மை, குழப்பம், கருத்துமயக்கம், பொருள்மயக்கம், இருபொருள்படுநிலை, தெளிவற்ற நிலை எனப் பல்வேறு நிலைகளில் பொருள்கொள்ளப்படுகின்றது. எனினும், கணினிமொழியியலில் பொருள் மயக்கம் என்றே கையாளப்படுகின்றது. இத்தகைய பொருள் மயக்கங்களைக் களைவதைக் கணினிமொழியியலில் ‘Word Sense Disambiguation(WSD)என்று கூறுவர்.
ஒரு தொடர் தன் அமைப்பில் வெளித்தோற்றத்திலும் உள்தோற்றத்திலும் வெவ்வேறு பொருள்தருகிறது. இத்தகைய பொருண்மை மாறுபாடு ஏற்படுவதற்குரிய சில சொற்களும் சில சூழ்நிலைகளும் இங்கு நோக்கப்படுகின்றன. தமிழ் மரபிலக்கணத்தில் ஒருசொல் குறித்த பல பொருள், பல பொருள் குறித்த ஒருசொல் என்ற வகைப்பாடும் காணப்படுகிறது. அகராதி நிலையில் ஒரு சொல்லுக்குப் பல பொருள்கள் இருக்கலாம். ஆனால், இவற்றிலிருந்து பொருள் மயக்கம் என்பது மாறுபட்டது.
பொருள் மயக்கம் ஏற்படுவதற்கான நிலைப்பாடுகள்
தமிழ்மொழித் தரவுகள் உலகளாவிய பொதுமொழியின் தன்மைகளைக் கொண்டிருப்பதோடு தமக்கெனச் சில தனித்தன்மைகளைக் கொண்டிருக்கின்றன. வழக்கிழந்த கூறுகளும் புத்தாக்கங்களும் தமிழில் காலங்காலமாக நிகழ்ந்துகொண்டுள்ளன. சாதி, தொழில், வட்டாரம் போன்றவை சார்ந்த வழக்குகளும், துறைசார்ந்த வழக்குகளும் பேச்சு, எழுத்து என்னும் நிலைப்பாடுகளும் தமிழ்மொழித் தரவினைக் கணினியின் ஏற்புத்திறனுக்கு ஏற்றாற்போல் ஒருமைப்படுத்துவதற்கும் பொதுவிதிகளை உருவாக்குவதற்கும் இடையூறுகளாக அமைகின்றன
சொற்களின் இலக்கண வகைப்பாட்டை நாம் நுண்மையான இலக்கண அறிவு(Grammatical Knowledge) மற்றும் உலகியல் அறிவின்(Pragmatic Knowledge) துணையோடு அறிகிறோம். ஆனால் அவற்றைக் கணினிக்குக் கற்றுத்தருவதில் பல்வேறு மொழியமைப்புச் சிக்கல்கள் எழுகின்றன. அவற்றைச் சரிசெய்வதற்கு உருபனியல், தொடரியல் பகுப்பாய்வுகள் துணைபுரிகின்றன. ஒரு தொடரில் ஒன்றுக்கு மேற்பட்ட அமைப்புகள் காணப்படலாம். அதாவது குறிப்பிட்ட தொடரில்  இடம்பெறும் சொற்கள் தங்களுக்குள் வெவ்வேறு வகையில் இணையலாம். அப்போது பொருள் மயக்கம் ஏற்படுகிறது.
ஆங்கிலத்தில் ஒலிபெயர்த்து(Transliterate) எழுதும்போது முறைப்படுத்தப்பட்ட ஒலிக்குறிப்பு எழுத்துக்களைப் பயன்படுத்தவேண்டும். ஆனால் குறில், நெடில், ,,, ,ர போன்ற எழுத்துக்கள் வேறுபாடுகளின்றிப் பயன்படுத்தப்படுவதால் பொருள் குழப்பமும் அவற்றை உச்சரிக்கும்போது தெளிவில்லாத சூழ்நிலையும் காணப்படுகிறதுஎடுத்துக்காட்டாக, பாடம் என்று எழுதுவதைப் ‘padam’ என்று எழுதினால் படம் என்று படிப்பதற்கும் வாய்ப்பிருக்கிறது. எனவே மக்களின் பெயர், ஊர்ப்பெயர், முகவரி, பொருள்களின் பெயர் போன்றவற்றைத் தவறாக உச்சரிக்கிற நிலை ஏற்படுகிறது. எனவே, இவற்றை ஓர் ஒழுங்குமுறைக்குக் கொண்டுவரவேண்டும்.
பொருள் வேறுபாட்டிற்கு வேற்றுமை உருபுகளும், சந்தி மாற்றங்களும், ,,, ,ர வேறுபாடுகளும் முக்கியப் பங்காற்றுகின்றன. மேலும் சாரியைகள், இரட்டித்தல் போன்றவையும் துணைசெய்கின்றன.
பாடல்களைப் படிக்கும்போது எளிமையாகப் புரிந்துகொள்ளவேண்டுமென்னும் நோக்கில் சொற்களைப் பிரிப்பதாலும் உரைநடை எழுதும்போது பொருள் மயங்குவது தெரியாமல் சொற்களைப் பிரிப்பதாலும் பொருள் மயங்குகிறது. பொருள் மயக்கம் ஏற்படாதவாறு பிரிக்கவேண்டும் என்பதைக் கவனத்தில்கொள்ளவேண்டியது அவசியம். பொருள் உணரும் திறன் குறைந்த இக் காலத்தில் பாடல்களில் எல்லாச் சொற்களையும் பிரித்தே எழுதுதல் வேண்டும், எளிமைப்படுத்தவேண்டும், சாதாரணப் பேச்சுவழக்கில் இருக்கவேண்டும் என்பது போன்ற தன்மைகள் கடைபிடிக்கப்படுகின்றன. மேலும், எழுத்துநடையில் மற்றவர்களிடமிருந்து தங்களை வேறுபடுத்தவேண்டும் என்பதற்காகவும் இத்தகைய நிலை இருக்கின்றது.
1. தனிச்சொற்களால் ஏற்படுகிற பொருள்மயக்கம்
சில தனிச் சொற்கள் தொடர்களில் பயன்படுத்தும்போது இருவேறு பொருள்களைத் தந்து நிற்கின்றன. தமிழில் தனித்த சில சொற்களைத் தொடர்களில் பயன்படுத்தும்போது அவை தோற்றத்தில் ஒன்றுபோலவும் பொருளில் இருவேறு நிலைகளிலும் காணப்படுகின்றது. ஒரு தொடரில் வேலை என்ற சொல் காணப்படுகிறது. அது வேலையைக் குறிக்கிறதா? அல்லது வேல் என்னும் ஆயுதத்தைக் குறிக்கிறதா? என்ற மயக்கம் ஏற்படுகிறது. தொடர் நிலையில் அதற்கு அடுத்து அல்லது அதற்கு முன் அமைந்த சொல்லை வைத்தே, இந்தச் சொல் இதைத்தான் குறிக்கிறது என்று அறியமுடிகிறது. நான் வேலை வாங்கினேன்.
          [அவரை - அவர் + ஐ அவரைச் செடி],  [வருட - வருடம், தலையை வருட],
          [காலை - கால் + ஐ காலைப்பொழுது],  [பாத்திரம் - கதாப்பாத்திரம், சமையல்பாத்திரம்]
          [ஆறு - ஆறு(River) எண்(Number)],  [எண்ண - எண்ணம்(Thinking) எண்ண(Counting)]
மேற்குறித்த சில சொற்களுடன் இரண்டாம் வேற்றுமை உருபு வந்துள்ளதா அல்லது தனிச்சொல்தானா என்ற குழப்பமே இந்தப் பொருள்மயக்கத்திற்குரிய காரணமாகும். இத்தகைய குழப்பமின்றி வேறுபடுத்துவதற்குச் சில இடங்களில் ‘இன்’ சாரியை பயன்படுத்தப்படுகிறது.
          காது + = காதை => காது + இன் + = காதினை
          காடு + = காடை => காடு + ட்(இன்) + = காட்டை, காட்டினை
2. தொடரமைப்பு நிலையில் ஏற்படுகிற பொருள் மயக்கம்
ஒரு தொடர் அமைப்பில் எல்லாச் சொற்களும் சரியான பொருளையே தந்துநின்றாலும் அவை பொருள்கொள்ளும் முறையில் மயக்கம் ஏற்படுகின்றன. முட்டாள் குமரனின் மனைவிஎன்னும் தொடரில் முட்டாள் என்பது குமரனுக்குப் பெயரடையாக வருகிறதா அல்லது அவன் மனைவிக்குப் பெயரடையாக வருகிறதா என்கிற குழப்பம் ஏற்படுகிறது. இத்தகைய நிலையில் வேற்றுமை உருபு மறைந்து வருவதாலும் முட்டாள் என்பதற்கு அடுத்து, காற்புள்ளி இட்டு எழுதாததாலும் இத்தகைய குழப்பம் ஏற்படுகிறது. இதனை அமைப்புப் பொருள் மயக்கம்(Structural Ambiguity) என்று மொழியியல் அறிஞர்கள் கூறுவர். தொடரின் புறநிலையிலும் அகநிலையிலும் மாறுபடாமல் குழப்பமின்றி இருந்தாலும் அவை எடுத்துக்கொள்ளும் முறையிலும் சூழல் தரும் பொருளிலும் வேறுபடுகின்றன.
3. சொற்களைப் பிரித்தும் சேர்த்தும் எழுதுகின்ற நிலையில் ஏற்படுகிற பொருள் மயக்கம்
தமிழில் வேர்ச்சொல்லுடன் பல்வேறுபட்ட ஒட்டுகள் இணைகின்றன. அவ்வாறு இணையும்போது அவற்றுக்குள்ளேயே ஓர் இயைபு விதி உருவாகின்றது. இவ்வாறு சொற்களுடன் ஒட்டுகளை இணைக்கும்போது சொற்களைப் பிரித்தும் சேர்த்தும் எழுதுகின்ற வழக்கம் காணப்படுகின்றது.
தமிழில் மொழியியல் விதிப்படி தனித்து நின்று பொருள்தராத துணைவினைகள்(Auxiliary Verb), ஒட்டுகள்(Affixes) மிதவை ஒட்டுகள்(Clitic)  போன்றவற்றைப் பிரித்து எழுதக்கூடாது என்பதை மீறுவது  பொருள் மயக்கத்திற்கு முக்கியக் காரணமாகும்.
பொதுவாக ஒரு சொல்லைப் பிரித்தோ சேர்த்தோ எழுதும்போது கூறவந்த கருத்தின் அடிப்படையே மாறுகின்ற நிலை ஏற்படுகிறது. எடுத்துக்காட்டாக, அவனுடனே என்று சேர்த்து எழுதினால் with him என்று பொருள்படும். அவன் உடனே என்று பிரித்து எழுதினால் he at once என்று பொருள்படும். எனவே மிகக் கவனத்தோடு இடமறிந்து பொருள்மயக்கம் ஏற்படாதவாறு சேர்த்தோ பிரித்தோ எழுதவேண்டும். பல்கலைக்கழகம், தொழில்நுட்பம் போன்ற சில கலைச்சொற்களையும் பிரித்து எழுதுதல் கூடாது. இதுபோல மொழிப் பயன்பாட்டு விதிகளை முறையாகப் பயன்படுத்தினால் கணினிவழி மொழியாய்வுக்கும் பொருள் மயக்கமின்றி வாசிப்பதற்கும் பயன்தரும்.
v  துணைவினைகள்
விடு(வந்துவிடு, போய்விடு, படித்துவிடு, தூங்கிவிடு). படு(பாடுபடு, வேதனைப்படு, ஆசைப்படு). இரு(பார்த்துக்கொண்டிரு, படித்துக்கொண்டிரு). இடுசேர்த்திடு, காட்டிடு, பார்த்திடு). கொண்டு(தெரிந்துகொண்டு, பார்த்துக்கொண்டிரு). கொள்ள (பார்த்துக்கொள்ள, பேசிக்கொள்ள, அறிந்துகொள்ள). விட்டு, விட்டது(பார்த்துவிட்டு, பேசிவிட்டு, பார்த்துவிட்டது, போய்விட்டது). பட்டு, பட்டது(அறியப்பட்டு, விளக்கப்பட்டு, கூறப்பட்டது, சேர்க்கப்பட்டது). வேண்டும்(பார்க்கவேண்டும், செல்லவேண்டும், எழுதவேண்டும்). உள்ளது(தெரியவந்துள்ளது, பாடப்பட்டுள்ளது).
கொள், உண், ஆம், போடு, வரு, தரு, உள் இதுபோன்ற ஐம்பதுக்கும் மேற்பட்ட துணைவினைகள் எழுத்து வழக்கிலும் பேச்சு வழக்கிலும் காணப்படுகின்றன. ஒரு தொடரில் ஒன்றுக்கு மேற்பட்ட துணைவினைகளும் இணைந்து வரும்.
          அவர்கள் படித்துவிட்டுச் சென்றனர்.         அவர்கள் படித்து விட்டுச் சென்றனர்.
பிரித்து எழுதியதால் இவ்விரு தொடர்களுக்கிடையே பொருள் வேறுபாடு தெளிவாகத் தெரிகிறது.
v  மிதவை ஒட்டு
          தான்   - அதைத்தான், அவன்தான், அப்போதுதான், அதனால்தான்.
v  பின்னொட்டு
கீழ், மேல் - துறையின்கீழ், தலைமேல். வழி - கணினிவழி, அதன்வழி.
விட - அவனைவிட, பேசியதைவிட.
v  வினை விகுதி
போது  - சொன்னபோது, பார்த்தபோது. படி - அதன்படி, சொன்னபடி.
v  பொதுநிலை
கண் - அதன்கண். காலம் - இடைக்காலம், சங்ககாலம்.
வர - சென்றுவர, நடந்துவர.
உருபனியலும் பொருள்மயக்கமும்
ஒரு சொல் ஓர் உருபன் கொண்டதாகவோ அல்லது அதற்கு மேற்பட்ட உருபன்களாகவோ இருக்கலாம். பல்வேறு உருபன்களால் உருவான சொற்களைக் கணினிவழிப் பகுப்பாய்வு செய்வது ‘உருபனியல் பகுப்பாய்வு’ என்பதாகும். இதற்காக உருபனியல் பகுப்பாய்விகள்(Morphological Parsers) உருவாக்கப்பட்டுவருகின்றன. இவ்வாறு உருவாக்கும்போது பொருள்மயக்கச் சொற்களின் சிக்கல்கள் நோக்கத்தக்கதாக உள்ளன.
இயந்திர மொழிபெயர்ப்பில்(Machine Translation) கணினிமொழியியல் விதியான இருநிலை உருபனியல்(Two Level Morphology) என்ற மொழித்தன்மைகுறித்து ஆராய்வர். ஒரு தொடரில் அடிநிலை(Deep Structure), புறநிலை(Surface Structure) ஆகிய இரண்டும் காணப்படும். இவற்றுள் புறநிலையில் எந்தவித மாறுபாடும் ஏற்படுவதில்லை. ஆனால், பொருள் மயக்கச் சொற்கள் வரும்போது அகநிலையில் குழப்பம் ஏற்படுகிறது.
தமிழில் காணப்படும் தொடர்களில் வேர்ச்சொற்கள் தனித்தும் விகுதிகளேற்றும் காணப்படுகின்றன. தனித்த சொற்களைக் கண்டறிவதற்கு அகராதிகளைப் பயன்படுத்தலாம். மற்றவற்றை உள்ளீடு செய்து ஆய்வுசெய்தே பகுத்தறிய முடியும். வேர்ச்சொற்களையும் ஒட்டுகளையும் பகுத்து, பொருள் மயக்கமின்றி வகைப்படுத்துவதற்கு உருபனியல் பகுப்பாய்வு அவசியமாகிறது.
மொழியியல் வகைப்பாட்டில் பொருள்மயக்கம்
மொழியியல் அடிப்படையில் பொருள் மயக்கத்தை, ஒலியனியல்(Phonology), உருபனியல்(Morphology), தொடரியல்(Syntax), சொற்பொருண்மையியல்(Semantics), கருத்தாடல்(Discourse) ஆகிய நிலைகளில் வகைப்படுத்தலாம்.
ஒலியனியல்(சந்தி) நிலையில், வேலை செய்தான்’, வேலைச் செய்தான் என்பவற்றில் முதலாவது வேலை பணியைக் குறிக்கிறது, இரண்டாவது வேலை கருவியைக் குறிக்கிறது. உருபனியல் நிலையில், நான் கத்தி விற்றேன் என்ற தொடரில் கத்தி என்ற பெயரைக் குறிக்கிறதா அல்லது வினையைக் குறிக்கிறதா என்பதில் குழப்பம் ஏற்படுகிறது. தொடரியல் நிலையில், நான் இராமனோடு சீதையைப் பார்த்தேன்என்ற தொடரில் இரண்டு வகையாகப் பொருள்கொள்ளலாம். நானும் இராமனும் சீதையைப் பார்த்தோம் என்றும் நான் இராமனும் சீதையும் சேர்ந்திருக்கும்போது பார்த்தேன் என்றும் பொருள்படுகிறது. சொற்பொருண்மை நிலையில்,  பச்சைக் காய்கறி’, ‘பச்சைப் பொய்’, ‘பச்சை உடம்பு ஆகிய தொடர்களில் பச்சை என்ற சொல் மூன்று வேறுபட்ட பொருள்களைக் குறித்து நிற்கிறது. மூன்றில் எந்தப் பொருளை எடுத்துக்கொள்வது என்பது அதன் அடுத்த சொல்லைப் பொறுத்தது. கருத்தாடல் நிலையில், ஏற்படுகிற பொருள் மயக்கத்தைக் கணினிக்குக் கற்றுத்தரமுடியாது. அவற்றை உலகியல் அறிவின்(Pragmatic Knowledge) வாயிலாகவே உணர முடியும்.
மேற்குறித்த பொருள் மயக்கங்களைத் தீர்த்துவைக்கக்கூடிய அறிவை - வழிமுறைகளை எவ்வாறு கணினிக்கு அளிப்பது குறித்து, பல்வேறு நிலைகளில் ஆராயப்பெறுகின்றன
பொருள் மயக்கத்தைத் தவிர்ப்பதற்குரிய பொதுவான சில வழிமுறைகள்
கணினிவழித் தமிழ்த் தொடர்களை ஆய்வு செய்யும்போது ஏற்படுகிற பொருள் மயக்கத்தை நீக்கிப் பொருளைத் தெளிவாகப் புரிந்துகொள்வதற்கு உருபொலியனியல் மாற்றங்கள் துணைபுரிகின்றன. பொருள் மயக்கத்தை இலக்கண வகைப்பாட்டின் வாயிலாகவே தெளிவுபடுத்த முடியும். பெயர், வினை அடிப்படையில் உருவாகும் சொற்களாக உருபனியல், தொடரியல் பகுப்பாய்வுகளைக் கொண்டு அடிச்சொல், விகுதிகள் ஆகியவற்றைப் பகுத்துத்தான் இவற்றைச் சரிசெய்ய முடியும்.
அவன் நெய்தான் விற்றான் என்ற தொடரில், அவன் நெய்யைத்தான்(நெய்+தான்) விற்றான் என்று வேற்றுமை மறைந்துநின்று பொருள்தருகிறதா? அல்லது அவன் துணியை நெய்தான் (நெய்+த்+த்+ஆன்) பிறகு விற்றான் என்ற பொருள்படுகிறதா? என்ற ஐயம் ஏற்படுகிறது. இத்தகைய நிலையில் தொடரியல் ஆய்வின் அடிப்படையிலேயே தெளிவுபெற முடியும்.
அடிச்சொல்லால் ஏற்படுகிற பொருள்மயக்கத்தை விகுதிகளைக்கொண்டு தெளிவுபெறலாம். விகுதிகளால் ஏற்படுகிற பொருள் மயக்கத்திற்கு அடிச்சொல்லைக்கொண்டு தெளிவுபெறலாம். எடுத்துக்காட்டாக, ‘படித்தான் என்ற சொல்லில் படி என்பது பெயராக வரும்போது படிதான் என்றும் வினையாக வரும்போது படித்தான் என்றும் வரும் என்பதனை அடிச்சொல் வாயிலாகப் பெறமுடிகிறது.ஆல்என்னும் விகுதிஅவனால் நான் வந்தேன்என்னும் தொடரில் பெயருக்குப் பின் வந்ததால் வேற்றுமை விகுதி என்றும், வந்தால் நான் வருவேன் என்னும் தொடரில் வினைக்குப் பிறகு வந்ததால் ஆல் என்பது நிபந்தனை விகுதி என்றும் பகுத்துக் கண்டறியமுடிகிறது.
இருஎன்ற சொல் இருவேறு பொருள்தருகின்றன. அவற்றை இடப்பொருள் அடிப்படையிலேயே சேர்த்தோ பிரித்தோ எழுதமுடியும். விட்டிசைப்பிற்காகவும், வகைப்படுத்துவதற்காகவும், பொருள் தெளிவிற்காகவும் காற்புள்ளி,இட்டு எழுதுவது கட்டாயமாகிறது. இதுபோன்ற பல்வேறு மொழிப் பயன்பாட்டு நெறிகள் தமிழ்மொழி இலக்கணங்களிலும் மொழியியல் விதிகளிலும் காணக்கிடைக்கின்றன.
நிறைவாக
பொருள் மயக்கத்திற்கான அடைப்படைக் காரணங்கள், பொருள் மயக்கம் ஏற்படுவதற்குரிய நிலைப்பாடுகளை மூன்றாகப் பகுத்தும் மொழியியல் வகைப்பாட்டிலும் தகுந்த எடுத்துக்காட்டுகளுடன் ஆராயப்பெற்றன. மேலும், பொருள் மயக்கத்தைத் தவிர்ப்பதற்குரிய பொதுவான சில வழிமுறைகள், கணினிவழித் தமிழாய்வு செய்யும்போது ஏற்படுகிற சிக்கல்களும் ஆராயப்பெற்றன. ஒரு தொடரை எழுதும்போது பெயர், வினை, துணைவினை போன்ற அடிப்படை வேறுபாடுகளை அறிந்து, பயன்படுத்தினால் பல்வேறு மொழிப் பயன்பாட்டுச் சிக்கல்கள் சரிசெய்யப்படும். அனைவரும் ஒரேவிதமான மொழிப் பயன்பாட்டுக்கொள்கையைப் பயன்படுத்துவதன்வழி, கணினிவழி மொழியாய்வு செய்வதற்கு எளிமையாக இருக்கும். இதுபோன்ற பல்வேறு மொழியமைப்புக் கூறுகளை முறைப்படுத்தவேண்டிய கட்டாயம் ஏற்பட்டுள்ளது என்பதை இக் கட்டுரை சுட்டிக்காட்டுகிறது.

தேர்ந்தெடுக்கப்பட்ட துணைநூற்பட்டியல்
1.     முனைவர் ச. அகத்தியலிங்கம், தமிழ்மொழி அமைப்பியல், மெய்யப்பன் தமிழாய்வகம், சிதம்பரம்.
2.     டாக்டர் பொற்கோ, (2006), இக்காலத் தமிழ் இலக்கணம், பூம்பொழில் வெளியீடு, சென்னை.
3.     எம்.. நுஃமான், (2007), அடிப்படைத் தமிழ் இலக்கணம், அடையாளம், திருச்சி.
4.     பேரா. கலாநிதி அ. சண்முகதாஸ், (2008), தமிழ்மொழி இலக்கண இயல்புகள், நியூ செஞ்சுரி புக்ஹவுஸ்.
5.     முனைவர் செ. வை. சண்முகம், (2004), தொல்காப்பியத் தொடரியல், உலகத்தமிழாராய்ச்சி நிறுவனம்.
6.     முனைவர் அ. தாமோதரன், துணைவினைகள், ஆய்வுக் கட்டுரை.
7.     தமிழ் இணையம் 2010, மாநாட்டுக் கட்டுரைகள்.
8.    Dr. M. Suseela, (2001), A Historical Study of Old Tamil Syntax, Tamil University.
9.    Thomas Lehman, (1993), A Grammar of Modern Tamil, Pondichery Institute of Linguistics and Culture.


1 comment:

  1. வணக்கம். அருமையான கட்டுரை.. அடியேன் உள்நாட்டு நாவல்களில் பொருண்மையியல் என்ற தலைப்பில் ஆய்வு செய்கிறேன். உங்களுடைய இக்கட்டுரை கூடுதல் விளக்கம் தந்துள்ளது....நன்றி நண்பரே...

    ReplyDelete