Sunday, December 30, 2012

பயனர் நோக்கில் ‘மென்தமிழ்’ தமிழ்ச்சொல்லாளர்

‘MenTamizh’ Tamil Wordprocessor - A Critical Study from the
end-user Perspective
 

     தமிழ்மொழியைக் கணினியில் பயன்படுத்துவதற்குத் தற்போது எழுத்துருக்கள், விசைப்பலகைகள், எழுத்துரு மாற்றிகள் போன்ற தனித்தனி மென்பொருள்கள் கிடைக்கின்றன. ஆங்கில மொழியைக் கணினியில் பிழையறப் பயன்படுத்துவதற்கும் பதிப்பிப்பதற்கும் உதவும் மைக்ரோசாஃப்ட் வேர்டு(Microsoft Word) எனும் சொற்செயலி அல்லது சொல்லாளர்(Wordprocessor) என்றழைக்கப்படும் ஒரு முழுமையான தொகுப்பு மென்மத்தைப் போன்று தமிழுக்கும் சொற்பிழை திருத்தி, சந்திப்பிழை திருத்தி, இலக்கணப்பிழை திருத்தி போன்ற வசதிகள் கொண்ட முழுமையான மென்பொருளைத் தமிழுக்கு உருவாக்குவதற்குப் பத்தாண்டுகளுக்கும் மேலாகப் பலராலும் முயற்சிகள் மேற்கொள்ளப்பட்டுவருகின்றன.
 தமிழ்மொழியமைப்பைக் கண்டறிவதிலும் கண்டறிந்த அமைப்பைக் கணினித் தொழில்நுட்பத்திற்கேற்ற வகையில் மாற்றிக் கொடுப்பதிலும் மொழியிலும் தொழில்நுட்பத்திலும் பொருளாதாரத்திலும் பல்வேறு நிலைகளில் சிக்கல்கள் எழுகின்றன. இத்தகைய நிலையில் தமிழ் இலக்கணம் (Tamil Grammar), கணினிமொழியியல்(Computational Linguistics), மொழித்தொழில்நுட்பம் (Language Technology) ஆகிய துறைகளின் அடிப்படையில் மென்தமிழ் (MenTamizh) எனும் தமிழ்ச் சொல்லாளர்(Tamil Wordprocessor) மென்பொருளை NDS Lingsoft Solutions Pvt. Ltd. எனும் நிறுவனத்தின் சார்பாகப் பேராசிரியர் முனைவர் ந. தெய்வசுந்தரம் அவர்கள் உருவாக்கியுள்ளார்.இதன் மூன்றாம் பதிப்பு  2012 ஆம் ஆண்டு ஆகஸ்ட் மாதம் புதுப்பொலிவுடன் வெளிவந்துள்ளது. இதனை SRM பல்கலைக்கழகத்தின் தமிழ்ப்பேராயக் கணினித்தமிழ்க் கல்வித்துறை மக்கள் பயன்பாட்டிற்காக வழங்கிவருகிறது.
    தமிழ்த் தட்டச்சு விசைப்பலகைகள்(Tamil Keyboards), ஒருங்குறி எழுத்துருக்கள்(Unicode Fonts), குறியேற்ற மாற்றி(Encoding Converter) சொற்பிழை திருத்தி(Spell Checker), சந்திப்பிழை திருத்தி(Sandhi Checker), தமிழ்ச்சொல் சுட்டி (Tamil Word Suggester), அகராதிகள்(Dictionaries), அகரவரிசைப்படுத்தம் (Sorting), சொல்லடைவு (Indexing), துணைநூற்பட்டியல் கருவி (Bibliography), எண்<->எழுத்து மாற்றி(Number to Word Converter) போன்ற கணினியில் தமிழைத் தவறில்லாமல் பயன்படுத்துவதற்கு உதவும் பலவகையான தமிழ்மொழிப் பயன்பாட்டுக் கருவிகள் கொண்ட தொகுப்பு மென்பொருளாக மைக்ரோசாஃப்ட் வோர்டு 2010 எனும் சொல்லாளருடன் ஒப்புநோக்கிப் பார்க்கத் தகுந்த அளவுக்கு சிறப்புறத் திகழ்கிறது.
          இந்த மென்தமிழ் மென்பொருளானது கணினியில் தமிழைப் பிழையறப் பயன்படுத்துவதற்கு எந்தெந்த வகைகளில் பயனர் நோக்கில் பயன்படுகின்றன என்பவற்றையும் இதன் சிறப்பியல்புகள், செயல்திறன், திறன் எல்லை போன்றவற்றையும் இந்த மென்பொருள் இன்னும் எந்தெந்த வகைகளில் கூடுதல் வசதிகளுடன் சிறப்புடையதாக மேம்படுத்தப்படவேண்டும் என்பதையும் குறிப்பிடுவதாக இந்தக் கட்டுரை அமைகிறது.                  
          விண்டோஸ் இயங்குதளங்களில்(எக்ஸ்பி – விண்டோஸ்8) 32 Bit, 64 Bit ஆகிய இரண்டிலும் செயல்படுகிறது. எம்.எஸ்.ஆபிஸ் வோர்டு 2010 எனும் மென்பொருளைப் போன்று காணப்படுவதால் இந்த மென்பொருளைப் பயன்படுத்துவதற்காக எந்தப் பயிற்சியும் தேவைப்படுவதில்லை. எளிமையாக இதனைக் கையாளமுடிகிறது.
 விசைப்பலகைகள்
          தமிழ்நெட்99(TamilNet99), பழைய தட்டச்சு(Old Typewriter), தமிழ் ஒலிபெயர்ப்பு(Tamil Phonetics) பாமினி(Bamini), மாடுயுலர்(Modular), அஞ்சல்(Anjal), தமிழ்நெட்99 எம்.ஓ.இ(TamilNet99MOU), இன்ஸ்கிரிப்ட்(Inscript)  மலேசியன் ஒலிபெயர்ப்பு(Malaysian Phonetics) சிங்கப்பூர் தமிழ்(Singapore Tamil), ரோமன் தமிழ்(Roman Tamil) விசைப்பலகை எனப் பல முறைகளில் தட்டச்சு செய்வதற்குரிய  விசைப்பலகைகள் உள்ளன. இதனால் எந்த முறையிலும் தட்டச்சுப் பயிற்சி பெற்றவர்களும் இதன் வாயிலாக ஒருங்குறியில் (யுனிகோடில்) தட்டச்சு செய்ய இயலும். இந்நிலையில் தமிழ்நெட்99(TamilNet99) என்ற தட்டச்சு முறையே தமிழக அரசால் தரப்படுத்தப்பட்டது என்பதும் புதிதாகத் தமிழ்த் தட்டச்சு செய்யப் பழகுவோர் இதனைப் பின்பற்றவேண்டும் என்பதும் இங்கு நினைவுகூறத்தக்கது.
எழுத்துருக்கள்
          தற்போது Adobe InnDesignமென்பொருளின் CS6 பதிப்பில் தமிழ் ஒருங்குறி செயல்படும் வசதி சேர்த்திருப்பதால் நூல் உருவாக்கம், வடிவமைப்புப் பணிகளுக்கு ஏற்ற சாய்வடிவு, தலைப்பு, குறுந்தலைப்பு, பாடல் எனத் தனித்தனி எழுத்துருக்களைப் பயன்படுத்தும் வகையில் அச்சு ஊடகத்திற்காக 20 தமிழ் எழுத்துருக்கள் இதில் இடம்பெற்றுள்ளன.
குறியேற்றமாற்றி
          இது பல்வேறு தமிழ் மென்பொருள்களில் பயன்படுகின்ற அஸ்கி (ASCII) அடிப்படையிலான பல வகையான தமிழ் எழுத்துருக்களை ஒருங்குறி உள்ளீட்டு முறையில் மாற்றித்தரும்; டெக்ஸ்ட்(.txt) கோப்புகளை மட்டுமல்லாமல், ஆர்டிஎஃப்(.rtf) கோப்புகளையும் மாற்றித்தருகிறது.
          தமிழில் பரவலாகப் பயன்படுத்தப்படும் எந்த வகைத் தமிழ் எழுத்துக் குறியீட்டையும் ஒருங்குறிக்கு மாற்றலாம். பின்னர் சொற்பிழை, சந்திப்பிழை போன்றவற்றைச் சரிசெய்த பின்னர் பழைய குறியீட்டுக்கு மாற்றிக்கொள்ளலாம். இதற்காக டேம், டேப், வானவில், பாமினி, இன்டோவோர்டு, சாப்ட்வியூ, கபிலன், திபூமி, கணியன், ஸ்ரீடேம்(ஸ்ரீலிபி), இளங்கோ, மயிலை, டிஸ்கி, ரோமன், டயகிரிடிக், அனு, செந்தமிழ் போன்ற குறியேற்றங்களை மாற்றித் தரும் வசதி இடம்பெற்றுள்ளது. மேலும், ஒருங்குறிக்கு அடுத்த நிலையில் பதிப்புப் பணிகளுக்கும் இயல்மொழியாய்வுப் பணிகளுக்கும் பயன்படும் வகையில் தமிழக அரசின் தரமாக அறிவித்த டேஸ்(TACE) குறியேற்றத்திற்கும் மாற்றித்தருகிறது.
          பெரும்பாலும் மேற்குறித்த குறியேற்றங்களில் பலவற்றை மாற்றித்தரும் பல குறியேற்ற மாற்றிகள் இருந்தபோதிலும் அவை .text கோப்புகளை மட்டுமே மாற்றித்தருவதாக அமைந்துள்ளது. கோப்பில் எழுத்துரு வடிவம், அளவு, நிறம், அட்டவணை போன்றவற்றை உள்ளடக்கிய .rtf கோப்புகளை வடிவமைப்பு மாறாமல் மாற்றித்தருவது கூடுதல் சிறப்பு.
சொற்பிழை திருத்தி
          ஆங்கிலச் சொற்பிழை திருத்தியைப் போன்று தட்டச்சு செய்யும்போதே சொற்பிழையைச் சரிபார்க்கும் முறையில் இதை உருவாக்கவில்லை. தமிழ்மொழியின் சொற்பட்டியலை வரையறை செய்ய இயலாத நிலையிலும் ஆங்கிலத்தைப் போன்று அகராதியை மட்டும் வைத்து இத்தகைய சொற்பிழைத் திருத்தியை உருவாக்க முடியாத நிலையிலும் சொற்களையும் சொற்களோடு இணையத் தகுந்த இலக்கண விகுதிகளையும் வைத்து விதிகளின் அடிப்படையில் சொற்பிழையைத் திருத்தும் வகையில் இது உருவாக்கப்பட்டுள்ளது என்பதை அறியமுடிகிறது. தட்டச்சு செய்து முடித்த பிறகு அல்லது வேறு ஏதேனும் மென்பொருளிலிருந்து படியெடுத்து(Copy) இதனுள் ஒட்டிய(Paste) பிறகு இரண்டு முறைகளில் இந்த மென்பொருளின் வாயிலாகச் சரிபார்க்கலாம்.
1.    தட்டச்சு செய்தபிறகு, ஆவணத்தைப் பயனீட்டாளர்கள் ஆங்கிலச் சொற்பிழை திருத்தியைப் போன்று ஊடாட்டத்தின்(Interaction) வழியே திருத்திச் செம்மைப்படுத்தலாம். அதாவது சொற்பிழைதிருத்திஎனும் வசதியின் வாயிலாகச் சென்றால் அந்தக் கோப்பில் உள்ள தவறான சொற்களை அடையாளம் கண்டு அதற்குரிய சரியான மாற்றுச் சொற்களைப் பரிந்துரைக்கும். இவ்வாறு காண்பிப்பவற்றுள் சரியானதைத் தேர்ந்தெடுத்து ஒவ்வொன்றாகச் சரிசெய்யலாம்.
2.    அதிகப் பக்கங்கள் கொண்ட ஆவணமாக இருந்தால், ‘சொற்பிழைகாட்டிஎனும் கருவி ஆவணத்தில் உள்ள தவறுகளைப் பயனீட்டாளர்களின் ஊடாட்டம் இன்றி, தானாகக் கண்டறிந்து, அவற்றைச் சிவப்புக் கோடிட்டுக் காட்டுகிறது. பின்னர் சிவப்புக் கோடிடப்பட்ட சொற்களை மட்டும் நாம் சொற்பிழை திருத்தியின் பரிந்துரை வாயிலாகவோ அல்லது தட்டச்சு வாயிலாகவோ திருத்திக்கொள்ள முடிகிறது.
          சரவணன், ரவி, சுகுமார் போன்ற பெயர்ச்சொற்களில் சிலவற்றையும் மன்னார்குடி, திண்டிவனம், மயிலாப்பூர், அடையாறு போன்ற ஊர்ப்பெயர்களில் சிலவற்றையும் கண்டறிவதில்லை. பெயர்ச்சொற்கள் முழுமையாக இவ்வளவுதான் என்று தொகுத்து உள்ளிட முடியாது. காலந்தோறும் புதியபுதிய பெயர்ச்சொற்கள் உருவாகிக்கொண்டே வரும் என்பதையும் அறியமுடிகிறது. மலர்’ ‘கொடிஎன்ற இரண்டு சொற்களைத் தனித்தனியாகக் கொடுத்தால் சரி என்று சொல்கிறது. மலர்க்கொடிஎன்று இரண்டு பெயர்ச்சொற்களைச் சேர்த்து எழுதும்போது உருவாகும் தொகைச்சொற்களைத் தவறு என்றே காட்டுகிறது. ஏனெனில், இவையெல்லாம் இரண்டு சொற்கள் இணைந்து உருவாகும் தொகைச்சொற்கள். இத்தகைய தொகைச்சொற்களைக் கையாளும் தொழில்நுட்பமும் இதில் சேர்க்கப்படவேண்டும். எனினும் அடிப்படை நிலையில் பிழை திருத்துவற்குப் பொருத்தமுடன் செயல்படுகிறது.
          ஆங்கிலமொழிக்கான சொற்பிழைதிருத்தியும் இதில் தனியாக உள்ளது. ஆங்கிலச் சொற்பிழைகளைத் தனியாக ஒரு முறை கொடுத்துத் திருத்திக்கொள்ளும் வகையில் அமைந்துள்ளது.
சந்திப்பிழை திருத்தி
          ஒற்று(சந்தி) இடப்படாத இடங்களில் இட்டும், தேவையில்லாத இடங்களில் இட்ட ஒற்றினை நீக்கியும் தருகிறது. படித்து பார்என்ற தொடரில் ஒற்று இடாமல் இருக்கிறபோது, அதைக் கண்டறிந்து படித்துப் பார்என்று திருத்தித் தருகிறது. வந்துப் பார்என்ற தொடரில் ப்என்ற ஒற்று வரக்கூடாது. அதையும் கண்டறிந்து, ‘வந்து பார்என்று திருத்தித் தருகிறது. தேடிக் சென்றான்என்று மாற்றி ச்க்குப் பதிலாக க்போடப்பட்டிருந்தால் அதனைச் சரியாக மாற்றித் தருகிறது. வாழ்ந்தக் வீடுஒற்று வரக்கூடாத இடத்தில் ஒற்று போடப்பட்டிருந்தால் அவற்றை நீக்கியும் தருகிறது.இதே அடிப்படையில் லைப் ஜாக்கெட்’, ‘சி-டாக் நிறுவனம்போன்ற சொற்களில் உள்ள ப்’, ‘க்ஒற்றுகளை நீக்கிவிடுகிறது.
      தமிழ் கல்வி கழகம்என்று இரண்டு அல்லது மூன்று பெயர்கள் ஒன்றுசேர்ந்து வரும்போது ஒற்று இடுவதில்லை. ஆனால், ‘தமிழ்க் கல்விக் கழகம்என்று ஏற்கனவே ஒற்று இடப்பட்டிருந்தால் சந்திப்பிழை திருத்தியில் அவற்றை நீக்குவதில்லை. அப்படியே விட்டுவிடுகிறது.
     கடலை சாப்பிட்டான்என்ற தொடரைச் சந்திப்பிழை திருத்தம் செய்யும்போது கீழுள்ளவற்றில் ஒன்றைத் தேர்வுசெய்யவும் என்று கடலைச் சாப்பிட்டான்(கடல் + ஐ), கடலை சாப்பிட்டான்(கடலை)ஆகிய இரண்டினைத் தருகிறது. மேற்குறித்த சொற்களின் வெளியமைப்பு ஒன்றாகத்தான் இருக்கின்றன. ஆனால், பொருள் வேறுபடுகிறது. கடலை என்பது முழுச்சொல்லா அல்லது ஐ வேற்றுமை விகுதியேற்ற சொல்லா என்பதைக் கண்டறியமுடியவில்லை. இத்தகைய முடிவைத் தொடரியல் ஆய்வின் அடிப்படையில் முடிவெடுக்க முடியும். இந்த ஆய்வின் அடிப்படையில் இந்த மென்பொருள் வளர்ந்தால் நம்மிடம் இந்த இரண்டு விருப்பத்தேர்வுகளைக் கேட்காமல் தானாகவே முடிவெடுப்பதற்கு வழிவகை செய்யும் என்பது இங்கு உணரப்படுகிறது. மேற்குறித்த அடிப்படையில் வேலை, முக்கிய, போன்ற சொற்களுக்கு இரண்டு பரிந்துரைகளைக் கேட்கிறது. இவ்வாறு ஏதேனும் ஒரு பரிந்துரையைக் கொடுத்த பிறகே அடுத்த சொல்லின் சந்திப்பிழை திருத்தத்திற்குச் செல்கிறது.
தமிழ்ச்சொல் சுட்டி
          இன்றைய தமிழ் ஊடகங்களில் தமிழ்த் தொடர்களில் அயல்மொழிச் சொற்கள் மிகுதியாக இடம்பெறுகின்றன. ஆங்கிலச் சொற்களே அளவுக்கு அதிகமாக பயன்படுத்தப்படுகின்றன. அயல்மொழிச் சொற்களைக் கண்டறிந்து, அவற்றிற்கு இணையான தமிழ்ச்சொற்களை(விகுதிகளுடன்) பதிலீடுசெய்து தருகிறது. இந்தகைய வாய்ப்பு நல்ல தமிழ்ப் பயன்பாட்டுக்கும், தமிழ் வளர்ச்சிக்கும் உதவும். ஆங்கிலச் சொற்களை ஒலிபெயர்த்து எழுதினாலும் அவற்றுக்கு நிகரான தமிழ்ச் சொற்களாக மாற்றித்தருகிறது. 'நான் காலேஜில் டீச்சரைப் பார்த்தேன்' என்று தட்டச்சு செய்திருந்தால், 'நான் கல்லூரியில் ஆசிரியரைப் பார்த்தேன்' என்று 'காலேஜ்' 'டீச்சர்' இரண்டையும் விகுதிகளோடு மாற்றித் தருகிறது. சொற்பிழைதிருத்தம் மேற்கொள்ளும்போது இந்தத் தமிழ்ச்சொல் சுட்டி கூடுதல்வாய்ப்பாகவே வழங்கப்பட்டுள்ளது. விரும்பினால் இதனைத்தேர்வு செய்துகொள்ளலாம். அவ்வாறு தேர்வுசெய்கிறபோது பிறமொழிச் சொற்களைப் பச்சைநிற அடிக்கோடிட்டும் சொற்பிழைகளைச் சிவப்புநிறத்தில் அடிக்கோடிட்டும் வேறுபடுத்திக்காட்டுகிறது. பிறமொழிச் சொற்களுள் சிலவற்றை மட்டுமே அடையாளம் காணுகிறது. இன்னும் பலசொற்கள் இவற்றோடு சேர்க்கப்படவேண்டும்.
          இவ்வாறு சொற்பிழை திருத்தம், சந்திப்பிழை திருத்தம் போன்றவற்றைச் செய்வதற்கு வேறு ஒரு கோப்பிலிருந்து இதில் படியெடுத்தும்(copy) ஒட்டலாம்(paste) அல்லது .doc, .docx, .odt, .txt, .rtf, .html, .xml போன்ற கோப்புகளாகச் சேமிக்கப்பட்டவற்றைத் திறக்கவும்(Open) செய்யமுடிகிறது. மேலும், இதிலிருந்து மேற்குறித்த வேறு எந்த வகைக் கோப்புகளாகவும் சேமிக்கவும்(Save as) முடியும்.
அகராதிகள்
          இருமொழி அகராதி (தமிழ்-ஆங்கிலம், ஆங்கிலம்-தமிழ்), தமிழ்நாடு அரசு ஆட்சிச்சொல் அகராதி (தமிழ்-ஆங்கிலம், ஆங்கிலம்-தமிழ்), மயங்கொலிச் சொல் அகராதி, அயற்சொல் அகராதி ஆகிய நான்கு வகை அகராதிகள் உள்ளன. 41 ஆயிரம் தற்காலத் தமிழ்ச் சொற்களைக் கொண்ட தமிழ்-ஆங்கிலம், ஆங்கிலம்-தமிழ் அகராதி இதில் இடம்பெற்றுள்ளது. கோப்பில் காணப்படும் சொற்களுள் ஏதேனும் ஒரு சொல்லுக்குப் பொருள் அறிய விரும்பினால் அந்தச் சொல்லின்மேல் இடப்புறம் சொடுக்கினால் அதற்குரிய பொருள், இணைச்சொல், எதிர்ச்சொல், அதன் இலக்கண வகைப்பாடு போன்றவற்றைத் தருகிறது.
இணைச்சொல் அகராதி :வெட்கம்என்ற சொல்லுக்குரிய இணையான சொல்லைத் தேடும்போது கூச்சம், நாணம், தயக்கம்போன்ற இணைச்சொற்களை வழங்குகிறது.
எதிர்ச்சொல் அகராதி :வெறுப்புஎன்ற சொல்லுக்கு எதிரான சொல்லைத் தேடும்போது விருப்பு, அவா, அன்பு, பாசம், நாட்டம், பிரேமை, பிரேமம், விருப்பம்போன்ற எதிர்ச்சொற்களைத் தருகிறது.
மயங்கொலிச்சொல் அகராதி : தமிழில் ஏற்படும் , , ’ - ‘, , ’ - ‘, எழுத்துகளில் ஏற்படும் மயக்கங்களைத் தவிர்க்கப் பயன்படும் பொருள் வேறுபாட்டுக் குறிப்புகளை வழங்குகிறது. ‘Pain’ என்ற சொல்லுக்கு இணையான வலிஎன்ற தமிழ்ச்சொல்லிற்கு எந்த லி’-‘ளி’-‘ழிவரும் என்கிற நிலையில் ஏதாவது ஒரு லியைக் கொடுத்துத் தேடும்போது இவை மூன்றிற்கும் என்னென்ன பொருள் வேறுபாடு, பெயர்(Noun), பெயரடை(Adjective), வினை(Verb), வினையடை(Adverb) போன்ற நிலைகளில் இலக்கணக் கூறுகளின் அடிப்படையில் என்னென்ன பொருள்களில் பயன்படுத்தப்படுகின்றன என்னும் பொருள் வேறுபாட்டை வழங்குகிறது.  
தமிழ்நாடு அரசு ஆட்சிச்சொல் அகராதி :  தமிழ்நாடு அரசின் தமிழ் வளர்ச்சித்துறை வெளியிட்டுள்ள ஆட்சிச்சொல் அகராதியும் இடம்பெற்றுள்ளது. இதன் வாயிலாக ஆட்சிச் சொல்லுக்குரிய பொருளைப் புரிந்துகொள்ளமுடிகிறது.
அகரவரிசைப்படுத்தி : ஆவணத்தில் இடம்பெற்றுள்ள சொற்களைத் தமிழ் நெடுங்கணக்கின் அடிப்படையில் அகரவரிசைப்படுத்தித்(Sorting) தருகிறது. இது கோப்பில் உள்ளவற்றை ஒவ்வொரு தனித்தனிச் சொல்லாகக் கணக்கில் எடுத்துக்கொள்கிறது. பல வரிகளையோ பத்தியையோ கொடுத்து வரிசைப்படுத்தச் சொன்னால் அவற்றைத் தனித்தனி சொல்லாகப் பிரித்து அவற்றை அகரவரிசைப்படுத்தித் தருகிறது.இது ஒரு முறை. மற்றொரு முறையில் வரியையோ, பத்தியையோ அப்படியே அகரவரிசைப்படுத்தும் முறை வழக்கில் உள்ளது.
சொல்லடைவி :      சொற்பட்டியலுடன் சொல் வரும் பக்கங்களை வழங்குகிறது. தனிச்சொல் மட்டுமல்லாமல், இந்திய இராணுவம், இந்திய விமானம் போன்ற இருசொல் இணைகளையும் அடைவு செய்துதருகிறது.
எண்<->எழுத்து மாற்றி : பயன்பாட்டில் இருக்கும் எத்தகைய எண்களையும் தமிழ்ப் புணர்ச்சி விதிப்படி தமிழ்ச் சொற்களாக மாற்றித்தருகிறது. ஆவணங்களின் இடையில் 56894போன்ற ரோமன் எண்கள் இடம்பெற்றால், அவற்றை ஐம்பத்தாறாயிரத்து எண்ணூற்றுத் தொண்ணூற்றுநான்குஎன மாற்றித் தருகிறது. இதே எண்களை ‘fifty-six thousand eight hundred ninety-four’ என்று ஆங்கிலச்சொற்களாகவும் மாற்றித் தருகிறது. இதே பணியைப் பின்னோக்கி எழுத்திலிருந்து எண்ணாகவும் மாற்றித் தருகிறது.
Pdfகோப்பு மாற்றி : ஆவணக் கோப்புகளை Pdfகோப்புகளாக மாற்றும் வசதியும் இம்மென்மத்தில் இடம்பெற்றுள்ளது.
துணைநூற்பட்டியல் : ஆய்வாளர்களுக்குப் பயன்படும் வகையில் துணைநூற்பட்டியல் தயாரிப்புக் கருவி ஒன்றும் இடம்பெற்றுள்ளது. MLA, API, Chicago போன்ற பலவகை ஆய்வுநடைகளில் துணைநூற்பட்டியலை எளிதாகத் தயாரிக்க உதவுகிறது.
          மேற்சுட்டியவாறு பல்வேறு சிறப்பியல்புகள் கொண்டதாக மென்தமிழ் திகழ்கிறது. எனினும் தமிழ்மொழியின் இலக்கணத்தைக் கணினிக்கு விதிகளாகக் கொடுக்கிற நிலையிலும் இலக்கணத்தில் காணப்படும் விதிவிலக்குகள், சூழல் தன்மையிலான பொருள் குழப்பங்கள் போன்றவற்றாலும் தொழில்நுட்பங்களைப் பயன்படுத்துவதற்குரிய பொருளாதார நெருக்கடிகளாலும் முழுமையான தன்னிறைவு பெறும் நிலையை நோக்கியே பயணிக்கிறது. உலகளாவிய பன்னாட்டு மென்பொருள் உருவாக்கம் மற்றும் பயனர் எளிமையாக்க(User Friendly) முறைகளில் இந்த மென்பொருள் இன்னும் மேம்படுத்தப்பட வேண்டும்.
          தமிழ்ச்சொற்பிழை திருத்தியும், சந்திப்பிழைதிருத்தியும் ஏறத்தாழ 90 விழுக்காட்டுக்குமேல் சரியான முடிவுகளைத் தருகின்றன. 100 விழுக்காடு சரியான முடிவுகளைத் தருவதற்குத் தமிழ்த் தொடரியல், பொருண்மையியல் ஆய்வுகளும், தமிழ் அகராதியும் வளரவேண்டும் என்பது உணரப்படுகிறது. தொகைச்சொற்களை கையாளுவதில்லை. தமிழ்மொழியமைப்பைக் கண்டறிவது ஒருபுறம்; கண்டறிந்த அமைப்பைக் கணினித் தொழில்நுட்பத்திற்கேற்ற வகையில் மாற்றிக் கொடுப்பது என்பது மறுபுறம். இவை இரண்டும் தொடர்ந்து வளரக்கூடியவையாகும்.
          யானைகள் வந்தது’, ‘போன்றவை பயன்படுத்தப்பட்டு வருகின்றதுஎன்று தவறாக ஒருமை-பன்மை மயக்கம், உயர்திணை-அஃறிணை மயக்கங்களைக் கண்டறிந்து திருத்தித்தரும் இலக்கணப் பிழை திருத்தியும் இதில் இருந்தால் கூடுதல் பயன் தரும் என்று எதிர்பார்க்கப்படுகிறது. உருபனியல் ஆய்வின் அடிப்படையில் இந்த மென்பொருள் உருவாக்குவதற்குப் பல ஆண்டுகள் ஆயின என்பதும் மேற்குறித்த இலக்கணப் பிழைத் திருத்தியை உருவாக்கத் தொடரியல்(Syntax) ஆய்வு மேற்கொள்ளப்படவேண்டும் என்பதும் உணரப்படுகின்றன.
       தமிழில் சொற்களைச் சேர்த்து எழுதுகிற, பிரித்து எழுதுகிற கட்டுப்பாடுகள் விதிக்கப்படவில்லை. அவரவர் விருப்பத்திற்கேற்ப வந்துகொண்டிருந்தான் என்பதை வந்து கொண்டு இருந்தான் என்று இரண்டு மூன்று சொற்களாகத் தனித்தனியாகப் பிரித்து எழுதுகிற நிலையும் பிரித்துத் தனித்தனியாக எழுதவேண்டிய சொற்களை இடைவெளி விடாமல் சேர்த்து எழுதுவதாலும் மொழியில் பல்வேறு குழப்பங்கள் ஏற்பட்டு, பொது இலக்கண விதிகளை உருவாக்க முடியாமல் போகிறது. தற்போதைய சொற்பிழைதிருத்தி, சந்திப்பிழைதிருத்தி ஆகியவற்றின் திறன் எல்லை தொடர்ந்து விரிவடையவேண்டும். இதற்கான முயற்சியில் என்.டி.எஸ் லிங்க்சாஃப்ட் சொல்யூஷன்ஸ் நிறுவனம் தன்னைத் தொடர்ந்து ஈடுபடுத்திக்கொண்டுவருகிறது.
          இதுபோன்ற மென்பொருள் தொடர்ந்து உருவாகாமல் போனதற்குத் தமிழ் மென்பொருள் உருவாக்கத்திற்குப் போதிய பொருளாதார ஆதரவும் ஒரு மென்பொருளை உருவாக்கினால் அதனை விலை கொடுத்து வாங்குவதற்கு அரசு, தனியார் நிறுவனங்கள், தனியாள் எனப் பலரும் முன்வராததால் இத்தகைய முயற்சிகள் பல தொடக்கநிலையிலேயே முடங்கிக்கிடக்கின்றன. இத்தகைய பணிகளுக்கு ஆதரவும் விற்பனைக்குரிய சந்தையும் இருந்தால் தமிழுக்கு விரைவில் எழுத்து பேச்சு மாற்றி, பேச்சு எழுத்து மாற்றி, எந்திர மொழிபெயர்ப்பு போன்ற பல்வேறு மென்பொருள்கள் உருவாவதற்கு வழிவகை ஏற்படும்.

No comments:

Post a Comment