Tamil morphological analyzer efforts on Github

Today after a long workday, and running 2miles to stay healthy, I checked out some of latest Tamil happenings on Github. Indeed there are 43 paginated results for github.com search for ‘Tamil’ projects – about 430 projects to do with Tamil.

Anyway – the rare find it is – I was very pleasantly surprised by the ongoing effort of Pranavan Thevendiran and team to Develop a Tamil Morphological Analyzer: at https://github.com/Pranavan135/Tamil_Morphological_Analyzer

This is also along the lines of a expertly developed Java project by VelSubra at https://github.com/velsubra/Tamil

Congratulations on a great start, and greetings from another language aficionado.

Vazhthukkal, nanbargale!

-Muthu

பொறியியல் கடைசி ஆண்டு திட்டப்பணி – open-tamil, எழில்

பொறியியல் கடைசி ஆண்டு திட்டப்பணிக்கு யோசனை தேவையா? open-tamil, எழில் திட்டதில் பங்களித்தும் பயிற்சி பெர – அனுகவும் ezhillang@gmail.com

அன்புடன்,

-முத்து

கணித்தமிழ் வளர்ச்சியில் கட்டற்ற மென்பொருட்கள்

கணித்தமிழ் வளர்ச்சியில் கட்டற்ற மென்பொருட்கள்

கணினித் தமிழ்

மூலம் – http://www.kaniyam.com/free-software-in-tamil-software-development/

கணித்தமிழ் வளர்ச்சியில் கட்டற்ற மென்பொருட்கள்

த.சீனிவாசன்

tshrinivasan@gmail.com

ஆங்கிலேயர் உருவாக்கிய கணிணியின் திரைகளில் 1990 களில் தமிழ் எழுத்துக்களைக் காட்டுவதற்கே பலரும் பல வகைகளில் பெரிதும் முயற்சி செய்தனர். பின் எழுத்துருக்கள், குறிமுறைகள், விசைப்பலகைகள் எனப்பல முயற்சிகள் மேற்கொள்ளப்பட்டன.

ஒருங்குறியின் வருகை தமிழை அனைத்து கணிணிகளிலும் கருவிகளிலும் காட்டுவதற்கு உதவியது. இது கணித்தமிழ் வளர்ச்சியின் முதல் நிலையே. இதுவே எழுத்துணரி (OCR), பேச்சு உணரி (Speech to Text), எழுத்து ஒலி மாற்றம் (Text to Speech), இயந்திர மொழிமாற்றம் என பல்வேறு கனவுகளுக்கு வித்திட்டது.

ஆங்காங்கே தனிநபர்களும் கல்வி நிறுவனங்களும், மத்திய, மாநில அரசு நிறுவனங்களும் இந்தக் கனவுகளை நனவாக்கும் முயற்சியில் ஈடுபட்டு வருகின்றன. பலரும் ஓரளவு வெற்றியும் கண்டு வருகின்றனர்.

பல்வேறு காரணல்களால் இந்த முயற்சிகள் ஒருங்கிணைக்கப்படவில்லை. மென்பொருட்களும், மூல நிரல்களும், ஆய்வுகளும் யாவருக்கும் பகிரப்படாமல் கல்வி, தனியார், அரசு நிறுவனங்களின் கிடங்குகளில், உறங்குகின்றன.

இந்த நிலை மாற, பல்வேறு தனி நபர்களும், அமைப்புகளும் தமிழ்க்கணிமைக்கான கட்டற்ற மென்பொருட்களை உருவாக்கி வருகின்றன. இந்த கட்டற்ற மென்பொருட்கள் மூல நிரலுடன் பகிரப்படுவதால், யாவரும் அவற்றின் தொடர்ந்த வளர்ச்சியில் எளிதில் பங்களிக்கலாம்.

தமிழ்க்கணிமையின் கனவுகளை கட்டற்ற வகையில் நனவாக்கி வரும் சில முயற்சிகளை இங்கு காணலாம்.

எழுத்துணரி

Tesseract என்ற மென்பொருள், ஒரு படத்தில் உள்ள எழுத்து வடிவங்களை உரை ஆவணமாக மாற்றுகிறது. ஆங்கிலத்தில் நன்கு செயல்படும் இதற்கு…

View original post 689 more words