Open-Tamil v0.95

Today, we are releasing Open-Tamil v0.95 via Python package index here.

எழில்-open-tamil contributors meetup

எழில்-open-tamil contributors meetup (2018). படம் – உபயம் : திரு. சீனிவாசன்.

In this release there are few new items and routine improvements.

  1. Indian Rupee sign parsing
  2. Package tamil-sandhi-checker with open-tamil

  3. Tamil Morse code module added to package

  4. Remove Python 2.x support with sunsetting from PSF
  5. Valai – package of web ReST API for some spellcheckers

Get the latest:

$ pip install --upgrade open-tamil

Thanks to all our contributors present and past.
Happy Holidays!

P.S: மின் அஞ்சல் அறிவிப்பு கீழ் இணைக்கப்பட்டது.

வணக்கம் தமிழ் கணிமை ஆர்வலர்களே,

இன்று Open-Tamil வரிசை எண் 0.95 வெளியீடு ஆனது.  இந்த நிரல் தொகுப்பு முற்றிலும் திறமூல MIT உரிமத்தில் வெளியிடப்பட்டது. இதனை கொண்டு நீங்கள் பைத்தான் கணினி மொழியில் தமிழ் மொழி ஆய்வுகளை செயல்படுத்தலாம்.
உதாரணமாக இரண்டு திறமூல சேவைகள்/செயல்பாடுகள் (அதாவது எழில், தமிழ்சந்தி மற்றும் தமிழ்பேசு-வலை என்பவற்றை தவிற்த்து [எங்கள் குழுவினர் அல்லாதவர்]) பயன்பாட்டில் பொதுவெளியில் உள்ளது தெரியவந்தது-
 1) பைதமிழ் என்ற (அவலோகிதம் போல) வேண்பா திரிப்பு நிரல் தொகுப்பு (library), மற்றும் 
2) வென்முரசு தோடர்நாவலை உரை-பகுப்பாய்வு செய்யவும் ஒரு செயலி என்றபடி உள்ளது.

இந்நிலையில் இந்த வெளியீட்டில் உள்ளவை,

1. தமிழ்சந்தி என்ற விருது பெற்ற திருமதி. நித்தியா-திரு. சீனிவாசன் அவர்களது படைப்பான  தமிழ் சந்திப்பிப்பிழைத்திருத்தி  இந்த தொகுப்பில் இடம் பெற்றது. இதில் நாற்பது விதிகளுக்கும் மேல் சந்திப்பிழைகளை கண்டரிய வசதிகள் உள்ளது.

2. தமிழ் மோர்சு என்ற தந்தி குறிகளை தமிழில் கையாள இது உதவுகிறது.

3. வலை என்ற நிரல் தொகுப்பில் திரு. நீச்சல்கீரன் அவரது வாணி  மற்றும் தமிழ்பேசு சொற்பிழை திருத்தியை இணையம்வழி கையாள வசதிகள் உள்ளன. 

முழு விவரங்களுடன் வெளியீடு: https://ezhillang.blog/2019/11/20/open-tamil-v0-95/

ஒப்பன் தமிழ் குழுவிற்காக,
அன்புடன்
-முத்து
கலிபோனியா

வாசிப்பு – தானியங்கி நுட்பங்கள் -1

இடம்தானியங்கி கார்கள் வரலாறு. வலம்: செயற்கை நுண்ணறிவு பின்னல்கள்

சமீபத்தில் செயற்கை நுண்ணறிவு பற்றி கற்க ஒரு வாய்ப்பு கிடைத்தது. முழு நேர வேலைகளில் இந்நூல்கள் உதவும் என்ற எதிர்பார்ப்புடன் இவற்றை படிக்க முயற்சி.

முதல்நூல் தானியங்கி கார்களின் வரலாறு பற்றியும் அதன் வளர்ச்சி, சமகால நிலை மற்றும் முதல்நிலை மாந்தர்கள் பற்றியும் உள்ளானது. அதாவது சிக்கல என்ன என்றால் “கார் ஓட்டுனர் இல்லாமல் எப்படி தோடக்க இடத்தில் இருந்து பயணர்கள் செல்லும் இடத்திற்கு விபத்துகள் இல்லாமல் குறுகிய காலத்தில் செல்லும்” என்று கொள்ளலாம். இது டார்பா , அமெரிக்க பல்கலைக்கழகங்களில் தோடங்கி ஜீஎம்கூகிள் மற்றும் பல சமகால நிறுவனங்களின் கார்கள், திட்டங்கள் பற்றி சொல்கின்றது.

அடுத்த புத்தகம் பற்றி அடுத்த பதிவில் :). மனிதன் தமிழ்தான் முதலில் பேசியதை நகைத்து புதுமைப்பித்தன் “முதல் குரங்கு தமிழ்க்குரங்கு,” என்பதை (கீழடி பற்றிய ஊடக நிகழ்வில்) பத்திரிகையாளர் மாலன் நினைவுபடுத்தினார். இறண்டாவது, மூன்றாவது ரோபோ தமிழ் பேசவைக்கலாம் – ஏனெனில் நீங்களே பிரம்மா!

சொல் விளையட்டு – மின்னல்

(c) 2019, ஐபாட்டி நிறுவனம் உருவாக்கிய ‘மின்னல்’ விளையட்டு

மின்னல் என்ற ஒரு சொல்விளையாட்டை தமிழ் கல்வி நிறுவனம் ஐபாட்டி உருவாக்கியுள்ளது. இதனை எனக்கு தெறிந்த அளவில் இவ்வாரு விளங்குகின்றது:

அதாவது வரிசையற்ற எழுத்து சதுரத்தில் இருந்து, முடிந்தளவு அதிக சொற்களை 30நொடிகளில் சொல்லவேண்டுமாம். இதுவே மின்னல் என்ற விளையாட்டு. “வாம்மா மின்னல்!” வடிவேலு நகைச்சுவை ஞாபகம் வரும்

இதனை எப்படி நிரல்படுத்தலாம் என்று தான் நமக்கு தோன்றும்; அதன்படி சிறிய நிரல் ஒன்று எழுதினேன்:

மின்னல் நிரல் துண்டு : இங்கு

காதல் -> தவம் – பாகம் 2

விடை: சொல் ஏணி (word-ladder games ) என்பன காதல்-இல் இருந்து தவம் வரை மாற்ற உதவும் – இதை காண்க.

  1. அதாவது, ஒரு அகராதியை கொண்டு, முனை-ஓரம் படம் அமைக்கவும்.
  2. இரு சொற்கள் ஓரத்தால் இணைக்கப்பட்டால், அவை ஒன்ருடன் ஒன்று ஒரு எழுத்து மாற்றம் வழி தொடர்புடையது என்று அர்த்தம்.

இதை கொண்டு ஏற்கனவே ‘காதல் -> தவம்‘ எழுதினோம்.

மேலும் இந்த ஆய்வுக்கட்டுரை அழகாக உள்ளளது – (கட்டுரை) ‘Word Morph and Topological Structures: A Graph Generating Algorithm’, Jürgen Klüver, Jörn Schmidt, Christina Klüver, (2016), Complexity, Vol. 21, No. S1. Wiley Publications.

 

Diphone speech synthesis

Simple unit-selection speech synthesis for English language is taken apart in this interesting blog post.
https://kastnerkyle.github.io/posts/bad-speech-synthesis-made-simple/

With some caveats, the above blog post represents the algorithm used in tamil-tts project (e.g. ). and demoed at tamilpesu.us/tts_demo

Adding formant synthesis will improve this simple TTS. Are you a ECE/EEE/CS/Mathematics or Engineering undergraduate student interested to improve this code ? Do you want to learn more about filters ? Or, do you have another person in mind ?

Just drop me a line <ezhillang@gmail.com>