Ezhil, Open-Tamil conference articles – 2017

One of major achievements of last year has been collecting inputs from our team and writing up two important papers – one for historical review and other for collective call to action on great opportunity that is Tamil open-source software.

Acknowledgements

We also take time to thank all co-authors who have pulled together their efforts at short notice to make these research works happen! Together these two papers represent a value of tens of thousands of Indian rupees, or more in the making (going by estimates of other Tamil software foundations).

We also thank conference organizers for partial travel grant toward making this presentation happen. Thank you!

Conference Articles – 2017

Ezhil, Open-Tamil conference articles – 2017 presented at Tamil Internet Conference, August, 2017, in Toronto, Canada. Both the papers were well received and good academic and development points were debated at the forum.

  1. Ezhil – எழில் மொழி பொது பயன்பாட்டிற்கும், வெளியீடு நோக்கிய சவால்களும்
    • This paper summarizes the path taken by Ezhil from inception toward delivering a fully installable product on Windows 64/32bit, Linux (Unbutnu, Fedora) systems, and offers a meditation on how students and teachers may adopt this product, and future pathways.
    • Presentation slides are here on slideshare.
  2. Open-Tamil / Open Source in Tamil – Tamil Open-Source Landscape – Opportunities and Challenges_MA_2017_final 
    • Some important contributions of this paper show collective interest in Tamil open-source which outpaces the other languages with larger speaking-population. This is a key indicator to develop better pathways to bring new developers and train them into developing Tamil software
    • GitHub Tamil language repositories
      GitHub Tamil language repositories compared with other languages, as measure of software developers interest.
    • Presentation slides are at slide-share

For questions and queries on these articles, please write to us at ezhillang@gmail.com or leave your comments below.

Ezhil Language Foundation

 

alpha release – எழில் 0.9 முன்-பரிசோதனை திரட்டி

எழில் முன் பரிசோதனை திரட்டி windows மற்றும் linux-க்கு இங்கு பெறலாம். கடினமாக உழைத்த குழுவினருக்கு நன்றி.

இதில் நீங்கள் பெற கூடிய செயலிகள்,

  1. எழில் இயக்கி “ezhili” (terminal – முனையம் இடைமுகம்)
  2. எழில் திருத்தி “ezhuthi” (GUI – பயனர் திரை இடைமுகம்)
  3. தமிழில் நிரல் எழுது புத்தகம்

உங்களுக்கு எதுவும் தடங்கல், பிழை செய்திகள், விருப்ப தேவைகள் இருந்தால் எல்லா அன்பாயும் மின்னஞ்சலில் ezhillang@gmail.com-இக்கு அனுப்பவும். திட்டினால் படிக்கவேமாட்டோம்.

நன்றி,

எழில் குழு

 

Open-Tamil and Ezhil updates (2016)

Today we are releasing updates to two packages maintained by Ezhil Language Foundation;

  1. open-tamil v0.65
    • open-tamil package contains minor bug fixes and solid performance on Python 2 and Python 3.
    • pip install –upgrade open-tamil
  2. ezhil-v0.82
    • Fix some issues for Python 3 installation from the previous release
    • pip install –upgrade ezhil

Both these packages maybe downloaded from PyPi (Python Package Index) via ‘pip’ command.

Thanks very much to the original contributors, bug reporters, and Tamil open-source software (TOSS) enthusiasts.

 

திருத்தும் உதவி – Pygments, ACE support

ஒரு புது திட்டம் என்றால், எழில் போன்ற மொழிகளுக்கு, மற்ற சுற்று சூழலில்  உள்ள மென்பொருள்களுக்கு நம்மை பற்றி சொல்லி கொடுக்க வேண்டும் என்ற ‘burden of proof’ பொறுப்பு நம்முடன் உள்ளது. எழில் மொழியில், Java, Python, என்பதில் போலவே எப்படி IDE, Syntax Highlighting கொண்டு வருவது ?

முதல் கட்டமாக Pygments என்கிற Python மொழியில் எழுதிய Syntax Highlighter என்ற திட்டத்தில் எழில் மொழியின் தொடரியலை / இலக்கணத்தை புரிந்து கொள்ளும் வகையில் செயல்பட்டோம். இதன் விளைவு இன்று எழில் மொழி Pygments என்ற திட்டத்தில் சேர்க்கபட்டது http://pygments.org/languages/ . முக்கியமாக நீங்கள் Pygments கொண்டு உங்கள் செயலியில் எழில் மொழியில் எழுதிய நிரல்களை உடனடியாக வண்ணம் குறியீடுகளுடன் வெளியீடு காட்டலாம்.

மேலும் ACE என்கிற வலை உலாவி (browser) வழி திருத்தியில் எழில் மொழியை செயல்படுத்த முயற்சிகள் மேற்கொள்ள பட்டது. இதன் விளைவாக http://ezhillang.org/koodam/play/ எழில் தளத்தில் நீங்கள் வண்ணகளுடன் உதவும் திருத்தியில் எழில் நிரல்களை இயக்கலாம்.

syntax-highlighting

தனி மரம் என்றுமே தோப்பாகாது!

 

Java and Open-Tamil : Write Tamil Applications using Java

Java and Open-Tamil : Write Tamil Applications using Java

I’m sharing a small example; you can download (from Github) the whole Java package and include it in your desktop, mobile or web app. For Free! Example gist follows.

// include the sources for the com/tamil package from
// https://github.com/arcturusannamalai/open-tamil/blob/master/java/OpenTamil/src
import java.util.Arrays;
import java.util.List;
import java.util.HashMap;
import com.tamil.utf8;
import com.tamil.Numeral;
public class utf8Demo {
public static void main(String [] args) {
/* Example 1: Get length of a Tamil word */
String inputWord = "எழில்",inputWord2 = "கட்டளை";
HashMap<String,Object> actual = utf8.get_length(inputWord);
System.out.println("Length of word "+ inputWord+ "= "+ actual.get("length") );
/* Example 2: Get number of Tamil letters */
//List<String> expected = Arrays.asList(new String [] {"எ","ழி","ல்"} );
StringBuffer actual = new StringBuffer();
for(String t : utf8.get_letters(inputWord)) {
actual.append( t );
}
if ( actual.toString() != inputWord)
throw new Exception("this will never happen because open-tamil parsed the words for you!");
/* Example 3: Convert number to a numeral */
double number = 1011.0;
/// you should see String numeral = "ஓர் ஆயிரத்தி பதினொன்று";
System.out.println("running -> "+number);
String numeral = Numeral.num2tamilstr(number).getNumeral();
System.out.println(numeral);
}
}

view raw
example.java
hosted with ❤ by GitHub

Tamil Text to Speech Synthesizers – Topical Overview

There are several open-source Tamil Text to Speech Synthesizers (TTS) available to date. Google uses one of these behind the scenes; we may wonder which one. Some of these have previously been reviewed by others at Azhagi and elsewhere on Tamil interwebs.

  1. eSpeak (Rule based synthesizer), GPL licensed (technique formant LPC analysis based)
  2. Festival  (Univ of Endinbrugh)(Tamil voice added on Feb, 2015), BSD like license.
    1. Research carried out by IISc team lead by Prof. A.G. Ramakrishnan
  3. tamil-tts by Prof. Vasu Renganathan, GPL (technique unit selection based)
  4. Android-tts – hack the English TTS to speak Tamil by transliteration
    1. This is a hack suggested by yours truly;
    2. e.g. to speak the phrase, “சும்மா இருக்கியா?” we use the English TTS via the transliteration, “Summaa Irukkiyaa?”. Clearly this maybe sub-optimal but work as a hack.

Opinion : While there are purpoted speech synthesizers in Tamil from academic government (tax-payer) funded projects like SSN-IIT collaboration, they are not publicly available or easily licensable. It is a situation that needs to be remedied.

Linguistic Aspects: One of key issues that make Tamil TTS a relatively easy goal is because the front-end is easily achieved due to the phoneme-orthography of Tamil language – i.e. Tamil language is itself a “phonetic language” where written spelling and phonetic/spoken forms are identical. This is not so in case of  English and European languages like French where there are silent words, and exceptions to rules almost all the time. Tamil language has few exceptions if any.

The back-end of the TTS engine is usually formed by LPC analysis or other source-filter separation algorithms which is an exciting and continually engaging problem for Signal processing engineers, computer scientists, and computational linguists.

Further research for Tamil TTS should improve on the naturalness and ability to include these wonderful tools of previous generation of engineers into our applications for mobile and desktop devices. Google scholar is your friend – start here!.

தமிழில் அல்கொரிதம் (Algorithm) / செயல்முரை நூல் தொகுப்பு

தமிழில் அல்கொரிதம் (Algorithm) / செயல்முரை நூல் தொகுப்பு ஒன்றை உருவாக்கணும். இதற்கு சமூக பொறியாளர்கள் பங்களிக்க வேண்டும்.

Alan M. Turing : கணிமையின் பிதாமகன் / Father of Modern Computing Theory ( http://en.wikipedia.org/wiki/Alan_Turing )

இதில் கீழ்க்கண்டவற்றை பற்றியும் எழுதனும்.

0. GCD, Factorial
1. Binary Search
2. Sorting
3. Recursion
4. Graph notation
5. DFS
6. BFS

இதில் தரவு-அமைப்புகைள (Data Structures) பற்றியும் எழுதனும்.

0. Stacks
1. Queues
2. Linked lists
3. Binary Trees
4. Graphs

Github, Wikibooks தளங்கள் ஒன்றை விருப்பத் தேர்வு செய்யலாம்.https://github.com/thamizha/ezhil-book

எழில் மொழியிலும் இதனை எ.கா உருவாக்கலாம்.

Tamil morphological analyzer efforts on Github

Today after a long workday, and running 2miles to stay healthy, I checked out some of latest Tamil happenings on Github. Indeed there are 43 paginated results for github.com search for ‘Tamil’ projects – about 430 projects to do with Tamil.

Anyway – the rare find it is – I was very pleasantly surprised by the ongoing effort of Pranavan Thevendiran and team to Develop a Tamil Morphological Analyzer: at https://github.com/Pranavan135/Tamil_Morphological_Analyzer

This is also along the lines of a expertly developed Java project by VelSubra at https://github.com/velsubra/Tamil

Congratulations on a great start, and greetings from another language aficionado.

Vazhthukkal, nanbargale!

-Muthu

பொறியியல் கடைசி ஆண்டு திட்டப்பணி – open-tamil, எழில்

பொறியியல் கடைசி ஆண்டு திட்டப்பணிக்கு யோசனை தேவையா? open-tamil, எழில் திட்டதில் பங்களித்தும் பயிற்சி பெர – அனுகவும் ezhillang@gmail.com

அன்புடன்,

-முத்து