Google CoLab – இணையம் வழி நிரல்களை பழகுதல்

என்ன :

கூகிள் நிறுவனம் CoLab – Code-Laboratory என்ற ஒரு சோவையை பெரும்பாலும் பைத்தான் வழி செயற்கையறிவு நிரல்களை (TensorFlow கொண்டு)  உருவாக்க பொதுமக்களுக்கு வழ்ங்கியுள்ளது. ஆனால் இதனை தமிழ் கணிமைக்கு பயன்படுத்தலாமா ? ஆம்.

தமிழ்-கூகிள்-கோலாப்-நிர்ல்-பயிற்சி

எப்படி:

ஒரு உதாரணமாக இந்த ‘பயில் தமிழ்’ interactive python (ipynb) நோட் புத்தகத்தில் (சுட்டி இங்கு) தொடங்கினால் எப்படி ஓப்பன் தமிழ் நிரல் தொகுப்பை பரிசோதிக்கலாம் என்று காணமுடியும்.

முதலில் ஒப்பன் தமிழ் நிரல் தொகுப்பை நிறுவ வேண்டும் – இதற்கு ‘!pip3 install open-tamil’ என்ற கட்டளையை கொடுக்கவும். அடுத்து ‘play’ பட்டன் அழுத்தியோ அல்லது ‘Ctrl + Enter’ விசைகளை அழுத்திபயோ இவற்றை இயக்கலாம்.

மேல் உள்ள உதாரண நிரல் துண்டின் வரிகள் 1 முதல் வரி 6 வரை இருக்கின்றன. இதன் பயன்பாட்டினைக் கொண்டு இலவசமாக எந்த வித சிரிய நிரல்களையும்  நீங்கள் இயக்கிட முடியும். ஓப்பன் தமிழ் போன்ற நிரல் தொகுப்புக்களை நீங்கள் எங்களது ஆவணக்கூருகள், மற்றும் உதாரணங்கள் மூலம் இந்த மேகக்கணிமை சேவையால் பரிசோதிக்கலாம்.

நன்றி

 

 

 

தமிழ் கணிமைக்கு செயற்கையறிவு சேவைகள்

இந்திய அழகியல் - விருந்தினர்கு வர்வேர்ப்ரை விளக்கு

இந்திய அழகியல் – விருந்தினர்கு வரவேர்ப்பறை விளக்கு. புதிய தொடக்கம்.

ஊருக்கு உபதேசம் இல்லாமல், தங்களது சேவைகளின் பயன்களை தாமே முதலில் பயன்படுத்துவதை ‘Eating your Dog Food‘ என்று கணினியாளர்கள் மத்தியில் பேசப்படுவதாவது.

இதன்படி தமிழ்கணிமைக்கு உதவும் வகையில் நேரடியாக தானியங்கி, செயற்கையறிவு சேவைகளை முதலில் தனது பயன்பாட்டிற்கு தமிழ் கணினியாளர்கள் கையாளவேண்டும்.

எனது பார்வையில் முதல்படி தேவைப்படும் சேவைகளானது:

  1. தானியங்கி வழி, கணினி உதவி ஆவனங்கள், பயிற்சி நூல்களை (training, tutorial manuals) மொழிபெயர்ப்பது
    • இந்த நூல்கள் அனைத்தும் சில கலைச்சொற்கள் தவிர மற்ற்வை அனைத்தும் ஒரே கோனத்தில் இருப்பவையாகின்றன. தானியங்கி மொழிபொயர்ப்பு செயலிகள் சரியனவையாக அமையும்.
    • இதன் முக்கியத்துவத்தை அதிகப்படுத்தி சொல்லமுடியாது. ஒவ்வொரு கலைசொல் அடங்கிய புத்தகமும் வெளிக்கொண்டுவர பல மாதங்களில் இருந்து சில ஆண்டுகள் ஆகின்றன – இந்த கால தாமத்தை குறைக்க வேண்டும்.
    • முக்கியமாக எனது பார்வையில் இந்த நூல்கள் விரைவில் தமிழாக்கம் ஆகவேண்டும்
      • Python மொழி உதவி ஆவணங்கள்
      • TensorFlow செயற்கையறிவு மென்பொருள் கட்டமைப்பு உதவி ஆவணங்கள்
  2. வீடியோ வழி, ஒலி வழி – உரை, கட்டுரை, நூல்கள் உருவாக்க செயற்கையறிவு செயலிகள்
    • தமிழில் கணினி சார்ந்த தகவல்களை தமிழ் கணினியாளர்கள் நேர்வழி பங்களிப்பதும் பயன்படுத்துவதற்கும் ASR, OCR, Video close-captioning, போன்ற செயல்பாடுகள் பலரையும் தமிழ்கணிமைக்குள் வரவேர்க்க உதவும்.
    • புதிய கருத்துக்களையும், புதிய தகவல்களையும் தமிழிலேயே உருவாக்க இது உதவும்
  3. செயற்க்கையறிவு அணிமாதிரிகளை பொதுவாக “Model Zoo” என்று அருங்காட்சியகமாக பயன்படுத்துவது.
    • தமிழுக்காக பலரும் தங்களது செயற்கையறிவு கருவிகளை உருவாக்குகின்றனர். இவற்றில் பயிற்சி செய்வது ஆகக்கடினமானது, அதிக நேரம் கணிமை செலவெடுக்கும் வழியில் ஆனது. எனவே இவற்றை முடிந்த அளவில் பொதுவெளி (public domain) உரிமத்தில் வெளியிடல் சிறப்பானது
    • இதன் முதல் முயற்சி GitHub-இல் அருங்காட்சியகம்
  4. தமிழ் அகழாய்வு பற்றிய உதவி செயலிக்கள் (சற்று திசைமாரி மேல் சொன்னமாதிரி இந்த பயன்பாடு கணிமைக்கு நேர்வழி உதவாதது என்க்கு புலப்படுகின்றது)
    • ஒரு பானை ஓட்டில் எழுதப்பட்ட சொல் தமிழ், தமிழி (பிரமி), அல்லது எண்களா? அல்லது எழுத்துக்களா? என்பதனை கண்டறிய பொதுமக்கள் கைபேசியில் சொயலிகளின் வழி நிறுவி தொல்லியல் வல்லுநர்களுக்கு சிறந்த சரியான தகவல்கள் அளிக்கும் வகை இந்த செயலிகள் உதவும்.

மேலும் தமிழ் மொழி கல்வி, சிந்தனைக்களம், தகவல் பரிமாற்றம் போன்றவற்றைப்பற்றி நீங்களும் சிந்தியுங்கள் – கருத்துக்களை இந்த வலையில், அல்லது மின் அஞ்சலிலும் பதிவிடுங்கள்.

நன்றி.

 

வாசிப்பு – தானியங்கி நுட்பங்கள் -1

இடம்தானியங்கி கார்கள் வரலாறு. வலம்: செயற்கை நுண்ணறிவு பின்னல்கள்

சமீபத்தில் செயற்கை நுண்ணறிவு பற்றி கற்க ஒரு வாய்ப்பு கிடைத்தது. முழு நேர வேலைகளில் இந்நூல்கள் உதவும் என்ற எதிர்பார்ப்புடன் இவற்றை படிக்க முயற்சி.

முதல்நூல் தானியங்கி கார்களின் வரலாறு பற்றியும் அதன் வளர்ச்சி, சமகால நிலை மற்றும் முதல்நிலை மாந்தர்கள் பற்றியும் உள்ளானது. அதாவது சிக்கல என்ன என்றால் “கார் ஓட்டுனர் இல்லாமல் எப்படி தோடக்க இடத்தில் இருந்து பயணர்கள் செல்லும் இடத்திற்கு விபத்துகள் இல்லாமல் குறுகிய காலத்தில் செல்லும்” என்று கொள்ளலாம். இது டார்பா , அமெரிக்க பல்கலைக்கழகங்களில் தோடங்கி ஜீஎம்கூகிள் மற்றும் பல சமகால நிறுவனங்களின் கார்கள், திட்டங்கள் பற்றி சொல்கின்றது.

அடுத்த புத்தகம் பற்றி அடுத்த பதிவில் :). மனிதன் தமிழ்தான் முதலில் பேசியதை நகைத்து புதுமைப்பித்தன் “முதல் குரங்கு தமிழ்க்குரங்கு,” என்பதை (கீழடி பற்றிய ஊடக நிகழ்வில்) பத்திரிகையாளர் மாலன் நினைவுபடுத்தினார். இறண்டாவது, மூன்றாவது ரோபோ தமிழ் பேசவைக்கலாம் – ஏனெனில் நீங்களே பிரம்மா!

ஆடுகளம் – 2020

Tamil projects for 2019-2020

Over the course of this year, since translating Ruby Kin, and preparing a summary of 3 years work on spell-checker for Tamil Internet Conference – 2019, I’ve been thinking of next level of interesting projects.

The following have come to mind, expressed in Twitter @ezhillang in various forms. Here they are in simply chronological order,

  1. Translating “Data Structures and Algorithms” book in Tamil
  2. Translating/Writing a “Debugging Techniques” book in Tamil: ‘கணினி செயல்முறை நிரகளில் வழுநீக்கம்‘ – பயிற்சி, நூல்
    • Debugging techniques are important learning milestone for any professional software/hardware developer which are usually learnt on the job and essentially skipped in academia (perhaps for practical purposes).
  3. (Research/Proof-of-concept) Viterbi algorithm based spelling correction algorithm for Tamil
  4. (Research/Proof-of-concept) Concordance based context ambiguity resolution for Tamil spelling correction.

Contingent on our levels and degrees of success we can share our work in forums like Tamil Internet Conference, ACL or ACM, etc.

நிவாடா மாகனத்தில் மலையேரும் சமயம் மொட்டை வெயிலில் எடுத்த தம்படம் 🙂

As always collaborators are welcome: email: ezhillang -AT- gmail -DOT- com

Summer 2019 Tamil Computing Essay Competition

Students (from 1st year in accredited college to final year and 1yr post graduation, bachelors degree only) are requested to participate in Summer 2019 Tamil Essay Competition.

Please submit a 4-8page essay on any of following topics of your choosing; essays are requested to be in the form of a project proposal and intent to benefit Tamil language development. Essay publication is granted to Ezhil Language Foundation. Essays can be in Tamil or English. Decision of judges is final and binding.

List of topics follows:

  1. Viterbi algorithm to decode spelling errors from big ram statistics
  2. Tamil Text to Speech synthesis using unit selection synthesis and AI approaches

Please email your entries in Word Doc or Open Office ODT format in UTF-8 Unicode encoding before September 4th, to email “ezhillang@gmail.com” with subject “essay competition 2019”

Please attach a note of your resume/ C.V. to the application.

Up to two winners maybe picked and announced by end of September 2019 and offered a opportunity to build a software.

Prize money of $100 and $75 are offered to any winners contingent on agreement of judges. If no suitable entries are present no prizes maybe declared.

Sincerely,

Ezhil Language Foundation

முகம் சுளிக்கும் நிரலாளரின் மூளைக்கு வேலை

படம்: முத்து கிட்டார் வாசிக்காமல் கருத்து சொல்கின்றான்.

உறங்குவதற்கும் முன் நிரல் எழுதினால் ஏன் தூக்கம் தூரம் செல்கின்றது ? நிரல் எழுதுவதும், வடிவமைப்பதும் இரு பரோட்டா கடையில், அல்லது ஓட்டலில் தோசை ஊற்றுவது போலன்று – மூளையை குழப்பி எடுக்கும், பின்னிப் பிணைந்து, எடுத்த பாதைகளும், எடுக்காத திசைகளையும் அவற்றின் தாக்கங்களையும் மனதில் மூளையில் படிப்படியாகக் கொண்டு நாம் அதனை செயல்படுத்தி நிரல் வடிவமைக்கின்ற்றோம். அரைத்த மாவை அரைக்க இங்கு வேலை இல்லை. ஒவ்வொரு வழு, பிழையும் ஒரு தனி கிரத்தில் இருந்து வந்தது போலவும் தோன்றும்.

விஸ்வணாதன் ஆனந்த் சதுரங்க ஆட்டத்தில் எப்படி மூளையை கசக்க்கி சிக்கலான ஆட்டத்தில் எதிராளியின் தாக்குதலில்இருந்து விடுவிக்க முயலும் சமயம் அவர்மூளையின் வேலை அளவில் உள்ள வேகம் சராசரி கணினி நிரலாளர்களின் வேகமாக அமையும். இப்படி சும்மா பேச்சுக்கு சொல்லவில்லை – கணினி நிரலாக்கத்தில் எதிராளி என்பது என்ன ?

Entropy என்று சொல்லக்க்கூடிய சரியான விடையின் பாதையில் உள்ள தவரான விடைகள் – இவற்றை சலிப்பில்லாமல் கடந்து வந்தால் சரியான விடை கிடைக்காது – அது, அந்த ஒவ்வொரு கட்டத்திலும் நாம் எடுக்கும் தீர்வுகள்/முடிவுகள் கணிமையின் திசையை சரியான (எளிதில் – path of least resistance – வழி கிடைக்காத வகையிலான) திசையில் எடுத்துச்சென்று விடையடையச் செய்கின்றது.

இதுதான் கணினி நிரலாளரின் குருகிய முகம் சுளிக்கும் பாவத்தில் உள்ள மன நிலை. அவர்/அவளு-க்கு ஒரு ஊக்குவிக்கும் சொல் கொடுங்கள் – இல்லை இல்லை சும்மா கூட விட்டுவிடுங்கள் – ஆனால் “ஐ.டியில் என்ன கிழிக்குர…” என்ற ஏழனப்பேச்சு வேண்டாம்.