2021 was a difficult year for everyone surviving into second year of global pandemic; however for Tamil computing community had much progress; here is my take on it.
Ezhil Language Foundation related activities in 2021
This year has been tough but we keep our head above the water for another challenging year 2022. I’m also happy to share I’ve volunteered to serve in the steering committee at INFITT organization to share some of open-source view points from my experience and some AI/ML strategies for developing our ecosystem.
Some of the major events by INFITT in 2021 are successful organization of Hackathon for college students at KCT in Kovai; 20th TIC organized virtually with good turnout and contributions from industry and academics.
Hope you are vaccinated, stay healthy, and in positive frame of mind to have a successful year and share some of your contributions to Tamil community.
2004-05 வாக்கில் திருச்சியில் படித்த காலம்; 2004-இல் எங்கள் திருச்சி GLUG என்பதை வழிநடத்திவந்த திரு. பி. விஜயகுமார் அவர்கள் பட்டம் பெற்று வேறு பணிகளுக்கு சென்றார். எங்களது கூட்டாளிகள் ஒரு நிரலாக்கம் போட்டியில் சேரலாம் என்று எண்ணி, பொறியியல் கல்லூரி படிப்பில் நெருக்கமான ஒரு மென்பொருளை தேர்வு செய்தோம்; அதாவது கனு-ஆக்டேவ் GNU Octave – இது MATLAB என்ற மென்பொருளுக்கு தோராயமான மாற்றாக விளங்கும் என்று எண்ணினோம். திட்டம் தொடங்க, அச்சமயத்தில் Octave-இக்கு ஒரு நல்ல திரை இடைமுகம் கிடையாத காலம் – அதில் வந்து GTK என்ற GUI Toolkitஐ இணைக்கலாம் என்பது திட்டம்; எங்கள் குழுவில் யாருமே கணினி பொறியியலில் வல்லுநர் கிடையாது – ஏதோ தட்டுத்தடுமாரி எப்படியோ படிப்படியாக மென்பொருளை “language bindings” என்ற தொழில் நுட்பம் கொண்டு செயல்படுத்திவிட்டோம்.
Octave-GTK, Octave-libglade bindings
அன்று திருச்சியில் மிகப் பெரிய பொறியியல் கல்லூரி என்றாலும், சிற்றுந்தில் ஏரி நெட்கபேயில் அருகிலுள்ள திருவெரும்பூரில் சென்று மட்டும் தான் SSH பொர்ட் 22 firewall தாண்டிய அனுமதி பெற்று இந்த திறமூல மென்பொருளை இணையத்தில், sourceforge-இல் தரவேற்றம் செய்ய வாய்ப்பு இருந்தது. இளங்கலை முடிந்த வாக்கில் இந்த போட்டியில் இரண்டாவது இடம் கொடுத்து அதில் கணிசமான (ஒன்றறை இலட்சம்) பரிசு தொகை குழுவிற்கு கொடுத்தார்கள்! நான் அன்றே அடுத்த விமானத்தில் அமெரிக்கா கிளம்பி ஒடியாந்துட்டேன். இன்றும் இதை நினைத்தால் வேடிக்கையாக இருக்கிறது.
ஓப்பன் தமிழ் என்று தொடங்கும் சமயம், அப்படி ஒரு சேவை இல்லையே என்று என்னால் நம்ப முடியவில்லை. சென்ற பத்தாண்டில் open-tamil, தமிழ்பேசு வலைதளம் என்றும் செயல்படுவதில் ஒரு மகிழ்ச்சி; இந்த தளத்தை Python3 என்றும் Django 3 என்றும் மேம்பாடு செய்தமையால் பல நவீன செயலிகள் – தமிழ் சந்திப்பிழைதிருத்தி, தமிழ் இணையவாணி சொல்திருத்தி, GNU Aspell சொல்திருத்தி போன்றவற்றை செயல்படுத்த முடிந்தது. கணியம் சயத் அபூதாகிர், சீனீ அவர்கள் தொடக்கிவைத்த இந்த வலைதளம் சிந்தனை மற்றும் கட்டமைப்பு, மற்ற மென்பொருள்களையும் பொது பயன்பாட்டிற்கு வழங்க உதவிகர்மாக இருக்கிறது. இந்த சமீபத்திய பதிப்பை வழங்க சூரேன் அவர்களும் குறிப்பிடத்தக்க பங்களிப்புகளை வழங்கியுள்ளார்.
இதனை செயல்படுத்தியவகையில் ஒரே கல்லில் இரண்டு மாங்காய் என்ற கதையாக இருக்கிறது; ஒரே{Tamil Sandhi Checker [சீனீ, நித்யா]} x {Spell Checker(s)} அதனை இரண்டு சொல்திருத்திகளுடன் (வாணி மேசைபதிப்பு/பைத்தான் வழி [ நீச்சல்காரன், சீனீ கணியம் குழு]) மற்றும் ஏஸ்பெல் [GNU ASpell, இளஞ்செழியன் தமிழா/மலேசியா குழுவினர்] இவற்றுடன் remix செய்து ஒரு புதிய சேவயை. http://tamilpesu.us அளிக்கமுடிகிறது என்பதுதான் திறமூல சூழலின் ஒரு பெரும்பலமாக இருக்கிறது.
எழில்-open-tamil contributors meetup (2018)
திறமூல மென்பொருள்களின் தொடக்கம் ஏதோ ஒரு உந்துதலினால் ஒரு இச்சையினால் தொடங்குகிறது. திறமூல மென்பொருட்களை அடிப்படை கட்டமைப்புகளில் பலரும் பொதுவாக அனுகி பயன்படுத்தும் வகைசெய்தால் மட்டும் “இனி மெல்ல தமிழ் வாழும், தமிழர் இணையத்தில் தழைக்கலாம், தமிழர்தொழில் நுட்பத்தின் வாயிலாக வல்லமை பெறலாம்” என்ற நிலை உறுதியாக வர வாய்ப்பு உண்டு. இந்த விஷயத்தில் தனியார் நிறுவனங்களும், அறக்கட்டளைகளும், தனியார்களும் தமிழக அரசைவிட, மற்ற நாடு அரசுகளைவிட, கண்டிப்பாக இந்திய அரசைவிட, ஊக்கம் அளிக்கக் கூடும். ஆனால் நாம் தொடர்ந்து தமிழ் கணினி /கலை ஆக்கங்களை ஊக்குவிவ்க வேண்டும். பண/அதிகார பலம் உள்ளவர்களிடத்தும் இதனை முறையிடுதலும் வேண்டும்.
மொழி வளர்க்க பாரதி சொன்னதுபோலும், “அச்சமில்லை …,”, அதை செயல்படுத்தல் திறமூல மென்பொருளில் எவருடைய தயவுதாட்சண்யையின்றி செயல்படும் நல்ல நிலை உருவாக்கும் என்ற எண்ணம்/நம்பிக்கை இருக்கிறது. கிட்டத்திட்ட மொழியின் வளர்ச்சி மாதிரிதான் மொழியியல் மென்பொருளும் வளர்கிறது.
பொது வீட்டின் முற்றத்தில் வேரேடுக்கும் ஆலமரத்தை, ஊக்குவிப்போம்! ஊர் ஒன்றுபட்டால் உண்டுவாழ்வு.
தமிழில் ஏன் நாம் செயல்படுகிறோம் என்று பலருக்கும் குறிப்பிட்டவரைப்பற்றி ஒரு கருத்து இருக்கும்பொழுது செயல்படும் நம்மவர்க்கு என்ன புரிதல் இருக்கிறது? ஒரு கண்ணாடியில் பார்த்தால் போதுமே – புலப்படும் அந்த பிம்பத்தின் உரிமையாளர். அவர்களது மனதில் நினைவோட்டத்தில் எண்ண ஓடுகிறது என்று எளிதில் சொல்லமுடியுமா என்ன – ஒட்டு மொத்த உளவியல், மனோதத்துவியல் துறைகளே இதனை சுற்றி கட்டமைக்கப்பட்டவை. அவர்கள் கண்டதைவிட புதிதாக நாம் எதுவும் இந்த வலைப்பதிவின் நீளத்தில் புரிந்துவிடலாமா என்ன? விளையாடாதீங்க.
சரி அப்பொழுது பொதுவான தனிமனித பொழுதுபோக்கு நேரங்களில் பங்களிப்புகள் நடத்தும் நமக்கு என்ன தேவைகள் இருக்கிறது? இவை எவ்வாராவது உறுமாறி தமிழ் பங்களிப்புகளாக மாற்றமடைகின்றன என்பதுதான் பலருக்கும் உள்ள செயல்பாட்டு நோக்கமாக அமைகிறது.
“தமிழ் சற்று தேக்கம் அடைந்த மொழி, தமிழில் செயல்படுவது ஒரு அடாவிசம் (atavism),” என்றெல்லாம் மற்ற இந்திய மொழியினர்கள் குற்றம் சாட்டினாலோ அல்லது மனதிற்குள் செறுக்காக எடைபோட்டு மதிப்பிட்டாலோ அவர்களுக்கு தமிழில் நடந்த, நடக்கும் விவாதங்கள், புரட்சி, போராட்டங்கள், அழகியல், முரண் போன்ற அறிவுசார்விவாதங்கள் பற்றியும் ஒன்றுமோ அறியாமையை மட்டும் சுட்டுகிறது.
ஆகட்டும் அவர்கள் கண்களுக்கு அரைப்பழங்குடியினராக மட்டும் தென்பட்டதால் அவர்களது (ஆங்கிலமல்லாத) மொழி வளர்ச்சியடைந்ததாக நான்கண்டதில்லை. எனினும் தமிழில் செயல்படும் பலரும் நெருக்கடிக்கிடையில் ஒரு பெரும்பாலான ஆங்கில சூழலில் பணியாற்றிக்கொண்டும், அல்லது மாணவரான சூழலில் தொடங்கி திறம்பட 30இல் இருந்து 60ஆண்டுகள் வரை பின்னடைந்த தமிழ் தகவல் ஆராய்ச்சிகளை தாமாகவே முன்னெடுத்து செய்கின்றனர். இவர்களை atavist, neanderthal என்றெல்லாம் பழிப்பது வெகுவான liberal/libertarian அரசியல் பார்வைக்குள் அடங்காதது. இதற்கு முன்சான்றே தமிழர்களை தற்குறைவாக பார்ப்பதாக மட்டுமே, “ஏய் மடராசி” என்றேல்லாம் சொல்வது போலவே அமைகிறது.
தமிழில் செயல்படுபவர்கள் பணத்திற்காகவும், ஆன்மீகம், பதவி, அரசியல், மொழி, இனம், தத்துவம், அழகியல், தொன்மை, தொடர்ச்சி, புதுமை என்றும் தனித்தனியாகவோ அல்லது பலவற்றினையும் கருத்தில்கொண்டும் செயல்படுவதனால் மொழி மேம்பாடு அடைகிறது.
இந்த எண்ணிம உலகில் 1-0 தவிர யார் மொழி கணினியில் செலுத்தப்பட வேண்டும் என்பது ஒரு அரசியல் – அதில் பிழைக்காதவர்கள் மொழிகள் தேக்கத்தை அல்லது ஒதுக்கப்படும் நிலைக்க தள்ளப்படுவதே ஒரு பின்னடைவு. மொழியையும் அதில் உள்ள கருத்துக்களையும் நாம் மனதில் அடைந்த முன்னேற்றத்திற்கும் வாழ்க்கை வழிக்கும் இசைவாக முன்னெடுத்துசெல்வது பெருமை – பன்மைத்துவத்தின் ஒரு உச்ச கட்டமாகவும் பார்க்கலாம். தமிழில் செயல்படுவது ஒரு புரிதல் – “நீ யார்,” என்ற தேடலின் ஒரு மிகப்பெரிய அடையாள கேள்வியின் பயணத்தில் உள்ள காட்டுப்பாதை. தாங்கள் பேசிய மொழிகள் பழுதடையப்பார்ப்பது ஒரு அடாவடி அடாவிசம்.
இராமானுஜன் இறந்து நூறாண்டுகள் ஆகிறது. அவரது அதீத, இன்றளவும் உலகம் மீண்டும் காணாத, கணித மேதையான அவரை பலகோணங்களில் காணலாம். அவர் ஒரு தமிழ்மகன் கூட என்றும் வலியுறுத்தி சொல்லவேண்டியது உண்டு. உலகளாவிய பலரும் இராமானுஜனின் கதையில் தமது வேட்கைக்கு ஊக்குவிப்பு தேடுகையில், தமிழராகிய நாமும் அவரது வெற்றிகளில் ஒரு வழி, ஒரு இலட்சிய இலக்கு தெறிகிறது என்றும் எண்ணலாம்; இவரை ஒரு தனிப்பட்ட இனக்குழு, மொழி, நாடு அல்லது துறைசார் நிபுணர் என்று மட்டும் பார்க்காமல் அவரது ஆளுமையில், வெற்றிவேட்கையில், அகால மறைவில் ஒரு மனித சோதனை-வெற்றி-பரிதாபம் என்றெல்லாம் பிரபஞ்சத்தின் உண்மைகளை கண்ட ஒரு தமிழ்மகனாகவும் பார்க்கிறோம்.
Princeton Companion to Mathematics
Ramanujan – biography (Princeton companion to Mathematics)
கொங்கு நாட்டு வட்டார வழக்கு சற்று இசைவானதும் கூட; மலை மலைசார் மக்கள், மலைச்சாரல் நிலம், மற்றும் பல தரப்பு மக்கள் காடு-மேடு-கலை என்றும் பலவகையில் வசீகரிக்கும் ஒரு குறிஞ்சி நில மண் வழி பிறந்த சொற்கள் பல படைப்பாளிகளின் வழி இன்றும் மேலோங்கி இந்த நிலத்து வழக்கு முன்நிற்கின்றது.
கிழே உள்ள சொல்தேடல்களில் உள்ள 10-சொற்களை கொடுக்கப்பட்ட உசாத்துனைகளிலிருந்து உங்களால் கண்டறியமுடியுமா? முயலுங்கள். தயாரித்தது: http://tamilpesu.us/xword/
உணவு அல்லது கட்டுச்சோற்றை கொண்டி செல்லும் கலன் (2)
கீழே இருப்பதை குனித்து கொங்கு நாட்டவர் எடுப்பார்கள் (4)
தனிமையில் நடந்து வருபவர் நடைபாவனை (7)
வைக்கோல், பருத்தி, ஆகியவை அறுவடையின்பின் காய்ந்த வடிவில் விலங்குகளுக்கு உணவாகும் (2)
ஏழு அல்லது எட்டு உருப்பிடிகள் (4)
பனையில் வழி வடிகட்டிய சர்க்கரை (6)
மதிய உணவுக்குப் பின் பொழுதுசாயும் வரை அளிக்கப்படும் சிறிய உணவுகள் (5)
காய்ச்சிய திடமான மதுபானம்(4)
பனை மற்றும் தென்னையில் இருந்து சுண்ணாம்பிட்டு இறக்கப்படும் மதுபானம்(2)
படம்: முத்து கிட்டார் வாசிக்காமல் கருத்து சொல்கின்றான்.
உறங்குவதற்கும் முன் நிரல் எழுதினால் ஏன் தூக்கம் தூரம் செல்கின்றது ? நிரல் எழுதுவதும், வடிவமைப்பதும் இரு பரோட்டா கடையில், அல்லது ஓட்டலில் தோசை ஊற்றுவது போலன்று – மூளையை குழப்பி எடுக்கும், பின்னிப் பிணைந்து, எடுத்த பாதைகளும், எடுக்காத திசைகளையும் அவற்றின் தாக்கங்களையும் மனதில் மூளையில் படிப்படியாகக் கொண்டு நாம் அதனை செயல்படுத்தி நிரல் வடிவமைக்கின்ற்றோம். அரைத்த மாவை அரைக்க இங்கு வேலை இல்லை. ஒவ்வொரு வழு, பிழையும் ஒரு தனி கிரத்தில் இருந்து வந்தது போலவும் தோன்றும்.
விஸ்வணாதன் ஆனந்த் சதுரங்க ஆட்டத்தில் எப்படி மூளையை கசக்க்கி சிக்கலான ஆட்டத்தில் எதிராளியின் தாக்குதலில்இருந்து விடுவிக்க முயலும் சமயம் அவர்மூளையின் வேலை அளவில் உள்ள வேகம் சராசரி கணினி நிரலாளர்களின் வேகமாக அமையும். இப்படி சும்மா பேச்சுக்கு சொல்லவில்லை – கணினி நிரலாக்கத்தில் எதிராளி என்பது என்ன ?
Entropy என்று சொல்லக்க்கூடிய சரியான விடையின் பாதையில் உள்ள தவரான விடைகள் – இவற்றை சலிப்பில்லாமல் கடந்து வந்தால் சரியான விடை கிடைக்காது – அது, அந்த ஒவ்வொரு கட்டத்திலும் நாம் எடுக்கும் தீர்வுகள்/முடிவுகள் கணிமையின் திசையை சரியான (எளிதில் – path of least resistance – வழி கிடைக்காத வகையிலான) திசையில் எடுத்துச்சென்று விடையடையச் செய்கின்றது.
இதுதான் கணினி நிரலாளரின் குருகிய முகம் சுளிக்கும் பாவத்தில் உள்ள மன நிலை. அவர்/அவளு-க்கு ஒரு ஊக்குவிக்கும் சொல் கொடுங்கள் – இல்லை இல்லை சும்மா கூட விட்டுவிடுங்கள் – ஆனால் “ஐ.டியில் என்ன கிழிக்குர…” என்ற ஏழனப்பேச்சு வேண்டாம்.
தமிழ் வசைபாட ஒரு உகந்த மொழி. உங்களுக்கு எவரையும், எதனையும் எக்காரணங்கொண்டும் திட்டவேண்டும் என்றால் இம்மொழியில் 0 மதிப்பில் தொடங்கி 100 வரை காதில் உதிரம் திந்தும் வரை வாய்ப்புகள் உண்டு.
இந்தபதிவு அனைவருக்கும் பொருத்தமானதா என்பதை தீர்மானிக்க நான் யார் ? நீங்களே முடிவு செய்யுங்கள். உங்களுக்கு இதனை படிக்க பிரியமில்லைஎன்றால் உடனடியாக வேறு வலைபக்கத்திற்கு செல்லுங்கள் இங்கு கூகிளாண்டவர்.
வசைசொற்களுக்கும் அதன் இணையான ஆங்கில சொல்லையும் கீழே தருகிரேன்.
தாயொழி – mother fucker
ஓத்தா – fucker
தெவிடியாப்பிள்ளை – bastard
சூத்தமூடு – shut your ass
பீ – poop
தெவிடியா – whore, bitch
புண்டை – cunt
ஊம்பாதவாயா – Cocksucker
நக்கிட்டுப்போ – Kiss My Ass
ஓத்திட்டுப்போ – Go Fuck Yourself
ஓம்மால – fuck your mom
ஓக்காளி – fuck your sis
புண்டை மவனே – pussy
பொச்சு – vagina
சுன்னி, பூல்/பூலு – penis
குசு – fart
நாயே – dog
பன்னி – pig
முலை/காய் – breast
அறிவு கெட்ட கூதி – retarded cunt
இந்த பட்டியல் நீண்டது இதுஒரு தொடக்கமாக எடுத்துக்கொள்ளலாம். சமகால A-certificate படங்கள் ‘வட சென்னை’ பொன்ற திரைக்கதைகளில் கவனித்துப்பார்த்தால் எவ்வளவு அழகாக தமிழில் வசைபாடலாம் என்று புரிந்து கொள்ளலாம்.
இப்படி ஒருவசை சொல் பட்டியல் நம்மிடத்தில் இருந்தால் என்ன செய்யலாம் ? உங்களை அடுத்த பதிவில் விடைகளுடன் சந்திக்கிரேன். அதுவரை சிறி, சிந்தி நண்பர்களே!
உலகில் தலைசிறந்த பொறியாளர் ஆண்-பெண்கள் Google-இல் வேலை செய்வதாக கேள்வி. ஆமாம் நனும், நீங்களும் தினமும் கோடு, ரோடு எல்லம் தான் காலா காலமாக போடுகிரோமே அப்படி கூகிளில் என்ன புளியகரச்சு ஊத்திராங்க ?
படம்: கணினி பொறியாளர் வேலைக்கு தயாராக்கும் நேர்க்காணல் புத்தகங்கள்!
சரி.
இதுதாங்க – நம்ம திக்கி தினரி, Stack-Overflowவில் பார்த்து விடை காணுவதில்லாமல் அல்கோரிதங்களில் புலியாகவும் இருப்பது இவர்களின் முதன்மை சிறப்பு!
நீங்கள் இந்தவகை பன்னாட்டு நிறுவனங்களில் அல்லது, உயர்நிலை கணினி தொழிலில் நிரலாளராக வேலை பார்க்க சில படிகள் உண்டு.
ஒரு கணினி பொறியியல் பட்டம் பெற்றும், அதில் கணினி நிரல்கள் வடிவமைப்பதில் வித்தகராக தேற்சி பெருங்கள். இது இல்லட்டியும் பரவாயில்லை.
சில பிரசித்தி பெற்ற வலைப்பூ இருக்கிரது – அவற்றையும் படியுங்கள்; 1 இணைப்பு, 2 இணைப்பு
சில நேர்காணல் புத்தகங்களைப் படியுங்கள்; இவை
‘Cracking the coding interview,’ – Gayle Laakman இங்கு
‘Programming interviews exposed’ – John Morgan, et-al இங்கு
சில நல்ல கணினி செயல்முறை புத்தகங்கள் பற்றியும் படியுங்கள்; இவை பற்றி முதல், இரண்டாம் கட்டுரைகள் எற்கணவே இங்கும் [முதல்], இங்கும் [இரண்டு].
இவைகளை நீங்கள் படித்தும், இவற்றில் உள்ள பயிற்சி பாடங்களை கணக்கிட்டும், தீர்வு கண்டும் ஆறு மாதம் அல்லது ஒரு வருடம் முயன்றால் நல்ல விளைவுகள் கிட்டும். கண்டிப்பாக நீங்கள் ஒரு வளர்ச்சி பெற்ற பொறியாளர் ஆவீர்கள்!
It is easy to confuse Jackfruit and Durian. Jackfruit is one of the famous ‘muk kani’ [முக்கனி – மா, பலா, வாழை] trio of fruits from Tamilnadu – Mango, Jack and Banana. Durian is not quite native of Tamilnadu [AFAIK], but more popular in equatorial south east Asia. Not to be out done, Tamil people have gotten taste of this fruit as well; globally however Durian aficionados remain a minority – the fruit is more widely known for being banned from airlines, airports and public arenas for its somewhat off-putting smell to the people unfamiliar with its taste; those ignorant of such this finer thing have no proclivity to this fruit and continue to cast bad light on it.
One day last year during the Thanksgiving holiday here in California, I went out to a grocery store in Bay Area. Silicon Valley, Lyndon B. Johnson’s opening up gates of America to Asian immigrants, the Gold Rush, Spanish Missions in reverse chronological order has settled this area with several immigrant populations – and today we are thankful for bountiful Pan-Asian, European, Hispanic options in the area.
At this grocery store there was big sign : “NOT DURIAN”, and a 1lb pieces of fruit were marked $5. Fresh Jackfruit is pretty much unheard of in USA except when imported and sliced open by immigrant run grocery stores in diverse communities in the area. Definitely, Bay Area qualifies for such a place. While the sign was written with intent to invite Durian wary folk to try and taste the Jackfruit, it did leave a bad taste before trying out the fruit.
Maybe, just maybe our languages and heritage are having bad publicity and marketing and sometimes misrepresentation and misinformation to turn away new speakers, learners and teachers, adoption of language in newer markets and products. Maybe our languages are not Durian. We are the Jackfruit.
அடிக்கடி தமிழில் பலர் சொல்லி கேள்விப்பட்டிருக்கேன்: “தமிழ் பலாப்பழம் மாதிரி, வெளியிருந்து உள்ள வர முள்ளாத் தெரியும், ஆனால் சொழ சொழயா பழங்கள் இந்த முள்ளை தாண்டி வந்தால் காத்திருக்கு!”. முயற்சி திருவினையாகும்.