மாலை பொழுதின் மயக்கமென்ன

img_2450-e1509836851566.jpg

படம்: ஜூலை மலர், ஆண்டிற்கு ஒருமுறை மலரும். உபாயம், எனது தந்தை, வேளாண் வல்லுநர், திரு. அண்ணாமலை.

“தமிழ் தெரியுமா?” என்று நிறையபேர் ஒருவரை கேட்பது, இணையத்தின் தூரத்தில்,  பழக்கமான நாம் பார்க்கும் ஒரு விஷயம். காரணம் அடிக்கடி சிலரது சொற்களில் தலையெடுக்கும் சொற்பிழை. இவற்றை தவிர்க்க அவர்களுக்கு தேவை, பிழைகளை தடுக்கும்/திருத்தும் சொல்திருத்தி – spell checker – மூலம் ஒரு கட்டுரையை சோதித்தால். பல ஆண்டுகள் தமிழ் பயின்ற பொலிவு லேசுலே நமக்கும் கிடைக்கும். இந்த கட்டுரையும் அப்படி ஒரு (வளர்ச்சி நிலையில் உள்ள சொற்பிழை திருத்தியின் வாயில் சோதிக்கப்பட்டே பரிசுரம் செய்யப்பட்டது).

மாலை பொழுதில் மயக்கமென்ன ? தமிழில் உள்ள மயங்கொலி எழுத்துகள்  நான்கு வரிசையில் அமைக்கலாம்,

  • , , வரிசை.
  • , வரிசை.
  • , , வரிசை.
  • , , வரிசை.

சொல்திருத்தியில் கணினி நிரல் செய்யவேண்டியது இதுவே:

  1. உள்ளீடு கொடுக்கபட்ட சொல் சரியானதா, அல்லது தவறானதா ?
  2. தவறான சொல் என்ற பட்சத்தில் அதன் மாற்றங்கள் என்னென்ன ?

முதல் படியை எளிதாக ஒரு கையகராதியை கொண்டு செயல்படுத்தலாம். இதனை ஓபன்-தமிழ் (open-tamil) solthiruthi தொகுப்பில் Tamil VU மின் அகராதியை கொண்டு செயல்படுத்தியுள்ளோம். சரியான சொற்கள், அதாவது வேர் எடுத்த, புணர்ச்சி மற்றும் சாந்தி பிரிக்கப்பட்ட சொற்கள் அனைத்தும்  சராசரி மின்அகராதியில் காணலாம். இதுவே எளிதான படி.

இரண்டாவது படிதான் ஒரு சொல்திருத்தியின் சிறப்பிற்கும், தரத்திற்கும்,  முக்கியமானது; இந்த பதிவில் எப்படி மயங்கொலி எழுத்து பிழைகளை திருத்தலாம் என்று சில எண்ணங்களை சமர்ப்பிக்கிறேன்.

உதாரணம் உரையின் சொல் “பளம்” என்பது பிழை என்று கண்டறியப்பட்டது. இது பள்ளம், அல்லது பழம் என்று இரு மாற்றங்களை எழுத்தாளர் நினைத்தாலும் இதனை பிழையாக உள்ளீடு செய்துள்ளார். இங்கு ள-ல-ழ மயக்கம் காணப்படுகிறது.

இதனை கணினி “பலம்”, “பழம்” என்றும் மாற்றுகளை உருவாக்கி இதில் அகராதியில் உள்ளவற்றை மட்டுமே வடிகட்டி எழுத்தாளருக்கு பரிந்துரை செய்யவேண்டும்.

இதனை கொண்டு அணைத்து மயங்கொலி பிழைகளை திருத்தும் ஒரு தன்மை கொண்ட சொல்திருத்தியை உருவாக்கலாம். உதாரணம்,

வளர்ச்சி நிலையில் உள்ள, தற்போது மென்பொருள் வடிவமைப்பில் உள்ள சொல்திருத்தி ஓபன்-தமிழ் தொகுப்பில் காணலாம்: [எச்சரிக்கை: இது இன்னும் பொது பயன்பாட்டிற்கு பொருத்தமானதல்ல]

muthu@brightone:~/devel/open-tamil$ ./spell.sh -i
>> பளம்
சொல் “பளம்” மாற்றங்கள்
(0) பம், (1) பளகு, (2) உளம், (3) பள், (4) அளம்
, (5) ஆளம், (6) பழம்
வணக்கம்!

-முத்து அண்ணாமலை

கலிஃபோர்னியா, அமெரிக்கா.

எழில் – டுவிட்டரில் ஒரு தானியங்கியாக

தொடக்கம்

சென்ற வாரம் எழில் மொழியை டுவிட்டர் வழி செயல்படுத்த ஒரு உத்தி ஒன்றை உருவாக்கலாம் என்று தீர்மானித்தேன். பல செயல்பாடுகள் facebook, skype, போன்றவை messenger bot என்ற தானியங்கிகள் வழி செயல்படுவது ஓர் இரண்டு ஆண்டுகளாக சமணியமாகின.  இதே போல கடந்த மாதம் கனடாவில் குறள் பாட் என்ற தானியங்கி facebook செயலி பற்றி  கேள்விப்பட்டேன்; நிரைய நாட்களாக இப்படி ஒரு எழில் இடைமுகம் கொடுக்க வேண்டும் என்று எண்ணினேன், இதற்க்கு இப்போது ஒரு காலம் வந்துவிட்டது!

வழி

ஏற்கனேவே குறள்களை புதுவள்ளூர் @puthuvalluvar என்ற முகவரியில் தானியங்கி வழி செய்திருந்தேன். இது தற்போது செயலுற்று கிடக்கிறது ஆனால் இதனை செயல்படுத்த python-twitter என்ற நிரல் தொகுப்பை பயன்படுத்தினேன்; இதனை கொண்டு @ezhillangbot என்ற புது கணக்கில் ஒரு தனியாகியை உருவாக்கினேன். இதன் மூல நிரல் இங்கு. twitter பக்கம் நீங்கள் ஒரு

பயன்பாடு

இதனை ஒரு cron-வேலையாக நிறுவிய பின்னர் அனைவரும் பயன்பாடு செய்ய இப்படி உங்கள் கணக்கில் இருந்து ஒரு எழில் நிரலை டுவீட் செய்யுங்கள்;

               @ezhillangbot அச்சிடு(“வணக்கம் உலகம்!”)

இதனை படித்துவிட்டு தானியங்கி உங்கள் பெயரை சூட்டி நிரலின் விடையை அளிக்கும்; உதாரணம்,

ezhillangbot-tweet-toezhillangbot-execution-1

இதனை நீங்களும் பரிசோதனை செய்து எனக்கு தகவல்கள் சொல்கிறீர்களா ? டுவிட்டரில் நேர்வழி சொல்லுங்கள், இல்லகாட்டி இங்கும் சொல்லுங்கள்!

நன்றி.

முத்து

தமிழ் இணைய மாநாடு 2017 – டொரோண்டோ, கனடா

16-ஆவது தமிழ் இணைய மாநாடு, டொராண்டோ, கனடாவில் சென்ற வாரம் சிறப்பாக நடைபெற்றது.  

எனக்கும் ஒரு நல்ல அறிமுகவாகவும், அனுபவமாகவும் இருந்தது.  மாநாடு நிறைவு பெரும் நாள் — at University of Toronto Scarborough (UTSC). இந்த படங்கள் எடுக்கப்பட்டன:

group-pic

நன்றி, நினைவுகள்

எனக்கு நிரைய விஷயங்கள் புதிதும், பலதும், பழையதும் புரிந்தது. எனக்கும் வயசாக நான் தொடர்ந்து வேலை செய்த அறிஞர்களிடத்து நான் ஞாயமாக கண்ட ஒரு ஆதங்கம் “இளைஞர்கள் முன்னோடிகளின் வேலைகளையும், பங்களிப்புகளையும் சரிவர மதிப்பதில்லை” என்ற ஒரு கருத்து. இது பெரும்பாலும் உண்மை. ஒரு கருவி, செயல்பாடு உருவாக்கிய பின் அதனை அடடா இது தானா – நம்மளே பன்னிருக்கலாமே என்று ஒரு  “post-hoc”, “after the fact”  நினைப்பில் முன்வந்த உருவாக்கங்களை நாம் லேசுபடுத்தியுள்ளோம்.

தமிழ் இணைய மாநாடு (2017)-இல் வரலாறு படைத்த தமிழறிஞர்களுடன் கலந்துரையாடியது மகிழ்ச்சி. நியூட்டன் சொன்னது, “standing on shoulders of giants”, போன்ற நமது இன்றைய நிலைக்கு காரணம் இவர்களை போன்ற சான்றோரின் பணி. நம்ம Jimmy Wales, Steve Jobs, Richard Stallman போன்றவர்களை மட்டும் ஒரு கடவுள் அளவுக்கு பார்க்கிறோம் – நம்மது தமிழர்களை நாம் மிகைப்படுத்துவதும், பெருமிதம் கொண்டும், கொண்டாடுவதும் அரிது.

கடன்

எனது பயனத்தை நிஜமாக்கிய மாநாடு குழு தலைவர் பேரா. திரு. செல்வா அவர்களுக்கும், எனது குடும்பத்தினருக்கும், எழில் மொழி குழு, திறமூல தமிழ் மென்பொருள் நண்பர்களுக்கும் நன்றி.

 

குறிப்பாக எழில் திட்டம் நிறைய கடன்பட்டது – முக்கியமாக எனது பங்களிப்பாளர்களுக்கும், எங்கள் குடும்பகளுக்கும் முன்னிலையில். எங்கோ செல்கிறோம், விரைவில் முன்னேற்றமோ, முடிவோ வரும்.

மேலும் புது சவால்கள் வரும், அத்துடன் துணிச்சலான தீர்வுகளும் வரும். அச்சம் இல்லை என்பது இந்திய சுதந்திர போராட்டம் என்பதற்கு மட்டும் பாரதி சொன்னதில்லை, தமிழில் இயங்கும் நமக் கும் கூட இது பொருந்துமோ!

பொருளடக்கம்

அகத்து 25

முதல் நாள் என்னால் போக முடியவில்லை; இதனை பற்றி இங்கு படிக்கலாம்.

அகத்து 26

இரண்டாம் நாள் திரு. முத்து நெடுமாறன் அவர்கள் “கருவாக்கல் – உருவாக்கல் – விரிவாக்கல்” என்ற தலைப்பில் பேசினார். நல்ல உரை, இது product development பற்றியும், அவரது ஏறத்தாழ 30-ஆண்டு அனுபவத்தை தொட்டு அற்புதமான ஒரு பேச்சாக அமைந்தது. அவர் சொன்னதில் சில முக்கியமானது, மற்ற இடங்களிலும் நான் கேட்டிருக்கிறேன் ஆனால் முதலில் தமிழ் வெளியில் இவரிடமே.

  1. தமிழினால் மட்டும் உங்கள் உத்தி வியாபாரம்/பயன்பாடு ஆகாது. அதற்க்கு முதல் நிலை பயனர் தேவைகளை பூர்த்தி செய்யவேண்டும்.
  2. எளிமை, பயனர் அனுபவம் எளிதாக இருத்தல் வேண்டும்.
  3. உரிமம் – இலவசமாக கொத்தாலும் ஒரு உத்தி/செயலி அபாரமாக வெற்றி அடையும் என்று சொல்ல முடியாது.
  4. மேலும், பயனர்கள் எப்படி தமிழ் இடைமுகங்களை புறக்கணிக்கின்றனர் என்றும் உதாரணங்கள் கூறினார்.

அடுத்து  பேரா. திரு. வாசு அரங்கநாதன், அவர்கள் பேசினார். அவர் தமிழில் எப்படி மொழியியல் வழியிலும் JSON-வழி tagging செய்வது, ஒரு crowdsourced-ஆக இதை எப்படி செய்து செவ்விலக்கியங்களை படிப்பது என்று அவர் ஆராய்ச்சி செய்தும் உருவாக்கி வரும் அந்த ஒரு மென்பொருள் வலைதளத்தை உதாரணம் காட்டினார். இது ஒரு பெரிய மேம்பாடாக எனக்கு தெரிந்தது.

எனது படைப்பான, “Tamil open-source challenges and opporunities” என்கிற தலைப்பில் வேகமாக பேசினேன்; எதிர்பாராத விதமாக சில மூத்த பேராசிரியர் நடுவில், அமெரிக்க பல்கலை வரம்பில் இல்லாதபடி, கேள்விகள் எழுப்பியும் அபிப்ராயங்களை எழுப்பியும் சற்று திசை திருப்ப முயன்றார்; நான் “உங்கள் விமரிசனங்களை ஒப்பு கொள்கிறேன்,” என்றபடி பேசி சென்றேன்.   எனது பேச்சில் நல்ல ஈடுபாடு இருந்ததாக தெரிந்தது. எனது திரை-படிமங்கள் இங்கு slideshare-இல்.

Image may contain: 1 person, screen

தமிழ் திற மூல மென்பொருள் வெளியில் உள்ள சவால்களும், வாய்ப்புக்களும் என்ற கட்டுரையை வழங்கிய பொழுது. (INFITT 2017, University of Toronto, Scarborough).

எனக்கடுத்தது நினைவில் உள்ளபடியான கட்டுரை “நூலகம் அறக்கட்டளை”-யின் நற்கீரன் அவர் படைத்தார். தமிழில் object-entity தொடர்பாடல் உருவாக்குதல் பற்றியும் ஒரு ontology பயன்செய்து semantic web உருவாக்குதலை பற்றியும் மிக துல்லியமாக பேசினார்.

அகத்து 27

இன்று சிறப்புரை ஆற்றியது பேரா. திரு. கல்யாணசுந்தரம் அவர்கள் மதுரை திட்டம் பற்றி, அதன் தோற்றம், அவரது கணிமை ஈடுபாடு, வரலாறு பற்றி மிக அருமையாக பேசினார். மதுரை திட்டம் பற்றி எப்படி 30-ஆண்டு காலமாக தொடர்ந்து புத்தகங்களை எண்ணிம உரையாக பராமரித்து வருகிறார் என்றும் கூறினார்.

இளங்கோ சேரன் அவர் “clj-thamil” பற்றியும் prefix tries தரவமைப்பு (data structure) பற்றியும் பேசினார். இதில் அவர் நேர்வழி பயன்பாடு (demo) காட்டி எல்லாரையும் அசத்திட்டார். அவரது திரை-படிமங்கள் மற்றும் கட்டுரை இங்கு.

எழில் பதிவெண் 0.99 வெளியீடு படைப்பு

எனது பங்கிற்கு நான் அதிகமாக எதிர்பார்த்து கொண்டிருந்த எழில் கணினி மொழி வெளியீடு பற்றிய சவால்கள் பற்றிய கட்டுரை வாசிக்க நேரம் வந்தது; கட்டுரை திரை படிவங்கள் இங்கே. நான் அரங்கில் உள்ளோரை கேள்விகளை படைப்பு முடியும் வரை சேமித்து கொள்ள சொன்னேன். எழில் வளர்ச்சி பற்றியும், சந்தித்த முட்டுக்கட்டைகளையும் பற்றியும் எப்படி இன்றுள்ள நிலையை எட்டினோம் என்றும் சொன்னேன். “தமிழில் நிரல் எழுது” என்ற புத்தகத்தை விளம்பரப்படுத்தினேன். பேச்சு முடிந்தபின் சிலருக்கு இந்த புத்தகத்தை கையெழுத்திட்டு சிறப்பு நினைவாகவும், மற்றவருக்கு கனடிய வெள்ளி ஆறரை-இக்கும் விற்பனை செய்தேன். ரொம்ப கேள்விகள் இல்லை. நேரம் அதிகம் சென்றது – உணவும் வேளை ஆகியது. – ஆனால் எல்லோரும் அப்பாடா என்று என்னைவிட சற்று பெருமூச்சு விட்ட மாதிரி எனக்கு நலைப்பின்னர் தோன்றியது. என்ன எதிர்பார்த்தேன் என்று தெரியவில்லை

விழா மலர்

விழா மலரில் நானும், நண்பர் கணபதியுடன் ஒரு கட்டுரை “GPUs powering the AI revolution,” என்று எழுதினோம். மற்ற நல்ல கேள்விகள் கட்டுரைகள்.

  1.  “தமிழில் ஒரு திற மூல சொல் திருத்தி” அதன் முக்கியத்துவம் பற்றி வள்ளிபுரம் சுகுந்தன் நல்ல கட்டுரை எழுதியுள்ளார்.
  2. பேரா. பொன்னவைக்கோ, TACE16 பற்றி எவரேனும் இதனை மென்பொருளாக்கி, பரிசோதித்தல் வேண்டும் என்று ஒரு தேவையை முன்வைத்தார்; இதற்க்கு Unicode extended plane-இல் இடம் உள்ளதாக ஒப்புதல் வந்துள்ளது என்றும் சொன்னார், ஆனால் எதுவும் மென்பொருட்கள் பொதுவாக/பரவலாக இதுவரை இல்லை.
  3. விழா மலரில் பேராசிரியர் திருமதி. ராஜம் கிருஷ்ணன், மாநாடு தலைவர் திரு. செ. இரா. செல்வகுமார் பற்றி சிலாகித்து அருமையாக ஒரு வாழ்த்து எழுதியிருந்தார்.

முடிவுரை

இன்னும் கூடுதலாக நேரம் செலவிடமுடியவில்லை என்பதும் மனதில் இருந்தாலும், So long Toronto, Canada. மீண்டும் சந்திப்போம் – நயாகரா, Space needle, போன்ற சுற்றுலாக்களை அப்போது காண்போம்; மனைவியும் வருவாளோ என்னமோ. அதுவரை வேலைகள் நிறைய உள்ளன.

 

எழில் உதவி ஆவணம் காட்டி மேம்பாடு

எல்லா மென்பொருளிலுமே ஒரு “Help” (உதவி) மெனு கொடுப்பது IT துறையில் உள்ள ஒரு எழுதாத சட்டம் என்றே சொல்லலாம்.

இப்போது இந்த எழில் செயலி எழுதியில் ஒரு உதவி ஆவணம் கட்டியை முன்னாடியே இணைத்திட்டோம். ஆனால் அது மனசுக்கு பிடித்தமாதிரி இல்லை.

இப்போது இந்த window (சாளரத்தில்) எனக்கு மூன்று விஷயங்கள் பிடிக்கவில்லை; இதற்க்கு படம் 1 உதவியாக இருக்கும்:

  1. புத்தகத்து தலைப்பு “0” என்று சொல்லக்கூடாது; இது நீக்கப்படவேண்டும்.
  2. அடுத்து அத்தியாயங்களின் தலைப்பு இடது பக்கம் ஆரம்பித்து  இருக்கவேண்டும்.

    ezhil_book_screen_updates

    படம் 1:   எ ழுதி உதவி ஆவணம் காட்டி

  3. அடுத்து அத்தியாயத்தின் தலைப்பை பெரிய எழுத்துக்களில் இருக்க செய்யவேண்டும்.

இவற்றை github வழு பட்டியலில் issue என்று பதிவு செய்தேன்

 

 

இதனை GTK3+ documentation கைவசம் வைத்து நிரலை மாத்தி எழுதலாம். இதற்க்கு முன்னும் பின்னும் ஒரு மணி நேரம் மேல் ஆனது.

ஒவ்வொரு முறையும் ezhil-lang/editor/DocView.py என்ற நிரலை மாற்றிய பின் python ezhuthi.py என்று இயக்கி “உதவி > புத்தகம்” என்ற மெனுவில் இருந்து சுடக்கி இதன் தோற்றத்தை சரிபார்க்கவேண்டும்.

எல்லாம் சரியானதும் இது போன்று காட்சி அளித்தது:

ezhil_book_screen_updated

படம் 2: திருத்தம் செய்த நிரலில் “உதவி > புத்தகம்” தோற்றம்

இதனை github-இல் உடனே சேர்த்துவிட்டேன். இப்போது எழில் ஆவணம் காட்டி மேம்பாடு செய்தாச்சு ! மீன்டும் பார்க்கலாம்.

-முத்து

ஆய்வு கட்டுரைகள் – தமிழ் இணைய மாநாடு

இந்த ஆண்டு தமிழ் இணைய மாநாடு டொரோண்டோ நகரில் நடைபெறவுள்ளது. இதனை ஒட்டி எழில் மொழி அறக்கட்டளை திட்டத்தின் கீழ் இரண்டு கட்டுரைகள் எழுதி ஒப்புதலுக்காக சமர்பித்துள்ளோம்.

இதில் எவையேனும் அல்லது இரண்டும் தேர்ந்தெடுக்கப்பட்டால் மாநாட்டில் பேச வசதியாக இருக்கும்.

கட்டுரை தலைப்புகள்,

  1. “எழில் – பொது பயன்பாட்டிற்கும், வெளியீடு நோக்கிய சவால்களும்”
  2. “Tamil Open-Source Landscape – Opportunities and Challenges”

பொறுத்திருந்து பார்ப்போம். கட்டுரையில் பங்களித்தவர்கள் அனைவருக்கும் நன்றி.

 

 

 

கணிமையில் மகளிர் பங்களிப்பு – சர்வதேச மகளிர் தினம்

ezhil_March08_2017

படம் 1: எழில் திருத்தி ‘எழுதி’ இல் ‘பெர்னோல்லி எண்கள்’ (Bernoulli Numbers) என்பதை எளிதாக இயக்கி பயன்படுத்தலாம் என்று காட்டும்.

சர்வதேச மகளிர் தினம்க அன்று கணிமையில் மகளிர் பங்களிப்பு பற்றி ஒரு சிறிய கட்டுரை.

கணினி நிரலாக்கமே ஒரு உயர்குடி பிரிட்டிஷ் பெண்  அடா லவ்லேஸ்  தனது வாத்தியார் சார்லஸ் பபேஜ் அவரது “analytical engine” ஆதி-கணினியில் “Bernoullli Numbers,” (பெர்னோல்லி எண்கள்) கணக்கிட எழுதியதால் உருவானது. ஆனால் இவருக்கோ காலம் அப்படி எழுதிய நிரல் ஓடவே இல்லை – ஏன் என்றால் அந்த கணினியின் திறன் போதவில்லை. இது ஏற்கனவே இந்த வலைப்பதிவில் எழுதினேன்.

அடுத்த கட்டமாக கணிமையில் முக்கியமான “compiler” என சொல்லக்கூடிய “தொகுப்பி”-யை உருவாக்கியவர் அமெரிக்க பெண் கிரேஸ் ஹாப்பர் (Grace Hopper).

இவை இரண்டும் கணிமையில் டூரிங் முன் (Before Turing) அடா லவ்லேஸ், மற்றும் டூரிங் பின் (After Turing) கிரேஸ் ஹாப்பர் என்று சொல்லும் அளவிற்கு பெரிய சாதனைகள். கணிமை பெண்களினாலும் ஆனது, இல்லையேல் பேங்கினால் ஆனதா ? நீங்களே சொல்லுங்கள்.

இன்னும்  எங்கள் எழில் திட்டத்தில் பங்களித்த பெண்கள் பற்றி இங்கு – சென்ற ஆண்டு எழில் “கால்சீ” திட்டத்தில் பங்களித்த ப்ரியா, “எழில் கையேடு,” படம் “வரைந்த” வியட்நாமிய ப் பெண், அவர்களுக்கு நன்றி.  சென்ற ஆண்டு எழில் பற்றி ஊக்கம் அளித்த குடும்பத்தினர் – மனைவி, மற்றும் தாய்  அவர்களுக்கு நன்றி.

இன்று எழில் மொழியை பேக்கஜ் செய்யும் பணியில் ஆகிய முன்னேற்றம் பற்றி ஒரு மேம்பாடு செய்யப்பட்ட திரை-சேமித்த-படம்; இதில் ‘பெர்னோல்லி எண்கள்’ (Bernoulli Numbers) என்பதை எளிதாக இயக்கி பயன்படுத்தலாம் என்று காட்டும்.

தரவமைப்புகள் – கருத்து கணிப்பு

வணக்கம்,

சில ஆண்டுகளாக தமிழில் data structures என்ற தரவமைப்புகளை முறையாக அணுகவேண்டும் என்று யோசித்து வருகிறேன். இதன் காரணமாக நம் சமூகத்தில் ஒரு கருத்து கணிப்பை உருவாக்கி இருக்கிறேன்.  இதில் அனைவரும் பங்கேற்குமாறு  கேட்டு கொள்கிறேன்.
சுட்டி இங்கு https://goo.gl/forms/ijmbWjFk5lV2L2m92
நன்றி,
முத்து