“கௌசல்யா” – பல பைட்டு தமிழ் குறியீடு – Unicode and Tamil multi-byte encoding

ஒன்ருடன் ஒன்ரு சமன்பாடு (ASCII – ஆங்கிலம் போன்று இல்லாதது) பல பைட்டு தமிழ் குறியீடு – Unicode and Tamil multi-byte encoding என்பதை சறியாக புறிந்து கொள்வதை பற்றி தமிழ்நாடு பயனத்தில், SKP கல்லூரி, SRM பல்கலைகழகத்திலும் இந்த வாரம் பேசினேன்.

இந்த நிரல் கீழே

# -*- coding: utf-8 -*-
import tamil
name = u"கௌசல்யா"
L = len(tamil.utf8.get_letters(name))
print(u"name variable has %d letters"%L)
assert L == 4
# ஒன்ருடன் ஒன்ரு சமன்பாடு - பல பைட்டு தமிழ் குறியீடு