Tamil in Morse-code

Can we compose a Tamil Morse-code ? Yes, we can.

315px-International_Morse_Code.svg

International Morse Code – Source: Wikipedia

  1. Start with a frequency count of Tamil letters from various sources
  2. Build a probability distribution from the frequency counts
  3. Build a Huffman code using the above distribution
  4. Each letter of Tamil alphabet gets a Morse code : 0 = ‘.’, 1 – ‘-‘.
    புள்ளி, கோடு.

Tamil Morse Code Table generated from Open-Tamil library. See here for full code and methodology. Full table follows.

Can you decode what this Morse code means in Tamil ? Hint: 2 words (4,5) letters long

…-. .-.—.-.-..– ..-.–.—.-.-… –.-…. …-. –.-…–.–.. –.-…–.-.. –.-…–.–.-…  .-.-…

  1. அ -> ..-…-
  2. ஷ -> —..-
  3. உ -> –.–.-
  4. வ் -> ..-.–.–..
  5. வௌ -> -.-.-…-.-..-..
  6. க -> …-.
  7. வை -> ..-.–…
  8. வோ -> .-…..-….
  9. வொ -> .——.-…–
  10. ங -> -.-.-…-.-…
  11. வே -> .——–
  12. வெ -> -.-…..
  13. வு -> .—…-
  14. வீ -> ..–..-..-
  15. வூ -> ..-.–.—.-..
  16. பௌ -> .-.—..-..-..
  17. தௌ -> —-.
  18. த் -> –.—.–
  19. தொ -> .–…-
  20. னி -> .——..
  21. தை -> …..-
  22. ப் -> ..–…
  23. ன -> .-.—…
  24. தே -> …–…–
  25. தூ -> –.—…
  26. தீ -> -..-.-
  27. து -> …–.–
  28. ற -> ..–.-
  29. வ -> -.-.—
  30. மா -> –.—-.
  31. மி -> -.-.–.-
  32. மை -> -.-….–.
  33. மொ -> ..-.–.–.-
  34. மோ -> .-…..-…-..
  35. மௌ -> –..
  36. ம் -> ..-.–.—-
  37. மீ -> —–..
  38. மு -> –.—..-
  39. மூ -> -.-.-…–
  40. ழொ -> …——-
  41. மெ -> –.-.–
  42. மே -> ..-..-
  43. தா -> …….
  44. தி -> .-.-…
  45. ஞே -> .——.-…-.-.-
  46. வி -> -.-.-.-
  47. வா -> ———.-.-..
  48. றீ -> .—…..-
  49. ய் -> ———.–.
  50. யௌ -> -.-.-…-..
  51. யோ -> .-…..-.—
  52. யொ -> –.-…—-
  53. ஆ -> .——.–
  54. யே -> .—..–.–.
  55. யெ -> …–…-.
  56. ஊ -> -.-.-…-.–.
  57. யூ -> -.-.-…-.—
  58. யு -> -.-.-…-.-..-.–
  59. எ -> .-.—.–
  60. ஞை -> .–.—-
  61. ஞொ -> –.-…–.–.—
  62. ஒ -> –.-…–.–.-.-..
  63. ஞ் -> ..-.-.
  64. ஞீ -> .-.—..-..–
  65. ஞூ -> .—..–.—
  66. ச -> ….-..
  67. ஞெ -> .——-.
  68. ஞ -> ..-.–.—.-.-…
  69. டி -> ….–
  70. டா -> .–.—.
  71. ஷ் -> ..-….
  72. ப -> .—.-
  73. ரா -> -.—
  74. ரி -> —…–..-.
  75. ம -> -.-..-
  76. க் -> -..-..-
  77. கௌ -> ——-.
  78. ல -> .—..-.
  79. கை -> .-…..—
  80. கோ -> ———-
  81. கொ -> .—-.
  82. கே -> ——–..
  83. கெ -> ..-.–.-.
  84. கு -> .-.–..
  85. கீ -> -..–.
  86. ஔ -> …–.-.-..-
  87. கூ -> -.-….—-
  88. கி -> —.-.
  89. கா -> —…–..–
  90. ரூ -> –.-…–.-.-.
  91. ட் -> –.-..-
  92. ரு -> –.-…–.–..
  93. ரெ -> —…–…-
  94. ரே -> –.-.-.-
  95. டை -> .——.-.-..
  96. டே -> .-.—..-..-.–
  97. ரோ -> ———.—
  98. ரை -> ..–..-…-
  99. டூ -> -.-.-…-.-..–
  100. டு -> .–.-.
  101. ர் -> –.-….
  102. ஞா -> .-……
  103. ஞி -> –.-…–.–.-.-.-
  104. ரீ -> ..-.–.—…
  105. யி -> .-.—.-.-.-
  106. யா -> .-…..-.–..
  107. டௌ -> .-…..-.-.
  108. டோ -> –.-…–.—
  109. டொ -> ..–..–
  110. ஃ -> —–.-.
  111. இ -> ……—-
  112. னா -> –.-…-.
  113. ஏ -> .-..—
  114. று -> .-…..-.–.-
  115. ரொ -> .-.—.-..
  116. ஓ -> ———.-.–
  117. றூ -> .-…..-…–.
  118. றே -> —…–.-
  119. டெ -> -.-.-..-
  120. றை -> .——.-….
  121. றோ -> -.-.-…-.-.-
  122. றொ -> .—–.
  123. ற் -> —.–
  124. ட -> -..-…
  125. ண -> ..-.–.—.-.-..-
  126. ஷி -> …–.-..
  127. லா -> -.-…-
  128. லி -> ……-.
  129. நை -> .-.-.-
  130. ய -> -.-….—.
  131. நொ -> .-.—..-.-
  132. நோ -> .——.-..–
  133. ள -> .-…-
  134. ரௌ -> –.-…–.–.-.—
  135. நௌ -> ..-.—
  136. ந் -> ———..
  137. நூ -> —…-..
  138. நீ -> .-..-.
  139. நு -> -.-….-.
  140. நெ -> .-.—.-.–
  141. நே -> .-.-..–
  142. ங் -> .–….-
  143. நி -> –.-…–.–.-…
  144. ஙு -> .-.—..-…
  145. லெ -> –.-…–..
  146. லே -> —…—
  147. லு -> ..-.–.—..-
  148. லூ -> –.-…–.–.-..-
  149. லௌ -> ..—
  150. ல் -> -.-.–..
  151. யீ -> –.–..
  152. லை -> .-.—.-.-..–
  153. லொ -> …—-.—
  154. லோ -> .—..–.-.
  155. ளொ -> .-…..-..-
  156. ஸ் -> –.-…–.–.–.
  157. தோ -> …——.
  158. றி -> .-.-..-.
  159. றா -> ——–.-
  160. னை -> …—-..
  161. னோ -> .——.-.–
  162. னொ -> ———.-.-.-
  163. ன் -> -.–.
  164. னு -> .—……
  165. னீ -> .——.-..-.
  166. னூ -> .——.-.-.–
  167. னே -> ..-.–.—.–
  168. னெ -> —–.–.-
  169. சௌ -> –.-…—.-
  170. ச் -> .-….-
  171. சை -> ..–..-.-
  172. சொ -> …–…..
  173. சோ -> .—..–..
  174. ஈ -> ..–..-….
  175. செ -> ——..
  176. சே -> …–….-
  177. சீ -> —…-.-
  178. சு -> .-..–.
  179. சூ -> ……—.
  180. ளோ -> .-…..-…—
  181. ஐ -> .-.—..-..-.-.
  182. ளை -> .—..—
  183. ணி -> .–.–..
  184. ணா -> –.-…–.-..
  185. ள் -> —….
  186. ளூ -> –.-…–.-.—
  187. நா -> -.-.-….
  188. ளு -> .——.-…-..
  189. ளீ -> .-.—.-.-..-.
  190. ளே -> .-.—.-.-…
  191. ளெ -> …–.-.-…
  192. ழா -> ——.-
  193. ழி -> -…
  194. த -> …–.-.–
  195. ந -> .–…..
  196. யை -> ———.-..
  197. றெ -> .–..-
  198. ர -> ..-.–.—.-.-.–
  199. பை -> —–.–..
  200. ழ -> …—–.
  201. பொ -> –.-.-..
  202. போ -> ..-.–..-
  203. பெ -> .—….-
  204. பே -> .——.-…-.-..
  205. பீ -> …—-.–.
  206. பு -> -..—
  207. பூ -> ……–.
  208. பா -> .-.—-
  209. பி -> .-.–.-
  210. தெ -> …—-.-.
  211. ழ் -> —–.—
  212. ழீ -> –.-…–.–.-.–.
  213. ழோ -> –.-…–.-.–.
  214. ழை -> .-…..–.
  215. ழெ -> ..-.–.—.-.-.-.
  216. ழே -> -.-.-…-.-..-.-.
  217. ழூ -> .-…..-…-.-.
  218. டீ -> .-…..-…-.–.
  219. ழு -> –.—–
  220. ணோ -> .——.-.-.-.
  221. ணொ -> .-…..-…-.—
  222. ணை -> –.—.-.
  223. ளி -> .–.–.-
  224. ளா -> …–.-.-.-
  225. ண் -> ….-.-
  226. ணூ -> .——.-…-.–
  227. ணு -> .-.—..–
  228. ணீ -> —…–….
  229. ணே -> ..-.–.—.-.–
  230. ணெ -> –.-…—..
  231. சா -> …–..-
  232. சி -> …—.

Caveats and Closing Comments

Of course 15 of 247 letters are perhaps not received any codeword in this codebook. Further with inclusion of Grantha letters, 323 letters exist in Tamil some of which we don’t have code words.

Further, a large text corpus like Project Madurai’s [PM] unigram frequency distribution maybe useful to develop a widely representative Morse code table. Once you have this PM unigram data, you know how to get this Tamil Morse codebook regenerated!