Thursday, October 28, 2010

INFITT Response to Extended Tamil Proposal in Unicode Tamil Block

As you are aware, International Forum for Information Technology in Tamil (INFITT - through its Unicode Working Group has worked on several proposals in the past and is working on many proposal to enrich the Tamil Unicode block and offer advise to other Unicode blocks. Several of our members are experts in multiple languages of the world and
technologist who implement Unicode in various IT application areas. Our Members Language knowledge base extends to Tamil, English, Hindi, Telugu, Kannada, Malayalam, Sanskrit, French, Spanish, German, Chinese, Korean, Malayan, Sinhalese, Japanese, Arabic to specify a few.

After carefully reviewing the proposal to encode Characters for Extended Tamil (L2/10-256R)authored by Mr. Shriramana Sharma that proposes to add some new characters to an "Extended Tamil Block" in SMP, proposal L2/10-425 written by Mr. Vinodh Rajan to encode in BMP, INFITT Working Group (WG-02) on Tamil Unicode and the leaders of INFITT concluded that the proposed characters do not belong in a Tamil Script block but perhaps Grantha Indic characters used to write other Indo-Aryan / Dravidian Languages. INFITT has also reached out to various Tamil Department Heads, Vice Chancellors , Tamil Language experts, All have opined that the proposal L2/10-256R, L2/10-425 are grossly misleading and have to be rejected outright. We have also enclosed few samples of the letters received from Tamil Scholars and IT industry experts and Tamils over the world. A list of linguists and technologists who have written to us confirming this fact is also listed at the end of this letter. Should you need copy of all letters, please feel free to drop a note, we will submit all the letters calling for rejections of these two proposals L2/10-256R, L2/10-425 to you.

Continuation to our letter dated September 30 2011 and your acceptance no L2/10-363 and in view of the views expressed by Tamil Scholars and other Indic Scholars, if UTC decides to give representation to these additional characters that are created to support other indic languages,

perhaps UTC can choose to name as below, representing the nature of the character set recommended.
1. Grantha Indic Character
2. Grantha Dravidian Character
3. Grantha South Asian Character
4. Grantha Augmented Character
5. Grantha Linear Character

Unicode Tech committee can choose any of the names to name these new characters in line with purpose they are used for.

We are also pleased inform you that INFITT WG02 working group experts on Unicode are working on the following proposals to further enrich Unicode

1. Adding Archaic Tamil symbols and scripts of Tamil
Encoding the correct canonical forms Tamil Characters in the new Extended Tamil block(11B5 to 11CF, requested in the proposal L2/10-408) and Grantha Characters in the extended Grantha block (11D0 to 11D7 requested in the proposal L2/10-408) in SMP, thus extending wide Unicode Usage to Tamil Publishing Industry, currently crippled with limitations.

Should you need clarifications or assistance feel free to reach me in my cell.

Signed ,
Chair and ED ,INFITT


  1. எந்த மொழியில் அனைத்துவித ஒலிகளுக்கும் வழி இருக்கிறதோ, எந்த மொழியில்
    உலகில் உள்ள அறிவுப் பெட்டகங்கள் இருக்கிறதோ, எந்த மொழியில் அதிக அளவு
    வியாபார-பொருளாதார வளர்ச்சி இருக்கிறதோ, அந்த மொழிதான் நீண்டு வாழும். வெறுமே தூய்மை கெட்டுவிடும் என்று தீட்டு பார்த்துக்கொண்டிருந்தால் மொழி வளராது. மொழி வளர மொழி திறந்திருக்க வேண்டும்.
    மாற்றங்களே அடையாமல் இருப்பதுதான் தூய நிலை என்றால், உலகில் மிகத்
    தூய்மையானது பதப்படுத்தப்பட்ட பிணம் மட்டுமே.

  2. செத்த மொழியும் செத்த பிணமும் (பதப்படுத்தப்பட்ட) ஒன்றுதான். வாழும் மொழி
    அது தன்னில் தூய்மையாக வளர்ந்து வாழும்.
    எந்த மொழி எழுத்தைக் கடன்வாங்கியுள்ளது? ஒலிக்குறியாக புதிய எழுத்தைப்
    படைத்துக்கொண்டது?.அன்பர் பட்டியலிட்டால் நன்று.

  3. மேற்கண்ட கேள்வி என்னை நோக்கியது அன்று எனினும் எனக்குத் தெரிந்த
    ஒரு பொதுக் கருத்தைப் பகிர்ந்துகொள்ள விரும்புகிறேன்.
    இது தமிழையும் சமசுகிருதத்தையும் தொடர்புபடுத்தியது அன்று.

    தமிழையும் ஒரு வெளிநாட்டு மொழியையும் தொடர்புபடுத்தியது.
    கி. பி. 1549-ஆம் ஆண்டு வாக்கில் போர்த்துக்கீசிய மொழியில் தமிழ் மொழியை விளக்கி எழுத
    முனைந்தவர் பாதிரி அன்றீக்கு அடிகளார் (Fr. Henrique Henriques). அவர் தமிழ் மொழியின்
    ஒலிகளைப் போர்த்துக்கீசிய மொழியில் விளக்க முனைந்தபோது அவருக்குத் தேவையான
    எழுத்துக்கள் இலத்தீன், போர்த்துக்கீசிய எழுத்துப் பட்டியலில் இல்லை.
    குறிப்பாக ல, ள, ற என்ற ஒலிகளை விளக்கிச் சொல்லவும், ட, ர, ற, என்ற ஒலிகள் வழக்கத்தில் புழங்கும்போது
    எப்படி அவர் காதில் பட்டன என்பதை விளக்கிச் சொல்லவும், அகர ஒலி ஒரு சொல்லின் இறுதியில் மூக்கொலிக்கு முன்
    எப்படி ஒலிக்கிறது என்பதை விளக்கவும் -- இப்படிப் பலவற்றை விளக்கப் புதிய எழுத்துக்களைப் படைத்துக்
    கொண்டிருக்கிறார். தேவையானால் விளக்கம் தருவேன்.
    அன்றீக்கு அடிகளாரின் இலக்கணக் கையெழுத்துப் பிரதியிலிருந்து சில பக்கங்களை
    இங்கே பார்க்கலாம்:
    ( < > )


    By Express News Service
    29 Oct 2010 03:31:45 AM IST

    Why sneak Grantha into Tamil Unicode?
    CHENNAI: The decades-long resistance to the imposition of Sanskrit on
    Tamil language and popular culture saw a sudden revival on Thursday
    with Dravidar Kazhagam (DK) president K Veeramani giving a call to the
    Tamil people and Chief Minister M Karunanidhi to wake up to what he
    called a ‘Brahmin conspiracy’ to sneak Grantha characters into the
    Unicode for Tamil.
    He alleged that one Sri Rama Sharma had made an appeal to the Unicode
    Consortium on July 10 for inclusion of 26 characters of the Grantha
    script in the Tamil script, which now has space for only 128
    Veeramani said that a set of five Grantha characters - jha, sha, ha,
    sa and shree - that are sparsely used in Tamil text has already been
    included in the Unicode while the new set of 26 characters was not
    used at all in Tamil, be it in the written or spoken form.
    When Tamil computer experts were demanding the expansion of the Tamil
    Unicode to incorporate all the 247 letters of the language’s
    alphabets, Sharma’s demand smacks of a bid to sneak Sanskrit into
    Tamil language through the backdoor, he said.
    To prove that point, Veermani cited Sharma’s argument that the 26
    letters needed to be included in the Unicode to help write Sanskrit.
    Stating that Sharma had consulted Madras Sanskrit College professor
    Mani Dravid and Sri Jeyandra Saraswathi Ayurveda College’s Venugopal
    Sharma before making his plea, Veeramani asked why should Sanskrit
    scholars’ advice be taken to develop Tamil. On Sharma’s contention
    that the Granthi characters needed to be included to expand Tamil
    language, Veeramani said it would instead lead to ‘assassination’ of
    Tamil and called the bid a ‘cultural invasion’ borne out of jealousy
    over the growth of Tamil in cyberspace.
    Pointing out that Sharma’s reply to a question if the Granthi
    characters were in contemporary use was ‘yes, occasionally’ and (they
    were needed) ‘to publish Sanskrit text in Tamil Nadu’, Veeramani said
    the proof Sharma had produced for that were two old books - one
    published by Chennai Kamakoti Kodisthanam in 1951 and ‘Bhoja Saritham’
    by T S Narayana Sastri in 1916. Making it clear that Tamil and
    Sanskrit were not the same, Veermani said that Grantha script was used
    in olden times to write Sanskrit text in southern India.
    It was an alternative to the Devanagiri script and was popularised
    with a view to robbing Tamil of its the individual identity, he said.

  5. அண்ணன் ரவிக்குமார் அவர்களுக்கு வணக்கம்,
    Thats tamil யில் திரு.வீரமணி அவர்கள் எழுதிய கட்டுரையின் மூலமாக நம் தமிழ் யூனிகோடில் நாம் உபயோகப்படுத்தாத சமஸ்கிருத எழுத்துக்கள் 26 சேர்க்கப்படுவதை பற்றி எழுதிருந்தார். அதை எதிர்க்க வேண்டியதன் அவசியத்தை உங்கள் கட்டுரை மூலமாக உணர்ந்தேன். அதையே என் ப்ளாக்கில் போட்டு இருந்தேன். அந்த போஸ்டிற்கு கமெண்ட் எழுதிருக்கும் செயபால் புதிதாக ஒன்றை சொல்லியிருக்கிறார். அதை தங்கள் கவனத்திற்கு கொண்டு வர வேண்டும் என நினைத்தேன்.
    SH உச்சரிப்பில் அவர்கள் கொண்டுவந்திருக்கும் 13 எழுத்துக்களும் நாம் உபயோகிக்காத எழுத்துக்கள்.
    இதுதான் அந்த லிங்க்

    இது யூனிக்கோடு வெளியிட இருக்கும் Draft ஆக இருக்குமா என எனக்கு தெரியவில்லை. நீங்கள்தான் தெளிவுபடுத்தவேண்டும்