Saturday, July 12, 2025

கணினியில் தமிழ்க் குறியேற்றம்

 2012: கல்லூரி இதழில் வெளியானது.


கடந்த நூற்றாண்டுகளில் இருந்து கணினியின் வளர்ச்சி யாரும் எதிர்பார்க்காத ஒன்று. எழுத்துலகில் காகிதம் பிறந்தது ஒரு புரட்சி. அதுபோலத் தொழில்நுட்பத்தில் கணினி ஒரு புரட்சி. காலமும் தொழிற்நுட்பமும் வளர வளர காகிதம், அச்சு எந்திரம், கணினி என எழுத்துத் தொடர்பான சாதனங்களும் வளர்ச்சியடைந்தன. கணினி கணக்கு போடத்தான் உருவாக்கப்பட்டது. ஆனால், இன்று உலகையே கணினிதான் ஆட்சி செய்கிறது.

கணினியில் மொழி எழுத்துருக்கள்  ஆரம்பம் முதல் எப்படிப் புகுத்தப்பட்டன என்பதெல்லாம் விரிலான வரலாறு.முத்தமிழின் நான்காம் பரிமாணமமான கணினித் தமிழின் எழுத்துரு ஆக்கத்தினை இக்கட்டுரை விவரிக்க முயலுகிறது.

குறியேற்றம்

கணினி எல்லாத் தகவல்களையும்  தன்னகத்தே கொண்டிருந்தாலும், அதற்குத் தெரிந்தது என்னவோ சுழியமும் ஒன்றும்தான். எப்படிப்பட்ட தகவலானாலும் அது இரண்டு அடிமான எண்களாகவே அறியும் .அப்படிதான் அது உருவாக்கப்பட்டது. எடுத்துக்காட்டாக, 15 எனும் எண்ணை 1111 என்றும், 1345 எனும் எண்ணை  10101000001  என்றும் புரிந்து கொள்ளும். இம்முறையைப் பைனரி டிஜிட்(Binary Digit) அல்லது ஷார்ட்லி பிட்(Shortly Bit) என்று மொழிவர். படங்கள், காணொளிகள், எழுத்துகள், குறியீடுகள் என எல்லாவற்றையும் இந்த  முறையில்தான் கணினி ஏற்கிறது.

 ஆங்கில எழுத்து A-க்கு  பொது தரநிர்ணயத்தில் 65வது  இடம்  ஒதுக்கப்பட்டுள்ளது. A-வை விசைப்பலகையில் அழுத்தியவுடன் 65 எனும் எண்ணினை எடுத்துச்சென்று மையச்செயலகம் மூலம் பைனரி எண்களாக மாற்றி, அவ்வெண்ணில் நிறுவப்பட்டுள்ள எழுத்துருவைத் திரையில் விழச்செய்யும். இதுவே இதன் உள் தொழில்நுட்பம். இதைத்தான் புரோகிராமர் செய்வார்.

ஆஸ்கி (ASCII)

இது செய்தித் தொடர்பில் ஒரு ஒழுங்கிணை ஏற்படுத்த உருவாக்கப்பட்டதாகும். செய்திகளைப் பரிமாறிக் கொள்வதில் உள்ள சிக்கல்களை நீக்கப் பொதுவான ஒரு தரநிர்ணயம் செய்யப்பட்ட விசைப்பலகை முறை தேவையாயிருந்தது. இதற்காக உருவாக்கப்பட்டதுதான் ஆஸ்கி (ASCII- American Standard code for information interchange). இது அமெரிக்காவில் உருவாக்கப்பட்டது. இதில் ஆங்கில எழுத்துக்களுக்கு மட்டுமே இடமுண்டு. இம்முறையில் ஒரு பைட் என்பது எட்டு பிட். அதாவது 27 = 128. மொத்தம் 128 எழுத்துருக்களை நிரப்புவதற்கான இடத்தைக் கொண்ட ஒரு அமைப்பு முறை. இதில் ஆங்கில எழுத்துருகள், குறியீடுகள், எண்கள் ஆகியவை நிரப்பப்பட்டு, ஒவ்வொரு எழுத்தும் சராசரியாக 7 பிட்டினைப்(கீற்று) பெற்றுத்திகழ்ந்தது. இதன்படி ஆங்கில எழுத்து A-க்கு 65-ஆவது இடமும் சிறிய எழுத்து a-க்கு 97-வது இடமும் ஒதுக்கப்பட்டுள்ளதுஅந்தந்த எழுத்துருக்களுக்கான இடங்களில் வெவ்வேறு விதங்களில் எழுத்துருக்களை அமைத்து விதவிதமான எழுதி வந்தனர்.

நாம் தனித்தனியே எழுத்துரு கோப்புகளைத் திரையில் கண்டிருப்போம். இந்தக் கோப்புகள் குறியேற்றம் செய்யப்பட்ட எண்களில் அமரவேண்டிய எழுத்துருக்களின் கட்டளைகள்தான். இவை பெரும்பாலும் *.ttf  வடிவத்தில் இருக்கும்.

விரிவுபடுத்தப்பட்ட ஆஸ்கி (E-ASCII)

கணினியில் ஆங்கில எழுத்துருக்கள் புகுத்தப்பட்ட தொழில்நுட்பம் மற்ற  ஐரோப்பிய நாடுகளுக்கும் பரவியது. பிற ஐரோப்பிய மொழிகள் ஏறக்குறைய ஆங்கிலத்தோடு ஒத்துப்போனது. இருப்பினும் 128 இடங்கள் போதாமையால் கூடுதலாக ஓர் இடம் தேவைப்பட்டது. முன்பே இருந்த ஆஸ்கியில் கூடுதலாக ஒரு பிட் சேர்க்கப்பட்டு, 27  -லிருந்து 28  -ஆக உயர்த்தப்பட்டது. இதனால் கூடுதலாக 128 இடங்கள் கிடைத்தன. உள்ளது போலவே முதல் 128 இடங்கள் ஆங்கிலத்திற்கு ஒதுக்கப்பட்டு, ஆங்கிலத்தோடு வேறு பட்ட பிற ஐரோப்பிய  மொழிகளின்  எழுத்துருக்கள் சேர்க்கப்பட்டன. இதில் சராசரியாக ஒவ்வொரு எழுத்துருக்கும் 8 பிட்டுகள் இருந்தன. இவ்வகையான ஆஸ்கி utf8 (cnicode transformation formate 8) இரகத்தைச் சார்ந்தது. இம்முறையில் எவ்விதப் பிரச்சனையும் இல்லாமல் செய்திகள் பரிமாறப்பட்டன. இந்த ஆஸ்கி தரநிர்ணய முறைக்கு .எஸ்.: 8859 என்ற எண்ணில் தரநிர்ணயம் வழங்கப்பட்டது.

 திஸ்கி (TSCII-Tamil Standard code information interchange)

மேலை நாடுகளில் கணினி எழுத்துரு இவ்வாறு வளர்ச்சியடைந்த காலத்தில், அவர்களுடைய மொழிகளே இணையத்தில் ஆதிக்கம் செலுத்தின. அப்போதெல்லாம் இங்கிருந்த நிலையே வேறு. பல்கலைக்கழகங்களிலும், பொறியியல் கல்லூரிகளிலும், குளிரூட்டப்பட்ட அறைகளில் மிகவும் பத்திரமாகக் கணினி பாதுகாக்கப்பட்டது. இங்கு மட்டுமல்ல பெரும்பாலான ஆசிய நாடுகளில் இதே நிலைதான். பிறகு படிப்படியாகப் பலருடைய முயற்சியின் காரணமாக முதல் ஆஸ்கியில் பலரும் பலவிதமான குறியேற்ற முறைகளில் தமிழ் எழுத்துருக்களைப் புகுத்தினர். 1996 பிப்ரவரியில் இந்திய மொழிகளில் இணையத்தில் புகுந்த முதல் மொழி தமிழ்மொழிதான். TAM, TAB போன்ற பல்வேறு குறியேற்ற முறைகள் வெவ்வேறு காலகட்டங்களில் உருவானவை. இவை ஆங்கில எழுத்துகளை நீக்கிவிட்டு தமிழ் எழுத்துக்களால் நிரப்பப்பட்டன.

இணையத்தில் இது பெரும் நடைமுறைச் சிக்கலை ஏற்படுத்தியது. இதன் விவரங்களை அறிவே, அதனைச் சார்ந்த எழுத்துருக்களைத் தரவிறக்கம் செய்து கணினியில் நிறுவ வேண்டியிருக்க வேண்டும். முரசு அஞ்சல் உட்பட ttf எழுத்துருக்கள், மயிலை, இணைமதி, மயிலைசீறி, டி.எஸ்.சி போன்ற எழுத்துருக்கள் ஆஸ்கி முறையில் உருவானவையே.

ஆனால், திஸ்கி முறை சற்று வித்தியாசமானது. எப்படியெனில், முதல் 128 இடங்களை அப்படியே ஆங்கிலத்திற்கு ஒதுக்கிவிட்டு, மீதமிருந்த 128 இடங்களில் மட்டும் தமிழைப் புகுத்திய முறை இது. இது ஓரளவு சிக்கலில்லாத ஒன்றாக இருந்தது. இருப்பினும், திஸ்கி முறையில் அரங்கேற்றப்பட்ட இணையப் பக்கங்களைக் காணவும், அதனைச் சார்ந்த எழுத்துருக்கள் தரவிறக்கம் செய்யப்பட்டிருக்க வேண்டும். பலரும் இத்தகைய திஸ்கி முறையைப் பயன்படுத்தினர்.

நிறை: எந்த ஒரு இயங்குதளமும் (OS), செயலியும் (software) திஸ்கி குறியேற்ற முறையை ஒத்தியங்குகிறது. Dos, windows 95, 3.1, 98, Me பதிப்பு ஆகியவைகளில் திஸ்கி தடையின்றி இயங்குகிறது. இதைச்சார்ந்ததமிழ்99’ விசைப்பலகை, தமிழ்நாட்டில் நடைபெற்ற தமிழ் இணைய மாநாட்டில் பரிந்துரைக்கப்பட்டதுடன், TSC, TTF போன்ற எழுத்துருக்களைப் பயன்படுத்தும்படியும் வேண்டுகோள் விடுக்கப்பட்டது.

குறை: TAM,TAB. ASCII முறைகளில் எழுத்துருக்கள் முறையாக வரிசைப்படுத்தப்படவில்லை. எடுத்துக்காட்டாக TAM, ‘வை 140-ஆவது இடத்தில் புகுத்தியிருந்தால் மற்றொன்று அதில்வை புகுத்தியுள்ளதாக  உள்ளது. இது இணையப்பக்கங்களில் பெரிய பிரச்சனையாக இருந்தது.

ஒருங்குறி (Unicode)

Unique code, universal code என்றெல்லாம் சொல்லலாம். இது ஓர் தனித்துவமான உலகமொழிக்கான தனிக் குறியீட்டு முறை. இதில் மொழி எழுத்துருக்கள், கணிதம், மொழியியல், பயன்பாட்டில் இல்லாத வரி வடிவங்கள் என அனைத்தும் இடம் பெற்றுள்ளன. இது ஒரு பொது நியமக் குறிமுறை என்பதால் இதில் எவ்விதச் சிக்கலும் செய்திப் பரிமாற்றத்தில் ஏற்பட வழியில்லை.

ஆங்கிலம் தவிர உலகளாவிய மொழிகளில் ஏற்பட்ட குறியாக்கப் பிரச்சனையைப் போக்கவும், உலக மொழிகளை ஒன்றிணைக்கவும் மிகப் பெரிய கணினி நிறுவனங்கள், உலக நாடுகள், கணினி ஆர்வலர்கள் ஆகியோர்களால் 1991-இல் யுனிகோடு  நிறுவனம் உண்டாக்கப்பட்டது. இது ஒரு 32 பிட் திட்டம். 65000 இடங்களில் மொழி எழுத்துருக்களின் அவற்றின் கொள்ளவுக்கு ஏற்ப புகுத்தப்பட்டுள்ளது. இதில் இந்திய மொழிகளுக்கு ஒதுக்கப்பட்டுள்ள இந்தக் குறியாக்க முறைக்கு ISCII (Indian Standard code For Information Interchange) என்று பெயர்.

தமிழ் எழுத்துருக்களின் இடம்:

தற்போது ஒருங்குறியில் 8 பிட் அடிப்படையில்தான் குறியாக்க முறை வரையறை செய்யப்பட்டுள்ளது. நம்மிடமுள்ள TAM,TAB,TSCII முறைகளை விட இதில் பன்மொழி உள்ளடக்கிய எழுத்துருவைப் பயன்படுத்த வழி ஏற்படுகிறது. வரிசைப் படி 2946-ஆவது இடத்திலிருந்து 3071-ஆவது இடம் வரை 65000-இம் கீற்றுகளில் இடம் ஒதுக்கப்பட்டுள்ளது. இதன்படி 2949 என்ற எண்ணில் தமிழ் முதல் எழுத்துஉள்ளதென்றால் அது உலகின் எவ்விடத்தில் சென்று பார்த்தாலும்தான் இருக்கும். இதனால் செய்திப் பரிமாற்றத்தில் குழப்பம் ஏற்பட வாய்ப்பேயில்லை.

பயன்பாடு

இணையத்தில் கருத்துக்களங்கள், தமிழ்ச் சொல்லாடல்கள், உரையாடல்கள், கருத்துப்பரிமாற்றங்கள், கட்டுரைகள், உரைநடைகள் என யாவற்றையும் தடையின்றி எவையும் பதிவிறக்கம் செய்யலாம். படித்து இன்புறலாம். மேலும், கணினிக்குறிப்பேடு (Notepad), சொற்செயலி (Word process), தரவுத்தளம் (Database), விரிதாள்கள் (Spreadsheet), தூதுபோகு செயலிகள் (Messenger), திகுப்பாளர் (HTML Editor), வலைப்பக்க வழங்கிகள், மெய்நிகர் (Chat line), தரவுக்கடத்திகள் (Protocol), மின்னஞ்சல் (E-Mail) என இன்னோரன்ன கணினியின் செயலிகளையும், நிரல்களையும் தமிழில் பார்க்க, படிக்க, தகவல்களைத் தட்டச்சு செய்து பார்வையிடப் பயன்படுத்த வழிப் பிறந்துள்ளது.

ஒருங்குறியும்  கணினிநிறுவனங்களும்

மைக்ரோசாப்ட், ஆப்பிள் போன்ற கணினி நிறுவனங்கள் ஒருங்குறியை ஏற்றுக்கொண்டுள்ளன. விண்டோஸ் XP விண்டோஸ் 2003, 2007, ஆப்பிள், புதிய மெக்கிண்டாஷ், புதிய லினெக்ஸ் ஆகியவையுடைய கணினிகளில் ஒருங்குறி முறையைத் தடையின்றிப் பயன்படுத்தமுடிகிறது. Internet exploere, outlook express, Adope in Design முதலிய செயலிகளும் இலவசமாக வழங்கப்படும் OpenOffice.org செயலியும் கூட மேற்கண்டவைகளின் பட்டியலில் நீளும். முழுக்க முழுக்க ஒருங்குறியில் செயல்படும்  செயலிகள் நாளுக்கு நாள் அதிகரித்து வருகின்றன.

சில ஒருங்குறி செயலிகளும் எழுத்துருக்களும்

சர்மாஸ் சொல்யூசன் மென்பொருள், அழகி தமிழ் மென்பொருள், .கலப்பை 3, முரசுஅஞ்சல், குறள் தமிழ் செயலி, புதுவை தமிழ் எழுதி, புதுவை யுனிகோடு எழுத்துரு மாற்றி, என்.ஹெச்.எம் தமிழ் செயலி, யுனிகோட் மாற்றி என்று செயலிகளும்,  யுனிகோடு இணைமதி, தமிழ்யுனிகோடு, இளங்கோ பாரதி, கோட் 2001, தேனி யுனிகோடு, தமிழ் யுனிகோடு ஆவரங்கள், லதா யுனிகோடு எழுத்துரு, சூரியன்.காம் ttf எழுத்துரு தொகுப்பு-கணிஞர் உமர் போன்ற எழுத்துருக்களும் இன்னும் புதிய புதிய செயலிகளும் எழுத்துருக்களும் வெளிவந்தவண்ணம் உள்ளன.

குறை

இதை விண்டோஸ் 95-இல் காண முடியாது. குறைந்தபட்சம் விண்டோஸ் 98-ஆவது இருக்க வேண்டும். யுனிகோடில் தமிழுக்கென ஒதுக்கப்பட்ட இடம் மிகக் குறைவு. அதுமட்டுமல்லாது, கலைநயமிக்க நமது தமிழ் எழுத்துக்கள் உடைக்கப்பட்டும் அகரவரிசையின்றியும் உள்ளன. ஒதுக்கப்பட்ட 128 இடங்கள் கூட முழுமையாக நிரப்பப்படவில்லை. எடுத்துக்காட்டாக, ‘ர்எனும் ஒற்றெழுத்து  + ‘  என உடைக்கப்பட்டுள்ளது. இரண்டு வெவ்வேறு எண்களில் உள்ளவற்றை ஒன்றிணைத்தால்தான் ஒரு முழு எழுத்து கிடைக்கிறது. ‘பல்எனும் ஈரெழுத்துச் சொல் சாரணமாக இரண்டு இடங்களைப் பிடிக்கும். ஆனால் யுனிகோடில் மூன்று இடங்களைப் பிடிக்கும். இப்படி உருக்களின் அளவு கூடும்போது, கோப்பின் அளவும் கூடுகிறது. இணையத்தில் அனுப்பும் நேரம், இறக்கும் நேரம், தேடல் போன்ற யாவுமே நேரத்தை அதிகம் செலவிடக் கூடியதாக இருக்கிறது. ஆங்கிலத்தோடு போட்டிப்போடுமளவிற்கு இல்லை.

1999-இல் சென்னை தமிழ் இணைய மாநாட்டில் யுனிகோடில் தமிழுக்கான இடம் போதாது எனும் குரல் எழுப்பப்பட்டது. இது குறித்து ஆராய ஒரு பணிக்குழு அமைக்கப்பட்டு ஆய்வு செய்து முடிவில் அதன் குறை அறியப்பட்டது. தமிழின் யுனிகோடு பிரச்சனையைத் தீர்க்கும் பொருட்டுஉத்தமம்’ (உலகத்தமிழ் தகவல் தொழிற்நுட்ப மன்றம்) எனும் அமைப்பு இயங்கிவருகிறது. இந்த அமைப்பில் இந்திய, தமிழக பிரதிநிதிகள் இருந்தும் தமிழுக்கான இடப்பற்றாகுறையை எடுத்துரைக்க யாரும் முன்வரலில்லை என்பது வருத்தம் தரும் செய்தி. திரு. ஆனந்த கிருஷ்ணன் தலைமையில் உத்தமம் இருந்த போது, இடப்பற்றாக் குறை பற்றிக் கருத்து மேலோங்கியிருந்தது. ஆனால், கணினி நிறுவனங்களைக் கருத்தில் கொண்டு இன்று அதனை மீண்டும் பேச யாரும் ஆர்வம் காட்டவில்லை.

தனக்குரிய இடத்தைச் சீன அரசு பெற்றது  வரலாறு. சீன, கொரிய, ஜப்பானிய மொழிகள் 25000 இடங்களைப் பெற்றுள்ளன. சிங்களவர்கள் கூட 400 இடங்களைப் பெற்றுவிட்டனர். தமிழுக்கு குறைந்த பட்சம் 388 இடங்களும், அதிக பட்சம் 512 இடங்கள் வரை தேவைப்படுகிறது. இது ஒவ்வொரு இந்திய மொழிக்கும் பொருந்தும். சீன அரசைப் போல இந்திய அரசு தம் மொழிகளுக்கான யுனிகோட் பங்கினைப் பெற்றுத்தருமா என்பது கேள்விக்குறியே. இனி வரும் காலம் கணினி-இணைய  காலம். பாரம்பரியமிக்க தமிழ் மொழி சிறக்க வேண்டுமென்றால் அதற்கு யுனிகோடில் தமிழுக்கு உரிய பங்கு அவசியம்.

தற்போது நடைமுறையில் இருக்கும் யுனிகோடு முறையும் நிரந்தரமல்ல. இதுவும் இனிவரும் காலங்களில் மாறக்கூடும். இதற்கான பணிகள் நடைபெற்றுவருவதாகக் கேள்வி. காலம் மாறிக்கொண்டே வருகிறது. தமிழ் சிறக்கப் படைப்பாளிகள் கணினிக்கு மாறுவதைத் தவிர வேறு வழியில்லை. படைப்பு எல்லோரிடமும் போய் சேரவும், உடனுக்குடன் விமர்சனங்களைக்  கேட்கவும் கணினி-இணையத்தால்தான் முடியும். உலகத்தமிழர்களை ஒன்றிணைத்த யுனிகோடு தவீன தகவல் தொழிற்நுட்பத்தில் ஒரு புரட்சியே. இது தமிழர்களை மட்டும் ஒன்று சேர்க்கவில்லை. உலகத்தையே ஒன்றாக்கிவிட்டது.

 

துணைநின்ற தளங்கள்

  •      எழில்நிலை                                - www.ezhilnila.com
  •      தமிழ்மணம்                                 - www.tamilmanam.com
  •      வெப்தமிழன்                               - www.webtamizhan.com
  •      தமிழ்தளம்                                    - www.tamilthalam.com
  •      தமிழ் சீர்வை வலைதளம்    - www.tamilseermai.blogspot.com
  •      பிபிசிதமிழ்                                   - www.bbctamil.com

No comments:

Post a Comment