Advertisement |
Computer နဲ႔ ျမန္မာစာ (၁)
Credit— ထြန္းေအာင္ေက်ာ္
Computer နဲ႔ ျမန္မာစာ လို႔ ေခါင္းစဥ္တပ္လိုက္ရေပမယ့္ အဓိက,က Zawgyi နဲ႔ Unocode ဘာကြာလဲ၊ အားသာခ်က္ အားနည္းခ်က္ စတာေတြအေၾကာင္း အဓိက ေျပာခ်င္တာပါ။ အဲဒါေတြ မေျပာခင္ computer မွာ အခ်က္အလက္ေတြကို ဘယ္လိုမွတ္သားသလဲ၊ font ဆိုတာ ဘာလဲ ဒါေတြကို အေျခခံအေနနဲ႔ အရင္ေျပာခ်င္ပါတယ္။
အဲဒီခ်က္ေတြအေၾကာင္း မေျပာခင္ ကၽြန္ေတာ္က ဘာေကာင္မွ မဟုတ္ပါဘူး။ Zawgyi အားေပးသူ မဟုတ္သလို၊ Unicode သမားလည္း မဟုတ္ရပါဘူး။ အဆင့္ျမင့္ computer ပညာရွင္တစ္ေယာက္လည္း မဟုတ္တဲ့အတြက္ ကၽြန္ေတာ္ ေရးတာ သားတာေတြကို သာမန္ ဗဟုသုတေလာက္ဘဲ သေဘာထားၾကပါရန္ ႀကိဳတင္ေတာင္းပန္ထားပါရေစ။ မွားေနတာ ေတြ႔ရင္လည္း ေမတၱာေရွ႕ထားၿပီး တည့္မတ္ ဆံုးမေတာ္မူၾကပါကုန္။
Computer မွာ အခ်က္အလက္ မွန္သမွ်ကို one (1) နဲ႔ zero (0) ေတြအျဖစ္ မွတ္သားပါတယ္။ အဲဒီ one (1) သို႔မဟုတ္ zero (0) အခ်က္ျပတစ္ခုကို bit လို႔ ေခၚပါတယ္။ အဲဒီ one (1) သို႔မဟုတ္ zero (0) အတြဲ 8 ခုကိုေတာ့ Byte လို႔ ေခၚပါတယ္။ အၾကမ္းဖ်င္းအားျဖင့္ စာတစ္လံုးဟာ မွတ္ဉာဏ္ေနရာ 1 Byte ယူပါတယ္။ ဥပမာ အဂၤလိပ္ အကၡရာ A ကို computer မွာ 01000001 လို႔ မွတ္သားပါတယ္။ အဂၤလိပ္ အကၡရာ Z ကိုေတာ့ 01011010 လို႔ မွတ္သားပါတယ္။
အဲဒီ zero (0) ေတြ one (1) ေတြကို တကယ္တန္း ဖတ္႐ႈမွတ္သားဖို႔ မလြယ္ကူပါဘူး။ ဒီေတာ့ အဲဒီ (binary number) ႏွစ္လီစိတ္ကိန္းေတြကို လူနားလည္လြယ္တဲ့ (decimal number) ဆယ္လီစိတ္ကိန္းအျဖစ္ ေျပာင္းလဲ အသံုးျပဳပါတယ္။ ဆိုေတာ့ အဂၤလိပ္ အကၡရာ A ရဲ႕ code ကို 65 လို႔ သတ္မွတ္ၿပီး အဂၤလိပ္ အကၡရာ Z ကိုေတာ့ 90 လို႔ သတ္မွတ္ပါတယ္။ တကယ္လို႔ စမ္းၾကည့္ခ်င္ရင္ Microsoft Office Word မွာ Alt + 0065 လို႔ ႐ိုက္ၾကည့္ပါ။ အဂၤလိပ္ အကၡရာ A ကို ေတြ႕ရပါလိမ့္မယ္။
အဲဒီလို သတ္မွတ္ထားတဲ့ Charactor Code စနစ္ကို ASCII (American National Standard Code for Information Interchange) လို႔ ေခၚပါတယ္။ မူလ ASCII သတ္မွတ္ခ်က္ဟာ 0 ကေန 127 အထိသာ ရွိပါတယ္။ ဒါက အဂၤလိပ္ဘာသာစကားအတြက္ အဆင္ေျပေပမယ့္ က်န္ ဥေရာပ ဘာသာစကားမ်ားပါ အဆင္ေျပေစဖို႔ ေနာက္ပိုင္း 255 အထိ တိုးခ်ဲ႕ခဲ့ပါတယ္။ ဘာလို႔ 255 အထိသာ တိုးခ်ဲ႕ထည့္သြင္းရသလဲဆိုရင္ ASCII character တစ္လံုးဟာ မွတ္ဉာဏ္ 1 byte သာ ေနရာယူႏိုင္လို႔ပါ။ (1 Byte မွာ 256 လံုးအထိသာ မွတ္သားႏိုင္ပါတယ္။) တကယ္လို႔ Notepad မွာ A လို႔ တစ္လံုးတည္း ႐ိုက္ထည့္ၿပီး save မယ္ဆိုရင္ အဲဒီ file ရဲ႕ size ဟာ 1 Byte သာရွိတာ ေတြ႕ရပါလိမ့္မယ္။
Computer နဲ႔ ျမန္မာစာ ဆိုၿပီး ဘာလို႔ ဒါေတြ ေျပာေနရလဲဆိုရင္ computer မွာ ျမန္မာစာ သံုးစြဲႏိုင္ဖို႔ စတင္ႀကိဳးပမ္းၾကစဥ္အခါက အခက္အခဲနဲ႔ အေျခအေနကို နားလည္ႏိုင္ၾကေစခ်င္လို႔ပါ။ ဒါမွလည္း ေနာက္ပိုင္း ျပႆနာေတြကို ပိုၿပီး နားလည္ႏိုင္မယ္ ယူဆမိပါတယ္။
Computer မွာ ျမန္မာစာကို စ,သံုးမယ္ဆိုေတာ့ ျမန္မာဘာသာစကားအတြက္ character code သီးသန္႔ မရွိပါဘူး။ ဒီေတာ့ ရွိၿပီးျဖစ္တဲ့ ASCII code ေတြကို ျမန္မာစာအတြက္ အသံုးျပဳရပါတယ္။ Monitor screen ေပၚမွာ ျမန္မာအကၡရာနဲ႔ ျမင္ရဖို႔၊ Printer နဲ႔ ျမန္မာအကၡရာကို အဆင္ေျပေျပ ႐ိုက္ထုတ္ႏိုင္ဖို႔ အေတာ္ႀကီး ႀကိဳးစားခဲ့ရတာပါ။ အျခားဘာသာစကားေတြထက္ ေနရာေရြ႕ျခင္း၊ ေနရာမေရြ႕ျခင္း စတဲ့သဘာဝ (font kerning) အမ်ိဳးမ်ိဳးရွိတဲ့ စာလံုးေတြမ်ားျပားတဲ့ ျမန္မာဘာသာအတြက္ အေစာပိုင္း font ေရးသူေတြမွာ အေတာ္ခက္ခဲခဲ့မွာပါ။
ဟုတ္ကဲ့ ကၽြန္ေတာ္တို႔ ေရႊျမန္မာေတြက ယခုမွာသာ ငါက Zawgyi ကြ။ ငါက Unicode ကြ ဆိုၿပီး ကြဲၾက ျပဲၾကတာ မဟုတ္ရပါဘူး။ အဲဒီအခ်ိန္ကလည္း ျမန္မာအကၡရာေတြကို အသံထြက္အတိုင္း စီစဥ္လိုသူေတြနဲ႔ လက္ႏွိပ္စက္ လက္ကြက္ကို အေျခခံၿပီး စီစဥ္လိုသူေတြ ကြဲခဲ့ၾကတာပါဘဲ။ ေနာက္ပိုင္းမွာေတာ့ လက္ႏွိပ္စက္လက္ကြက္ကို အေျခခံတဲ့ M-Myanmar, Win, Metrix, Academy စတဲ့ ျမန္မာ font ေတြ ေခတ္စားလာၿပီး အသံထြက္ကို အေျခခံတဲ့ Ava စတဲ့ font ေတြ ေမွးမွိန္သြားခဲ့ပါတယ္။ Apple Macintosh သံုးခဲ့ဘူးသူေတြ မွတ္မိၾကဦးမယ္ ထင္ပါတယ္။
ဗဟုသုတအျဖစ္ ေျပာရရင္ အဲဒီ Ava font ကို SOAS မွ ျမန္မာစာ ပါေမာကၡ Mr. John Okell က 1989-1990 ဝန္းက်င္ေလာက္မွာ ေရးခဲ့တာပါ။ သူ႔ကို ဂၽြန္အုတ္ခဲ လို႔ ရည္ၫႊန္းၿပီး ဟာသလုပ္ေရးထားတဲ့ စာတစ္ပုဒ္ ငယ္ငယ္က ဖတ္ဘူးေပမယ့္ ေရးသူကို တိတိက်က် မမွတ္မိေတာ့ပါ။ ဆရာႀကီး မင္းသုဝဏ္ ျဖစ္မယ္ ထင္မိပါတယ္။
လက္ႏွိပ္စက္ လက္ကြက္ကို အေျခခံတဲ့ font ေတြကေတာ့ တစ္ခုနဲ႔ တစ္ခု တကယ္တူခဲ့ပါသလား။ မတူပါဘူး ခင္ဗ်ာ။ အထူးသျဖင့္ M-Myanmar ဟာ က်န္ Win, Metrix, Academy ေတြနဲ႔ အဓိက ဗ်ည္းေတြကလြဲလို႔ အေတာ္မ်ားမ်ား ကြဲလြဲပါတယ္။ ဥပမာ M-Myanmar မွာ character code 0171 ဟာ - ဇၩ - ျဖစ္ပါတယ္။ -Win---Innwa မွာေတာ့ square bracket - [ - ျဖစ္ပါတယ္။ Win အုပ္စု၊ Metrix အုပ္စု စသျဖင့္ အုပ္စုလိုက္ တြဲေခၚေပမယ့္ Win အုပ္စုအတြင္းမွာ၊ Metrix အုပ္စုအတြင္းမွာလည္း လံုးဝေတာ့ identical မျဖစ္ပါဘူး။
အမွန္ေတာ့ ASCII font ေတြမွာ လက္ကြက္တူညီေအာင္ ညႇိဖို႔ နည္းပညာအရ အခက္အခဲ မရွိပါဘူး။ ကၽြန္ေတာ္တို႔ ျမန္မာေတြရဲ႕ သူတစ္လူ ငါတစ္မင္း စိတ္ဓာတ္လို႔ ေျပာရမလား မသိ။ လက္ကြက္ပံုစံေတြ အမ်ိဳးမ်ိဳး ကြဲျပား မွတ္သားခဲ့ၾကရပါတယ္။ နမူနာအျဖစ္ ေလ့လာလို႔ရေအာင္ ေအာက္မွာ ျမန္မာလက္ကြက္ပံုစံေတြ ျပထားပါတယ္။
ဘာဘဲျဖစ္ျဖစ္ အဲဒီအခ်ိန္က အေရးတႀကီး လိုအပ္ေနတဲ့ ျမန္မာ font ေတြ ေရးခဲ့ ႀကိဳးစားခဲ့လို႔သာ ျမန္မာစာကို computer မွာ သံုးလို႔ရခဲ့တာဆိုေတာ့ သူတို႔ေက်းဇူးကို ေမ့ထားလို႔ေတာ့ မရပါဘူး။
ဒီအပိုင္းကို ASCII font ဆိုတာ ဘာလဲ။ Unicode နဲ႔ ဘာကြာျခားသလဲ ဆိုတာ နည္းနည္းရွင္းၿပီး နိဂံုးခ်ဳပ္ပါမယ္။
အၾကမ္းဖ်င္း ေျပာရရင္ ASCII font ဆိုတာ monitor မွာ ျမန္မာလို ျမင္ရ၊ ျမန္မာဘာသာနဲ႔ print ထုတ္လို႔ ရေပမယ့္ computer က ျမန္မာစာအျဖစ္ သိမွတ္ျခင္း မရွိဘဲ graphical အရ လဲလွယ္ထားတဲ့ ရုပ္ပံုအရသာ ျမန္မာစာျဖစ္ေနေပမယ့္ သက္ဆိုင္ရာ code ေတြအရသာ သိေနတဲ့ ျမန္မာစာလံုးပံုံျဖစ္ပါတယ္။ ဒါေၾကာင့္ ASCII font နဲ႔ ႐ိုက္ထားတဲ့ ျမန္မာစာပိုဒ္ေတြကို Microsoft Office Word မွာ spelling & grammer error မ်ားအျဖစ္ ေဖာ္ျပေနတာ ျဖစ္ပါတယ္။ ေနာက္ Arial သို႔မဟုတ္ Courier စတဲ့ font ေတြနဲ႔ change လိုက္ရင္ အဂၤလိပ္စာလံုးေတြအျဖစ္ ေျပာင္းသြားတာကို ေတြ႕ရပါလိမ့္မယ္။
ေနာက္ မူလ keyboard ရဲ႕ character code ေတြအတိုင္း သံုးထားတာျဖစ္လို႔ Keyman, Keymagic စတဲ့ keyboard converter ေတြ သံုးဖို႔ မလိုအပ္ပါဘူး။
-
Zawgyi တို႔ Unicode တို႔နဲ႔ ပတ္သက္ၿပီး ဆက္ေရးပါဦးမယ္။
M-Myanmar, Win---Innwa, Academy, CE-Classic စတာေတြ ပါဝင္တဲ့ Myanmar Keyboard Layout ကို high resolution နဲ႔ လိုခ်င္ရင္ေတာ့ ေအာက္ပါ link မွာ down ယူႏိုင္ပါတယ္။
မူရင္း =>