Sunday, April 19, 2009

Standard Myanmarsar

စနစ္က်တဲ့ ျမန္မာစာ


သျကဿငန္မွာ ဘယ္မွ မသြားျဖစ္ပါဘူး။ ေန့ေန့ညည ျမန္မာစာနဲ့ ပတ္သက္တာ တစ္ခုကို က်ြန္ေတာှရယ္ မာခ္ရယ္ ျကိုးစားပမ္းစား လုပ္ေနျကတယ္။ ကုဒ္ေတြကို မာခ္က ေရးတယ္။ ျပီးေတာ့ NLP အတြက္ အေရးပါတဲ့ နည္းပညာေတြကို သူက က်ြမ္းက်ြမ္းက်င္က်င္ တတ္ေျမာက္ထားသလို ေလာ့ဂ်စ္လည္း ေကာင္းတာမို့ ေတာှေတာှ အလုပ္ျဖစ္ပါတယ္။ က်ြန္ေတာှက ေခါင္းပူရံု မ်က္စိရွုပ္ရံုေလာက္ အမွားစစ္၊ အျကံေပး ဟိုေတြးဒီေတြး ဒီေလာက္ပါပဲ။

အဲဒီရက္ပိုင္းက အင္တာနက္ကို လံုးလံုးလ်ားလ်ားျကီး ဖြင့္မေပးေသးေပမယ့္ ရံုးပိတ္ရက္မို့ ေတာှေတာှေလး ျမန္ပါတယ္။ မီးကလည္း ၂၄နာရီနီးပါး ပံုမွန္လာေနတာမို့ စိတ္ခ်မ္းခ်မ္းသာသာနဲ့ အလုပ္လုပ္နိုင္တယ္။ ဒါေျကာင့္ ဒီရက္ပိုင္း အလုပ္ျပီးနွုန္းက ျမန္တယ္။ အျကံေကာင္းေတြလည္း ထြက္တယ္။ အခု က်ြန္ေတာှတို့ စမ္းေနတဲ့ဟာက ျမန္မာစာသားေတြကို Research လုပ္နိုင္ဖို့ ျဖစ္ပါတယ္။ ရလဒ္ေတြဟာ သိပ္ေကာင္းပါတယ္။ က်ြန္ေတာှတို့ မျမင္ေတြ့ခဲ့တဲ့ အမွားေတြကို ျမင္ေတြ့လာတယ္။ မွန္တယ္လို့ ထင္ထားတာေတြ မွားေနတာ ေတြ့ရတယ္။ ျမန္မာစာကို ကြန္ပ်ူတာေပါှ တင္ရာမွာ မရွိမျဖစ္ လိုလာမယ့္ Ngram လမ္းေျကာင္းကို က်ြန္ေတာှတို့ ေျခခ်မိလာျပီ။ ျပီးေတာ့ ေနာင္တခ်ိန္ ေပါှလာနိုင္တဲ့ ျမန္မာ Search Engine ေတြအတြက္ ျမန္မာစာလံုး ပိုင္းျဖတ္ပံု စနစ္ေတြကို က်ြန္ေတာှကို ေလ့လာနိုင္လာျပီ။

ျမန္မာစာဟာ စာလံုး တစ္ခုနဲ့ တစ္ခုျကား Space မခံတဲ့ ဘာသာစကားမ်ိုး ျဖစ္ခဲ့ေလေတာ့ ေတာှေတာှ ဒုကဿခေရာက္တယ္။ အဓိကက လူ့အမွားပဲ။ စာလံုးေပါင္းသတ္ပံု မွားတာက ထားေတာ့။ ကြန္ပ်ူတာနဲ့ ျပင္ရတာ လြယ္လြယ္ေလးရယ္။ အျဖတ္အေတာက္ အထားအသို မွားတာမ်ိုးက်ေတာ့ ကြိုင္တက္ပါေလေရာ။ က်ြန္ေတာှကိုယ္တိုင္ ဒါေတြ လုပ္ေနတာမို့ ဘေလာ့မွာ စာေရးတဲ့အခါ အျဖတ္အေတာက္ မွန္နိုင္သမ်ွ မွန္ေအာင္ ျကိုးစားေရးတယ္။ ဒါေပမယ့္ စစ္လိုက္ေတာ့ ထြက္လာလိုက္တဲ့ အျပစ္ေတြ အမ်ားျကီးပဲ။ ဘုရားစူး ဒီအတိုင္း ျကည့္ရင္ ဘာမွ ျမင္ရမွာ မဟုတ္ဘူး။ ျမန္မာစာအေျကာင္း ေရးေနတဲ့ သူေတြ (က်ြန္ေတာှအပါအဝင္) ေတာှေတာှမ်ားမ်ားဟာ အျဖတ္အေတာက္ အထားအသို မွားေနျကတာ အမ်ားျကီးပါပဲ။ ျမန္မာစာမွာ စာလံုးတစ္ခုနဲ့ တစ္ခုအျကား ေနရာလပ္ ခ်န္တဲ့စနစ္ကို အရင္ကတည္းကသာ စနစ္တက် က်င့္သံုးခဲ့ရင္ အခုလို သိပ္ခက္ခဲမယ္ မထင္ဘူး။

က်ြန္ေတာှကေတာ့ ကြန္ဆာေဗးတစ္ မဟုတ္ဘူး။ ျပီးေတာ့ လူမခ်စ္ရင္ မူလည္းမခ်စ္ဘူး ဆိုတဲ့အထဲ မပါဘူး။ လူ မေကာင္းေပမယ့္ သူ့မူေလး တစ္ခုက ေကာင္းေနရင္ အဲဒီမူကို မမုန္းပါဘူး။ ဥပမာ ဦးေနဝင္းကို က်ြန္ေတာှ မျကိုက္ဘူး။ ဒါေပမယ့္ ျမန္မာစာလံုးေပါင္း သတ္ပံုက်မ္းကို (ဘယ္လိုနည္းနဲ့ျဖစ္ျဖစ္) လုပ္သြားခဲ့တာကို တကယ္ ေက်းဇူးတင္တယ္။ အရာရာမွာ စနစ္တစ္ခု ရွိဖို့ လိုအပ္တယ္။ လူကိုမုန္းရင္ေတာ့ တနဲ့တစ္ ျပသဿသနာ၊ က်ြန္ေတာှ၊ က်ြန္မ၊ က်ြန္ုပ္၊ ရွင္၊ ခင္ဗ်ား စတဲ့ဟာေတြကို မုန္းေနမွာပဲ။ ဒါေပမယ့္ စာဆိုတာ ေပေပါှမွာ စကဿကူေပါှမွာတင္ ရွိေနေတာ့မယ့္အရာ မဟုတ္ဘူး။ ကြန္ပ်ူတာေပါှ တက္လာေတာ့မယ္။ အဲဒီအခါမွာ စံစနစ္ဆိုတာ ရွိကိုရွိရမယ္။ ဒီေခတ္မွာ က်ြန္ (Slave) ဆိုတာ မရွိေတာ့ဘူး။ သက္ဦးဆံပိုင္ ဘုရင္စံနစ္ မဟုတ္ဘူး။ အဲဒီအတြက္ က်ြန္ေတာှ ဆိုတဲ့ ေဝါဟာရဟာ ဟိုးယခင္တုန္းက (ေတာှေသာ ေက်းေတာှမ်ိုး က်ြန္ေတာှမ်ိုး) ဆိုျပီး အဓိပဿပာယ္ ထြက္ေကာင္း ထြက္နိုင္ေပမယ့္ ဒီေန့ေခတ္မွာ အနက္ မတူနိုင္ေတာ့ဘူး။ က်ြန္ေတာှလို့ ေျပာမိတာနဲ့ ဒီေကာင္ တယ္ေတာှတဲ့ က်ြန္ျကီးပါလားလို့ ဘယ္သူမွ မျမင္ေတာ့ပါဘူး။ က်ြန္ေတာှဟာ ေယာက္်ားတစ္ေယာက္ကို ကိုယ္စားျပုတဲ့ စကားလံုးတစ္လံုး ျဖစ္ေနပါျပီ။ (ေယာက္်ာလံုးမပါ)။ ျပသဿသနာက အဲဒီ ေရွးရိုး အယူအဆကို ဒီေန့ေခတ္ကာလျကီး အထိ တခ်ို့က လက္ကိုင္ထား ေနျကတဲ့ အဓိက အေျကာင္းရင္းကေတာ့ လူကို မုန္းတာေျကာင့္ပဲ ျဖစ္ပါလိမ့္မယ္။

ဦးနု က်ျပန္ေတာ့ ဦးေနဝင္းေလာက္ လူမုန္းမမ်ားတဲ့ အတြက္ သူ့ရဲ့ ဆဋဿဌသဂဿငါယနာတင္ပြဲ အေျကာင္းကို သိပ္ျပီး အေရးတယူ မလုပ္ျကဘူး။ ဆဋဿဌသဂဿငါယနာတင္ က်မ္းဂန္ေတြမွာ ဘုရားေဟာ မဟုတ္တာေတြ ပါတယ္။ ဒါေျကာင့္ တခ်ို့နိုင္ငံေတြက ျမန္မာျပည္က ဆဋဿဌသံဃာယနာတင္ပြဲကို အသိအမွတ္ မျပုျကဘူး။ ထားပါေတာ့။ အေရးျကီးတာက ဒီလို အသံုးအနွုန္းဆိုရင္ (တ) ျဖစ္ရမယ္။ ဒါမ်ိုး ဆိုရင္ေတာ့ (တစ္) ျဖစ္တယ္ ဆိုျပီး အဲဒီလို ျပတ္ျပတ္သားသား ဆံုးျဖတ္လိုက္တာဟာ အလြန္မွန္ကန္တဲ့ ဆံုးျဖတ္ခ်က္တစ္ခု ျဖစ္ပါတယ္။ ဦးေနဝင္း မွန္တယ္လို့ က်ြန္ေတာှ ေျပာတာ မဟုတ္ဘူး။ အဲဒီကိစဿစကို ျငင္းခဲ့ျကတဲ့ ဆရာျကီးေတြ အမ်ားျကီးပဲ။ လူကိုေျကာက္လို့ မွားေနတဲ့အရာကို လက္ခံတယ္ ဆိုရင္ေတာ့ သူတို့ ကိုယ့္ကိုကိုယ္ တူနဲ့ထုေသဖို့ ေကာင္းေသးတယ္လို့ မွတ္ခ်က္ခ် ခ်င္တယ္။ ဒါေပမယ့္ အဲဒီကေန ဘာရလာသလဲဆိုေတာ့ ဒီေန့ ကြန္ပ်ူတာေခတ္မွာ (အေရအတြက္၊ ကိန္းဂဏန္း နဲ့ ပတ္သက္တဲ့ စာလံုးေတြဆိုရင္ တစ္ ဆိုျပီး မွတ္ပါ) ဆိုတဲ့ ေသခ်ာတဲ့ စည္းမ်ဉ္း တစ္ခုကို ေရးနိုင္တာပါပဲ။

ဒီေနရာမွာ စာေပ (Literature) နဲ့ ဘာသာေဗဒ (Linguistic) မတူပံုကိုလည္း သိသင့္ပါေသးတယ္။ တခ်ို့ေတြက စာေပမွာ ေတာှတယ္။ ဒါေပမယ့္ အဲဒါဟာ စာေပမွာ ေတာှတာ သက္သက္ပဲ ရွိပါေသးတယ္။ အဲဒီလူဟာ ဘာသာေဗဒမွာ က်ြမ္းက်င္သူ မဟုတ္ေသးဘူး။ ဘာသာေဗဒဟာ ပိုျပီး ခက္ခဲ နက္နဲတယ္လို့ ေျပာရပါမယ္။ အဲဒီနွစ္ခုကို လူေတြက ေရာေရာပစ္ျကေတာ့ စာေပေတာှတဲ့သူ ေျပာတဲ့ စကားဆိုရင္ မွန္တယ္ထင္ျပီး ဤကိုက်ြဲ လိုက္ဖတ္ျကေရာ။ ဒါေျကာင့္ ဟိုးတုန္းက ျမန္မာစကားလံုးေတြရဲ့ ရင္းျမစ္ကို စိတ္ကူးေတြ၊ စာေတြ့ေတြနဲ့ လိုက္ရွာေဖြခဲ့ျကတဲ့ ဆရာျကီးေတြရဲ့ စာအုပ္ေတြကို ကမဿဘာ့ပညာရွင္ေတြ လက္သင့္မခံ ျကတာပါ။ အဲဒီအခါတုန္းက ဘာသာေဗဒ ပညာရပ္က သိပ္ျပီး မတြင္က်ယ္ခဲ့ေသးလို့လည္း ျဖစ္ေကာင္း ျဖစ္ပါလိမ့္မယ္။

Academic Term Paper ေတြ သီးဆစ္ေတြ ေရးဖူးတဲ့သူဆိုရင္ သိျကပါတယ္။ သက္ဆိုင္ရာ အဖြဲ့အစည္း၊ သက္ဆိုင္ရာ ပညာရပ္ ပညာရွင္ေတြ ထုတ္ေဝတဲ့ စာအုပ္ေတြကို အထူး ဂရုျပု ျကရတယ္။ အဲဒါေတြ ေနာက္မွာမွ အျခားစာအုပ္ေတြက လိုက္တယ္။ ျမန္မာနိုင္ငံက ျမန္မာစာဌာနဟာ ျမန္မာစာနဲ့ ပတ္သက္ရင္ အထင္ကရ ျဖစ္ပါတယ္။ ျမန္မာစာနဲ့ ပတ္သက္တဲ့ သုေတသနေတြ လုပ္တယ္။ စာအုပ္စာတမ္းေတြ ထုတ္ေဝတယ္။ ျမန္မာအဘိဓာန္ေတြ၊ စာလံုးေပါင္း သတ္ပံုက်မ္းေတြ ျပုစုတယ္။ ဒီလိုျပုစုရာမွာ သူတို့ ပညာရွင္ေတြ အခ်င္းခ်င္း ျကားထဲမွာလည္း အယူအဆ မတူညီသူေတြ အမ်ားျကီးပါ။ အဲဒီအခါ အျကိတ္အနယ္ ျငင္းျကခံုျကရင္း အေျဖတစ္ခု ထြက္လာေအာင္ လုပ္ျကရတယ္။ ထြက္လာတဲ့ အေျဖကို အတည္ျပုျပီးမွ စာအုပ္ ထုတ္ျကတယ္။ ဒါေျကာင့္လည္း ဒီလို အဖြဲ့အစည္းေတြက ထုတ္ေဝ ျပဋဿဌာန္းထားတဲ့ အခ်က္အလက္ေတြ စည္းမ်ဉ္းေတြကို နိုင္ငံတကာ ပညာရွင္ေတြ အားလံုးက ပိုျပီး လက္ခံျကတာပါ။

အခုလို ရွည္ရွည္ေဝးေဝး ေျပာေနရတာ အေျကာင္း ရွိပါတယ္။ ကိုယ္က သီေပါမင္း ေခတ္ေလာက္က ဆိုရင္လည္း အမ်ိုးမ်ိုး ကြဲျပားေနတဲ့ စာလံုးေပါင္း သတ္ပံုေတြကို ညညြီတ္ေအာင္လို့ ျပဋဿဌာန္းထားတဲ့ ျမန္မာမင္း လြွတ္ေတာှသံုး သတ္ပံု က်မ္းစာေတြကို လိုက္နာရပါလိမ့္မယ္။ ထို့အတူ ဒီဘက္ေခတ္မွာလည္း ျမန္မာစာ အဖြဲ့က ျပဋဿဌာန္းထားတဲ့ စာလံုးေပါင္း သတ္ပံုက်မ္းကို လိုက္နာသင့္ပါတယ္။ အခုလို ျမန္မာစာကို ကြန္ပ်ူတာေပါှ တင္ဖို့ ျကိုးစားေနျကတဲ့ အခ်ိန္မွာ ျမန္မာစာကို စနစ္တက် ေရးသားသင့္ပါတယ္။

က်ြန္ေတာှတို့ ဘေလာ့ေတြ၊ ဝဘ္ဆိုဒ္ေတြ၊ စာအုပ္ေတြက စာေတြကို စစ္ေဆးျကည့္တဲ့အခါ လူတစ္ေယာက္ခ်င္းစီရဲ့ မတူညီတဲ့ စာလံုး ပိုင္းျဖတ္ပံုေတြ၊ မွားယြင္းေနတဲ့ သတ္ပံုေတြ၊ ကြဲျပားတဲ့ အသံုးေတြကို ေတြ့လာရတယ္။ တခါတေလ တစ္ေယာက္ထဲကေန တစ္ခုနဲ့တစ္ခု မတူေအာင္ မ်ိုးစံုေရးတာ ေတြ့လာရတယ္။ အဲဒီအခါမွာ သူ့စာေတြဟာ စနစ္တက် မရွိေတာ့ဘူး။ ျပန့္က်ဲေနတယ္။ စနစ္တက် မရွိတဲ့အတြက္ စက္ကလည္း စိတ္ညစ္ပါတယ္။ စနစ္တက်မရွိတဲ့စာနဲ့ စနစ္တက် ေရးသားထားတဲ့စာ နွစ္မ်ိုး ယွဉ္တဲ့အခါ စက္က စနစ္တက်ရွိတဲ့စာကို ပိုျပီး အေလးထားပါတယ္။ ဒါကလည္း မွတ္သားရတာ သူ့အတြက္ လြယ္ကူလို့ပါ။ ေဇာှဂ်ီနဲ့ ရိုက္ထားတဲ့ စာေတြဆို ပိုဆိုးတယ္။ ဒီေနရာမွာ ေဇာှဂ်ီဟာ Input Rendering System တစ္ခုကို ထည့္ထားမယ္ဆိုရင္ ဒီျပသဿသနာေတြ အမ်ားျကီး ေျပလည္သြားေစနိုင္တယ္။ အျဖတ္အေတာက္မွာေတာ့ က်ြန္ေတာှတို့စာမွာ ယခင္ကတည္းက စနစ္တက် မရွိခဲ့တဲ့အတြက္ ေတာှေတာှေလး ခက္ခဲ ေနဆဲပါ။

အခု က်ြန္ေတာှတို့ မတူညီတဲ့ စာလံုး ပိုင္းျဖတ္ပံုေတြကို ေလ့လာေနပါတယ္။ ေတာှေတာှေလးလည္း ခရီးေရာက္ ေနပါျပီ။ က်ြန္ေတာှတို့ ျကိုးစားေနတာက ဘယ္သူေတြ ဘယ္လိုပဲ မွားမွားယြင္းယြင္း လုပ္ထားထား၊ စနစ္တက် အစီအစဉ္တက် ျဖစ္သြားေအာင္ စက္ကေန အလိုအေလ်ာက္ ျပင္ေပးသြားနိုင္တဲ့ စနစ္ေလး တစ္ခုပါ။ မွားပေလ့ေစ ေရးခ်င္လို့ကို ဒီလို တမင္သက္သက္ ေရးတာမ်ိုး ဆိုရင္လည္း ဒီေကာင္ကို သံုးစရာ မလိုပါဘူး။ ဒါေပမယ့္ ကြန္ပ်ူတာတို့၊ Search Engine တို့ ဆိုတာေတြမွာ စနစ္တက် ျဖစ္ေနတဲ့ ဟာေတြကို ပိုျပီး အေရးေပးတယ္ ဆိုတဲ့ အခ်က္ေလးကိုေတာ့ အေလးအနက္ အသိေပးခ်င္ပါတယ္။ စနစ္မက်တဲ့ စာေတြဟာ အေရအတြက္ ဘယ္ေလာက္မ်ားမ်ား တန္ဖိုး က်သြားနိုင္ပါတယ္။ တခ်ို့ေတြရဲ့ စာလံုးေတြမွာ အသတ္နွစ္ခု ျဖစ္ေနတာေတြ၊ လံုးျကီးတင္ နွစ္ခု ျဖစ္ေနတာေတြ၊ ဒါေရးျပီးမွ ဟိုဟာ ေရးရမွာကို ဟိုဟာ အရင္ေရးတာေတြ အမ်ားျကီး ေတြ့ရတယ္။ ဒါေျကာင့္ စာေရးတဲ့အခါ သဒဿဒါ အထားအသို မမွန္ကန္ရင္ေတာင္ သတ္ပံုနဲ့ ပုဒ္ျဖတ္ပုဒ္ရပ္ေတြကို တတ္နိုင္သမ်ွ သတိထားျပီး ေရးသင့္တယ္လို့ အျကံျပုလိုပါတယ္။


အထက္ပါစနစ္ကို စိတ္ဝင္စားသူေတြ မာခ့္ရဲ့ဘေလာ့မွာ ေလ့လာနိုင္ပါတယ္။ [Link]

Fix: ဆဋဿဌသဃဿငာယနာ လို့ မွားေရးထားမိတာကို မေမဓာဝီ ညြွန္ျပလို့ ျပင္လိုက္ပါတယ္။

No response to “Standard Myanmarsar”

 
© 2009 NYI LYNN SECK 18+ DEN. All Rights Reserved | Powered by Blogger
Design by psdvibe | Bloggerized By LawnyDesignz