टी डी आई एल
यूनिकोड मे प्रस्तावित परिवर्तन
वैदिक कोड समुच्चय
मशीन आधारित अनुवाद
की-बोर्ड अभिविन्यास
सूचना प्रौद्योगिकी शब्दावली
समाचार पत्रिका विश्वभारत
सम्मेलन कार्यशिविर सूची
सम्मेलन कार्यशिविर प्रस्तुतियाँ
प्रायः पूछे जाने वाले प्रश्न

 

सार्विक ज्ञान और भाषा पर अन्तर्राष्ट्रीय सम्मेलन - एक रिपोर्ट  

1. 25-29 नवम्बर को यूएनएल अन्तर्राष्ट्रीय सम्मेलन का अयोजन यूएनडीएल फ़ाउंडेशन स्विटज़रलैंड, ट्रांसकल्चरा ब्राज़ील और आईआईटी बम्बई द्वारा किया गया। सार्विक नेटवर्किंग भाषा (यूएनएल) के विकास के लिए समग्र विषय “सार्विक ज्ञान निर्मित” करना है ताकि पारस्परिक ज्ञान के लिए संवाद और सब राष्ट्रों के लिए शान्ति, विकास और कल्याण के लिए संस्कृतियों के बीच परा-सांस्कृतिक समझदारी को सुकर बनाया जाए। केन्द्रीय विषय यह है कि “भाषा रोध को हटाया सूचना मीडिया के संचार और सार्वभौम रूझान के माध्यम से राष्ट्रों के बीच शान्ति और सुव्यवस्था को बढ़ावा” दिया जाए। यूएनडीएल फाउंडेशन ने सुझाव दिया है कि “सार्विक बनाने” की ओर पहला कदम “स्थानीय ज्ञान” और “सार्विक ज्ञान” के बीच एक सेतु का निर्माण किया जाए। यूएनडीएल इस सिद्धांत को प्रस्तुत करता है कि अन्य भाषाओं में उनकी भाषा का अनुवाद करते समय समाज की स्थानीय संकल्पना और संदर्भ को अक्षुण्ण रखते हुए साधारणीकरण प्राप्त किया जा सकता है। साधारणीकरण के लिए सामाजिक, आर्थिक, राजनीतिक और सांस्कृतिक वातावरणों में उत्पन्न तनावों के लिए राष्ट्रों के बीच पारस्परिक ज्ञान परा-सांस्कृतिक समझदारी की ज़रूरत होती है। दार्शनिक और मानवशास्त्रीय संदर्शों से ज्ञान और संस्कृति की नानाविध अभिव्यक्तियों की सार्विक समझदारी के लिए खोज से हमें एक कारण प्राप्त होता है कि भाषा तक इंजीनियरी दृष्टिकोण से पहुंच की जाए।

2. गोआ में सम्मेलन में, दार्शनिक, सामाजिक और इंजीनियरी उपागमों का प्रयोग करते हुए ज्ञान, संस्कृति और भाषा के अन्योन्याश्रय और बहुभाषी संरचना के रूप में यूएनएल को जानने और उसपर चर्चा करने पर ध्यान केन्द्रित किया गया जिससे विभिन्न भाषाओं और संस्कृतियों के लोगों के बीच संचार और ज्ञान की भागीदारी हो। अनुसंधानकर्ताओं, विख्यात विद्वानों, प्रोफेसरों, लेखकों, यूएनएल सोसाइटी सदस्यों और जापान, चीन, इंडोनेशिया, जर्मनी, स्पेन, ब्राजील, रूस, ईरान और भारत से बहुत से प्रतिनिधियों ने सम्मेलन में भाग लिया।

3. सम्मेलन को दो विचार-गोष्ठियो- “परासंस्कृति और भाषा संसाधन” में विभक्त किया गया। पहले भाग में ज्ञान के दार्शनिक और मानवशास्त्रीय पहलुओं को संस्कृतियों और भाषाओं के बीच “सार्विक ज्ञान और वार्तालाप” के लिए शामिल किया गया। चीन और भारत के पंद्रह सुप्रसिद्ध विद्वानों को भाषा का दर्शन, भाषा विज्ञान और संस्कृति जैसी शिक्षा-पद्धतियों पर अपने लेख प्रस्तुत करने के लिए आमंत्रित किया गया। मुख्य अंशदान था “की-वर्डस के एन्साइक्लोपीडिया” के विचार की गवेषणा करना।

दूसरे भाग में वैबिंग सार्विक ज्ञान के लिए और बहुभाषी मंच के विकास के लिए इंजीनियरी, कम्प्यूटर विज्ञानों और भाषा विज्ञानों के दृष्टिकोणों से ज्ञान और भाषा के विषय लिए गए। यूएनएल अनुप्रयोग टूल्ज़ पर चार अनुसन्धान खोजों, मशीनी अनुवाद और कोष-विषयक साधनों, सूचना पुन:प्राप्ति और वाणी और दृश्य सूचना संसाधन का आयोजन विचार-गोष्ठी में किया गया। यूएनएल के विकास के लिए भाषा-विज्ञान और साफ़्टवेयर इंजीनियरी पर 21 संदर्भित लेखों के अलावा, भारत और अन्य भाग लेने वाले देशों से प्रमुख वाणी और भाषा संसाधन समूहों से 6 आमंत्रित वक्ताओं ने वाणी प्रौद्योगिकी, मशीनी अनुवाद के लिए संरचना निर्माण, ई-शिक्षा और दूरी शिक्षा- भारतीय संदर्श, भारत और यूरोप के बीच परस्पर ज्ञान के लिए नीतियों, पुनर्निवेश के मानवशास्त्रीय उदाहरणों और मुख्य सांस्कृतिक बिम्बों आदि के पारस्परिक अवलोकन जैसे विषयों पर लेख प्रस्तुत किए। एक विशेष अधिवेशन गोआ के लोगों की भाषा कोंकणी भाषा को समर्पित किया गया।

4. श्री राजीव रत्न शाह, सचिव, सूचना प्रौद्योगिकी विभाग, संचार एवं सूचना प्रौद्योगिकी मंत्रालय और गोआ के राज्यपाल ने इस विशेष अधिवेशन को सम्बोधित किया। डॉ. हिरोशी उचीडा मेचिंग ज़हू और रोनाल्डो मार्टन ने एक विशेष अधिवेशन में यूएनएल सिस्टम के विभिन्न पहलुओं को प्रस्तुत किया।

अपने उद्धाटन भाषण “ज्ञान प्रबन्ध और भाषा विज्ञान अनेकत्व” में श्री राजीव रत्न शाह, सचिव, डीआईटी ने वैज्ञानिकों, तकनीशियनों, इंजीनियरों और भाष-विज्ञानियों का ध्यान आईटी संसूचकों और विश्व के भाषा-विज्ञान दृश्य-विधान की ओर आकृष्ट किया और कहा कि विभिन्न भाषाओं के निम्न प्रस्तुतीकरण से उत्पन्न ज्ञान के अपरदन और डिजिटल संसार में विश्व की संस्कृतियों पर काबू पाने की तत्काल ज़रूरत है। उन्होंने बताया कि सहस्त्राब्दि में राष्ट्रीय परमश्रेष्ठता उस सीमा द्वारा निर्धारित की जाएगी जिस तक सूचना प्रौद्योगिकी स्थानीय भाषाओं में अपनी क्षमता को प्रदान कर सकेगी। जिसका अर्थ है कि डिजिटल संसार में 10 लिपियों और 1650 से ज्यादा बोलियों वाली कम से कम हमारी 18 संवैधानिक भाषाओं का उपयुक्त पस्तुतीकरण कर सकेगी। इन्टरनेट प्रयोग के बारे में निकामी के डेटा को निर्दिष्ट करते हुए उन्होंने विश्व में व्याप्त डिजिटल बांट के अव्यवस्थित फैलाव को रेखांकित किया। उन्होंने कहा कि जनसंख्या के आधार पर हिन्दी और दो से अधिक भारतीय भाषाएं 2050 तक सर्वाधिक बोली जाने वाली भाषाएं होंगी। उन्होंने आईसीटी में नवाचारों के लिए वैज्ञानिकों/तकनीशियनों और भाषाविदों से ज्यादा योगदान मांगा ताकि भारत की आबादी के 95 प्रतिशत से ऊपर विभिन्न भाषायी समूहों, जो अंग्रेज़ी नहीं जानते, के बीच ज्ञान अन्तर को घटाया जाये। उन्होंने प्रतिनिधियों को बताया कि सरकार ने इस दिशा में कई पहलें की है जिसमें कम्प्यूटिंग, संचार और तत्व प्रौद्योगिकियों के अभिसरण के संदर्भ में संरचनात्मक प्रौद्योगिकियों के विकास पर ध्यान केन्द्रित किया है। ओसीआर प्राप्त करने के लिए हिन्दी, मराठी, पंजाबी, तेलगू, तमिल, कन्नड़ के लिए 95 प्रतिशत करेक्टर स्तर परिशुद्धता से अधिक भारतीय भाषाओं के लिए सहयोगी तकनीकी विकास को बढ़ावा दिया है। असमी, बंगला, मलयालम और उड़िया के लिए उसे शीघ्र उपलब्ध कराया जायेगा। अंग्रेज़ी से हिन्दी के लिए ऑन-लाइन मशीन अनुवाद का विकास किया गया है और आईआईटी कानपुर वेबसाइट को उपलब्ध कराया गया है। 1991-2002 के दौरान सरकारी व्यय लगभग 4 मिलियन यूएस डालर था। (श्री शाह का वक्तव्य देखें)। डॉ. ओम विकास, वरिष्ठ निदेशक और प्रमुख, भारतीय भाषाओं के लिए प्रौद्योगिकी विकास, सूचना प्रौद्योगिकी विभाग, ने बताया कि जब कि सूचना प्रौद्योगिकी विषय वस्तु और सूचना मार्ग निर्देशन से संकल्पना मार्गनिर्देशन की ओर बढ़ रही है, यह केवल भाषा रोध ही नहीं बल्कि विश्व के विभिन्न भागों में आई टी उपयोक्ताओं की कम उपलब्धता है जिसके कारण डिजिटल विभाजन का अव्यवस्थित फैलाव हुआ है। उन्होंने कहा कि विश्व के आईटी स्थानीकरण की दिशा में अत्यधिक प्रयासों का लक्ष्य स्थानीय उपयोक्ताओं के लिए इन्टर्फेस विकास, अनुवाद और लिप्यन्त्रण करना है जो स्थानीय संकल्पनाओं और संदर्भों का अपर्याप्त समर्थन करता है। इसी दिशा में नवाचारों की अत्यधिक आवश्यकता होती है। यूनेस्को रिर्पोट का हवाला देते हुए उन्होंने कहा कि जबकि भारत के इनेगिने देशों की श्रेणी में आता है जो आईटी से अत्यधिक काम लेते हैं वहां आर्थिक विकास के लिए डिजिटल विभाजन भी भारत मे सब से ज्यादा है। भारतीय भाषाओं में प्रौद्योगिकी विकास के लिए सरकार की विभिन्न पहलों के बारे में भी उन्होंने प्रतिनिधियों को जानकारी दी। संदर्भ के लिए प्रस्तुति को अनुबन्ध “ख” पर रखा गया है। ओसीआर और मशीन-ससहाय-अनुवाद तन्त्र विकास के अतिरिक्त अन्य पहलों मे समांतर कार्पोरा, बहुभाषी पुस्तकालयों/शब्द कोशों, शाब्दिक संसाधनों, पोर्टलों, टेक्स्ट से वाणी तक तंत्र का विकास ISCII का मानकीकरण, यूनीकोड, XML, INSFOC आदि शामिल है। उन्होंने प्रतिनिधियों को यह भी बताया कि भारत सरकार ने सरकार अकादमियों और उद्योग के बीच भाषा प्रौद्योगिकी के समेकित प्रबन्ध के लिए भाषा प्रौद्योगिकी क्षेत्र में अन्योन्यक्रिया के लिए भारतीय और एमएनसी कंपनियों का संकाय स्थापित किया है। उन्होंने बताया कि जिन लंबी अवधि लक्ष्यों की खोज की जा रही है वे है- वाणी से वाणी अनुवाद और मानव प्रेरण सिस्टम।

5. बहुभाषी सूचना, डेटा और ज्ञान प्रस्तुतीकरण पर काम करने के तकनीकी पहलुओं से ज्ञान और भाषा पर प्रश्नों के बारे में भी सम्मेलन में चर्चा की गई और सांस्कृतिक ज्ञान और विषय-वस्तुओं को उत्पन्न करने, भण्डारण प्रबन्ध और मूल्यांकन के लिए कम्प्यूटर प्रौद्योगिकियों का प्रयोग करने में वास्तविक अनुभवों और एक साथ कई भाषाओं में उन्हें उपलब्ध कराने की विशेष जांच की गई। यूएनएल कई की-शब्दों, संकल्पनाओं और बिम्ब जैसे हृदय, मुख, जीवन या अधिक वैज्ञानिक स्तर पर शून्य के बारे में परा-सांस्कृतिक (ट्रांसकल्चरल) उपागम कैसे प्राप्त कर सकता है इसे सीखने और परीक्षण करने के लिए विशेषत: अवसर प्रदान करेगा। मूल भाषाओं में उनके विशिष्ट और विलक्षण अर्थ को उनके सार्विक अर्थ में कैसे वयक्त किया जा सकता है ? दार्शनिक से इंजीनियरी संदर्शों तक भाषा, ज्ञान और संस्कृति के अन्योन्याश्रय पर चर्चा करने का अवसर भी सम्मेलन में प्रदान किया गया। यूएनएल बहुभाषी अवसंरचना और सम्बद्ध भाषा-विज्ञान पर प्रौद्योगिकीय विषयों से संबंधित विशिष्ट विषयों को सीखने और उनपर चर्चा करने के लिए एक अन्य अवसर प्रदान करना भी अभीष्ट था। इन विभिन्न विषयों के बारे में एक समेकित पहुंच को सुकर बनाने के लिए प्रोग्राम की व्यवस्था व्यापक और प्रेरक मूल विषय “सार्विक ज्ञान और भाषा” के अन्तर्गत की गई और चार अन्त:संबंधित संदर्शों दार्शनिक, सांस्कृतिक, भाषा-विज्ञान और इंजीनियरी से संकेन्द्रण किया जाएगा। इस व्यापक ढांचे के अन्तर्गत विभिन्न विषयों पर लेख और चर्चाओं को सम्मेलन आमंत्रण देता है जिसमे “सार्विक ज्ञान” की संकल्पना भी शामिल है।

6. यूएनएल की विशिष्ट रूपरेखाओं पर विशेष सत्र में भाषा के इंजीनियरी संदर्श और अन्योनयाश्रय ज्ञान के लिए खोज पर चर्चा की गई। भाषा (भाषाओं) और संस्कृति (संस्कृतियों), प्रणाली विज्ञानों के अर्थगत और तर्कसंगत पहलुओं के पस्तुतीकरण के लिए सिस्टम और उपाय खोजने जैसे विषयों को लिया गया। इस उपाय को अपनाने के लिए कौन से टूल्ज़ होंगे ? ज्ञान पद्धतियों की विभिन्नता के साथ सार्विक ज्ञान का सिद्धांत कहां तक संगत होगा। संस्कृति के और विज्ञान के दृष्टिकोण से सार्विकता और विभिन्नता की दुविधा को सामना करने के लिए स्वत:शोध और ज्ञान-शास्त्र प्रणाली-विज्ञान के रूप में मानते हुए सदृश ज्ञान और सदृश मानव-शास्त्र के प्रणाली-विज्ञान के संभावित और भिन्न प्रयोग क्या हैं ? क्या सार्विक कम्प्यूटर लेखन प्रणाली दो कार्य कर सकती है (सब से पहले, सार्विक समझदारी को प्रस्तुत करना यानी सार्विक तर्क के रूप में आमतौर पर क्या समझा जाता है और दूसरे, विभिन्न सांस्कृतिक ज्ञान पद्धतियों के लिए जो मात्र विशिष्ट है उसे दर्ज करना)। इस कार्य को पूरा करने के लिए यूएनएल कहां तक उपयुक्त और संगत है ? जिन तरीको से कम्प्यूटर भाषाओं, सूचना, डेटा और ज्ञान से संबंध रखते हैं, कम्प्यूटर बिना किसी कठिनाई के वस्तुपरक डेटा और वास्तविक सूचना तैयार कर सकते हैं लेकिन क्या वे इतनी ही आसानी से व्यक्ति परक सूचना भी संसाधित कर सकते है

सूचना प्रौद्योगिकी विभाग से प्रतिनिधियों और सम्मेलन के अन्य प्रतिनिधियों के बीच अन्योन्यक्रिया के महत्वपूर्ण परिणाम दो संभावित अन्तर्राष्ट्रीय सहयोग अवसर हैं।

डॉ. ओम विकास, एसडी, डीआईटी और री जीसस कार्डेनोसा लेरा, निदेशक, सेन्टर डी लेंगुआ एस्पेनोला, मैडरिट, स्पेन “भाषा प्रौद्योगिकी के क्षेत्र में भारतीय-यूरोपीय सहयोग” में सहयोग के निम्नलिखित संभावित क्षेत्रों की पहचान करते हैं।

1) ई-कांटेंट विकास (पहले चरण में स्पेनिश से हिन्दी शब्दकोश का विकास)
2) भाषा टूल्ज का स्थानीकरण
3) वाणी-से-वाणी अनुवाद

डॉ. ओम विकास एसडी, डीआईटी और उन्नीस अन्य प्रतिनिधियों ने “बहुभाषी खुला स्रोत साफ़्टवेयर के लिए अन्तर्राष्ट्रीय सहयोग” पर चर्चा की। चर्चा के महत्वपूर्ण बिन्दु निम्नानुसार थे:-

1) नियमित रूप में मिलने और प्रगति मानीटर करने के लिए अन्तर्राष्ट्रीय सहयोग के अन्तर्गत अकादमियों और उद्योग में खोजकर्ताओं के एक संयुक्त कार्य दल का गठन
2) बहुभाषी कम्प्यूटिंग के लिए पुन:प्रयोज्य खुला स्रोत साफ़्टवेयर घटकों की पहचान
3) विशेषज्ञों का आदान-प्रदान
4) बहु-भाषी साफ़्टवेयर घटकों के भण्डार के निर्माण में भारत द्वारा नेतृत्व।

डॉ. बिमल सरीन, सीईओ, मीडिया लैब एशिया के की-नोट