|
|
| संबंधित
संस्थानों/संगठनों द्वारा विकसित इन्टरनेट साधन तथा
प्रौद्योगिकियां |
1. जावा आधारित समाधान : आई आई टी कानपुर
वार्तामय एवं गतिय प्रस्तुति द्वारा
वेब दस्तावेजों का प्रदर्शन : वेब निर्माता विभिन्न प्रकार के अक्षर समूहों और फॉन्ट का प्रयोग करके विभिन्न भाषाओं
में दस्तावेज तैयार करते हैं । यह संभव नहीं है कि दस्तावेज देखने
वाले की मशीन पर सभी फॉन्ट तथा अक्षर समूह हों । अतः संसाधन सहायता
के लिए उसे या तो फॉन्ट को डाउनलोड करने याइन्हे अपनी मशीन पर
प्रतिष्ठापन करने या किसी सॉफ्टवेयर को प्रतिष्ठापित करने की आवश्यकता
होती है । एक सच्चे सुगम समाधान के लिए प्रयोक्ता को अपनी मशीन
पर किसी विशेष फॉन्ट या सॉफ्टवेयर के प्रतिष्ठान की आवश्यकता नहीं
होनी चाहिए ।
देवनागरी दस्तावेजों के प्रदर्शन के लिए जावा
केन्द्रित समाधान का विकास किया गया है । जावा एप्लेट पब्लिक डोमेन
के 'भगवान' फॉन्ट का प्रयोग करते हुए देवनागरी दस्तावेजों को ट्रू
टाईप फॉन्ट में दिखाता है । एप्लेट तथा फॉन्ट संबंधी जानकारी लगभग
100त्त् में है । सर्वर जावा एप्लेट उभारों को इंकोड करता है और
इसे दस्तावेज के साथ भेजता है जिससे दस्तावेज देखने के लिए प्रयोक्ता
को हिन्दी फॉन्ट अपेक्षित नहीं होते हैं । हिन्दी अन्वेषण इंजन
को लाइनैक्स प्लेटफार्म पर विकसित किया गया है ।
स्वमेव फॉन्ट प्रतिष्ठापक : गैर
रोमन वेब साइटों को देखने के लिए प्रयोक्ताओं को आमतौर पर फॉन्ट
डाउनलोड करने पड़ते हैं या फॉन्ट को मैन्युली प्रतिष्ठापित करना
पड़ता है, जो श्रम साध्य कार्य है । जब कभी प्रयोक्ता फॉन्ट प्रतिष्ठापन
का चयन करता है तो प्रक्रिया सम्पादन के लिए एकल निष्पादन विकसित
किया गया है ।
देवनागरी में यू.आर.एल पता
: वर्तमान ब्राउजरों में यू आर एल
और एच टी एम एल पृष्ठों में फार्म भरने में हिन्दी में प्रविष्टि
नहीं होती है । अतः विश्वव्यापी वेब को बहुभाषी होनी जरूरी है
। इसमें स्थानीय भाषा में प्रविष्ट यू आर एल को अन्तराष्ट्रीय
रूप से मान्य स्वरूप यथा यू टी एक -8 इकोडिंग की सहायता से यूनी
कोड में संपरिवर्तन शामिल है ।इससे दस्तावेजों के फार्मों को
स्थानीय भाषा में भरने में सक्षम हो जाएंगे । आगे यह भी, यदि
दस्तावेज विविध भाषाओं में उपलब्ध है तो उन भाषा समूहों के चयन
की सुविधा होगी जिनमें वह दस्तावेज देखना चाहता है । यह समाधान
जोड़ी के 1.2 स्विंग घटकों पर आधारित है और स्थानीय मशीन
पर फॉन्ट होने की कल्पना करता है ।
भारतीय
भाषा अन्वेषण(सर्च) इंजन : यह
अन्वेषण इंजन देवनागरी एच टी एम एल दस्तावेजों के अनुक्रमण और
खोज करना
चाहिए ।इसके मूल अंग एकली कारक अनुक्रमणीकार और अन्वेषण संसाधक
है । अनुक्रमणीकार और अन्वेषण संसाधक का विकास किया जा रहा है
क्योंकि ये दो मॉड्यूल पाठ्य की भाषा की वाक्य संरचना तथा विषयार्थ
से संबंधित हैं । अनुक्रमणीकार मुख्य शब्द मालूम करना, शब्द प्रति
स्थापन को रोकनो, स्टेमिंग (शब्द के विविध स्वरूपों से
संबंधित कार्य) शब्द पर्याय निकालना और पदभार अभिकलन जैसी क्रियाएं
करेगा
। अन्वेषण संसाधक मुख्य खोज शब्दों वाले दस्तावेजों की खोज करेगा,
संगता गणना करेगा और उनकी माप के अनुसार श्रेणीबद्ध करेगा । यह
अन्वेषण इंजन जटिल शब्द में आनेवाले मुख्य शब्दों ( जो नियमों
के अनुसार जुड़े हुए हैं उदाहरण के लिए यदि सॉफ्टवेयर को दस्तावेज
में 'रामेश्वर' मिलता है तो वह 'राम' मुख्य शब्द देगा ) की
खोज करेगा । यह मान लिया गया है कि दस्तावेज ईस्की में है ।
विरासत संबंधी वेबसाइट : ये वेब साइटें उपनिषदों
और भगवदगीता पर केन्द्रित परम्परागत पाठ्य सामग्री को लेकर तैयार
की गइ है । उपलब्ध कराए गए कार्य हैं :
फॉन्ट डाउनलोडिंग अनुप्रयोग (.exe)
फाइलें हैं । प्रयोक्ता किसी भी भारतीय भाषा को फॉन्ट डाउनलोड
कर सकते हैं और फॉन्ट को
प्रतिष्ठापित कर सकते हैं ।
कुछ तकनीकी शब्द, जो संस्कृत मूल के हैं, पर टीकाएं दी गई हैं
। ऐसे तकनीकी शब्दों की परिभाषाएं, माउस से क्लिक करने पर प्रदर्शित
होती हैं ।
संदर्भ के लिए उसी उपनिषद/गीता के संबंधित
श्लोकों से सम्पर्क ।
प्रत्येक पाठ की अन्वेषण प्रक्रिया है जिसके द्वारा प्रयोक्ता
किसी शब्द की उपस्थिति मालूम कर सकता है और उस विशेष श्लोक को
उसके अनुवाद और टीका सहित देख सकता है ।
प्रयोक्ता मूल श्लोकों को देखने के लिए भाषा का चयन कर सकता है
।
भारतीय भाषा दस्तावेजों को
सीडी प्राधिकरण साधन : जिन प्रौद्योगिकियों को प्रयोग विश्वव्यापी वेब यथा एच
टी एम एल, एक्स एम एल, जावा, जावा स्क्रिप्ट इत्यादि के प्रकाशन
में प्रयोग किया जा रहा है, उनका सीडी पर दस्तावेज सुपर्दगी
में भी प्रयोग बढ़ रहा है । उन दिनों कम्प्यूटर संबंधी सम्पूर्ण
दस्तावेज वेब ब्राउजर का प्रयोग करके देखे जा सकते हैं । यह आशा
की जाती है कि यह प्रवृत्ति गैर तकनीकी प्रकाशन में
भी प्रयोग होगी । भारतीय भाषाओं के लिए सीडी प्रकाशक टूल बॉक्स
'साइट मैनेजमेंट'
साधन और शब्द कोश सहित अन्वेषणों का विकास चल रहा है ।
2. एक्टिव एक्स आधारित समाधान : सी- डैक,
पुणे
वेब
आधारित ई-मेल : हिन्दी
ई-मेल सेवा का विकास किया गया है जो ग्राहक पीसी पर भारतीय भाषाओं
के लिए कुँजीपटल कार्यों व फॉन्टों
को सक्षम बनाने के लिए इंटरनेट एक्सप्लोरर 4.0 तथा ब्राउजरों
के पश्चातवर्ती संस्करणों में उपलब्ध उन्नत एक्टिव न् प्रौद्योगिकियों
का प्रयोग करता है । यह सेवा हिन्दी में ई-मेल भेजने के लिए हिन्दी
भाषा में पाठ्य टंकण की सुविधा प्रदान करती है जो एच टी एम एल
प्रारूप में परिवर्तित हो जाती है । एच टी एम एल में परिवर्तित
यह हिन्दी पाठ्य फॉन्ट कूट सहित प्रयोक्ता के पते पर भेज दिया
जाता है, जो नेटस्केप कॉम्पोजर जैसे किसी मानक एच टी एम एल का
प्रयोग करके ही उसे किसी वेब पेज पर प्रतिष्ठापित कर सकता
है ।
जब पहली बार प्रयोक्ता मशीन का उपयोग करता
है तब ग्राहक कम्प्यूटर पर सॉफ्टवेयर के संघटक यथा एक्टिव न्
नियन्त्रण तथा हिन्दी फॉन्ट डाउनलोड कर लेता है और प्रतिष्ठापित
कर लेता है ।
डाक भेजने/देखने में सक्षम होने के लिए प्रयोक्ता को पहले लॉगिंग
नाम तथा पासवर्ड निर्धारित करके एक खाता खोलना चाहिए । मशीन पर
एर खाताधारक दूसरे खाताधारक को संदेश भेज सकता है । प्रयोक्ता
इंस्क्रिप्ट कुँजीपटल स्वरूप का प्रयोग करके संदेश टंकित करता
है, यह संदेश डेटाबेस में भंडारित हो जाता है , सर्वर पर यह डेटा
ईस्की में भंडारित होता है । जब ई-मेल पढ़ने का संदेश प्राप्त
होता है, तब सर्वर डेटाबेस से संदेश प्राप्त करता है और एच टी
एम एल फाइल बनाता है जिसमें फ्लाइसे प्रदर्शित करता है ।एङऊ माइक्रो
विजुअल इंटरडेव है, जो वेब पेज तैयार करने तथा एम एस एसक्यूएल
सर्वर के लिए ओ डी बी सी ड्राईवर के प्रयोग करके बैक एण्ड डेटाबेस
से सम्पर्क करने के लिए ए एस पी (सक्रिय सर्वर पेज ) की क्षमता
का उपयोग करता है । ए एस पी का प्रयोग करने से, वेब पेज से ही
डेटाबेस के बारे में जानकारियां ली जा सकती हैं । एक्टिव न् प्रौद्योगिकी
पर आधारित हिन्दी ई-मेल, सर्च इंजन और बुलेटिन बोर्ड प्रणाली
का विकास कर लिया गया है । हिन्दी ई-मेल भी दस्तावेजों को ईस्की
स्वरूप में सांचित
करता है ।
हिन्दी बुलेटिन बोर्ड प्रणाली: का विकास हो
रहा है । वेब आधारित इस अनुप्रयोग से प्रयोक्ता विचार विमर्श
के लिए प्रकरण सृजित कर सकता है और एक प्रकरण के अन्दर ही तारतम्य
बनाए रख सकता है ।
हिन्दी सर्चइंजन: का भी विकास किया जा रहा
है और इसमें निम्नलिखित शामिल हैं
नेट को हाथ से संचालित करना और हिन्दी दस्तावेजों
की अनुक्रमणिका तैयार करना
पृष्ठ विवरण सहित वेब पेज यू आर एल प्रस्तुत करने के लिए हिन्दी
भाषा के दस्तावेज सृजकों को आमंत्रित करना
और सर्च इंजन के लिए हिन्दी में कुँजीपटल अर्थात हिन्दी में डेटा
संग्रह के लिए वेब
आधारित अनुप्रयोग बनाना ।
हिन्दी के लिए शब्द रूपिम/शब्द संग्रह/संधि आदि पर विशिष्ट खोज
तकनीकी
खोज परिणाम के लिए एच टी एम एल दस्तावेजों अनुक्रमणिका का हिन्दी
में विवरण
भारतीय भाषाओं के लिए ऐसे मेटा-टैग आदि के लिए मानक निर्धारित
करना
बहुभाषी ई-मेल ग्राहक : हिन्दी भाषा मेंई-मेल
भेजने व प्राप्त करने में ग्राहकों की सुविधा के लिए एक कार्यशील
नमूना विकसित किया गया, यदि प्रेषक तथा प्राप्तकर्त्ता दोनों
के पास यह सॉफ्टवेयर हो, तो इंटरनेट सम्पर्क की की आवश्यकता नहीं
होती है । यह अनुप्रयोग एम एस एक्सचेंज द्वारा उपलब्ध कराए गए
इंटरफेस की सहायता से संचार के लिए एम ए पी आई, विस्तारित एम
ए पी आई एवं कॉम जैसी प्रौद्योगिकियों का प्रयोग करेगा । यह अनुप्रयोग
पी ओ पी 3 सर्वर से प्राप्त सभी प्रकार की डाक को डाउनलोड करता
है और उन्हे मशीन पर सीमित स्थान पर भंडारित करता है । एम एस-एक्सचेंज
डाक के इस भंडारण की देख-रेख करता है । प्रयोक्ता की सुविधा के
लिए यह अनुप्रयोगइन-बॉक्स, मेल प्रेषण, मेल-लोप और आउट बॉक्स
जैसे फोल्डरों तक पहुँच उपलब्ध कराता है ।
| विभिन्न
संस्थानों/संगठनों द्वारा विकसित संस्कृत संसाधन
साधन |
1. देशिका : उच्च अभिकलन विकास केन्द्र (सी - डैक), बंगलौर
देशिका नामक सॉफ्टवेयर पैकेज संस्कृत का प्राकृतिक भाषा अवबोधन प्रणाली है । इस
सॉफ्टवेयर में सामान्य एवं स्वरित लिखित संस्कृत पाठ्यों के लिए भाषा सृजन एवं विश्लेषण
मॉड्यूल शामिल हैं । यह प्राचीन भारतीय विज्ञान के सिद्धांतों पर आधारित है । देशिका
का उद्देश्य सृजन एवं विश्लेषण (पद परिचय) सहित संस्कृत के सभी शब्दों का संसाधन
है । समें संस्कृत के सर्वाधिक प्रसिद्ध शब्दकोश अमरकोश पर आधारित सम्पूर्ण डेटाबेस,
पाणिनि के अष्टाध्यायी के व्याकरण नियमों का उपयोग करनेवाला नियम आधार, तथा अर्थगत
एवं पाठगत संसाधन के लिए न्याय एवं मीमांसा शास्त्र पर आधारित स्वतःशोध प्रणाली
विज्ञान शामिल है । यह सॉफ्टवेयर वैदिक (धर्मग्रंथीय) पाठों का भी विश्लेषण कर सकता
है । एङऊ देशिका की मुख्य विशेषता विश्लेषण मॉड्यूल है जो सामान्य प्रयोजन का संस्कृत
पद परिचायक है । इसका अभी वस्तार (प्रसार) किया जा रहा है ताकि समास एवं संयुक्त
शब्द के रूपों का विग्रह एवं पहचान किया जा सके । वैदिक विश्लेषण के प्रयास किए
जा रहे हैं । तैतिरीय प्रतिशाख्य एवं अष्टाध्यायी की वैदिक प्रक्रिया का उपयोग करते
हुए ऋगवेद एवं कृष्णयजुर्वेद की तैतिरीय शाखा का विश्लेषण ।
एङऊ देशिका सॉफ्टवेयर प्राकृतिक भाषा प्रयोग (विशेषकर एक पृथक वाक्य का) पद परिचय,
वाच्य परिवर्तन, प्रश्नों के उत्तर अथवा संक्षेपण के जरिए सहायक है । यह प्राचीन
भारतीय विज्ञान पर आधारित भाषा निरपेक्ष ज्ञान प्रतिनिधित्व योजना के विकास; भाषा
विज्ञान विश्लेशण के लिए यंत्रों के विकास तथा धर्मग्रंथीय (स्वरित पाठ) ज्ञान का
वाश्लेषण एवं प्रस्तुतीकरण में सहायक, ध्वन्यात्मक तथा भाषा अनुसंधान,
अध्यापन आदि में सहायक है । इसका विकास डॉस प्लेटफॉर्म पर किया गया था परंतु अब
से विन्डोज
प्लेटफॉर्म पर हस्तांतरित कर दिया गया है । :
2. संस्कृत लेखन प्रणाली - सीडैक, बंगलौर
संस्कृत शब्द संसाधक का विकास किया जा रहा
है जो विशिष्ट संस्कृत समुच्चयबोधकों का भी संचालन करेगा । जो
आवश्यकताएं इस सॉफ्टवेयर द्वारा पूरी की जाएंगी, वे इस प्रकार
हैं
संस्कृत में शब्द संसाधन
शब्दानुक्रमणिका, विश्वकोश, इलेक्ट्रॉनिक शब्दकोश आदि जैसे शब्दशास्त्र
के साधन
लिप्यंतरण सुविधा
लघुगणक खोज/छाँट
संधि और समास के लिए शब्द विच्छेद प्रोग्राम
विभिन्न लिपियों, वेब अभिगम, वेब आयोजन; प्रकाशन आदि के लिए फॉन्ट
काव्य विश्लेषण (पाठगत/छंद संबंधी/शाब्दिक)
अमरकोश, व्याकरण नियम; व्युत्पत्ति, वेद (धर्मग्रंथों) से उद्धरण
की विषय सूची से युक्त पुस्तिका
रामायण, महाभारत जैसे महाकाव्य, अन्य पुराण, सूत्र में शास्त्रीय
पाठ तथा प्रामाणिक संदर्भ
भारतीय शास्त्रीय पाठों का ऑन-लाइन अध्येता/बालबोध
आकृति विज्ञान (रूपिम), व्याकरण सम्मत एवं अर्थगत विश्लेषण के
लिए साधन
टैगिंग, लेमटाइजिंग, स्टैटिस्टिकल अध्ययन आदि जैसे भाषागत विश्लेषण
के लिए साधन
3. संस्कृत वाक्यों का व्याकरण सम्मत एवं अर्थगत विश्लेषण - संस्कृत
अनुसंधान अकादमी, मेलकोट
जिस्ट कार्ड से युक्त डॉस
प्लेटफॉर्म पर संस्कृत वाक्यों का व्याकरण सम्मत एवं अर्थगत विश्लेषण
का विकास किया गया है तथा इसे विन्डोज
प्लेटफॉर्म पर हस्तांतरित किया जा रहा है । वाक्य को विश्लेषण
की मौलिक इकाई माना जाता है क्योंकि यह मानव के मौखिक संचार का
आधार है ।शब्दों की महत्ता तभी जानी जाती है जब वाक्य का अर्थ
ज्ञात हो । शब्दों का क्रमबद्ध वर्गीकरण एवं संतुलित व्याकरण
से संस्कृत की जानकारी में सहायता मिलती है तथा ससे तंत्र का
निर्माण होगा जो प्राकृतिक भाषा संसाधन प्रणाली के विकास में
सहायक होगी । इस प्रणाली के विभिन्न मॉड्यूल इस प्रकार हैं :
सुबन्त : यह 26000 से अधिक शब्दों, सभी कारकों
के सृजन एवं विश्लेषण का संचालन कर सकता है ।
तिङन्त: यह धातुओं के क्रिया संबंधी रूपों, दो वाच्यों, दस लकारों
तथा केवल तिङन्त, निजन्त एवं सन्नत जैसे तीन रूपों का संचालन
कर सकता है ।
कृदन्त: यह 150 धातुओं के 11 प्रकार के कृदन्तों के कारकों के
शब्द रूपों का सृजन, विश्लेषण एवं पहचानने के संचालन में सक्षम
है ।
डेटाबेस: 690 अव्यय, 26,000 संज्ञात्मक शब्द, 600 क्रियात्मक
धातु, 600 क्रियात्मक धातुओं के कृदन्त रूप, 5 तद्धित प्रत्यय
।
वाक्य (वाणि) के भाग जिनका
विश्लेषण संचालन के लिए किया गया वे इस प्रकार हैं :- संज्ञा,
सर्वनाम, विशेषण,
कृदन्त, अव्यय, अव्यय कृदन्त और क्रिया । अनेक विशेषण एवं कृदन्त
से युक्त वाक्यों का भी विश्लेषण किया जा सकता है । डेटाबेस से
किसी शब्द के चयन से बने वाक्य का व्याकरण सम्मत विश्लेषण किया
जा सकता है । परंतु एक सीमित क्षेत्र के भीतर अर्थगत विश्लेषण
किया जाता है । अर्थगत विश्लेषण के संचालान के लिए एक मेट्रिक्स
(सम्पुटक) तैयार किया गया है जिसमें पर्यायवाची शब्दों सहित संज्ञा
के 52 समुच्चय
इस प्रकार हैं । '2' संज्ञाएँ, 27
कार्य जिन्हें लगभग 200 क्रियाओं के द्वारा इंगित किया गया है
। एक सामान्य अनुच्छेद जिसमें 10 से ज्यादा सरल वाक्य नहीं हो,
का व्याकरण सम्मत एवं अर्थगत विश्लेषण सफलतापूर्वक किया जा चुका
है ।
4. कम्पयूटर साधित संस्कृत अध्यापन एवं अधिगम परिसर (कैसल) -
जवाहरलाल नेहरू विश्वविद्यालय, नई दिल्ली
स्वतंत्र अनुप्रयोग के रूप में संस्कृत अध्यापन एवं अधिगम के
लिए जिस्ट कार्ड से युक्त डॉस प्लेटफॉर्म पर कैसल सॉफ्टवेयर का
विकास किया गया है । इस परियोजना के अंतर्गत संस्कृत स्वर विज्ञान
एवं शब्द स्वर विज्ञान का संचालन किया गया है । स प्रणाली के
अंतर्गत विकास किए गए विभिन्न मॉड्यूल स प्रकार हैं :
प्रत्याहार: यह पाणिनीय
व्याकरण के ध्वनि वर्गों से संबंधित है । इसका ध्वनियों के समूह
के लघुरूप के रूप में वर्णन किया जा
सकता है ।
संधि: ध्वनियों
से संबंद्ध समान उच्चारण स्थान वाले वर्णों के अत्यधिक सामीप्य को 'संधि' कहते हैं । विभिन्न प्रकार
के शब्द निर्माण के लिए एक सामान्य मापदंड है । संधि के प्रकार
प्रथम शब्द के अंतिम वर्ण और दूसरे शब्द के आरम्भिक वर्ण पर निर्भर
करते हैं । इसमें णत्व-षत्व विधान आंतरिक संधि के लिए एक प्रोग्राम
भी शामिल है ।
सुबन्त: यह
मापदन्ड अपरिवर्तनीय संज्ञा से संबंधित है । इस प्रणाली में लागत
अपने अंगों सहित संज्ञा मूल वाले हैं
तथा समें संज्ञा के 21अ3 परिवर्तत रूप प्राप्त किया जाता है ।
तिङन्त: क्रिया-संबंधी क्रियारूपों को तिङन्त कहते हैं । इस मॉड्यूल
(मापदन्ड) में क्रिया और लकार (काल/भाव) का उपयोग किया जाता है
तथा प्रत्येक क्रिया के प्रत्येक लकार में 9 क्रिया रूपों का
सृजन होता है ।
कृदन्त: मूलरूप
से व्युत्पन्न शब्दों को कृदन्त कहा जाता है । इसमें अर्थगत अवस्था,
क्रिया की मूल धातु एवं कृत्
प्रत्यय का उपयोग किया जाता है । कृदन्त सका निष्पन्न रूप है
।
तद्धित: द्वितीयक
स्तर
पर व्युत्पन्न शब्दों को तद्धित कहा जाता है । इसमें अर्थगत अवस्था,
संज्ञात्मक आधार एवं तद्धित प्रत्यय का उपयोग किया जाता है ।
तद्धित सका निष्पन्न रूप है ।
समास: दो
या दो से अधिक शब्दों के मिलाकर एक नया समन्वित रूप प्रदान करने
को ही समास कहते हैं
। इसमें दो या दो से अधिक संज्ञात्मक आधारों का उपयोग किया जाता
है जो सार्थक होते हैं तथा सामान्य प्रत्ययों से युक्त होते हैं
।
श्री-प्रत्यय: द्वितीयक क्रियात्मक धातुएँ प्राप्त करने
के लिए इन प्रत्ययों का मौलिक क्रियात्मक धातुओं के साथ उपयोग
किया जाता है ।व्युत्पन्न क्रिया का उपयोग पुनः तिङन्त मॉड्यूल
(मापदन्ड) में किया जाता है ताकि प्रत्येक लकार में 9 क्रियारूपों
का सृजन हो सके ।
संस्कृत के अधिगम/अध्यापन के लिए निम्नलिखित
प्रदर्शनात्मक मापदंड का विकास किया गया है :
अध्यापन वर्णमाला: यह मॉड्यूल संस्कृत वर्णमाला के उसके लक्षणों
के साथ अध्यापन से संबंधित है । वर्णमाला ज्ञान की जाँच के लिए
अभ्यास भी तैयार किए गए हैं ।
सन्धि विच्छेद: इस
प्रणाली में एक शब्द को लिया जाता है तथा उसके संघटक शब्दों को
अलग-अलग कर दिया जाता है ।
सुबन्त विच्छेद: दिए
गए शब्द को मूल शब्द एवं प्रत्यय में अलग-अलग किया जाता है ।
इसके अतरिक्त मूल शब्द से सम्बद्ध व्याकरण संबंधी विशेषताओं
(अंगों) अर्थात संज्ञात्मक आधार का भी प्रदर्शन किया जाता है
।
तिङन्त विच्छेद: दिए गए ( प्रकृत) शब्द को धातु शब्द और
प्रत्यय में अलग-अलग किया जाता है । इसके अतिरिक्त धातु से संबद्ध
व्याकरण संबंधी विशेषताओं (अंगों), जो क्रियात्मक धातु है, का
भी प्रदर्शन किया जाता है ।
संस्कृत
के विद्वानों द्वारा पाठ संसाधन आदि में प्रयोग के लिए संस्कृत
शब्द संसाधक से युक्त संस्कृत लेखन प्रणाली का विकास सी-डैक,
बंगलौर में किया जा रहा है ।
1. आंग्लभारती मशीन अनुवाद
तंत्र (अंग्रेजी-हिन्दी) ई.आर.एण्ड डी.सी.आई. नोएडा
यह सॉफ्टवेयर पैकेज संस्कृत के लिए प्राकृतिक भाषा अवबोधन प्रणाली है । इसका विकास
रमणश्री प्लाजा, '2'ऊ211 ब्रुन्टन रोड़, बंगलौर (कर्णाटक)
स्थित भारत सरकार, सूचना प्रौद्योगिकी मंत्रालय की एक वैज्ञानिक संस्था, उन्नत अभिकलन विकास केन्द्र (सी-डैक)
के भारतीय विरासत समूह द्वारा किया गया है । इस सॉफ्टवेयर
में साधारण एवं स्वरित लिखित संस्कृत पाठों के लिए भाषा निर्माण एवं विश्लेषण
मापदन्ड शामिल हैं । यह प्राचीन भारतीय विज्ञान के सिद्धांतों पर आधारित है ।
देशिका का उद्देश्य निर्माण एवं विश्लेषण (पद परिचय) सहित संस्कृत के सभी शब्दों
का संसाधन है । समें सांस्कृत के सर्वाधिक प्रसिद्ध शब्दकोश अमरकोश पर आधारित
सम्पूर्ण डेटाबेस, पाणिनि के अष्टाध्यायी के व्याकरण नियमों का उपयोग करनेवाला
नियम आधार, तथा अर्थगत एवं पाठगत संसाधन के लिए न्याय एवं मीमांसा शास्त्र पर
आधारित स्वतःशोध प्रणाली विज्ञान शामिल है । यह सॉफ्टवेयर वैदिक (धर्मग्रंथीय)
पाठों का भी विश्लेषण कर सकता है ।
शब्दबोध एक परस्पर सक्रिय अनुप्रयोग है जिसका निर्माण संस्कृत वाक्यों के अर्थगत
एवं व्याकरण सम्मत संरचना के विश्लेषण के लिए किया गया है । यह जिस्ट शेल से
युक्त 6.0 अथवा उच्चतर एमएस डॉस प्लेटफॉमर् पर कार्य करता है । इसका विकास ए
एस आर, मेलकोट में किया गया है
शब्द संसाधन के लिए वर्तनी शोधक उपयोगी है तथा अधिकांशतः इसके शब्द संसाधक सॉफ्टवेयर के साथ एकीकृत किया गया है । कुछ भारतीय भाषाओं में वर्तनी शोधक उपलब्ध है । शब्दकोश विकास के लिए चालू परियोजनाओं के क्षेत्र के अंतर्गत वर्तनी शोधक के विकास आता है । सी ई ए टी आई, मोहाली में पंजाबी वर्तनी-शोधक का विकास किया गया है ।
|