डा. बालकृष्ण बल
१. ल्याङ्ग्वेज इञ्जिनियरिङ के हो त ?
विश्वमा ल्याङ्ग्वेज इञ्जिनियरिङको प्रादुर्भाव भएको लगभग एक दशक हुन लाग्यो । सामान्यतया मानिसले कम नै सुनेका र झेलेका ल्याङ्ग्वेज इञ्जिनियरिङको प्राविधिक अर्थ भने कम्प्युटर सिस्टमहरूमा भाषागत ज्ञानको विशिष्टतालाई समावेश गरी मानव उपयोगी सेवा र सुविधा प्रदान गर्ने सफ्ट्वेयर वा एप्लिकेसनको निर्माण गर्ने विधा भन्ने नै बुझिन्छ । विज्ञान र प्रविधिको विकासक्रमका घटनाहरूले द्रुतगतिमा फड्को मारिरहेको आजको दिनमा सही अर्थमा कम्प्युटरको प्रयोगबाट मानिसले फाइदा लिनका लागि कम्प्युटर र मानवका बीचमा सम्वाद गराउन जरूरी भइसकेको छ । यस मामलामा ल्याङ्ग्वेज इञ्जिनियरिङको भूमिका अहम् हुन्छ ।
हामी मानिसहरूले बोल्ने भाषा र कम्प्युटरले बुझ्ने भाषा बिलकुल फरक हुन्छ । हामी मानव जाति एक अर्कासँग सञ्चार गर्न आआफ्ना देश, जाति र समुदायले प्रयोग गर्ने भाषा प्रयोग गर्छौँ भने कम्प्युटरले प्रोग्रामिङ ल्याङ्ग्वेजको भाषा प्रयोग गरी निर्मित प्रोग्राममार्फत् सञ्चार गर्दछ ।कम्प्युटरलाई पनि मानव जाति जत्तिकै वा ऊ भन्दा बौद्धिक बनाउने वैज्ञानिकहरूको जमर्को अहिले देखिको हैन।यस्तो सामथ्र्यताको विकास गर्न कम्प्युटरलाई हामी मानवहरूले बोल्ने प्राकृतिक भाषाको अपार ज्ञानको भण्डार उक्त यन्त्रले बुझ्ने तरिकाले सम्प्रेषण र प्रशोधन गराउनु पर्छ । यसै सिलसिलामा कम्प्युटरलाई चाहिने जानकारी वा डेटा मूलतः इनपुट नामक चरणमा दिइन्छ, जसलाई कम्प्युटरले उचित प्रशोधन प्रक्रियापश्चात् आउटपुट चरणमा निश्चित ढाँचामा आउटपुट गर्छ अर्थात् बाहिर ल्याउँछ । इनपुट चरणमै पनि इनपुटका ढाँचा विभिन्न प्रकारका हुन्छन् जस्तो कि पाठ, छवि, अडियो भिडियो आदि । यसरी नै आउटपुट पनि इनपुट जस्तै विभिन्न ढाँचाका हुन्छन् । रोचक पक्ष त के छ भने इनपुट चरणदेखि आउटपुट चरणसम्म डेटा वा जानकारी प्रशोधित हुने क्रममा थुप्रै अन्य चरणहरू संलग्न हुने गर्छन् । जसका आआफ्नै विशेषताहरू हुन्छन् । यी चरणहरू क्रमशः रिकग्नाइज एण्ड भ्यालिडेट अर्थात् पहिचान र प्रमाणीकरण गर्ने, एनालाइज एण्ड अन्डरस्ट्यान्ट अर्थात् विश्लेषण गर्ने तथा बुझ्ने, अप्लाई अर्थात् प्रयोगमा ल्याउने र अन्तिममा जेनेरेट अर्थात् उत्पादन गर्ने छन् । यस अर्थमा कम्प्युटरलाई दिइएको इनपुट डेटा वा जानकारीलाई सर्वप्रथम पहिचान र प्रमाणीकरण गरिन्छ, त्यसपछि विश्लेषण गर्ने र बुझ्ने काम हुन्छ, क्रमशः कम्प्युटरको विश्लेषण तथा बुझाइलाई प्रयोगमा ल्याइन्छ अनि अन्ततः कम्प्युटरले ज्ञान जेनेरेट वा उत्पादन गर्छ ।
२. ल्याङग्वेज इञ्जिनियरिङ र भाषागत स्रोत तथा संसाधनहरू
कम्प्युटरलाई हामी मानव जातिले जस्तै सोच्ने र बुझ्ने सामथ्र्यता ल्याङ्वेज इञ्जिनियरिङमार्फत् विकास गर्न सकिन्छ। तर यो हासिल गर्न हामीले निश्चित भाषागत स्रोत तथा संसाधनहरूको बन्दोबस्त गर्नुपर्छ । ती स्रोत तथा संशाधनहरू निम्नअनुसार छन्-
क)लेक्सिकन अर्थात् शब्द ज्ञानको भण्डार
लेक्सिकनअन्तर्गत शब्द र तिनकाबारे ज्ञानको भण्डार पर्दछन् । उक्त ज्ञान शब्दको तहमा व्याकरणगत संरचनाको अध्ययन अर्थात् मर्फोलोजी, ध्वनिगत संरचनाको अध्ययन अर्थात् फोनोलोजी, विभिन्न सन्दर्भमा शब्दका अर्थगत अध्ययन अर्थात् लेक्सिकल सिम्यान्टिक्स जस्ता विभिन्न प्रारूपमा हुन्छन् । सामान्यतया कुनै पनि लेक्सिन उपयोगी हुनका लागि लाखौँ शब्दका प्रविष्टिहरू हुन आवश्यक हुन्छ।यस्ता लेक्सिकन व्यक्तिवाचक नामका साथै प्राविधिक पदावलीजस्ता विषयका हुन सक्छन् ।
ख) व्याकरण
विश्वमा बोलिने तथा लेखिने मानव भाषाहरूका आफ्नै विशेषता हुन्छन् । यी भाषामा तयार पारिएका पाठ्यसामग्रीहरूलाई कम्प्युटरले कुशलतापूर्वक पहिचान र विश्लेषण गर्न सम्बन्धित भाषाको व्याकरण कम्प्युटरले बुझ्ने ढाँचामा हुन जरूरी हुन्छ । यस्तो व्याकरणलाई प्राविधिक भाषामा कम्प्युटेसनल ग्रामर भनिन्छ । यस्तो व्याकरणले शब्द, वाक्यांश वा वाक्यको स्तरमा दुवै सिन्ट्याक्स (व्याकरण) र सिम्यान्टिक्स (अर्थ) केलाउने क्षमता बोक्दछ ।
ग) कर्पोरा
कर्पस (एकवचन) र कर्पोरा (बहुवचन) भन्नाले पाठ वा वाणीका रूपमा सङ्ग्रहीत सामग्री भन्ने बुझिन्छ । कर्पोराको उपादेयता निम्न कार्यका लागि हुन्छः
अ) कुनै पनि भाषाको विश्लेषण र त्यसका विशेषताका बारे अध्ययन गर्न,
आ) कम्प्युटर सिस्टमलाई मानव जाति जस्तै सोच्ने, बुझ्ने र विश्लेषण गर्ने सामथ्र्यता प्रदान गर्न आवश्यक तालिम दिने कार्य,
इ) ल्याङ्ग्वेज इञ्जिनियरिङ टेक्निक वा एप्लिकेसनको प्रभावकारिता परीक्षण गर्न,
उ) पछिल्लो समय मसिन लर्निङ जस्ता उन्नत प्रविधिको कार्यान्वयनमा पनि कर्पोराको व्यापक प्रयोग गरेको पाइन्छ ।
३.ल्याङ्ग्वेज इञ्जिनियरिङ अन्तर्गतका उपयोगी एप्लिकेसन सफ्ट्वेयर
समाजलाई विकासको पथमा व्यापक कायापलट र रूपान्तरण गर्ने सामथ्र्य बोक्ने ल्याङ्ग्वेज इञ्जिनियरिङअन्तर्गत थुप्रै उपयोगी एप्लिकेसन सफ्ट्वेयर पर्दछन् । त्यस्ता केही उपयोगी एप्लिकेसन सफ्ट्वेयरहरू निम्न किसिमका छन्-
क) स्पिच रिकग्निसन अर्थात् वाणीको पहिचान गर्ने एप्लिकेसन सफ्ट्वेयरः यस्तो सफ्ट्वेयरले कम्प्युटरलगायतका यन्त्रमा इनपुटको रूपमा दिइएको वाणी वा अडियो सामग्रीलाई पहिचान गरी कुनै उपयोगी कार्य गर्दछ । जस्तै हामीले बोलेको कुरालाई कम्प्युटरमा आफैँ टाइप हुने सुविधा आदि ।
ख) स्पिच (टुस्पिच ट्रान्सलेसन अर्थात् वाणीबाट वाणीमा समानान्तर अनुवाद गर्ने एप्लिकेसन सफ्ट्वेयरः यस्तो सफ्टवेयरले कुनै एक भाषामा बोलिएको सामग्रीलाई अर्को भाषामा वास्तविक समयमा समानान्तर रूपमा अनुवाद सेवा प्रदान गर्छ ।
ग) अप्टिकल क्यारेक्टर रिकग्निसन (ओसिआर) अर्थात् छवि ढाँचामा रहेको पाठलाई सम्पादनयोग्य ढाँचामा रूपान्तरण गर्ने एप्लिकेसन सफ्ट्वेयरःयस्तो सफ्ट्वेयरले छवि ढाँचामा रहेको पाठलाई सम्पादनयोग्य ढाँचामा रूपान्तरण गर्दछ यो सुविधा विशेष गरी दृष्टिविहीन तथा दृष्टिमा समस्या भएका मानिसहरूलाई छवि ढाँचामा भएका पाठ्यसामग्रीहरू कम्प्युटरको सहयोगबाट सुन्न र पढ्नका लागि उपयोगी हुन्छ ।
घ) टेक्स्ट टु स्पिच (टिटिएस) अर्थात् पाठवाचक एप्लिकेसन सफ्टवेयर ः यस्तो सफ्ट्वेयरले पाठ सामग्री देख्न र पढ्न नसक्ने मानिसहरूलाई पढेर सुनाई सहयोग पुर्याउँछन् ।
ङ) मसिन ट्रान्स्लेसन (एम्टी) अर्थात् यान्त्रिक अनुवाद एप्लिकेसन सफ्टवेयरः यस्तो सफ्ट्वेयरले कुनै पनि स्रोत भाषामा भएको सामग्रीलाई लक्षित भाषामा वास्तविक समयमा अनुवाद सेवा प्रदान गर्दछ ।
च) सेन्टिमेन्ट एनालिसिस अर्थात् विचार विश्लेषणः यस्तो सफ्टवेयरले सामाजिकलगायत अनलाइन न्युज मेडियामा छापिएका पाठ्यसामग्रीको विश्लेषण गरी सकरात्मक, नकरात्मक वा तटस्थ भनी पाठलाई वर्गीकरण गर्दछ । यस्तो प्रकारको विश्लेषणले रेस्टुरेन्ट, होटेल तथा अन्य सेवा सुविधाका बारेमा जनमानसको विचार तथा मतकाबारे जानकारीको आँकलन गर्दछ।निर्वाचनताका चुनावी नतिजाको प्रक्षेपणसमेत यस्तो सफ्ट्वेयरले गर्न सक्ने भएकाले समाजमा रहेका राजनीतिक, सामाजिक सबै क्षेत्रका मानिसहरूको यसप्रति विशेष रूचि र चासो देखिन्छ ।
छ) इन्फर्मेसन रिट्राइभल अर्थात् सर्च इञ्जिनबाट आफूलाई चाहिएका जानकारी र कागजात निकाल्ने सफ्ट्वेयरः यस्तो सफ्ट्वेयरले न्ययनभि जस्ता सर्च इञ्जिनबाट आफूलाई चाहिएका जानकारी र कागजात निकाल्न सहयोग पुर्याउँछन् ।
(लेखक काठमाडौँ विश्वविद्यालय धुलिखेलका सहप्राध्यापक, कम्प्युटर तथा इन्जिनियरिङ विभागका प्रमुख हुनुहुन्छ ।)