Site icon Taaza Time 18

कैसे एक पिता का बेटे के कन्नड़ होमवर्क का समाधान 21 भारतीय भाषाओं के लिए मुफ्त कीबोर्ड ऐप बन गया | प्रौद्योगिकी समाचार

track_1x1.jpg


कृष्णा पेरमी याद करते हैं कि यह सब कैसे शुरू हुआ। बेंगलुरु के 35 वर्षीय स्वतंत्र डेवलपर कहते हैं, ”मैं अपने बच्चे को कन्नड़ होमवर्क में मदद करना चाहता था।” घर पर इसी सरल कार्य के कारण पर्मी ने एक निःशुल्क कीबोर्ड ऐप अक्षर विकसित किया, जो 21 भारतीय भाषाओं का समर्थन करता है।

पर्मी का कहना है कि वह अपने बेटे को घर पर कन्नड़ का अभ्यास करने में मदद कर रहे थे। अपने बच्चे के लिए पढ़ने के अभ्यास और नोट्स बनाने के लिए, उन्हें अपने iPhone पर कन्नड़ में आराम से टाइप करने का एक तरीका चाहिए था। हालाँकि उत्तरी कर्नाटक में बड़े होते हुए उन्होंने हाथ से भाषा पढ़ना और लिखना सीखा था, लेकिन इसे डिजिटल रूप से टाइप करना स्वाभाविक रूप से नहीं आया।

पर्मी ने अंततः वही किया जो उसके पद पर बैठे अधिकांश लोग करते हैं: उसने एक ब्राउज़र में Google इनपुट टूल्स खोला। वेब टूल, जो अपने लॉन्च के बाद से बहुत अधिक नहीं बदला है, उसे अंग्रेजी में ध्वन्यात्मक रूप से टाइप करने और कन्नड़ अक्षरों को स्क्रीन पर देखने की सुविधा देता है। “लेकिन जब भी मैंने इसे अपने फोन पर इस्तेमाल किया, तब भी यह मोबाइल के लिए अनुकूलित नहीं था,” वह कहते हैं। इसके लिए इंटरनेट कनेक्शन की आवश्यकता थी, और ऐसा लगा, उनके शब्दों में, “अभी भी उस युग में अटका हुआ है”।

इसलिए उन्होंने खुद एक ऐप बनाया. उन्होंने Google Input Tools API लिया, इसे एक देशी iPhone ऐप में लपेटा और लगभग एक साल तक इसका उपयोग किया। आख़िरकार, उन्होंने इसे ऐप स्टोर पर डालने का फैसला किया। तभी एक छोटा लेकिन परिणामी विवरण सामने आया। जब ऐप्पल ने डेवलपर्स से यह घोषित करने के लिए कहा कि उनका ऐप गोपनीयता पोषण लेबल पर कौन सा डेटा एकत्र करता है, तो पर्मी को एहसास हुआ कि भले ही वह व्यक्तिगत रूप से कुछ भी संग्रहीत नहीं कर रहा था, फिर भी प्रत्येक लिप्यंतरण क्वेरी एक बाहरी सर्वर पर जा रही थी।

“यह सही नहीं लगा क्योंकि Google को कौन सा डेटा भेजा जा रहा था, इस पर मेरा कोई नियंत्रण नहीं था। कीबोर्ड को काम करने के लिए इंटरनेट कनेक्शन की भी आवश्यकता थी। उसी समय, मैंने पूरी तरह से निजी, ऑफ़लाइन, ऑन-डिवाइस विकल्प की तलाश शुरू कर दी,” वे कहते हैं।

कीबोर्ड और गोपनीयता

जब सॉफ्टवेयर स्टैक की बात आती है, तो कीबोर्ड असामान्य रूप से संवेदनशील स्थिति पर कब्जा कर लेते हैं, क्योंकि अधिकांश ऐप्स के विपरीत, वे टाइप किए गए प्रत्येक अक्षर को लॉग इन करते हुए उपयोगकर्ता और बाकी सभी चीजों के बीच बैठते हैं। तृतीय-पक्ष कीबोर्ड डेवलपर्स के पास एक वैकल्पिक ‘पूर्ण एक्सेस’ मोड तक पहुंच होती है जो अतिरिक्त सुविधाओं को सक्षम करता है लेकिन सिद्धांत रूप में, डेटा ट्रांसमिशन को भी सक्षम बनाता है। यह एक ऐसा क्षेत्र है जहां उपयोगकर्ता का भरोसा कमाना कठिन है और खोना आसान है।

वे कहते हैं, “लोग बहुत सारी निजी चीज़ों जैसे ओटीपी, क्रेडिट कार्ड नंबर आदि के लिए कीबोर्ड का उपयोग करते हैं।” “मैं यह आश्वासन देना चाहता था कि मैं कुछ भी एकत्र नहीं कर रहा हूँ।”

इस विज्ञापन के नीचे कहानी जारी है

गोपनीयता-संरक्षण विकल्प के लिए पर्मी की खोज ने उन्हें AI4भारत की ओर प्रेरित किया, जो कि आईआईटी मद्रास पर आधारित एक शोध पहल है, जो भारतीय भाषाओं के लिए प्राकृतिक भाषा प्रसंस्करण पर केंद्रित है। उनके ओपन-सोर्स रिलीज़ में IndicXlit, 21 भारतीय भाषाओं में प्रशिक्षित एक लिप्यंतरण मॉडल था जो ध्वन्यात्मक अंग्रेजी इनपुट को मूल लिपियों में परिवर्तित करता है।

पर्मी ने साझा किया कि जब IndicXlit का उपयोग संस्थागत संदर्भों में किया जा रहा था, तो उन्हें कोई भी उपभोक्ता-स्तरीय ऐप नहीं मिला जिसने इसे एकीकृत किया हो। तभी उन्होंने एक बनाने का फैसला किया। “मैं थोड़ा खुश और भावुक भी हुआ क्योंकि जब आप उपभोक्ता स्तर पर भारत के बाहर कहीं से मॉडलों का उपयोग करने के बारे में सुनते रहते हैं, और फिर आपको कुछ ऐसा मिलता है जिसे आप किसी भी सर्वर या एपीआई को कोई जानकारी भेजे बिना कीबोर्ड में एकीकृत कर सकते हैं, सब कुछ डिवाइस पर कर सकते हैं, यह एक सफलता की तरह लगता है। यह बहुत खास महसूस हुआ, “उन्होंने साझा किया।

इंजीनियरिंग समाधान

जब पूछा गया कि AI4भारत IndicXLit मॉडल पूरी तरह से डिवाइस पर कैसे काम करता है, तो पर्मी ने स्वीकार किया कि रास्ते में कुछ चुनौतियाँ थीं। iOS में कीबोर्ड एक्सटेंशन की मेमोरी सीमा सख्त होती है, लगभग 50 से 75 एमबी। जैसा कि जारी किया गया, इंडिकएक्सलिट मॉडल लगभग 350 एमबी का था और इसमें लगभग 15 मिलियन पैरामीटर थे।

इसे कीबोर्ड के अंदर फिट करने के लिए, पर्मी को इसकी आउटपुट गुणवत्ता को ख़राब किए बिना इसे काफी संपीड़ित करना पड़ा। तकनीक को क्वांटिज़ेशन कहा जाता है, जो अनिवार्य रूप से मॉडल के वजन की संख्यात्मक सटीकता को कम कर रहा है ताकि उनके अधिकांश व्यवहार को संरक्षित करते समय उन्हें कम मेमोरी की आवश्यकता हो। कम सटीक, लेकिन फिर भी अर्थपूर्ण, और बहुत हल्का।

इस विज्ञापन के नीचे कहानी जारी है

“आप सटीकता खोए बिना इसे संपीड़ित कर सकते हैं,” उन्होंने कहा। “तभी मैं इसे कीबोर्ड पर रख सकता था और सुनिश्चित कर सकता था कि आकार वास्तव में प्रयोग करने योग्य था।”

अक्षर पूरी तरह से डिवाइस पर चलते हुए उपयोगकर्ताओं को अंग्रेजी में ध्वन्यात्मक रूप से टाइप करने और पाठ को तुरंत भारतीय भाषाओं में परिवर्तित करने की अनुमति देता है। (एक्सप्रेस छवि)

परिणाम अक्षर था, एक कीबोर्ड जो पूरी तरह से डिवाइस पर चलता है, इसके लिए किसी इंटरनेट कनेक्शन की आवश्यकता नहीं होती है, और कोई उपयोगकर्ता डेटा एकत्र नहीं करता है। यह 21 भारतीय भाषाओं का समर्थन करता है, जिनमें कई ऐसी भाषाएं भी शामिल हैं जो कोंकणी, बोडो, कश्मीरी, डोगरी, मैथिली, मणिपुरी, संस्कृत और सिंधी जैसे प्रतिस्पर्धी टूल में दिखाई नहीं देती हैं। तुलना के लिए, Gboard लिप्यंतरण के लिए छह भारतीय भाषाओं का समर्थन करता है; एप्पल का अपना सिस्टम कीबोर्ड 11 को सपोर्ट करता है।

कश्मीरी या बोडो जैसी भाषा बोलने वालों के लिए, मुख्यधारा के कीबोर्ड की अनुपस्थिति आकस्मिक नहीं है; यह प्रौद्योगिकी उत्पादों में एक व्यापक पैटर्न को दर्शाता है, जहां समर्थन उपयोगकर्ता आधार आकार और व्यावसायिक व्यवहार्यता का पालन करता है। “जब कोई बड़ा संगठन कोई सुविधा जोड़ना चाहता है, तो वे सोचते हैं, ‘क्या उपयोगकर्ता आधार पर्याप्त है?’ ‘क्या कर्षण प्रयास को उचित ठहराएगा?” पर्मी कहते हैं। “एक स्वतंत्र डेवलपर के रूप में, मैं बस इसे शिप कर सकता हूं, इसमें सुधार करता रह सकता हूं और इसे लोगों के हाथों में सौंप सकता हूं।”

साक्षात्कार से पहले, हमने कीबोर्ड का परीक्षण किया। हालाँकि यह विभिन्न भाषाओं में लिपियों में एक आसान अनुक्रम प्रदान करता है, फिर भी कुछ खामियाँ बनी रहती हैं। जब सटीकता की बात आती है, तो पर्मी स्वीकार करते हैं कि इस पर अभी भी काम चल रहा है। उन्होंने साझा किया कि मॉडल प्रत्येक इनपुट के लिए कई सुझाव तैयार करता है और उन्होंने सबसे सामान्य शब्दों को पहले स्लॉट में धकेलने के लिए एक कस्टम डिक्शनरी परत बनाने में काफी समय बिताया।

इस विज्ञापन के नीचे कहानी जारी है

अंतराल और सटीकता की यात्रा

पर्मी ने खुलासा किया कि वह हर भाषा का परीक्षण 20 से 30 वास्तविक दुनिया के स्निपेट के बैच के साथ करता है, जिसमें उस तरह के मिश्रित भाषा के वाक्यांश भी शामिल हैं जिन्हें लोग वास्तव में टाइप करते हैं। कश्मीरी और मणिपुरी जैसी भाषाएँ, जो पड़ोसी लिपियों के साथ लक्षण साझा करती हैं, पर विशेष ध्यान देने की आवश्यकता है। उनके लिए, वह उपयोगकर्ता रिपोर्टों और अपने स्वयं के परीक्षण के आधार पर शब्दकोश को अद्यतन करता रहता है।

अंतराल हैं. संख्याएँ अभी तक लिप्यंतरित पाठ के साथ स्पष्ट रूप से एकीकृत नहीं हुई हैं; हिंदी में ‘दृश्यम 3’ जैसा कुछ टाइप करने से अप्रत्याशित परिणाम मिल सकते हैं। अक्षर के भीतर स्वत: सुधार वर्तमान में ऐप्पल के मानक से बहुत दूर है, पर्मी का कहना है कि वह अगली सुविधा है जिस पर वह काम कर रहा है: कीबोर्ड को अंग्रेजी में इतना विश्वसनीय बनाना कि उपयोगकर्ताओं को सिस्टम कीबोर्ड पर वापस स्विच करने की आवश्यकता महसूस न हो।

AI4भारत के IndicXlit मॉडल का उपयोग करके निर्मित, अक्षर 21 भारतीय भाषाओं का समर्थन करता है और उपयोगकर्ता डेटा को बाहरी सर्वर पर भेजे बिना ऑफ़लाइन काम करता है। (एक्सप्रेस छवि)

इस इंटरव्यू से कुछ हफ्ते पहले अक्षर को ऐप स्टोर पर लॉन्च किया गया था। जब पर्मी से स्वागत समारोह के बारे में पूछा गया तो उन्होंने खुलासा किया कि यह प्रतिक्रिया उन क्षेत्रों से आई जिनकी उन्हें उम्मीद नहीं थी। महाराष्ट्र में एक उपयोगकर्ता ने लिखा कि वह इसका उपयोग अपने व्यावसायिक ग्राहकों को मराठी में व्हाट्सएप संदेश भेजने के लिए कर रहा था। इसके अलावा, जब पर्मी ने रेडिट पर ऐप के बारे में पोस्ट किया, तो संयुक्त राज्य अमेरिका में दूसरी पीढ़ी के भारतीयों से प्रतिक्रियाओं का एक सिलसिला आया – वे लोग जो घर पर भारतीय भाषाएं बोलते हुए बड़े हुए हैं, उन्हें पढ़ और लिख सकते हैं, और जिन्होंने अपना पूरा जीवन अंग्रेजी कीबोर्ड पर टाइप करने में बिताया है। “उन्होंने कहा कि यह वही है जिसकी वे तलाश कर रहे थे,” उन्होंने याद किया।

एक भाषा ऐप जो सभी के लिए निःशुल्क है

ऐप मुफ़्त है, और पर्मी का कहना है कि यह मुफ़्त रहेगा। अर्थशास्त्र दिखने में जितना सरल लगता है उससे कहीं अधिक सरल है: क्योंकि सब कुछ कोर एमएल के माध्यम से स्थानीय रूप से चलता है, कोई सर्वर लागत नहीं है, कोई एपीआई शुल्क नहीं है, और कोई स्केलिंग बुनियादी ढांचा नहीं है। वह कहते हैं, ”मुझे कोई होस्टिंग लागत या सर्वर लागत नहीं आ रही है।” “हर चीज़ का ध्यान कोर एमएल द्वारा रखा जाता है, सब कुछ स्थानीय रूप से चलाया जाता है।”

इस विज्ञापन के नीचे कहानी जारी है

यह पूछे जाने पर कि क्या उनकी कीबोर्ड को एंड्रॉइड पर लाने की योजना है, पर्मी ने कहा कि इस पर विचार चल रहा है। वह स्विफ्ट के साथ काम करता है, जो आईओएस, मैकओएस, वॉचओएस और टीवीओएस पर ऐप बनाने के लिए ऐप्पल द्वारा विकसित एक सहज ओपन-सोर्स प्रोग्रामिंग भाषा है। स्विफ्ट का उपयोग करके एंड्रॉइड ऐप विकसित करने के लिए आधिकारिक समर्थन की घोषणा अक्टूबर 2025 में की गई थी।

पर्मी ने साझा किया कि वह अंततः अक्षर को एंड्रॉइड उपयोगकर्ताओं के लिए लाना चाहते हैं – कम से कम इसलिए नहीं कि अधिकांश भारतीय स्मार्टफोन उपयोगकर्ता उस प्लेटफॉर्म पर हैं। वह नए भाषा मॉडल के लिए AI4भारत के अनुसंधान आउटपुट पर भी कड़ी नजर रख रहे हैं। गोंडी, एक आधिकारिक मान्यता प्राप्त भारतीय भाषा, अभी तक IndicXlit द्वारा समर्थित नहीं है। उन्होंने कहा, जब कोई मॉडल उपलब्ध हो जाएगा तो वह इसे एकीकृत कर देंगे।

जब उनसे पूछा गया कि वह किस पैमाने पर बदलाव देखना चाहते हैं, तो उन्होंने कहा, कीबोर्ड व्यापक दृष्टिकोण की दिशा में एक छोटा कदम है। वह प्रौद्योगिकी को लोगों को उनके द्वारा बोली जाने वाली भाषा तक सीमित हुए बिना बातचीत करने, सीखने और सहयोग करने में मदद करने के एक तरीके के रूप में देखते हैं।





Source link

Exit mobile version