OCR Kya Hai? और इसके लाभ और हानी पूरी जानकारी

OCR – का अर्थ है  Optical Character Reader या Optical Character Recognition , जोकि किसी भी डाटा को पड़ कर उसमे एडिट कर सकता  है।

OCR Kya Hai

यह एक प्रकार की तकनीक है , जो किसी भी टेक्स्ट को , इमेज को editing करने में हमारी सहयता करती है।  यह एक प्रकार का AI डिवाइस और सॉफ्टवेयर है जिसके प्रयोग से आप हर राइटिंग को कंप्यूटर में ऐड करके उसमे अपनी इच्छानुसार परिवर्तन कर सकते हैं। जैसे ऑफिस का वाइट बोर्ड है ,उसमे अपने कुछ लिखा या आपके किसी सहयोगी ने कुछ भी लिखा , तो आप उसे जैसा का तैसा अपने कंप्यूटर में एंटर करके उसमे कुछ और टेक्स्ट ऐड करना चाहते है , तो आप इस तकनीक का प्रयोग कर सकते हैं।

आपने जो कुछ भी लिखा बोर्ड पर उसकी आप फोटो क्लिक करेंगे , जो एक JPG , PNG , की फाइल में कन्वर्ट होगी  या पीडीऍफ़ में भी हो सकती है यदि आपने camscan app का प्रयोग किया है , पर आप इसे एडिट तभी कर पाएंगे जब आपके कंप्यूटर OCR सॉफ्टवेयर है , या एक और तरीका भी है , आप chrome में जा कर PDF to word converter का इस्तेमाल करें , जिससे आपकी फाइल वर्ड में बदल जाएगी और आप उसमे एडिट भी कर सकेंगे।

परन्तु यदि आपके पास कोई JPG या image फाइल है तो इस स्थति में ओसीआर आपकी मदद करेगा। इसके अतिरिक्त कई बार हमें कही लिखा हुआ समझ नहीं आता या किसी की लिखावट इतनी बेकार होती है उसे समझना तो दूर पढ़ने  में भी कुछ नहीं आता है।  ऐसे में कंप्यूटर ओसीआर सॉफ्टवेयर की सहायता से सारे अक्षरों को पहचान कर ,उसे पढ़ने योग्य टेक्स्ट बना देता है।

Advantage

OCR की तकनीक विकसित हो जाने से कितना भी बड़ा डाटा हो , चाहे वो किसी पुस्तक के पृष्ठों पर हो या , किसी अखबार के पेज पर बनी हुई कोई तालिका , आप उसको आसानी से पड़ भी सकते है और उसी प्रकार की फॉर्मेट को कॉपी करके नया डाटा भी तैयार कर सकते हैं। इसके अतिरिक्त वह किसी भी अक्षर को चाहे वह अंको में हो या शब्दों में , दोनों को पढ़ने में सक्षम है।

Disadvantage

यह सॉफ्टवेयर user के लिए costly होता है , इसलिए इसे केवल बड़ी-बड़ी कंपनियों द्वारा , किसी बैंक द्वारा या किसी विज्ञापन एजेंसी द्वारा ही खरीदा जाता है।

पहले इसका प्रयोग अत्यंत सीमित था , इसका प्रयोग केवल चैक बुक पर अंकित कुछ नंबरों और बिजली बिल पर अंकित कुछ अंको को पढ़ने के लिए किया जाता था।  धीरे-धीरे तकनीक में सुधार हुआ और यह और विकसित रूप में लोगो के समक्ष आई जिसके कारण आज इसका प्रयोग कई कार्यो में किया जाता है ,

जैसे किसी पत्रिका में लिखे कंटेंट में , जिसमे आप किसी भी प्रकार का बदलाव नहीं कर सकते थे , परन्तु अब ओसीआर सॉफ्टवेयर की सहायता से आप न केवल उस पत्रिका के कंटेंट को कॉपी कर सकते है बल्कि उसमे एडिटिंग करके , या थोड़ा बहुत फेर बदल , या उसका फॉन्ट बदल के , या जैसा के तैसा फॉण्ट भी रखकर एक नया कंटेंट तैयार कर सकते है और उस पत्रिका के कंटेंट को एक नए रूप में प्रदर्शित कर सकते हैं।

इसके अतिरिक्त आप किसी भी image अथवा फोटो को एडिट भी कर सकते है जैसे हम कभी-कभी फिल्मों  है  या फोटोशूट में देखते है , कोई व्यक्ति वास्तविक रूप में जगह पर नहीं होता है , पर एडिटिंग करके उसे वहां दिखा दिया जाता है ताकि सब original लगे। इस प्रकार OCR कार्य करता है।

इसके जरिए आप किसी भी format की फाइल को डाटा में कन्वर्ट कर सकते है और उसमे हर प्रकार का बदलाव भी कर सकते हैं। यह किसी भी scanned दस्तावेज के अल्फाबेट्स को पड़ कर उसे पड़ने और बदलाव करने योग्य बनाता है।

यह हार्ड कॉपी को सॉफ्टकॉपी में बदलता है। आप अपनी handwritting को टेक्स्ट में कन्वर्ट करके उसमे दुबारा एडिटिंग भी कर सकते हैं। इसमें कनवर्टर में गलती की गुंजाइश न के बराबर होती है क्योंकि जब यह किसी भी स्कैन्ड डॉक्यूमेंट को टेक्स्ट में बदलता है तो punctuation , grammar , spelling सभी को चैक करता है।

प्रयोग :- इसका प्रयोग पासपोर्ट बनाने में , प्रिंटआउट की digitlization में , बैंकिंग क्षेत्र में , क़ानूनी दस्तावेजों में आदि कार्यो में इसका प्रयोग होता है।

लाभ :- इसके कुछ लाभ है जो इस प्रकार हैं :-

  • इसका सबसे बड़ा लाभ यह है की जब कोई दस्तावेज टेक्स्ट में कन्वर्ट हो जाता है तो उसमे बदलाव करना या उसमे कुछ सर्च करने का कार्य आसान हो जात्ता है।
  • इसके कारण डाटा एंट्री करना भी आसान हुआ है क्योंकि यदि किसी scanned डॉक्यूमेंट को maually एंट्री करते हैं तो उसमे काफी समय व्यर्थ हो सकता है और काम में गलती भी हो सकती है , इस तरह OCR बड़े डाटा की एंट्री सही एंट्री करके हमारे काम को आसान और सरल कर देता है।
  • इसका सबसे अधिक फ़ायदा नेत्रहीन लोगो को हुआ है क्योंकि यह scanned दस्तावेज को decode कर देता है जिसके कारण नेत्रहीन लोग भी स्क्रीन के शब्दों को पढ़ सकते हैं।
  • यदि कोई डॉक्यूमेंट आपकी handwritting में है तो OCR की फाइल में एरर हो सकते हैं परन्तु यदि कोई PDF या किसी पुस्तक का पृष्ठ है तो उसमे आपको एरर कम से कम होंगे और OCR सॉफ्टवेयर आपको उसी फॉरमेट में ही आपको टेक्स्ट दे सकता है जिस फॉर्मेट में वो पुस्तक पर अंकित है।
  • जब इसका प्रयोग केवल चैक बुक या सीमित कार्यो के लिए किया जाता था तो यह केवल कुछ स्टैण्डर्ड फॉरमेट को ही पढ़ सकता था परन्तु अब यह सॉफ्टवेयर हर प्रकार के अक्षरों को पढ़कर उन्हें सॉफ्टकॉपी में बदल सकता है।

OCR दो प्रकर की तकनीक पर काम करता है जो नीचे बताई गई हैं :-

Pattern Maching :- इसका प्रयोग 1960  में किया जाता था जिसमे केवल कुछ स्टैण्डर्ड फॉरमेट के अक्षरों को ही पढ़ा जा सकता था। इस तकनीक का दोष यह था कि यह केवल उन अक्षरों के कंटेंट को ही पढ़ सकता था जो कंप्यूटर में ऐड होते थे। जैसा कि नीचे दिखाया गया है.

Feacher Extraction :– यह तकनीक बहुत ही गहनता से टेक्स्ट को पढ़ती और पहचानती है। चाहे कैसे भी अक्षर हो हर अक्षर को पहचानकर एक सही फॉरमेट के रूप में टेक्स्ट उपलब्ध करता है। चाहे आपका टेक्स्ट लाइन में हो या किसी दो लाइन को जोड़ कर कोई अक्षर बनाया गया हो , हर अक्षर को पढ़कर टेक्स्ट के रूप में प्रदर्शित करता है।

OCR System में सावधानी :- किसी भी सॉफ्टवेयर को डाउनलोड करने से पहले उसके बारे अच्छे से जाँच परख कर लेनी चाहिए , केवल free डाउनलोड के चक्कर में कभी-कभी हमारे लिए मुसीबत भी बन सकती है। इसके लिए एंटी वायरस का सॉफ्टवेयर हमारे कंप्यूटर में होना चाहिए ताकि कोई भी आसानी से हमारे कंप्यूटर को हैक नहीं कर पायेगा।