सामग्रीहरू
माइक्रोसफ्ट एक्सेल पानामा PDF फाइलमा स्प्रिेडसिटबाट डाटा ट्रान्सफर गर्ने कार्य सधैं "रमाइलो" हुन्छ। विशेष गरी यदि तपाईंसँग महँगो पहिचान सफ्टवेयर छैन जस्तै FineReader वा यस्तै केहि। प्रत्यक्ष नक्कल गर्दा सामान्यतया केहि राम्रो हुन सक्दैन, किनभने। पानामा प्रतिलिपि गरिएको डाटा टाँसिएपछि, तिनीहरू सम्भवतः एक स्तम्भमा "एकसाथ टाँसिने" हुनेछन्। त्यसोभए तिनीहरूले उपकरण प्रयोग गरेर मेहनती रूपमा अलग गर्नुपर्नेछ स्तम्भहरूद्वारा पाठ ट्याबबाट तथ्याङ्क (डेटा - स्तम्भहरूमा पाठ).
र निस्सन्देह, प्रतिलिपि केवल ती PDF फाइलहरूको लागि सम्भव छ जहाँ पाठ तह छ, अर्थात् कागजबाट PDF मा स्क्यान गरिएको कागजातको साथ, यसले सिद्धान्तमा काम गर्दैन।
तर यो धेरै दुखी छैन, साँच्चै 🙂
यदि तपाइँसँग Office 2013 वा 2016 छ भने, त्यसपछि केहि मिनेटमा, अतिरिक्त कार्यक्रमहरू बिना, यो PDF बाट Microsoft Excel मा डाटा स्थानान्तरण गर्न सम्भव छ। र Word र Power Query ले यसमा हामीलाई मद्दत गर्नेछ।
उदाहरणका लागि, युरोपको लागि आर्थिक आयोगको वेबसाइटबाट पाठ, सूत्र र तालिकाहरूको गुच्छाको साथ यो PDF रिपोर्ट लिनुहोस्:
... र एक्सेलमा यसलाई बाहिर निकाल्ने प्रयास गर्नुहोस्, पहिलो तालिका भन्नुहोस्:
चलो जानुहोस्!
चरण 1. Word मा PDF खोल्नुहोस्
केही कारणका लागि, थोरै मानिसहरूलाई थाहा छ, तर 2013 पछि माइक्रोसफ्ट वर्डले PDF फाइलहरू खोल्न र पहिचान गर्न सिकेको छ (स्क्यान गरिएकाहरू पनि, त्यो पाठ तह बिना!) यो पूर्ण रूपमा मानक तरिकामा गरिन्छ: शब्द खोल्नुहोस्, क्लिक गर्नुहोस् फाइल - खोल्नुहोस् (फाइल - खोल्नुहोस्) र विन्डोको तल्लो दायाँ कुनामा ड्रप-डाउन सूचीमा PDF ढाँचा निर्दिष्ट गर्नुहोस्।
त्यसपछि हामीलाई आवश्यक PDF फाइल चयन गर्नुहोस् र क्लिक गर्नुहोस् खुला (खोल्नुहोस्)। शब्दले हामीलाई यो कागजातमा पाठमा OCR चलाउने छ भनेर बताउँछ:
हामी सहमत छौं र केहि सेकेन्डमा हामी हाम्रो PDF लाई पहिले नै Word मा सम्पादनको लागि खुला देख्नेछौं:
निस्सन्देह, डिजाइन, शैलीहरू, फन्टहरू, हेडरहरू र फुटरहरू, आदि कागजातबाट आंशिक रूपमा उड्नेछन्, तर यो हाम्रो लागि महत्त्वपूर्ण छैन - हामीलाई केवल तालिकाहरूबाट डाटा चाहिन्छ। सिद्धान्तमा, यस चरणमा, यो पहिले नै प्रलोभनमा छ कि केवल मान्यता प्राप्त कागजातबाट वर्डमा तालिका प्रतिलिपि गर्नुहोस् र यसलाई एक्सेलमा टाँस्नुहोस्। कहिलेकाहीँ यसले काम गर्छ, तर प्रायः यसले सबै प्रकारका डेटा विकृतिहरू निम्त्याउँछ - उदाहरणका लागि, संख्याहरू मितिहरूमा परिणत हुन सक्छन् वा पाठ रहन सक्छन्, हाम्रो अवस्थामा जस्तै। PDF गैर-विभाजकहरू प्रयोग गर्दछ:
त्यसोभए कुनाहरू न काटौं, तर सबै कुरालाई अलि बढी जटिल बनाउनुहोस्, तर सही।
चरण 2: कागजातलाई वेब पृष्ठको रूपमा बचत गर्नुहोस्
प्राप्त डाटा एक्सेलमा लोड गर्न (पावर क्वेरी मार्फत), Word मा हाम्रो कागजात वेब पृष्ठ ढाँचामा बचत गर्न आवश्यक छ - यो ढाँचा, यस अवस्थामा, Word र Excel बीचको एक प्रकारको साझा भाजक हो।
यो गर्नको लागि, मेनुमा जानुहोस् फाइल - यस रूपमा बचत गर्नुहोस् (फाइल - यस रूपमा बचत गर्नुहोस्) वा कुञ्जी थिच्नुहोस् F12 किबोर्डमा र खुल्ने विन्डोमा, फाइल प्रकार चयन गर्नुहोस् एक फाइलमा वेब पृष्ठ (वेबपेज - एकल फाइल):
बचत गरेपछि, तपाईंले mhtml एक्सटेन्सनको साथ फाइल प्राप्त गर्नुपर्छ (यदि तपाईंले एक्सप्लोररमा फाइल विस्तारहरू देख्नुहुन्छ)।
चरण 3. Power Query मार्फत फाइल एक्सेलमा अपलोड गर्दै
तपाईले सिधै एक्सेलमा सिर्जना गरिएको MHTML फाइल खोल्न सक्नुहुन्छ, तर त्यसपछि हामी, पहिले, सबै पीडीएफ सामग्रीहरू एकैचोटि, पाठ र अनावश्यक तालिकाहरूको गुच्छाको साथ प्राप्त गर्नेछौं, र, दोस्रो, हामी फेरि गलत कारणले डेटा गुमाउनेछौं। विभाजकहरू। त्यसकारण, हामी Power Query add-in मार्फत Excel मा आयात गर्नेछौं। यो एक पूर्ण नि: शुल्क एड-अन हो जसको साथ तपाईले एक्सेलमा लगभग कुनै पनि स्रोत (फाइल, फोल्डर, डाटाबेस, ईआरपी प्रणाली) बाट डाटा अपलोड गर्न सक्नुहुन्छ र त्यसपछि प्राप्त डाटालाई इच्छित आकार दिँदै हरेक सम्भावित तरिकामा रूपान्तरण गर्न सक्नुहुन्छ।
यदि तपाइँसँग एक्सेल 2010-2013 छ भने, तपाइँ आधिकारिक Microsoft वेबसाइटबाट Power Query डाउनलोड गर्न सक्नुहुन्छ - स्थापना पछि तपाइँ एक ट्याब देख्नुहुनेछ। पावर क्वेरी। यदि तपाइँसँग एक्सेल 2016 वा नयाँ छ भने, तपाइँलाई केहि डाउनलोड गर्न आवश्यक छैन - सबै प्रकार्यहरू पहिले नै पूर्वनिर्धारित रूपमा Excel मा निर्मित छ र ट्याबमा अवस्थित छ। तथ्याङ्क (मिति) समूहमा डाउनलोड र रूपान्तरण (प्राप्त र रूपान्तरण).
त्यसैले हामी या त ट्याबमा जान्छौं तथ्याङ्क, वा ट्याबमा पावर क्वेरी र टोली छान्नुहोस् डाटा प्राप्त गर्न or क्वेरी सिर्जना गर्नुहोस् - फाइलबाट - XML बाट। XML फाइलहरू मात्र होइन दृश्यात्मक बनाउनको लागि, विन्डोको तल्लो दायाँ कुनामा ड्रप-डाउन सूचीमा फिल्टरहरू परिवर्तन गर्नुहोस्। सबै फाईलहरू (सबै फाइलहरू) र हाम्रो MHTML फाइल निर्दिष्ट गर्नुहोस्:
कृपया ध्यान दिनुहोस् कि आयात सफलतापूर्वक पूरा हुनेछैन, किनभने। Power Query ले हामीबाट XML को अपेक्षा गर्दछ, तर हामीसँग वास्तवमा HTML ढाँचा छ। त्यसकारण, देखा पर्ने अर्को विन्डोमा, तपाईंले पावर क्वेरीको लागि बुझ्न नसकिने फाइलमा दायाँ क्लिक गर्न आवश्यक छ र यसको ढाँचा निर्दिष्ट गर्नुहोस्:
त्यस पछि, फाइल सही रूपमा पहिचान हुनेछ र हामी यसमा समावेश भएका सबै तालिकाहरूको सूची देख्नेछौं:
तपाईंले डाटा स्तम्भमा कक्षहरूको सेतो पृष्ठभूमिमा (टेबल शब्दमा होइन!) बायाँ माउस बटन क्लिक गरेर तालिकाहरूको सामग्रीहरू हेर्न सक्नुहुन्छ।
जब इच्छित तालिका परिभाषित हुन्छ, हरियो शब्दमा क्लिक गर्नुहोस् तालिका - र तपाईं यसको सामग्रीहरूमा "पार" जानुहुन्छ:
यसको सामग्रीहरू "कंघी" गर्न केही सरल चरणहरू गर्न बाँकी छ, अर्थात्:
- अनावश्यक स्तम्भहरू मेटाउनुहोस् (स्तम्भ हेडरमा दायाँ क्लिक गर्नुहोस् - हटाउन)
- थोप्लाहरू अल्पविरामले बदल्नुहोस् (स्तम्भहरू चयन गर्नुहोस्, दायाँ क्लिक गर्नुहोस् - मानहरू प्रतिस्थापन गर्दै)
- हेडरमा बराबर चिन्हहरू हटाउनुहोस् (स्तम्भहरू चयन गर्नुहोस्, दायाँ क्लिक गर्नुहोस् - मानहरू प्रतिस्थापन गर्दै)
- शीर्ष रेखा हटाउनुहोस् (गृहपृष्ठ - रेखाहरू मेटाउनुहोस् - शीर्ष रेखाहरू मेटाउनुहोस्)
- खाली रेखाहरू हटाउनुहोस् (गृह - रेखाहरू मेटाउनुहोस् - खाली रेखाहरू मेटाउनुहोस्)
- तालिका हेडरमा पहिलो पङ्क्ति उठाउनुहोस् (गृह - शीर्षकको रूपमा पहिलो लाइन प्रयोग गर्नुहोस्)
- फिल्टर प्रयोग गरेर अनावश्यक डाटा फिल्टर गर्नुहोस्
जब तालिका यसको सामान्य रूप मा ल्याइएको छ, यो आदेश संग पाना मा अनलोड गर्न सकिन्छ बन्द गर्नुहोस् र डाउनलोड गर्नुहोस् (बन्द र लोड) on मुख्य ट्याब। र हामी यस्तो सुन्दरता प्राप्त गर्नेछौं जसको साथ हामी पहिले नै काम गर्न सक्छौं:
- पावर क्वेरीको साथ तालिकामा स्तम्भ रूपान्तरण
- टाँसिने पाठलाई स्तम्भहरूमा विभाजन गर्दै