Power Query मार्फत PDF बाट Excel मा डाटा आयात गर्नुहोस्

माइक्रोसफ्ट एक्सेल पानामा PDF फाइलमा स्प्रिेडसिटबाट डाटा ट्रान्सफर गर्ने कार्य सधैं "रमाइलो" हुन्छ। विशेष गरी यदि तपाईंसँग महँगो पहिचान सफ्टवेयर छैन जस्तै FineReader वा यस्तै केहि। प्रत्यक्ष नक्कल गर्दा सामान्यतया केहि राम्रो हुन सक्दैन, किनभने। पानामा प्रतिलिपि गरिएको डाटा टाँसिएपछि, तिनीहरू सम्भवतः एक स्तम्भमा "एकसाथ टाँसिने" हुनेछन्। त्यसोभए तिनीहरूले उपकरण प्रयोग गरेर मेहनती रूपमा अलग गर्नुपर्नेछ स्तम्भहरूद्वारा पाठ ट्याबबाट तथ्याङ्क (डेटा - स्तम्भहरूमा पाठ).

र निस्सन्देह, प्रतिलिपि केवल ती PDF फाइलहरूको लागि सम्भव छ जहाँ पाठ तह छ, अर्थात् कागजबाट PDF मा स्क्यान गरिएको कागजातको साथ, यसले सिद्धान्तमा काम गर्दैन।

तर यो धेरै दुखी छैन, साँच्चै 🙂

यदि तपाइँसँग Office 2013 वा 2016 छ भने, त्यसपछि केहि मिनेटमा, अतिरिक्त कार्यक्रमहरू बिना, यो PDF बाट Microsoft Excel मा डाटा स्थानान्तरण गर्न सम्भव छ। र Word र Power Query ले यसमा हामीलाई मद्दत गर्नेछ।

उदाहरणका लागि, युरोपको लागि आर्थिक आयोगको वेबसाइटबाट पाठ, सूत्र र तालिकाहरूको गुच्छाको साथ यो PDF रिपोर्ट लिनुहोस्:

Power Query मार्फत PDF बाट Excel मा डाटा आयात गर्नुहोस्

... र एक्सेलमा यसलाई बाहिर निकाल्ने प्रयास गर्नुहोस्, पहिलो तालिका भन्नुहोस्:

Power Query मार्फत PDF बाट Excel मा डाटा आयात गर्नुहोस्

चलो जानुहोस्!

चरण 1. Word मा PDF खोल्नुहोस्

केही कारणका लागि, थोरै मानिसहरूलाई थाहा छ, तर 2013 पछि माइक्रोसफ्ट वर्डले PDF फाइलहरू खोल्न र पहिचान गर्न सिकेको छ (स्क्यान गरिएकाहरू पनि, त्यो पाठ तह बिना!) यो पूर्ण रूपमा मानक तरिकामा गरिन्छ: शब्द खोल्नुहोस्, क्लिक गर्नुहोस् फाइल - खोल्नुहोस् (फाइल - खोल्नुहोस्) र विन्डोको तल्लो दायाँ कुनामा ड्रप-डाउन सूचीमा PDF ढाँचा निर्दिष्ट गर्नुहोस्।

त्यसपछि हामीलाई आवश्यक PDF फाइल चयन गर्नुहोस् र क्लिक गर्नुहोस् खुला (खोल्नुहोस्)। शब्दले हामीलाई यो कागजातमा पाठमा OCR चलाउने छ भनेर बताउँछ:

Power Query मार्फत PDF बाट Excel मा डाटा आयात गर्नुहोस्

हामी सहमत छौं र केहि सेकेन्डमा हामी हाम्रो PDF लाई पहिले नै Word मा सम्पादनको लागि खुला देख्नेछौं:

Power Query मार्फत PDF बाट Excel मा डाटा आयात गर्नुहोस्

निस्सन्देह, डिजाइन, शैलीहरू, फन्टहरू, हेडरहरू र फुटरहरू, आदि कागजातबाट आंशिक रूपमा उड्नेछन्, तर यो हाम्रो लागि महत्त्वपूर्ण छैन - हामीलाई केवल तालिकाहरूबाट डाटा चाहिन्छ। सिद्धान्तमा, यस चरणमा, यो पहिले नै प्रलोभनमा छ कि केवल मान्यता प्राप्त कागजातबाट वर्डमा तालिका प्रतिलिपि गर्नुहोस् र यसलाई एक्सेलमा टाँस्नुहोस्। कहिलेकाहीँ यसले काम गर्छ, तर प्रायः यसले सबै प्रकारका डेटा विकृतिहरू निम्त्याउँछ - उदाहरणका लागि, संख्याहरू मितिहरूमा परिणत हुन सक्छन् वा पाठ रहन सक्छन्, हाम्रो अवस्थामा जस्तै। PDF गैर-विभाजकहरू प्रयोग गर्दछ:

Power Query मार्फत PDF बाट Excel मा डाटा आयात गर्नुहोस्

त्यसोभए कुनाहरू न काटौं, तर सबै कुरालाई अलि बढी जटिल बनाउनुहोस्, तर सही।

चरण 2: कागजातलाई वेब पृष्ठको रूपमा बचत गर्नुहोस्

प्राप्त डाटा एक्सेलमा लोड गर्न (पावर क्वेरी मार्फत), Word मा हाम्रो कागजात वेब पृष्ठ ढाँचामा बचत गर्न आवश्यक छ - यो ढाँचा, यस अवस्थामा, Word र Excel बीचको एक प्रकारको साझा भाजक हो।

यो गर्नको लागि, मेनुमा जानुहोस् फाइल - यस रूपमा बचत गर्नुहोस् (फाइल - यस रूपमा बचत गर्नुहोस्) वा कुञ्जी थिच्नुहोस् F12 किबोर्डमा र खुल्ने विन्डोमा, फाइल प्रकार चयन गर्नुहोस् एक फाइलमा वेब पृष्ठ (वेबपेज - एकल फाइल):

Power Query मार्फत PDF बाट Excel मा डाटा आयात गर्नुहोस्

बचत गरेपछि, तपाईंले mhtml एक्सटेन्सनको साथ फाइल प्राप्त गर्नुपर्छ (यदि तपाईंले एक्सप्लोररमा फाइल विस्तारहरू देख्नुहुन्छ)।

चरण 3. Power Query मार्फत फाइल एक्सेलमा अपलोड गर्दै

तपाईले सिधै एक्सेलमा सिर्जना गरिएको MHTML फाइल खोल्न सक्नुहुन्छ, तर त्यसपछि हामी, पहिले, सबै पीडीएफ सामग्रीहरू एकैचोटि, पाठ र अनावश्यक तालिकाहरूको गुच्छाको साथ प्राप्त गर्नेछौं, र, दोस्रो, हामी फेरि गलत कारणले डेटा गुमाउनेछौं। विभाजकहरू। त्यसकारण, हामी Power Query add-in मार्फत Excel मा आयात गर्नेछौं। यो एक पूर्ण नि: शुल्क एड-अन हो जसको साथ तपाईले एक्सेलमा लगभग कुनै पनि स्रोत (फाइल, फोल्डर, डाटाबेस, ईआरपी प्रणाली) बाट डाटा अपलोड गर्न सक्नुहुन्छ र त्यसपछि प्राप्त डाटालाई इच्छित आकार दिँदै हरेक सम्भावित तरिकामा रूपान्तरण गर्न सक्नुहुन्छ।

यदि तपाइँसँग एक्सेल 2010-2013 छ भने, तपाइँ आधिकारिक Microsoft वेबसाइटबाट Power Query डाउनलोड गर्न सक्नुहुन्छ - स्थापना पछि तपाइँ एक ट्याब देख्नुहुनेछ। पावर क्वेरी। यदि तपाइँसँग एक्सेल 2016 वा नयाँ छ भने, तपाइँलाई केहि डाउनलोड गर्न आवश्यक छैन - सबै प्रकार्यहरू पहिले नै पूर्वनिर्धारित रूपमा Excel मा निर्मित छ र ट्याबमा अवस्थित छ। तथ्याङ्क (मिति) समूहमा डाउनलोड र रूपान्तरण (प्राप्त र रूपान्तरण).

त्यसैले हामी या त ट्याबमा जान्छौं तथ्याङ्क, वा ट्याबमा पावर क्वेरी र टोली छान्नुहोस् डाटा प्राप्त गर्न or क्वेरी सिर्जना गर्नुहोस् - फाइलबाट - XML ​​बाट। XML फाइलहरू मात्र होइन दृश्यात्मक बनाउनको लागि, विन्डोको तल्लो दायाँ कुनामा ड्रप-डाउन सूचीमा फिल्टरहरू परिवर्तन गर्नुहोस्। सबै फाईलहरू (सबै फाइलहरू) र हाम्रो MHTML फाइल निर्दिष्ट गर्नुहोस्:

Power Query मार्फत PDF बाट Excel मा डाटा आयात गर्नुहोस्

कृपया ध्यान दिनुहोस् कि आयात सफलतापूर्वक पूरा हुनेछैन, किनभने। Power Query ले हामीबाट XML को अपेक्षा गर्दछ, तर हामीसँग वास्तवमा HTML ढाँचा छ। त्यसकारण, देखा पर्ने अर्को विन्डोमा, तपाईंले पावर क्वेरीको लागि बुझ्न नसकिने फाइलमा दायाँ क्लिक गर्न आवश्यक छ र यसको ढाँचा निर्दिष्ट गर्नुहोस्:

Power Query मार्फत PDF बाट Excel मा डाटा आयात गर्नुहोस्

त्यस पछि, फाइल सही रूपमा पहिचान हुनेछ र हामी यसमा समावेश भएका सबै तालिकाहरूको सूची देख्नेछौं:

Power Query मार्फत PDF बाट Excel मा डाटा आयात गर्नुहोस्

तपाईंले डाटा स्तम्भमा कक्षहरूको सेतो पृष्ठभूमिमा (टेबल शब्दमा होइन!) बायाँ माउस बटन क्लिक गरेर तालिकाहरूको सामग्रीहरू हेर्न सक्नुहुन्छ।

जब इच्छित तालिका परिभाषित हुन्छ, हरियो शब्दमा क्लिक गर्नुहोस् तालिका - र तपाईं यसको सामग्रीहरूमा "पार" जानुहुन्छ:

Power Query मार्फत PDF बाट Excel मा डाटा आयात गर्नुहोस्

यसको सामग्रीहरू "कंघी" गर्न केही सरल चरणहरू गर्न बाँकी छ, अर्थात्:

  1. अनावश्यक स्तम्भहरू मेटाउनुहोस् (स्तम्भ हेडरमा दायाँ क्लिक गर्नुहोस् - हटाउन)
  2. थोप्लाहरू अल्पविरामले बदल्नुहोस् (स्तम्भहरू चयन गर्नुहोस्, दायाँ क्लिक गर्नुहोस् - मानहरू प्रतिस्थापन गर्दै)
  3. हेडरमा बराबर चिन्हहरू हटाउनुहोस् (स्तम्भहरू चयन गर्नुहोस्, दायाँ क्लिक गर्नुहोस् - मानहरू प्रतिस्थापन गर्दै)
  4. शीर्ष रेखा हटाउनुहोस् (गृहपृष्ठ - रेखाहरू मेटाउनुहोस् - शीर्ष रेखाहरू मेटाउनुहोस्)
  5. खाली रेखाहरू हटाउनुहोस् (गृह - रेखाहरू मेटाउनुहोस् - खाली रेखाहरू मेटाउनुहोस्)
  6. तालिका हेडरमा पहिलो पङ्क्ति उठाउनुहोस् (गृह - शीर्षकको रूपमा पहिलो लाइन प्रयोग गर्नुहोस्)
  7. फिल्टर प्रयोग गरेर अनावश्यक डाटा फिल्टर गर्नुहोस्

जब तालिका यसको सामान्य रूप मा ल्याइएको छ, यो आदेश संग पाना मा अनलोड गर्न सकिन्छ बन्द गर्नुहोस् र डाउनलोड गर्नुहोस् (बन्द र लोड) on मुख्य ट्याब। र हामी यस्तो सुन्दरता प्राप्त गर्नेछौं जसको साथ हामी पहिले नै काम गर्न सक्छौं:

Power Query मार्फत PDF बाट Excel मा डाटा आयात गर्नुहोस्

  • पावर क्वेरीको साथ तालिकामा स्तम्भ रूपान्तरण
  • टाँसिने पाठलाई स्तम्भहरूमा विभाजन गर्दै

जवाफ छाड्नुस्