Úvodná » ako » Ako extrahovať obrázky, text a vstavané súbory z dokumentov programu Word, Excel a PowerPoint

    Ako extrahovať obrázky, text a vstavané súbory z dokumentov programu Word, Excel a PowerPoint

    Povedz, že vám niekto poslal dokument programu Word s množstvom obrázkov a chcete, aby ste tieto obrázky uložili na pevný disk. Obrázky z dokumentu Microsoft Office môžete extrahovať jednoduchým trikom.

    Ak máte súbor vo formáte Word (.docx), Excel (.xlsx) alebo PowerPoint (.pptx) s vloženými obrázkami alebo inými súbormi, môžete ich extrahovať (rovnako ako text dokumentu) bez toho, aby ste museli každý z nich uložiť samostatne , A najlepšie zo všetkého, nepotrebujete žiadny ďalší softvér. Formátované formáty súborov Office-docx, xlsx a pptx sú v skutočnosti komprimované archívy, ktoré môžete otvoriť ako všetky bežné súbory .zip v systéme Windows. Odtiaľ môžete extrahovať obrázky, text a iné vložené súbory. Môžete použiť vstavanú podporu Windows .zip alebo aplikáciu ako 7-Zip, ak chcete.

    Ak potrebujete extrahovať súbory zo staršieho kancelárskeho dokumentu - napríklad súbor .doc, .xls alebo .ppt - môžete to urobiť malým dielom slobodného softvéru. Tento postup podrobne popíšeme na konci tejto príručky.

    Ako extrahovať obsah novšieho súboru balíka Office (.docx, .xlsx alebo .pptx)

    Ak chcete získať prístup k vnútornému obsahu dokumentov Office založených na XML, otvorte program Prieskumník (alebo Windows Explorer v systéme Windows 7), prejdite na súbor, z ktorého chcete obsah extrahovať, a vyberte súbor.

    Stlačte "F2" na premenovanie súboru a zmenu rozšírenia (.docx, .xlsx alebo .pptx) na ".zip". Ponechajte hlavnú časť názvu súboru samostatne. Stlačte tlačidlo "Enter" po dokončení.

    Nasledujúce dialógové okno vás upozorní na zmenu prípony názvu súboru. Kliknite na "Áno".

    Systém Windows automaticky rozpozná súbor ako súbor so zipsom. Ak chcete extrahovať obsah súboru, kliknite pravým tlačidlom na súbor a v rozbaľovacej ponuke zvoľte možnosť "Extrahovať všetko".

    V dialógovom okne "Vybrať cieľ a vyberať súbory" sa v editovacom poli "Súbory budú extrahované do tejto zložky" zobrazená cesta, kde sa bude extrahovať obsah súboru .zip. Štandardne je v rovnakom priečinku ako súbor .zip vytvorený priečinok s rovnakým názvom ako názov súboru (bez prípony súboru). Ak chcete extrahovať súbory do iného priečinka, kliknite na tlačidlo "Prehľadávať".

    Prejdite na miesto, kde chcete vytlačiť obsah súboru .zip a kliknutím na položku Nová zložka vytvorte novú zložku, ak je to potrebné. Kliknite na položku "Vybrať priečinok".

    Ak chcete otvoriť okno Prieskumníka (alebo Prieskumníka Windows) so zložkou obsahujúcou extrahované súbory, ktorá sa zobrazí po ich extrahovaní, začiarknite políčko "Zobraziť extrahované súbory po dokončení", takže v poli je začiarknuté políčko. Kliknite na položku "Extrahovať".

    Ako získať prístup k vylúčeným obrázkom

    Do extrahovaného obsahu je zahrnutá zložka s názvom "slovo", ak je pôvodný súbor dokumentom programu Word (alebo "xl" pre dokument programu Excel alebo "ppt" pre dokument programu PowerPoint). Dvakrát kliknite na priečinok "word" a otvorte ho.

    Dvakrát kliknite na priečinok "media".

    Všetky obrázky z pôvodného súboru sú v priečinku "media". Extrahované súbory sú pôvodné obrázky používané v dokumente. V dokumente môžu byť nastavené zmeny veľkosti alebo iné vlastnosti, ale extrahované súbory sú nespracované obrázky bez použitia týchto vlastností.

    Ako získať prístup k extrahovanému textu

    Ak na počítači nemáte nainštalovaný balík Office a potrebujete extrahovať text z súboru Word (alebo programu Excel alebo PowerPoint), môžete získať prístup k extrahovanému textu v súbore "document.xml" v priečinku "word".

    Tento súbor môžete otvoriť v textovom editore, napríklad v programe Poznámkový blok alebo v programe WordPad, ale je ľahšie čítať v špeciálnom XML editore, ako je napríklad bezplatný program XML Notepad. Celý text zo súboru je k dispozícii v kusoch obyčajného textu bez ohľadu na štýl a / alebo formátovanie použité v samotnom dokumente. Samozrejme, ak si stiahnete slobodný softvér na zobrazenie tohto textu, môžete si tiež stiahnuť LibreOffice, ktorý dokáže čítať dokumenty balíka Microsoft Office.

    Ako extrahovať vložené objekty OLE alebo pripojené súbory

    Ak chcete mať prístup k vstavaným súborom v dokumente programu Word, keď nemáte prístup k aplikácii Word, najprv otvorte súbor Word v programe WordPad (ktorý je súčasťou systému Windows). Možno si všimnete, že niektoré ikony vstavaných súborov sa nezobrazujú, ale stále sú tam. Niektoré vstavané súbory môžu mať čiastkové názvy súborov. Program WordPad nepodporuje všetky funkcie programu Word, takže niektorý obsah môže byť nesprávne zobrazený. Ale mali by ste mať prístup k súborom.

    Ak klikneme pravým tlačidlom myši na jeden z vložených súborov v našom vzorovom súbore programu Word, jednou z možností je "Open PDF Object". Otvorí sa to vo formáte PDF vo východiskovom programe PDF na počítači. Odtiaľ môžete uložiť súbor PDF na pevný disk.

    Ak program WordPad nemá možnosť otvoriť váš súbor, poznačte si jeho typ súboru. Napríklad náš druhý súbor v tomto dokumente je súbor .mp3.

    Potom sa vráťte späť do priečinka Súbory z [Dokument] a dvakrát kliknite na priečinok "embeddings" vo vnútri priečinka "word".

    Bohužiaľ, typy súborov sa v názvoch súborov nezachovajú. Všetci majú namiesto toho príponu súborov ".bin". Ak viete, aké typy súborov sú vložené do súboru, môžete pravdepodobne vyvodiť, ktorý súbor je podľa veľkosti súboru. V našom príklade máme v našom dokumente vložený súbor PDF a súbor MP3. Pretože je súbor MP3 s najväčšou pravdepodobnosťou väčší ako súbor PDF, môžeme zistiť, ktorý súbor je, ktorý sa pozerá na veľkosti súborov a potom ich premenujte pomocou správnych rozšírení. Nižšie premenujeme súbor MP3.

    Všimnite si, že nie všetky súbory sa nevyhnutne otvoria pomocou tohto procesu - napríklad náš súbor PDF sa otvoril správne z programu WordPad, ale nedokázali sme ho otvoriť premenovaním jeho súboru .bin.

    Po extrahovaní obsahu súboru so zipsom môžete vrátiť rozšírenie pôvodného súboru späť na .docx, .xlsx alebo .pptx. Súbor zostane neporušený a môže sa normálne otvoriť v príslušnom programe.

    Ako extrahovať obrázky zo starších dokumentov balíka Office (.doc, .xls alebo .ppt)

    Ak potrebujete extrahovať obrázky z dokumentu balíka Office 2003 (alebo staršieho), je tu bezplatný nástroj s názvom Office Image Extraction Wizard, ktorý uľahčuje túto úlohu. Tento program vám tiež umožňuje extrahovať obrázky z viacerých dokumentov (rovnakých alebo rôznych typov) naraz. Prevezmite program a nainštalujte ho (k dispozícii je aj prenosná verzia, ak nechcete inštalovať).

    Spustite program a zobrazí sa uvítacia obrazovka. Kliknite na tlačidlo "Ďalej".

    Najprv musíme vybrať súbor, z ktorého chcete obrázky extrahovať. Na obrazovke Vstup a výstup kliknite na tlačidlo "Prehľadávať" (ikona priečinka) napravo od poľa Upraviť dokument.

    Prejdite do priečinka obsahujúceho požadovaný dokument, vyberte ho a kliknite na tlačidlo "Otvoriť".

    Priečinok obsahujúci vybraný súbor sa automaticky stane priečinkom výstupu. Ak chcete vytvoriť podsložku v rámci tohto priečinka s názvom rovnakého súboru, ako je vybratý súbor, začiarknite políčko "Vytvoriť priečinok tu", takže v poli je začiarknuté políčko. Potom kliknite na tlačidlo "Next".

    Na obrazovke Pripravené na spustenie kliknite na tlačidlo "Štart", čím začnete extrahovať obrázky.

    Počas procesu extrakcie sa zobrazí nasledujúca obrazovka.

    Na obrazovke Dokončené kliknite na tlačidlo "Kliknite sem na otvorenie cieľového priečinka", čím zobrazíte výsledné obrazové súbory.

    Pretože sme sa rozhodli vytvoriť podadresár, získame priečinok obsahujúci obrazové súbory extrahované zo súboru.

    Uvidíte všetky obrázky ako očíslované súbory.

    Môžete tiež extrahovať obrázky z viacerých súborov naraz. Ak to chcete urobiť, na obrazovke Vstup a výstup kliknite na začiarkavacie políčko Dávkový režim, takže v poli je začiarknuté políčko.

    Zobrazí sa obrazovka Dávka vstupu a výstupu. Kliknite na položku "Pridať súbory".

    V dialógovom okne Otvoriť prejdite na priečinok obsahujúci ľubovoľný súbor, z ktorého chcete vyberať obrázky, vyberte súbory pomocou klávesov "Shift" alebo "Ctrl" a vyberte viac súborov a kliknite na tlačidlo "Otvoriť".

    Súbory z iného priečinka môžete pridať kliknutím na tlačidlo "Pridať súbory", navigáciou do priečinka v dialógovom okne Otvoriť, výberom požadovaných súborov a kliknutím na tlačidlo "Otvoriť".

    Po pridaní všetkých súborov, z ktorých chcete extrahovať obrázky, môžete vybrať vytvorenie samostatného priečinka pre každý dokument v rámci rovnakého priečinka ako každý dokument, do ktorého sa uložia obrazové súbory, kliknutím na tlačidlo "Vytvoriť priečinok pre každý dokument ", takže je začiarknuté políčko.

    Môžete tiež zadať výstupný priečinok ako vstupný priečinok "rovnaký ako každý súbor" alebo zadajte alebo vyberte vlastnú zložku pomocou poľa pre editáciu a tlačidla "Prehľadávať" pod touto možnosťou. Po vybratí požadovaných možností kliknite na tlačidlo "Ďalej".

    Kliknite na tlačidlo "Štart" na obrazovke Pripravené na spustenie.

    Nasleduje nasledujúca obrazovka, ktorá zobrazuje postup extrakcie.

    Počet vytiahnutých obrázkov sa zobrazí na obrazovke Dokončené. Kliknutím na tlačidlo "Zavrieť" zatvorte Sprievodcu extrahovaním obrázkov balíka Office.

    Ak ste si zvolili vytvorenie samostatného priečinka pre každý dokument, uvidíte priečinky s rovnakými názvami ako súbory obsahujúce obrázky, podľa toho, ktoré výstupné priečinky ste zadali.

    Opäť získavame všetky obrázky ako očíslované súbory pre každý dokument.

    Teraz môžete obrázky premenovať, presunúť ich a použiť ich vo vlastných dokumentoch. Len sa uistite, že máte práva na ich legálne použitie.