Lekce 14 - DocX - Práce s dokumenty MS Word v C# .NET
V předešlém cvičení, Řešené úlohy k 11.-13. lekci práce se soubory v C# .NET, jsme si procvičili nabyté zkušenosti z předchozích lekcí.
V dnešním C# .NET tutoriálu si uvedeme formát
docx a rozpracujeme jednoduchý editor Microsoft Word souborů.
Formát DocX
DocX je formát používaný editorem MS Word z populárního
kancelářského balíku MS Office. Na rozdíl od
čistě textových dokumentů ukládá nejen text, ale i jeho
formátování jako velikost, font, barvu a tak dále. Můžeme
do něj vkládat i obrázky, tabulky a další položky. Tento formát je
definován specifikací Office Open XML.
Specifikace Office Open XML
Tato specifikace definuje souborové formáty na ukládání textových dokumentů, tabulek či prezentací používaných nejen v aplikacích Office od Microsoftu. Tyto formáty jsou v podstatě soubory ZIP s XML dokumenty uvnitř, které nesou samotná data. Tato specifikace je rozdělena do několika částí. Zmiňme si ty nejdůležitější:
- WordProcessingML - XML pro textové dokumenty, vytvářené
například v aplikaci MS Word. Ukládá se do souboru s příponou
docx. - SpreadsheetML - XML pro tabulky, vytvářené například v
aplikaci MS Excel. Ukládá se do souboru s
příponou
xlsx. - PresentationML - XML pro prezentace, vytvářené
například v aplikaci MS PowerPoint.
Ukládá se do souboru s příponou
pptx.
WordProcessingML
Jak již bylo řečeno, tak každý docx soubor je ZIP se XML
(WordProcessingML) soubory uvnitř, proto je můžeme stejně jako každý ZIP
extrahovat. Zkusme si schválně vytvořit nějaký dokument v MS Word a poté
jej extrahovat například změnou přípony z .docx na
.zip.
V nově vzniklé složce se kromě dalších nachází složka
word\ s XML dokumentem document.xml. Když si jej
otevřeme, uvidíte přibližně takovouto strukturu:
...konec náhledu článku...
Pokračuj dál
Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.
Omezená nabídka: Nauč se vše a ušetři
Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.
- Neomezený a trvalý přístup k jednotlivým lekcím.
- Kvalitní znalosti v oblasti IT.
- Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.
Popis článku
Požadovaný článek má následující obsah:
V C# .NET tutoriálu se naučíme pracovat se soubory aplikace MS Word a rozpracujeme jednoduchý editor docx souborů.
Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.