Lekce 14 - DocX - Práce s dokumenty MS Word v C# .NET
V předešlém cvičení, Řešené úlohy k 11.-13. lekci práce se soubory v C# .NET, jsme si procvičili nabyté zkušenosti z předchozích lekcí.
V dnešním C# .NET tutoriálu si uvedeme formát
docx
a rozpracujeme jednoduchý editor Microsoft Word souborů.
Formát DocX
DocX
je formát používaný editorem MS Word z populárního
kancelářského balíku MS Office. Na rozdíl od
čistě textových dokumentů ukládá nejen text, ale i jeho
formátování jako velikost, font, barvu a tak dále. Můžeme
do něj vkládat i obrázky, tabulky a další položky. Tento formát je
definován specifikací Office Open XML.
Specifikace Office Open XML
Tato specifikace definuje souborové formáty na ukládání textových dokumentů, tabulek či prezentací používaných nejen v aplikacích Office od Microsoftu. Tyto formáty jsou v podstatě soubory ZIP s XML dokumenty uvnitř, které nesou samotná data. Tato specifikace je rozdělena do několika částí. Zmiňme si ty nejdůležitější:
- WordProcessingML - XML pro textové dokumenty, vytvářené
například v aplikaci MS Word. Ukládá se do souboru s příponou
docx
. - SpreadsheetML - XML pro tabulky, vytvářené například v
aplikaci MS Excel. Ukládá se do souboru s
příponou
xlsx
. - PresentationML - XML pro prezentace, vytvářené
například v aplikaci MS PowerPoint.
Ukládá se do souboru s příponou
pptx
.
WordProcessingML
Jak již bylo řečeno, tak každý docx
soubor je ZIP se XML
(WordProcessingML) soubory uvnitř, proto je můžeme stejně jako každý ZIP
extrahovat. Zkusme si schválně vytvořit nějaký dokument v MS Word a poté
jej extrahovat například změnou přípony z .docx
na
.zip
.
V nově vzniklé složce se kromě dalších nachází složka
word\
s XML dokumentem document.xml
. Když si jej
otevřeme, uvidíte přibližně takovouto strukturu:
...konec náhledu článku...
Pokračuj dál
Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.
Koupit tento kurz
Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.
- Neomezený a trvalý přístup k jednotlivým lekcím.
- Kvalitní znalosti v oblasti IT.
- Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.
Popis článku
Požadovaný článek má následující obsah:
V C# .NET tutoriálu se naučíme pracovat se soubory aplikace MS Word a rozpracujeme jednoduchý editor docx souborů.
Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.