NOVINKA - Online rekvalifikační kurz Java programátor. Oblíbená a studenty ověřená rekvalifikace - nyní i online.
NOVINKA – Víkendový online kurz Software tester, který tě posune dál. Zjisti, jak na to!

Lekce 14 - DocX - Práce s dokumenty MS Word v C# .NET

V předešlém cvičení, Řešené úlohy k 11.-13. lekci práce se soubory v C# .NET, jsme si procvičili nabyté zkušenosti z předchozích lekcí.

V dnešním C# .NET tutoriálu si uvedeme formát docx a rozpracujeme jednoduchý editor Microsoft Word souborů.

Formát DocX

DocX je formát používaný editorem MS Word z populárního kancelářského balíku MS Office. Na rozdíl od čistě textových dokumentů ukládá nejen text, ale i jeho formátování jako velikost, font, barvu a tak dále. Můžeme do něj vkládat i obrázky, tabulky a další položky. Tento formát je definován specifikací Office Open XML.

Specifikace Office Open XML

Tato specifikace definuje souborové formáty na ukládání textových dokumentů, tabulek či prezentací používaných nejen v aplikacích Office od Microsoftu. Tyto formáty jsou v podstatě soubory ZIP s XML dokumenty uvnitř, které nesou samotná data. Tato specifikace je rozdělena do několika částí. Zmiňme si ty nejdůležitější:

  • WordProcessingML - XML pro textové dokumenty, vytvářené například v aplikaci MS Word. Ukládá se do souboru s příponou docx.
  • SpreadsheetML - XML pro tabulky, vytvářené například v aplikaci MS Excel. Ukládá se do souboru s příponou xlsx.
  • PresentationML - XML pro prezentace, vytvářené například v aplikaci MS PowerPoint. Ukládá se do souboru s příponou pptx.

WordProcessingML

Jak již bylo řečeno, tak každý docx soubor je ZIP se XML (WordProcessingML) soubory uvnitř, proto je můžeme stejně jako každý ZIP extrahovat. Zkusme si schválně vytvořit nějaký dokument v MS Word a poté jej extrahovat například změnou přípony z .docx na .zip.

V nově vzniklé složce se kromě dalších nachází složka word\ s XML dokumentem document.xml. Když si jej otevřeme, uvidíte přibližně takovouto strukturu:


 

...konec náhledu článku...
Pokračuj dál

Znalosti v hodnotě stovek tisíc získáš za pár korun

Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.

Koupit tento kurz

Koupit všechny aktuálně dostupné lekce s funkcí odevzdávání úloh a certifikátem za pouhých 720 Kč
Aktuální stav konta 0 Kč
Koupí tohoto balíčku získáš přístup ke všem 26 článkům (18 lekcí, 4 testy, 4 praktické cvičení) tohoto kurzu.

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Co od nás v dalších lekcích dostaneš?
  • Neomezený a trvalý přístup k jednotlivým lekcím.
  • Kvalitní znalosti v oblasti IT.
  • Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.

Popis článku

Požadovaný článek má následující obsah:

V C# .NET tutoriálu se naučíme pracovat se soubory aplikace MS Word a rozpracujeme jednoduchý editor docx souborů.

Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Článek pro vás napsal Lukáš Michalik
Avatar
jako Autor se věnuje C#, tvorbě her v C++ a JavaScriptu
Aktivity