Convert602
V předchozím kvízu, Kvíz - Soubory v Python, jsme si ověřili nabyté zkušenosti z kurzu.
Mnozí již možná neznají textový editor T602 od české firmy Software602, nicméně tento editor byl velmi populární zejména v 90. letech. Pro řadu uživatelů se jednalo o první textový editor, se kterým se vůbec setkali, a tak se nelze divit, že si ho někteří oblíbili dokonce takovým způsobem, že ho užívají dodnes. Přesně pro ty je tato aplikace určena, umožňuje totiž převod textu mezi moderními formáty dokumentů (DOCX a PDF) a formátem .602, který výše zmíněný editor užívá.
Podpora T602, již dávno skončila a tudíž se tento textový editor nedá provozovat pod operačním systémem Windows, ale jen v emulátoru prostředí MS-DOS - DOSBoxu.
O aplikaci
Jedná se o GUI aplikaci vytvořenou v programovacím jazyku Python (konkrétně ve verzi 3.8). Pro parsování textu z
DOCX dokumentů je využita knihovna docx
a pro parsování textu z
PDF dokumentů je použita knihovna pdfminer
. GUI bylo vytvořeno
za pomoci nativní knihovny Tkinter.
Instalace
Je třeba nainstalovat následující Python knihovny:
pip install python-docx pip install pdfminer.six pip install pyautogui
Užití
Uživatel v GUI vybere soubor, který chce převádět, zvolí také název a místo uložení výsledku převodu a může také upřesnit některé vlastnosti výsledného T602 dokumentu. Po upřesnění všech možností spustí uživatel převod. O ukončení převodu je poté informován. Výsledný soubor lze již otevřít a volně upravovat v programu T602. Program také umožňuje přímé otevření dokumentu v T602.
Aplikace také umí rozdělit příliš dlouhý text do více T602 souborů. Tato funkce byla přidána zejména proto, že T602 je zastaralý program, který má své limity. Není připraven na načítání velkých textových souborů. V případě, že text načtený ze vstupního souboru přesahuje délku 260 000 znaků, je vytvořeno několik T602 souborů s rozděleným textem. Maximální délka textu v souboru je variabilní a lze ji měnit v nastavení programu.
Aktuální limitace
- Program je schopen z DOCX dokumentu převést jen prostý text, nepodporuje například tabulky, podpora tabulek bude možná přidána v budoucnu.
- Převod PDF dokumentů není 100% spolehlivý. U většiny souborů proběhne převod v pořádku, ale u některých je výsledek v lepším případě nutné editovat v některém textovém editoru (např. Notepad ++) - nahrazení CID kódů znaků netypických fontů apod, v horším případě je výsledek zcela nečitelný. Tento problém je velmi špatně řešitelný, nicméně stále hledám alespoň částečné řešení.
GUI finální verze
Hodnocení poroty
Tento projekt se účastnil soutěže ITnetwork summer 2020.
Porotce | Bodů | Hodnocení |
---|---|---|
David Čápka |
8 | Nejsem uživatelem T602, ale z nostalgie jsme si jej stáhli, abychom konvertor otestovali. Po stažení 3 Python knihoven se opravdu spustil, thumbs up za návod. Vypadá to, že funguje korektně a dokáži si představit, že někomu pomůže doplnit jeho sbírku dokumentů, aniž by je musel všechny pracně migrovat do novějších formátů, když to třeba ani není nutné, život je přeci krátký. Chybí oboustranná konverze, na druhou stranu tyto nástroje již existují, možná tam nějaký zmínit. Je pro mě trochu těžké tohle hodnotit, dávám 8 bodů, protože to není tak všestranně užitečné, jako podobné programy v této kategorii, ale určitě je to dobrá práce! |
Samuel Hél |
6.5 | Konverze je možná pouze jednostranně, ale alespoň funguje. Sám bych si takový program sice rozjíždět na PC nechtěl a uživatel T602 nejsem. Netuším, jaké bych měl dát hodnocení, pro mě to je zbytečné, ale někomu to může přijít vhod. |
Michal Čápka |
7 | Ačkoliv ještě pamatuju diskety, zipky a podobně, tak s tímhle jsem se nikdy nesetkal, tudíž jsem musel trochu nastudovat, co že to vlastně ten T602 je. Přijde mi to jako pěkný, fanouškovský program na zavzpomínání na staré časy a pro ukázku toho, jak tehdy vlastně takový textový editor vypadal. |
Galerie
Stáhnout
Stažením následujícího souboru souhlasíš s licenčními podmínkami
Staženo 25x (9.85 kB)
Aplikace je včetně zdrojových kódů v jazyce Python