Vydělávej až 160.000 Kč měsíčně! Akreditované rekvalifikační kurzy s garancí práce od 0 Kč. Více informací.
Hledáme nové posily do ITnetwork týmu. Podívej se na volné pozice a přidej se do nejagilnější firmy na trhu - Více informací.
Avatar
kreketus
Člen
Avatar
kreketus:18.2.2019 10:42

Zkusil jsem:

Chci docílit: Ahoj. Jde o upravu textovych souboru jako v v tomto prikladu: kazdy blok uzitecneho textu je zahajen blokem vicemene opakujiciho se nepotrebneho textu, ktery je treba odstranit. Ovsem v tomto nepotrebnem bloku je i uzitecny kratky retezec, ktery konkretne pojmenovava blok uzitecneho textu.Takze v konecnem vysledku ma zustat zachovan uzitecny text uvedeny uzitecnym retezcem.
Muzete doporucit
jak A) obecne bez jakekoliv souvislosti s mymii zkusenostmi
tak B) vzhledem k mym preferencim uvedenym v zavorce:
(V davne minulosti bych na to asi pouzil PHP, ale nechce se mi oprasovat jeho znalost. Tusim, ze doporuceni budou smerovat na python.Tam mne odrazuje, ze syntakticky to nema temer nic spolecneho s javou ci c++. PHP mi sedelo, nebot jeho syntaxe se od nich odchylovala relativne malo. Objektova cast PHP se mi uz libila mene nez ta v jave, a proto se mi do PHP prilis nechce. )

 
Odpovědět
18.2.2019 10:42
Avatar
Tomáš Novotný:18.2.2019 11:08

Ahoj, použil bych regulárních výrazů. Jazyk je v podstatě jedno jaký, pokud reg. výrazy podporuje.

Nahoru Odpovědět
18.2.2019 11:08
∞ ... the exact amount of possibilities how to deal with the situation ... so by calm, your solution is one of many
Avatar
Odpovídá na kreketus
Tomáš Novotný:18.2.2019 11:13

V zásadě by to mohl zvládnout i nějaký šikovný textový editor s touto funkcí.

Editováno 18.2.2019 11:14
Nahoru Odpovědět
18.2.2019 11:13
∞ ... the exact amount of possibilities how to deal with the situation ... so by calm, your solution is one of many
Avatar
Peter Mlich
Člen
Avatar
Peter Mlich:18.2.2019 13:45

googlem se da najit editor, ktery dokaze podle reg. vyrazu nahradit text v zaskrtnutych souborech. Jednou jsem to pouzival asi pro 300 souboru.

Jinak si bohate vystacim s php. Treba toto je kod, ktery vybere ze souboru h1. Vyrobi z nej nazev souboru (odstrani diakritiku). A nove ulozi.

<?php
function removeDiacritics($str)
{
$str = StrTr($str,
"éěÉĚřŘťŤžŽúÚůŮüÜíÍóÓáÁšŠďĎýÝčČňŇäÄĺĹľĽŕŔöÖ",
"eeEErRtTzZuUuUuUiIoOaAsSdDyYcCnNaAlLlLrRoO"
);
return $str;
}

header('Content-Type: text/html; charset=windows-1250');

$path1 = "dd/";
$path2 = "ee/";
$name1 = "Interní prohlížeč.html";
echo $path1.$name1;
$str = file_get_contents($path1.$name1);
$str = preg_replace('~<h1[^>]*>(.*?)</h1>.*~is', '$1', $str);
$str = strip_tags($str);
$str = iconv('UTF-8', 'windows-1250', $str);
$str = removeDiacritics($str);
$str = strTolower($str);
$str = preg_replace('~[^a-z0-9]+~', '-', $str);
$str = preg_replace('~^-+|-+$~', '', $str);
$name2 = $str;
//file_put_contents($path.$name, $str);
//$str = preg_replace('~\<\/body.*$~', '', $str);
echo '<pre>';
var_dump($str);
//echo htmlentities($str);
?>
 
Nahoru Odpovědět
18.2.2019 13:45
Avatar
Lako
Člen
Avatar
Odpovídá na kreketus
Lako:19.2.2019 16:13

Kdyby jsi sem hodil ukázku, lépe by se odpovídalo. Nicméně to vypadá jako případ pro regulární výraz, se kterými umí pracovat skoro každý jazyk, avšak i textový editor a nebo můžeš použít třeba https://regexr.com/

 
Nahoru Odpovědět
19.2.2019 16:13
Avatar
Aleš13
Člen
Avatar
Aleš13:25.2.2019 18:07

Na takovéhle věci používám EditPlus (www.editplus.com). V něm se dají dělat i makra (záznam mačkání kláves), tohle v něm určitě půjde bez větších potíží taky.

 
Nahoru Odpovědět
25.2.2019 18:07
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 6 zpráv z 6.