Diskuze: chyba při čtení html kódu z xml souboru

Naučíme tě pracovat na home-office.

Více info »

V předchozím kvízu, Online test znalostí Java, jsme si ověřili nabyté zkušenosti z kurzu.

Aktivity

Tomáš Brůna

Tvůrce

Tomáš Brůna:26.1.2016 19:57

Ahoj,
když čtu z xml souboru HTML kód, tak mi to vyhodí výjímku:

Chyba při čtení souboru: ParseError at [row,col]:[21,81]
Message: The reference to entity "subset" must end with the ';' delimiter.

xml soubor nemůžu upravit, protože se vždy stáhne nový.

tady je kód kde čtu:

  private static void nactiRecept(String cesta)
    {
     XMLInputFactory factory = XMLInputFactory.newInstance();
     XMLStreamReader xsr = null;

     try
     {
            xsr = factory.createXMLStreamReader(new FileReader(cesta));
            String element = "";

            while(xsr.hasNext())
            {
                // načítáme element
                if (xsr.getEventType() == XMLStreamConstants.START_ELEMENT)
                {
                        element = xsr.getName().getLocalPart();
                        if (element.equals("div"))
                        {
                         if (xsr.getAttributeValue(0).contains("wikiPreview"))
                                System.out.println("jkjklj");
                        }
                }
                xsr.next();
        }

}
catch (Exception e)
{
        System.err.println("Chyba při čtení souboru: " + e.getMessage());
}
finally
{
        try
        {
                xsr.close();
        }
        catch (Exception e)
        {
                System.err.println("Chyba při uzavírání souboru: " + e.getMessage());
        }
}
    }

celý xml soubor:

Odpovědět

26.1.2016 19:57

Vi veri universum vivus vici

Atrament

Tvůrce

Atrament:27.1.2016 16:09

Tak je víceméně jasné v čem je problém - máš tam někde znak &, který v xml jen tak být nemůže, pravděpodobně to je součást nějakého linku. Nemůžeš sem hodit celý ten xml soubor? Nikdy jsem to ještě nemusel řešit, ale hádám že by mohlo stačit ten soubor prohnat filtrem co by nahradil všechny výskyty & za

&amp;

nebo něco na ten způsob.

Nahoru Odpovědět

27.1.2016 16:09

Tomáš Brůna

Tvůrce

Tomáš Brůna:28.1.2016 6:46

Jasně, promiň zapomněl jsem
http://www.itnetwork.cz/dev-lighter/673

Nahoru Odpovědět

28.1.2016 6:46

Vi veri universum vivus vici

Atrament

Tvůrce

Atrament:28.1.2016 16:32

Ale vždyť to vůbec není xml ale docela obyčejné html. To musíš parsovat html parserem a ne xml parserem:)

Akceptované řešení
+20 Zkušeností
+2,50 Kč

Nahoru Odpovědět

28.1.2016 16:32

Tomáš Brůna

Tvůrce

Tomáš Brůna:28.1.2016 16:42

aha, díky moc , jen napadlo, že by to tak mohlo jít

Nahoru Odpovědět

28.1.2016 16:42

Vi veri universum vivus vici

Tomáš Brůna

Tvůrce

Tomáš Brůna:28.1.2016 16:43

*mě

Nahoru Odpovědět

28.1.2016 16:43

Vi veri universum vivus vici

Naučíme tě pracovat na home-office.

Zjistit více...

Naučíme tě pracovat na home-office.

Více info »

Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 6 zpráv z 6.