Diskuze: C# úprava řetězce

C# .NET .NET (C# a Visual Basic) C# úprava řetězce American English version English version

Avatar
Ondřej Krsička
Redaktor
Avatar
Ondřej Krsička:

Ahoj, potřebuju metodu, která upravuje stringy. Př.:
"Já-Ondra mám rád římská(!!!) stavení. :-)" na
"JAONDRAMAMRAD­RIMSKASTAVENI"

 
Odpovědět 22.8.2015 22:06
Avatar
Milan Křepelka
Redaktor
Avatar
Milan Křepelka:

Třída String obsahuje metody ToUpper, Replace. Zbytek bys měl zvládnout.

 
Nahoru Odpovědět  +3 22.8.2015 22:26
Avatar
Ondřej Krsička
Redaktor
Avatar
Odpovídá na Milan Křepelka
Ondřej Krsička:

No nechce se mi to dělat přes pole znaků...
Jestli není nějaké úspornější řešení?

 
Nahoru Odpovědět 23.8.2015 0:11
Avatar
Odpovídá na Ondřej Krsička
Denis Homolík (Alfonz):

Nějak nechápu co je neúsporného na tom že zavoláš pár metod.

Nahoru Odpovědět 23.8.2015 0:13
Vše je možné, dokud si to myslíte!
Avatar
Jan Vargovský
Redaktor
Avatar
Odpovídá na Ondřej Krsička
Jan Vargovský:
internal class Program
{
    [STAThread]
    private static void Main(string[] args)
    {
        var input = "Já-Ondra mám rád% římská(!!!) stavení. :-)";
        var result = input.ToRetardedUpper();
        var expected = "JAONDRAMAMRADRIMSKASTAVENI";
        if (result != expected)
            Debugger.Break();
    }
}

public static class StringExtensions
{
    public static string ToRetardedUpper(this string s)
    {
        return new string(s.Normalize(NormalizationForm.FormKD)
                            .Where(c => char.IsLetter(c))
                            .Select(c => char.ToUpper(c))
                            .ToArray());
    }
}

TBH, nechce se mi už zkoumat jaký je rozdíl mezi compatibility a canonical decomposition, takže buď tam použiješ D a nebo KD.

Editováno 23.8.2015 1:08
 
Nahoru Odpovědět 23.8.2015 1:07
Avatar
coells
Redaktor
Avatar
Odpovídá na Jan Vargovský
coells:

Rozdíl je velice významný, ale musel bys použít speciální znaky, abys ho rozpoznal.
V tomhle případě [převod na uppercase ASCII] chceš compatibility decomposition, abys získal dekompozice ligatur a jiných speciálně formátovaných znaků, takže FormKD je správně.
V kanonické dekompozici by některé znaky mohly být identifikovány nekorektně kvůli formátování.

 
Nahoru Odpovědět  +1 23.8.2015 1:30
Avatar
Milan Křepelka
Redaktor
Avatar
Odpovídá na Ondřej Krsička
Milan Křepelka:

Přemýšlíš v podstatě správně ale nemá to efekt jaký si myslíš. Přemýšlíš pouze ve svém malém programátorském kontextu. Sice může existovat nějaká magiská metoda přímo v .NET FW UdelejMiPresne­ToCoChci a bude třeba na jeden řádek ale ta i ta .NET metoda tak jako tak musí vzít písmento po písmenku a udělat s tím co je potřeba.

Nechtěl jsem ti dávat hodové řešení, protože si myslím, že to nováčkům vypíná mozek a je to v jádru kontraproduktivní do budoucna. Ale na procházení znaku po znaku nic není. Ten počítač to musí tak jako tak udělat, jen ty to nevidíš. Jde jen o to abys to ty udělal optimálně.

http://www.aspnet.cz/…kritiku.aspx

 
Nahoru Odpovědět  +1 23.8.2015 8:54
Avatar
Ondřej Krsička
Redaktor
Avatar
Odpovídá na Milan Křepelka
Ondřej Krsička:

Tak to mám hotové, dík cicobasket za ujištění, že není metoda UdelejMiPresne­ToCoChci() :)

static string RemoveDiacritics(string s)
{
    s = s.Normalize(NormalizationForm.FormD);
    string output = "";
    for (int i = 0; i < s.Length; i++)
    {
        if (CharUnicodeInfo.GetUnicodeCategory(s[i]) != UnicodeCategory.NonSpacingMark)
            output += s[i];
    }
    return output;
}
static string Modify(string s)
{
    s = RemoveDiacritics(s);
    s = s.ToUpper();
    string allowed_chars = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
    string output = "";
    for (int i = 0; i < s.Length; i++)
        if (allowed_chars.Contains(s[i]))
            output += s[i];
    return output;
}
 
Nahoru Odpovědět  +2 23.8.2015 10:39
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 8 zpráv z 8.