Python - Advanced string escaping

Question

I have a string in python. I used escape() to get rid of the newlines, now my string looks like this:

&lt;p&gt;Wie hoch ist der Anteil &amp;laquo;oraler MS-Medikamente&amp;raquo;
bei Neuverschreibungen in Ihrer Sprechstunde?&amp;nbsp;&lt;/p&gt;

But its supposed to look like this

Wie hoch ist der Anteil oraler MS-Medikamente bei Neuverschreibungen in Ihrer Sprechstunde?

What can I do?

miken32 · Accepted Answer · 2025-05-29 16:18:27Z

1

Try to decode (reverse escape).
HTML Encoder / Decoder - Converts characters to their corresponding HTML Entities - Web 2.0 Generators http://www.web2generators.com/html/entities
You could use also this hint

import BeautifulSoup

soup= BeautifulSoup(raw_html)
cleantext = soup.text

edited May 29 at 16:18

miken32

42.5k16 gold badges127 silver badges177 bronze badges

answered Nov 13, 2014 at 9:49

user1630938

Sign up to request clarification or add additional context in comments.

Comments

Maroun · Accepted Answer · 2014-11-13 09:47:57Z

0

You can unescape the string in order to get HTML tags back:

import HTMLParser
parser = HTMLParser.HTMLParser()
str = parser.unescape(str)

and then use some regex to remove HTML tags:

p = re.compile(r'<.*?>')
return p.sub('', str)

I don't really recommend using regexes for parsing HTML, you can use BeautifulSoup instead.

answered Nov 13, 2014 at 9:47

Maroun

96.3k30 gold badges195 silver badges249 bronze badges

Comments

Alderven · Accepted Answer · 2014-11-13 10:14:37Z

0

List all unnecessary symbols in the characters list and then replace them:

string = '&lt;p&gt;Wie hoch ist der Anteil &amp;laquo;oraler MS-Medikamente&amp;raquo;bei Neuverschreibungen in Ihrer Sprechstunde?&amp;nbsp;&lt;/p&gt;'

def unescape(s):
    characters = ["&lt;p&gt;", "&lt;", "&gt;", "&amp;", "laquo;", "raquo;", "nbsp;", "/p"]
    for character in characters:
        s = s.replace(character, "")
    return s

print(unescape(string))

Here is the result:

Wie hoch ist der Anteil oraler MS-Medikamentebei Neuverschreibungen in Ihrer Sprechstunde?

answered Nov 13, 2014 at 10:14

Alderven

8,2885 gold badges28 silver badges42 bronze badges

Collectives™ on Stack Overflow

Python - Advanced string escaping

3 Answers 3

Comments

Comments

Comments

Your Answer

Hot Network Questions

Collectives™ on Stack Overflow

3 Answers 3

Comments

Comments

Comments

Your Answer

Sign up or log in

Post as a guest

Related