संभव डुप्लिकेट:
मेरे पास HTML कोड से भरा स्ट्रिंग है, जैसे कि
& amp; quot; ,
& rdquo; , और
& amp; mdash; । < / P>
क्या किसी भी पायथन पुस्तकालयों ने मुझे इन सभी पात्रों को अपने वास्तविक अक्षरों के साथ बदलने के लिए विश्वसनीय तरीके सुझाए हैं?
उदाहरण के लिए, मुझे सभी
& amp; quot;
आप इसका उपयोग करना चाहते हैं:
<कोड> HTMLParser से आयात HTMLParser पार्सर = HTMLParser () html_decoded_string = parser.unescape (html_encoded_string)मैं भी BeautifulSoup के लिए बहुत प्यार देख रहा हूँ
इन खूबसूरत सूट आयात से सुंदर सूप html_decoded_string = खूबसूरत सूप (html_encoded_string, convertEntities = खूबसूरत सूट। HTML_ENTITIES)
इन मौजूदा सवालों का भी डुप्लिकेट:
< / P>
Comments
Post a Comment