Java regex conversion -


संभव डुप्लिकेट:

मेरे पास स्ट्रिंग डेटा है जिसमें इस विशेष रूप से इस प्रारूप & amp; # 039

में एन्कोडेड कुछ विशेष वर्ण हैं जो एन्कोडिंग एक 'संकेत, एक एकल उद्धरण है। < P> तो उदाहरण "नागरिक और गृह घर" को "नागरिक का घर" जैसा दिखना चाहिए लेकिन ऐसा नहीं है।

दुर्भाग्य से यह इस तरह के रूप में व्याख्या नहीं की है, और मुझे इन चीजों के लिए अपनी सारी स्ट्रिंग को पार्स करने और उन्हें परिवर्तित करने की आवश्यकता है

सबसे पहले: यह स्वरूप क्या कहा जाता है, यह एक रूपांतरण पद्धति खोजने में मेरी मदद करेगी

दूसरा: क्या आप अपनी स्ट्रिंग्स को ठीक करने के लिए एक विधि के बारे में जानते हैं?

पहिया को फिर से बदलने की कोई आवश्यकता नहीं है: अपाचे कॉमन्स लैंग है जो आप चाहते हैं।

इकाई वाली स्ट्रिंग अनैसैप्प्स को पलायन करने के लिए वास्तविक यूनिकोड वर्ण युक्त स्ट्रिंग में बच जाती है। HTML 4.0 संस्थाओं का समर्थन करता है।

उदाहरण के लिए, स्ट्रिंग "& amp; lt; Fran & amp; ccedil; ais & gt;" बन जाएगा "& lt; Français & gt; "

यदि कोई इकाई पहचाने जाने योग्य नहीं है, तो उसे अकेला छोड़ दिया जाता है, और परिणाम स्ट्रिंग में शब्दशः सम्मिलित किया जाता है। जैसे "& amp; gt; और amp; zzzz; x" बन जाएगा "& gt; और amp; zzzz; x" < / html>

Comments