در حال رفع موجودیت های XML نجات یافته در Java با Regex؟

من چند XML با قالب بندی نامناسب دارم که باید تجزیه و تحلیل کنم. برطرف کردن مشکل در بالادست امکان پذیر نیست.

مشکل (فعلی) این است که همیشه از نویسه های آمپر به درستی فرار نمی کند ، بنابراین من باید و را به و

اگر تبدیل کنم & از قبل موجود است ، من نمی خواهم آن را به و تغییر دهم. به طور کلی ، اگر موجودی خوش فرم از قبل در آنجا باشد ، من نمی خواهم آن را نابود کنم. من فکر نمی کنم به طور کلی ، شناختن همه موجوداتی که می توانند در هر سند خاص XML وجود داشته باشند ، ممکن است ، بنابراین من می خواهم یک راه حل برای هر جایی مانند و حفظ کنم.

جایی که مجموعه ای از کاراکترها است که موجودی بین و اولیه و بسته شدن را تعریف می کند. به طور خاص ، و > به معنای واقعی کلمه نیستند که در غیر این صورت یک عنصر XML را نشان می دهد.

اکنون ، هنگام تجزیه ، اگر را ببینم و نمی دانم با ، ، (فاصله) ، انتهای خط یا دیگری و مواجه خواهم شد. بنابراین من فکر می کنم که باید را به یاد بیاورم زیرا به دنبال کاراکتری می گردم که به من بگوید با اصلی و چه کاری باید انجام دهم.

فکر می کنم نیاز دارم قدرت Push Down Automaton برای انجام این کار ، من فکر نمی کنم که یک دستگاه حالت محدود به دلیل آنچه که من فکر می کنم یک حافظه مورد نیاز است کار کند - آیا این درست است؟ اگر من به PDA نیاز دارم ، یک عبارت منظم است در تماس با String.replaceAll (رشته ، رشته) کار نمی کند. یا آیا جاوا regex وجود دارد که می تواند این مشکل را حل کند؟

به یاد داشته باشید: در هر سطر می توان چندین جایگزین داشت.

(من از این س [ال مطلع هستم ، اما جواب نمی دهد.

5
задан Community 23 May 2017 в 12:34
поделиться