من چند XML با قالب بندی نامناسب دارم که باید تجزیه و تحلیل کنم. برطرف کردن مشکل در بالادست امکان پذیر نیست.
مشکل (فعلی) این است که همیشه از نویسه های آمپر به درستی فرار نمی کند ، بنابراین من باید و
را به و
اگر تبدیل کنم &
از قبل موجود است ، من نمی خواهم آن را به و
تغییر دهم. به طور کلی ، اگر موجودی خوش فرم از قبل در آنجا باشد ، من نمی خواهم آن را نابود کنم. من فکر نمی کنم به طور کلی ، شناختن همه موجوداتی که می توانند در هر سند خاص XML وجود داشته باشند ، ممکن است ، بنابراین من می خواهم یک راه حل برای هر جایی مانند و
حفظ کنم.
جایی که مجموعه ای از کاراکترها است که موجودی بین
و
اولیه و بسته شدن
را تعریف می کند. به طور خاص ، و
>
به معنای واقعی کلمه نیستند که در غیر این صورت یک عنصر XML را نشان می دهد.
اکنون ، هنگام تجزیه ، اگر را ببینم و
نمی دانم با ،
، (فاصله) ، انتهای خط یا دیگری
و
مواجه خواهم شد. بنابراین من فکر می کنم که باید
را به یاد بیاورم زیرا به دنبال کاراکتری می گردم که به من بگوید با اصلی و
چه کاری باید انجام دهم.
فکر می کنم نیاز دارم قدرت Push Down Automaton برای انجام این کار ، من فکر نمی کنم که یک دستگاه حالت محدود به دلیل آنچه که من فکر می کنم یک حافظه مورد نیاز است کار کند - آیا این درست است؟ اگر من به PDA نیاز دارم ، یک عبارت منظم است در تماس با String.replaceAll (رشته ، رشته)
کار نمی کند. یا آیا جاوا regex وجود دارد که می تواند این مشکل را حل کند؟
به یاد داشته باشید: در هر سطر می توان چندین جایگزین داشت.
(من از این س [ال مطلع هستم ، اما جواب نمی دهد.