Вы можете использовать регулярное выражение «\ W». Это соответствует любому символу, отличному от слова. Требуемая строка:
String[] tokens=pdfName.split("\\W");