Есть ли способ выбрать в mysql слова, которые являются только Китайский, только японский и только корейский?
На английском языке это можно сделать с помощью:
SELECT * FROM table WHERE field REGEXP '[a-zA-Z0-9]'
или даже «грязного» решения, например:
SELECT * FROM table WHERE field> "0" AND field <"ZZZZZZZZ"
Есть ли подобное решение для восточных языков / символов CJK?
Я понимаю, что в китайском и японском языках используются общие символы, поэтому существует вероятность того, что японские слова, использующие эти символы будет ошибочно принят за китайские слова. Думаю, эти слова не будут отфильтрованы.
Слова хранятся в строковом поле utf-8.
Если это невозможно сделать в mysql, можно ли это сделать в PHP?
Спасибо! :)
править 1: Данные не включают, на каком языке находится строка, поэтому я не могу фильтровать по другому полю. править 2: использование api переводчика, такого как bing (Google закрывает свой api переводчика), - интересная идея, но я надеялся на более быстрое решение в стиле регулярных выражений.