Java и Unicode: как соотносятся графема, кодпоинт и чар?

Собственный поисковый матчер для Reedy уже вполне готов и отлично работает – всё ускорилось на порядок, по сравнению с “наивной” реализацией на регулярках.

Попутно пришлось, наконец, серьезнее разобраться с Юникодом, чтобы поиск хорошо работал с любыми языками и символами.

Unit-tesing Java Unicode Search

Читать далее »