Ideone.com

download

copy

Некоторые функции PHP (strlen, substr, а также обращение к строке как к массиву: $str[0]) не работают с многобайтовыми кодировками (вроде utf-8). В utf-8 1 символ закодирован с помощью от 1 до 6 байтов, а эти функции думают, что 1 буква всегда кодируется одним байтом. По этой причине они ломают символы, в результате получаются битые символы и ничего не работает. Потому вместо них надо использовать mb_ функции например mb_strlen, mb_substr. Вместо доступа к строке как к массиву надо использовать mb_substr.
Если тебе интересно, почему эти функции поддерживают только однобайтные кодировки, а не многобайтные, то причина в том, что они очень старые и написаны в то время (лет 40 назад) когда utf-8 и многобайтных кодировок еще не было.
Давай разберем пример. Допустим, у нас есть строка из русской буквы «щ» в кодирове utf-8. Попытаемся взять первую букву с помощью неправильной функции:
// Внимание! это неправильный код, не пиши так!
$s = "щ";
$x = substr($s, 0, 1);
Буква «щ» кодируется в utf-8 как 2 байта: 209 137 (я взял информацию тут: http://w...content-available-to-author-only...e.de/unicode-utf8-table.pl?start=1024&utf8=dec ). substr отрезает от строки не первую букву, а первый байт. Это значит, что в $x он положит 1 байт с кодом 209. В utf-8 это неверная последовательность, она не соответвует никакому символу (так как после 209 обязательно должно идти второе число). Ideone может вообще отказаться что-то отображать, встретив такой код.
То же самое, когда ты обращаешься к строке как к массиву: $s[0]. Эта команда берет не первую букву, а только первый байт строки. Естественно, такая программа не будет работать.
Функция strlen считает число байт (не букв) в строке. То есть в данном случае strlen($s) вернет нам 2.
Латинница и цифры кодируются в utf-8 одним байтом, с ними это работает, но все равно, не надо использовать эти функции — это слишком ненадежно и легко сделать ошибку.
Вывод: используй mb_* функции. Не используй доступ к строке как к массиву. В регулярных выражениях используй флаг u (он говорит что используется utf-8 а не однобайтовая кодировка).
Некоторые строковые функции без префикса mb тем не менее корректно работают с utf-8 и их можно использовать. Вот они: strtr (если передавать массив), str_replace, str_repeat, explode, addslashes, trim.
Не работают с utf-8: strrev, strlen, substr, strpos, ucfirst, wordwrap, str_pad и большинство других строковых функций, для работы которых нужно считать число символов. Не работает задание ширины в функциях вроде sprintf и printf.
mbstring.func_overload
В неоторых (неграмотных) учебниках ты можешь увидеть совет включить опцию mbstring.func_overload (подробнее про нее: http://p...content-available-to-author-only...p.net/manual/ru/mbstring.overload.php ). Ни в коем случае так не делай, так как это изначально неправильно спроектированная опция. Она не решает проблему, для которой задумывалась (включить в старом приложении использующем функции вроде strlen поддержку utf-8), а лишь создает путаницу. Например, при ее включении strlen заменяется на поддерживающую utf-8 mb_strlen, но ucfirst ни на что не заменяется и не работает.

0J3QtdC60L7RgtC+0YDRi9C1INGE0YPQvdC60YbQuNC4IFBIUCAoc3RybGVuLCBzdWJzdHIsINCwINGC0LDQutC20LUg0L7QsdGA0LDRidC10L3QuNC1INC6INGB0YLRgNC+0LrQtSDQutCw0Log0Log0LzQsNGB0YHQuNCy0YM6ICRzdHJbMF0pINC90LUg0YDQsNCx0L7RgtCw0Y7RgiDRgSDQvNC90L7Qs9C+0LHQsNC50YLQvtCy0YvQvNC4INC60L7QtNC40YDQvtCy0LrQsNC80LggKNCy0YDQvtC00LUgdXRmLTgpLiDQkiB1dGYtOCAxINGB0LjQvNCy0L7QuyDQt9Cw0LrQvtC00LjRgNC+0LLQsNC9INGBINC/0L7QvNC+0YnRjNGOINC+0YIgMSDQtNC+IDYg0LHQsNC50YLQvtCyLCDQsCDRjdGC0Lgg0YTRg9C90LrRhtC40Lgg0LTRg9C80LDRjtGCLCDRh9GC0L4gMSDQsdGD0LrQstCwINCy0YHQtdCz0LTQsCDQutC+0LTQuNGA0YPQtdGC0YHRjyDQvtC00L3QuNC8INCx0LDQudGC0L7QvC4g0J/QviDRjdGC0L7QuSDQv9GA0LjRh9C40L3QtSDQvtC90Lgg0LvQvtC80LDRjtGCINGB0LjQvNCy0L7Qu9GLLCDQsiDRgNC10LfRg9C70YzRgtCw0YLQtSDQv9C+0LvRg9GH0LDRjtGC0YHRjyDQsdC40YLRi9C1INGB0LjQvNCy0L7Qu9GLINC4INC90LjRh9C10LPQviDQvdC1INGA0LDQsdC+0YLQsNC10YIuINCf0L7RgtC+0LzRgyDQstC80LXRgdGC0L4g0L3QuNGFINC90LDQtNC+INC40YHQv9C+0LvRjNC30L7QstCw0YLRjCBtYl8g0YTRg9C90LrRhtC40Lgg0L3QsNC/0YDQuNC80LXRgCBtYl9zdHJsZW4sIG1iX3N1YnN0ci4g0JLQvNC10YHRgtC+INC00L7RgdGC0YPQv9CwINC6INGB0YLRgNC+0LrQtSDQutCw0Log0Log0LzQsNGB0YHQuNCy0YMg0L3QsNC00L4g0LjRgdC/0L7Qu9GM0LfQvtCy0LDRgtGMIG1iX3N1YnN0ci4KCtCV0YHQu9C4INGC0LXQsdC1INC40L3RgtC10YDQtdGB0L3Qviwg0L/QvtGH0LXQvNGDINGN0YLQuCDRhNGD0L3QutGG0LjQuCDQv9C+0LTQtNC10YDQttC40LLQsNGO0YIg0YLQvtC70YzQutC+INC+0LTQvdC+0LHQsNC50YLQvdGL0LUg0LrQvtC00LjRgNC+0LLQutC4LCDQsCDQvdC1INC80L3QvtCz0L7QsdCw0LnRgtC90YvQtSwg0YLQviDQv9GA0LjRh9C40L3QsCDQsiDRgtC+0LwsINGH0YLQviDQvtC90Lgg0L7Rh9C10L3RjCDRgdGC0LDRgNGL0LUg0Lgg0L3QsNC/0LjRgdCw0L3RiyDQsiDRgtC+INCy0YDQtdC80Y8gKNC70LXRgiA0MCDQvdCw0LfQsNC0KSDQutC+0LPQtNCwIHV0Zi04INC4INC80L3QvtCz0L7QsdCw0LnRgtC90YvRhSDQutC+0LTQuNGA0L7QstC+0Log0LXRidC1INC90LUg0LHRi9C70L4uCgrQlNCw0LLQsNC5INGA0LDQt9Cx0LXRgNC10Lwg0L/RgNC40LzQtdGALiDQlNC+0L/Rg9GB0YLQuNC8LCDRgyDQvdCw0YEg0LXRgdGC0Ywg0YHRgtGA0L7QutCwINC40Lcg0YDRg9GB0YHQutC+0Lkg0LHRg9C60LLRiyDCq9GJwrsg0LIg0LrQvtC00LjRgNC+0LLQtSB1dGYtOC4g0J/QvtC/0YvRgtCw0LXQvNGB0Y8g0LLQt9GP0YLRjCDQv9C10YDQstGD0Y4g0LHRg9C60LLRgyDRgSDQv9C+0LzQvtGJ0YzRjiDQvdC10L/RgNCw0LLQuNC70YzQvdC+0Lkg0YTRg9C90LrRhtC40Lg6CgoKLy8g0JLQvdC40LzQsNC90LjQtSEg0Y3RgtC+INC90LXQv9GA0LDQstC40LvRjNC90YvQuSDQutC+0LQsINC90LUg0L/QuNGI0Lgg0YLQsNC6IQokcyA9ICLRiSI7CiR4ID0gc3Vic3RyKCRzLCAwLCAxKTsKCgrQkdGD0LrQstCwIMKr0YnCuyDQutC+0LTQuNGA0YPQtdGC0YHRjyDQsiB1dGYtOCDQutCw0LogMiDQsdCw0LnRgtCwOiAyMDkgMTM3ICjRjyDQstC30Y/QuyDQuNC90YTQvtGA0LzQsNGG0LjRjiDRgtGD0YI6IGh0dHA6Ly93Li4uY29udGVudC1hdmFpbGFibGUtdG8tYXV0aG9yLW9ubHkuLi5lLmRlL3VuaWNvZGUtdXRmOC10YWJsZS5wbD9zdGFydD0xMDI0JnV0Zjg9ZGVjICkuIHN1YnN0ciDQvtGC0YDQtdC30LDQtdGCINC+0YIg0YHRgtGA0L7QutC4INC90LUg0L/QtdGA0LLRg9GOINCx0YPQutCy0YMsINCwINC/0LXRgNCy0YvQuSDQsdCw0LnRgi4g0K3RgtC+INC30L3QsNGH0LjRgiwg0YfRgtC+INCyICR4INC+0L0g0L/QvtC70L7QttC40YIgMSDQsdCw0LnRgiDRgSDQutC+0LTQvtC8IDIwOS4g0JIgdXRmLTgg0Y3RgtC+INC90LXQstC10YDQvdCw0Y8g0L/QvtGB0LvQtdC00L7QstCw0YLQtdC70YzQvdC+0YHRgtGMLCDQvtC90LAg0L3QtSDRgdC+0L7RgtCy0LXRgtCy0YPQtdGCINC90LjQutCw0LrQvtC80YMg0YHQuNC80LLQvtC70YMgKNGC0LDQuiDQutCw0Log0L/QvtGB0LvQtSAyMDkg0L7QsdGP0LfQsNGC0LXQu9GM0L3QviDQtNC+0LvQttC90L4g0LjQtNGC0Lgg0LLRgtC+0YDQvtC1INGH0LjRgdC70L4pLiBJZGVvbmUg0LzQvtC20LXRgiDQstC+0L7QsdGJ0LUg0L7RgtC60LDQt9Cw0YLRjNGB0Y8g0YfRgtC+LdGC0L4g0L7RgtC+0LHRgNCw0LbQsNGC0YwsINCy0YHRgtGA0LXRgtC40LIg0YLQsNC60L7QuSDQutC+0LQuCgrQotC+INC20LUg0YHQsNC80L7QtSwg0LrQvtCz0LTQsCDRgtGLINC+0LHRgNCw0YnQsNC10YjRjNGB0Y8g0Log0YHRgtGA0L7QutC1INC60LDQuiDQuiDQvNCw0YHRgdC40LLRgzogJHNbMF0uINCt0YLQsCDQutC+0LzQsNC90LTQsCDQsdC10YDQtdGCINC90LUg0L/QtdGA0LLRg9GOINCx0YPQutCy0YMsINCwINGC0L7Qu9GM0LrQviDQv9C10YDQstGL0Lkg0LHQsNC50YIg0YHRgtGA0L7QutC4LiDQldGB0YLQtdGB0YLQstC10L3QvdC+LCDRgtCw0LrQsNGPINC/0YDQvtCz0YDQsNC80LzQsCDQvdC1INCx0YPQtNC10YIg0YDQsNCx0L7RgtCw0YLRjC4KCtCk0YPQvdC60YbQuNGPIHN0cmxlbiDRgdGH0LjRgtCw0LXRgiDRh9C40YHQu9C+INCx0LDQudGCICjQvdC1INCx0YPQutCyKSDQsiDRgdGC0YDQvtC60LUuINCi0L4g0LXRgdGC0Ywg0LIg0LTQsNC90L3QvtC8INGB0LvRg9GH0LDQtSBzdHJsZW4oJHMpINCy0LXRgNC90LXRgiDQvdCw0LwgMi4KCtCb0LDRgtC40L3QvdC40YbQsCDQuCDRhtC40YTRgNGLINC60L7QtNC40YDRg9GO0YLRgdGPINCyIHV0Zi04INC+0LTQvdC40Lwg0LHQsNC50YLQvtC8LCDRgSDQvdC40LzQuCDRjdGC0L4g0YDQsNCx0L7RgtCw0LXRgiwg0L3QviDQstGB0LUg0YDQsNCy0L3Qviwg0L3QtSDQvdCw0LTQviDQuNGB0L/QvtC70YzQt9C+0LLQsNGC0Ywg0Y3RgtC4INGE0YPQvdC60YbQuNC4IOKAlCDRjdGC0L4g0YHQu9C40YjQutC+0Lwg0L3QtdC90LDQtNC10LbQvdC+INC4INC70LXQs9C60L4g0YHQtNC10LvQsNGC0Ywg0L7RiNC40LHQutGDLgoK0JLRi9Cy0L7QtDog0LjRgdC/0L7Qu9GM0LfRg9C5IG1iXyog0YTRg9C90LrRhtC40LguINCd0LUg0LjRgdC/0L7Qu9GM0LfRg9C5INC00L7RgdGC0YPQvyDQuiDRgdGC0YDQvtC60LUg0LrQsNC6INC6INC80LDRgdGB0LjQstGDLiDQkiDRgNC10LPRg9C70Y/RgNC90YvRhSDQstGL0YDQsNC20LXQvdC40Y/RhSDQuNGB0L/QvtC70YzQt9GD0Lkg0YTQu9Cw0LMgdSAo0L7QvSDQs9C+0LLQvtGA0LjRgiDRh9GC0L4g0LjRgdC/0L7Qu9GM0LfRg9C10YLRgdGPIHV0Zi04INCwINC90LUg0L7QtNC90L7QsdCw0LnRgtC+0LLQsNGPINC60L7QtNC40YDQvtCy0LrQsCkuCgrQndC10LrQvtGC0L7RgNGL0LUg0YHRgtGA0L7QutC+0LLRi9C1INGE0YPQvdC60YbQuNC4INCx0LXQtyDQv9GA0LXRhNC40LrRgdCwIG1iINGC0LXQvCDQvdC1INC80LXQvdC10LUg0LrQvtGA0YDQtdC60YLQvdC+INGA0LDQsdC+0YLQsNGO0YIg0YEgdXRmLTgg0Lgg0LjRhSDQvNC+0LbQvdC+INC40YHQv9C+0LvRjNC30L7QstCw0YLRjC4g0JLQvtGCINC+0L3QuDogc3RydHIgKNC10YHQu9C4INC/0LXRgNC10LTQsNCy0LDRgtGMINC80LDRgdGB0LjQsiksIHN0cl9yZXBsYWNlLCBzdHJfcmVwZWF0LCBleHBsb2RlLCBhZGRzbGFzaGVzLCB0cmltLgoK0J3QtSDRgNCw0LHQvtGC0LDRjtGCINGBIHV0Zi04OiBzdHJyZXYsIHN0cmxlbiwgc3Vic3RyLCBzdHJwb3MsIHVjZmlyc3QsIHdvcmR3cmFwLCBzdHJfcGFkINC4INCx0L7Qu9GM0YjQuNC90YHRgtCy0L4g0LTRgNGD0LPQuNGFINGB0YLRgNC+0LrQvtCy0YvRhSDRhNGD0L3QutGG0LjQuSwg0LTQu9GPINGA0LDQsdC+0YLRiyDQutC+0YLQvtGA0YvRhSDQvdGD0LbQvdC+INGB0YfQuNGC0LDRgtGMINGH0LjRgdC70L4g0YHQuNC80LLQvtC70L7Qsi4g0J3QtSDRgNCw0LHQvtGC0LDQtdGCINC30LDQtNCw0L3QuNC1INGI0LjRgNC40L3RiyDQsiDRhNGD0L3QutGG0LjRj9GFINCy0YDQvtC00LUgc3ByaW50ZiDQuCBwcmludGYuCgoKbWJzdHJpbmcuZnVuY19vdmVybG9hZAoK0JIg0L3QtdC+0YLQvtGA0YvRhSAo0L3QtdCz0YDQsNC80L7RgtC90YvRhSkg0YPRh9C10LHQvdC40LrQsNGFINGC0Ysg0LzQvtC20LXRiNGMINGD0LLQuNC00LXRgtGMINGB0L7QstC10YIg0LLQutC70Y7Rh9C40YLRjCDQvtC/0YbQuNGOIG1ic3RyaW5nLmZ1bmNfb3ZlcmxvYWQgKNC/0L7QtNGA0L7QsdC90LXQtSDQv9GA0L4g0L3QtdC1OiBodHRwOi8vcC4uLmNvbnRlbnQtYXZhaWxhYmxlLXRvLWF1dGhvci1vbmx5Li4ucC5uZXQvbWFudWFsL3J1L21ic3RyaW5nLm92ZXJsb2FkLnBocCApLiDQndC4INCyINC60L7QtdC8INGB0LvRg9GH0LDQtSDRgtCw0Log0L3QtSDQtNC10LvQsNC5LCDRgtCw0Log0LrQsNC6INGN0YLQviDQuNC30L3QsNGH0LDQu9GM0L3QviDQvdC10L/RgNCw0LLQuNC70YzQvdC+INGB0L/RgNC+0LXQutGC0LjRgNC+0LLQsNC90L3QsNGPINC+0L/RhtC40Y8uINCe0L3QsCDQvdC1INGA0LXRiNCw0LXRgiDQv9GA0L7QsdC70LXQvNGDLCDQtNC70Y8g0LrQvtGC0L7RgNC+0Lkg0LfQsNC00YPQvNGL0LLQsNC70LDRgdGMICjQstC60LvRjtGH0LjRgtGMINCyINGB0YLQsNGA0L7QvCDQv9GA0LjQu9C+0LbQtdC90LjQuCDQuNGB0L/QvtC70YzQt9GD0Y7RidC10Lwg0YTRg9C90LrRhtC40Lgg0LLRgNC+0LTQtSBzdHJsZW4g0L/QvtC00LTQtdGA0LbQutGDIHV0Zi04KSwg0LAg0LvQuNGI0Ywg0YHQvtC30LTQsNC10YIg0L/Rg9GC0LDQvdC40YbRgy4g0J3QsNC/0YDQuNC80LXRgCwg0L/RgNC4INC10LUg0LLQutC70Y7Rh9C10L3QuNC4IHN0cmxlbiDQt9Cw0LzQtdC90Y/QtdGC0YHRjyDQvdCwINC/0L7QtNC00LXRgNC20LjQstCw0Y7RidGD0Y4gdXRmLTggbWJfc3RybGVuLCDQvdC+IHVjZmlyc3Qg0L3QuCDQvdCwINGH0YLQviDQvdC1INC30LDQvNC10L3Rj9C10YLRgdGPINC4INC90LUg0YDQsNCx0L7RgtCw0LXRgi4K

Not running #stdin #stdout 0s 0KB

stdin

copy

Standard input is empty

stdout

copy

Standard output is empty

https://ideone.com/kBwfL9

language:

Text (text 6.10)

created:

visibility:

public

Share or Embed source code

Discover > Sphere Engine API

The brand new service which powers Ideone!

Discover > IDE Widget

Widget for compiling and running the source code in a web browser!

Discover > Sphere Engine API

Discover > IDE Widget

Choose your language