Только для читателей Lifeexample возможно открыть интернет-магазин на Moguta.CMS со скидкой в 15%

<<< Какую CMS для интернет-магазина выбрать начинающему || Анализ скорости загрузки сайта >>>

Как посчитать количество символов на PHP

02.12.2015

Привет читатель блога Lifeexample!

В силу рабочих процессов, мне часто приходится заниматься копирайтингом, что обычно подразумевает использование различных сервисов для анализа текста, в том числе и платных. Я думаю, что можно основные инструменты для копирайтинга, такие как “подсчет количества символов” и “подсчет количества слов”, а также подобные задачи, решить с помощью простого PHP скрипта.

Начнем с задачи “как посчитать количество символов на PHP”, ведь это наиболее важно при оптимизации текста.

Создание формы

Скрипт будет работать с текстом пользователя, а соответственно первым делом необходимо создать поле для ввода текста.

Создаём на локальном сервере файл index.php и пишем в него:

1
2
3
4
5
6
7
8
9
10
11
12
13
<html>
    <head>
        <meta charset="utf-8"/>         //Задаём кодировку юникод
    </head>
    <body>
        <form name="text-form" method="post">   //Форма. Так как исполняющий скрипт будет в этом же файле, то атрибут action заполнять не нужно
            <textarea name="text" cols="80" rows="6"></textarea>  // Поле для ввода текста,  ширина поля 80 символов, высота 6 строк
            <br/>
            <input type="submit" value="Отправить"/>  // Кнопка отправки формы
            <input type="reset" value="Очистить"/> // Кнопка очистки формы
        </form>
    </body>
</html>

Получается вот такая простенькая форма – как раз то, что нам нужно.


1. Как посчитать количество символов на PHP

 

Чтобы посчитать количество символов на php, насколько я помню, необходимо использовать функции strlen(). Добавим её в наш код:

1
2
3
4
5
6
7
8
9
10
11
12
<body>
        <form name="text-form" method="post">
            <textarea name="text" cols="80" rows="6"></textarea>
            <br/>
            <input type="submit" value="Отправить"/>
            <input type="reset" value="Очистить"/>
        </form>
        <?php
        $text=$_POST['text']; // Создаём переменную $text и помещаем в неё наш текст
        echo ‘Количество символов с пробелами: ' , strlen($text); // С помощью функции php strlen() считаем количество символов, и выводим результат на экран
        ?>

</body>

Пробуем, вводим «1111», получаем:

как посчитать количество символов php

Вроде бы работает, пробуем «qwerty», получаем:

Как посчитать количество символов на php

Неплохо! И последний контрольный, пробуем «Привет», получаем:

Как посчитать количество символов на php 2

И снова, довольные, получаем количество символов…12…стоп! П-р-и-в-е-т – 6 букв, что-то не так.

Давайте разбираться! Оказывается, причина такого расхождения в том, что функция strlen() считает длину строки в байтах, а не в символах, а размер кириллических символов в UTF-8: по 2 байта вместо 1 для латинских, этого то я и не учёл.

Для того, чтобы правильно посчитать количество русских символов на php, необходимо использовать функцию mb_strlen() и не забыть указать кодировку:

1
2
3
4
5
6
7
8
9
10
11
12
13
<body>

        <form name="text-form" method="post">
            <textarea name="text" cols="80" rows="6"></textarea>
            <br/>
            <input type="submit" value="Отправить"/>
            <input type="reset" value="Очистить"/>
        </form>
        <?php
        $text=$_POST['text'];
        echo 'Количество символов с пробелами: ' , mb_strlen($text, 'utf-8');  
        ?>//Функция mb_strlen() правильно считает количество кириллических символов
</body>

Пробуем ещё раз с помощью php посчитать количество символов в слове «привет»:

Как правильно посчитать количество слов на php

Вот теперь всё верно!

2. Как посчитать количество символов без пробелов на PHP

Теперь давайте попробуем посчитать количество символов не считая пробелы, для этого используем функцию обработки строк str_replace( ):

1
2
3
4
5
6
7
8
9
10
11
12
13
14
<body>
        <form name="text-form" method="post">
            <textarea name="text" cols="80" rows="6"></textarea>
            <br/>
            <input type="submit" value="Отправить"/>
            <input type="reset" value="Очистить"/>
        </form>
        <?php
        $text=$_POST['text'];
        $text_nonspace=str_replace(array(" "), '', $text); //Ищем в переменной $text пробелы " " и заменяем их на пустоту '', результат записываем в новую переменную $text_nonspace.
        echo 'Количество символов с пробелами: ' , mb_strlen($text, 'utf-8');
        echo '<br/>','Количество сиволов без пробелов: ' , mb_strlen($text_nonspace, 'utf-8');//C помощью той же функции php mb_strlen() считаем количество символов в переменной с вырезанными пробелами.             
        ?>
    </body>

Результат:

Пишем текст «Привет мир!»

Как посчитать количество сиволов без пробелов php

3. Как сделать, чтобы форма не очищалась после отправки

Идём дальше, как мне кажется, не совсем удобно, что текст из формы пропадает после нажатия на кнопку «Отправить». Давайте попробуем это исправить.

Для этого нам нужно, чтобы при загрузке формы проверялось, есть ли значение в Post и, если есть, подставлялось в форму.

Получилось вот так:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
<body>
        <form name="text-form" method="post">
            <textarea name="text" cols="80" rows="6"><?php if (isset($_POST['text'])) echo $_POST['text']; else echo "Введите текст";?></textarea> //Определяется, была ли установлена переменная $_POST['text'], если да, выводит её значение, если нет, выводит “Введите текст”

            <br/>
            <input type="submit" value="Отправить"/>
            <input type="reset" value="Очистить"/>
        </form>
        <?php
        $text=$_POST['text'];
        $text_nonspace=str_replace(array(" "), '', $text);
        echo 'Количесвто символов с пробелом: ' , mb_strlen($text, 'utf-8');
        echo '<br/>','Количество символов без пробела: ' , mb_strlen($text_nonspace, 'utf-8');             
        ?>
</body>

4. Как посчитать количество слов на PHP

Функционал всё растёт, код всё увеличивается. Что дальше? Как посчитать количество символов на php, мы разобрались, теперь давайте попробуем посчитать количество слов.

Сначала мне пришла в голову мысль, что это можно реализовать просто посчитав все пробелы в тексте, но, как оказалось, PHP нам предлагает готовую функцию —  str_word_count().

Однако, и тут всё не так просто, как кажется — попробовав функцию в деле, я обнаружил, что она тоже не умеет работать с кириллицей. Не долго думая я написал

str_word_count($text, ‘utf-8’), но функция совсем перестала работать.

Погуглив, я узнал, что заставить функцию работать правильно можно только прописав в charlist все кириллические символы, причём и верхним и нижним регистром. Что такое charlist? Сейчас объясню.

Функция str_word_count() имеет 3 параметра:

  1. String – строка. Обязательный параметр, переменная с текстом.
  2. Format — Указывает возвращаемое значение данной функции.
  • 0 — возвращает количество найденных слов
  • 1 — возвращается массив, содержащий все слова, входящие в строку string
  • 2 — возвращается массив, индексами которого являются позиции в строке string, а значениями — соответствующие слова.
  1. Charlist — Список дополнительных символов, которые будут рассматриваться как «слово».

Синтаксис такой: str_word_count(String, format, ‘charlist’), например, str_word_count($text, 0, ‘абв‘).

Таким образом, наша функция должна выглядеть так:

str_word_count($str,0,»АаБбВвГгДдЕеЁёЖжЗзИиЙйКкЛлМмНнОоПпРрСсТтУуФфХхЦцЧчШшЩщЪъЫыЬьЭэЮюЯя»)

Немного подумав, можно укоротить эту строчку. В таблице ASCII все русские буквы (кроме «Ё» и «ё») имеют коды с 192 по 256. Также, у нас есть функция chr(), которая возвращает символ по его коду. Можно сделать простой цикл, который сам запишет в переменную буквы русского алфавита. Понадобится ещё функция iconv(), чтобы перевести текст из кодировки utf-8 в cp1251, так как в utf-8 другие коды символов.

1
2
3
4
5
6
<? 
for ( $i = 192; $i < 256; $i++ ) { 
  $abc. = chr($i); //Цикл на каждом шагу добавляет к переменной $abc новую букву
}
$abc=iconv( 'cp1251', 'utf-8', $abc); //Переводим строку из кодировки utf-8 в сз1251
echo 'Количество слов в тексте: ', str_word_count($text,0,$abc);?>

Получилось не намного короче, зато более логично. Мы же всё таки программированием занимаемся. В итоге наш код будет выглядеть так:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
<body>
        <form name="text-form" method="post">
            <textarea name="text" cols="80" rows="6"><?php if (isset($_POST['text'])) echo $_POST['text']; else echo "Введите текст";?></textarea>
            <br/>
            <input type="submit" value="Отправить"/>
            <input type="reset" value="Очистить"/>
        </form>
        <?php
        $text=$_POST['text'];
        $text_nonspace=str_replace(array(" "), '', $text);
        echo 'Количество символов с пробелами: ' , mb_strlen($text, 'utf-8');
        echo '<br/>','Количество символов без пробелов: ' , mb_strlen($text_nonspace, 'utf-8');   
        for ( $i = 192; $i < 256; $i++ ) {$abc .= chr($i);}
        $abc=iconv( 'cp1251', 'utf-8', $abc);
        echo '<br/>','Количество слов в тексте: ', str_word_count($text,0,$abc);      
           
        ?>
    </body>

В браузере же это выглядит вот так:

Как посчитать количество слов php

На сегодня всё, теперь вы легко можете посчитать количество символов на PHP. Если всё-таки у вас остались вопросы – не стесняйтесь, задавайте в комментариях, отвечу всем.

Успехов вам и до новых встреч!

Чтобы не пропустить публикацию следующей статьи подписывайтесь на рассылку по E-mail или RSS ленту блога.

Нравится

Комментарии

  • Лилия

    Спасибо за статью!
    А можно сделать подсчет количества символов в реальном времени
    при наборе, чтобы сразу.

  • boy cat names

    Выделяем тот абзац, где хотим посчитать количество символов. Либо выделяем весь текст и жмем на вкладку

  • Alex

    Здравствуйте. а как можно посчитать слова на любом языке?

  • Оставить комментарий

    Не отвечать

    Подписаться на комментарии к этой статье по RSS

    Яндекс.Метрика