PHP-ML: машинное обучение на PHP | OTUS

PHP-ML: машинное обучение на PHP

PHP_Deep_7.4-5020-68d475.png

Принято считать, что для нейронных сетей, искусственного интеллекта и машинного обучения следует использовать специальные языки, такие как R либо универсальный Python. Однако существуют библиотеки для работы с искусственным интеллектом и на PHP.

Одна из таких полноценных библиотек — PHP-ML. Этот проект разработан командой PHP-AI и представляет собой довольно известную библиотеку, которая появилась в 2017 году и сразу стала довольно популярной. При этом сами разработчики утверждают, что их детище стало «свежим подходом к Machine Learning на PHP».

Библиотека поддерживает версию интерпретатора не менее 7.0 и добавляется к проекту через Composer:

composer require php-ai/php-ml

Среди возможностей PHP-ML: • работа с ML-алгоритмами; • перекрестная валидация; • нейросети; • препроцессинг; • извлечение данных и много чего ещё.

Приведём примеры

Давайте рассмотрим PHP-ML на простейшем примере работы с классификацией:

use Phpml\Classification\KNearestNeighbors;

$samples = [[1, 3], [1, 4], [2, 4], [3, 1], [4, 1], [4, 2]];
$labels = ['a', 'a', 'a', 'b', 'b', 'b'];

$classifier = new KNearestNeighbors();
$classifier->train($samples, $labels);

$classifier->predict([3, 2]); 
// возвращается 'b'

В следующем примере мы определяем язык, на котором написан текст:

<?php

    declare(strict_types=1);

    namespace PhpmlExamples;

    include 'vendor/autoload.php';

    use Phpml\Dataset\CsvDataset;
    use Phpml\Dataset\ArrayDataset;
    use Phpml\FeatureExtraction\TokenCountVectorizer;
    use Phpml\Tokenization\WordTokenizer;
    use Phpml\CrossValidation\StratifiedRandomSplit;
    use Phpml\FeatureExtraction\TfIdfTransformer;
    use Phpml\Metric\Accuracy;
    use Phpml\Classification\SVC;
    use Phpml\SupportVectorMachine\Kernel;

    $dataset = new CsvDataset('data/languages.csv', 1);
    $vectorizer = new TokenCountVectorizer(new WordTokenizer());
    $tfIdfTransformer = new TfIdfTransformer();

    $samples = [];
    foreach ($dataset->getSamples() as $sample) {
        $samples[] = $sample[0];
    }

    $vectorizer->fit($samples);
    $vectorizer->transform($samples);

    $tfIdfTransformer->fit($samples);
    $tfIdfTransformer->transform($samples);

    $dataset = new ArrayDataset($samples, $dataset->getTargets());

    $randomSplit = new StratifiedRandomSplit($dataset, 0.1);

    $classifier = new SVC(Kernel::RBF, 10000);
    $classifier->train($randomSplit->getTrainSamples(), $randomSplit->getTrainLabels());

    $predictedLabels = $classifier->predict($randomSplit->getTestSamples());

    echo 'Accuracy: '.Accuracy::score($randomSplit->getTestLabels(), $predictedLabels);

А вот как выполняется предсказание качества вина:

<?php

    declare(strict_types=1);

    namespace PhpmlExamples;

    include 'vendor/autoload.php';

    use Phpml\CrossValidation\StratifiedRandomSplit;
    use Phpml\Dataset\Demo\WineDataset;
    use Phpml\Metric\Accuracy;
    use Phpml\Regression\SVR;
    use Phpml\SupportVectorMachine\Kernel;

    $dataset = new WineDataset();
    $split = new StratifiedRandomSplit($dataset);

    $regression = new SVR(Kernel::RBF, 3, 0.1, 10);
    $regression->train($split->getTrainSamples(), $split->getTrainLabels());

    $predicted = $regression->predict($split->getTestSamples());

    // predicted target are regression result so to test accuracy we must round them

    foreach ($predicted as &$target) {
        $target = round($target, 0);
    }

    echo 'Accuracy: '.Accuracy::score($split->getTestLabels(), $predicted);

Более подробную информацию вы можете найти на GitHub или здесь(документация на русском).

Естественно, библиотека PHP-ML не сделает за вас всё и не избавит от необходимости изучать теоретические данные по нейросетям и машинному обучению. Но если вы php-разработчик и интересуетесь ML-направлением, она может вам пригодиться.

Не пропустите новые полезные статьи!

Спасибо за подписку!

Мы отправили вам письмо для подтверждения вашего email.
С уважением, OTUS!

Автор
0 комментариев
Для комментирования необходимо авторизоваться
Популярное
Сегодня тут пусто