Как работать с API Google Analytics 4 на языке R: воркшоп от эксперта Netpeak
Что такое язык R и в чем его преимущества
Язык R — это язык программирования для статистической обработки данных и работы с графикой. В числе его выраженных преимуществ:
- кроссплатформенность. Его можно установить на Windows, MacOS, Linux. Скрипты, которые будут написаны на одной из этих операционных систем, можно практически без изменений запускать на другой;
- язык R имеет более 15 000 дополнительных пакетов, которые существенно расширяют его базовые возможности. Т. е. практически под любую вашу задачу на R вы найдете на 80% готовое решение;
- язык R — это Open Source. Бесплатный инструмент с открытым исходным кодом. При работе с ним платить не придется;
- также язык R имеет удобную среду разработки RStudio.
Установка языка R и среды установки RStudio на Windows
При установке никаких особо сложных манипуляций не потребуется. Просто запустите установщик языка R. Здесь все предельно просто, остается дождаться завершения процесса установки.
А непосредственно скачать инструмент можно на сайте проекта CRAN, на котором хранятся все файлы языка R.
RStudio можно скачать с официальной страницы. Программа здесь представлена в нескольких вариантах. Но для 99% ваших задач будет достаточно версии RStudio Desktop. Это бесплатное приложение, которое делает разработку R-скриптов гораздо более комфортным.
Обратите внимание, в первую очередь необходимо установить сам язык R, только потом среду разработки RStudio. Действия, выполняемые в процессе установки стандартные, как у подавляющего большинства программ, устанавливаемых на компьютер.
Настраиваем проект в Google Cloud Console для работы с Google Analytics API
Пока идет установка открываем Google Cloud Platform. Для того чтобы работать с Google Analytics или любым другим доступным Google API, необходимо создать проект в Google Cloud. Создается он предельно просто.
- Выбираем выпадающее меню «API project» со списком проектов, который будет пуст, если создается первый проект. Далее нажимаем клавишу «New project» и задаем произвольное имя проекта.
- Теперь открываем наш новый проект. В нашем примере это Yaglavebinar. Следом открываем основное меню, находящееся под значком трех горизонтальных линий, выбираем раздел «API&Services» и через пункт «congent screen» переходим на экран авторизации. Здесь нам необходимо заполнить несколько полей и нажать «Create».
- Далее в первой строке вводим имя нашего приложения, оно может быть произвольным. Во второй строке вводим почтовый адрес, сохраняем введенную информацию.
- Следующий экран можно пропустить без внесения изменений. А уже на вкладке «Test users» добавить дополнительные почтовые адреса, через которые у нас есть доступ к Google Analytics. Теперь снова сохраняем данные и возвращаемся к основной панели.
- Экран авторизации у нас создан, на следующем этапе необходимо создать клиент для авторизации. Для этого нажимаем на клавишу «Credentials» и тапаем «Create Credentials». В выпадающем окне выбираем вторую сверху позицию «Create OAuth client ID». И там, где идет выбор типа приложения, кликаем «Desktop app». Задаем имя приложению.
- Теперь нажимаем «Create», и на этом в принципе процесс создания завершен. Остается скачать клиент для авторизации в виде JSON-файла.
И последнее, что нам предстоит сделать в Google Cloud консоли, это активация всех API, связанных с Google Analytics. Для этого переходим в меню «Library», пишем в поисковой строке «Google Analytics». Перед нами открывается экран с API интерфейсами. Теперь заходим в каждый из них поочереди и нажимаем кнопку «ENABLE».
На этом процесс настройки проекта в Google Cloud завершен.
Пример работы с API Google Analytics 4 на языке R
Далее запускаем RStudio. В работе нам понадобится три окна. Поэтому заходим в меню «View» и выбираем пункт «Show».
Код, как правило, прописывается в верхней левой панели. Внизу слева располагается консоль, в которой мы будем видеть вывод команд. В верхней правой части будут отображаться объекты, которые мы будем создавать в ходе R-сессии. А нижняя правая часть отвечает за построение графиков и справку по любой из функций.
Установка дополнительных пакетов расширяющих возможности языка R
Для начала нам необходимо установить дополнительные пакеты расширений, которые устанавливаются одной командой. Вводим «install packages» и перечисляем наименования паков, которые нам предстоит установить. В нашем примере это: google analytics, dplyr, tidyr, ggplot2.
Пакеты следует рассматривать как дополнительное программное обеспечение, которое необходимо установить один раз, а подключать или отключать по необходимости. Осуществляется это при помощи команды «Library» с указанием наименований пакетов в скобках. Выполнение кода задается совместным нажатием клавиш Ctrl+Enter по нужной строке.
Двигаемся дальше. Для того чтобы пройти авторизацию, необходимо использовать клиент, который создавался в Google Cloud и был сохранен в виде JSON-файла. Воспользовавшись функцией «Google AuthR», передаем путь к этому файлу. Далее запускаем выполнение нашей функции авторизации, которая проходит уже через браузер.
В браузере мы выбираем нужный нам аккаунт, указываем пакет разрешений, которые будут работать с API. Если все сделано верно, появится сообщение об успешной авторизации. После этого можно возвращаться к работе с языком R.
И первое, что мы здесь можем сделать, это запросить, к примеру, список аккаунтов Google Analytics 4, который доступен под логином авторизации (или несколькими логинами). Выполняется это с помощью функции «gaa_account_list», в которую передается значение ga4. Таким образом вы получите ваши аккаунты.
Обратите внимание, что при указании пути задается именно ga4. В противном случае получите совершенно другой перечень аккаунтов, не предназначенных для работы с Google Analytics 4. На самом деле язык R позволяет работать не только с 4 версией Google Analytics, но и с универсальной. Но в сегодняшнем примере мы рассматриваем именно четверку.
Далее, чтобы запросить какой-либо отчет из Google Analytics, мы должны получить список всех доступных полей. Делается это с помощью функции «gaa_meta». Получаем вот такую табличку с наименованиями полей, которые есть в app и названиями в веб-интерфейсе. Также здесь есть пункты «описание», «категории» и некоторые другие данные о каждом из полей.
Кроме того, тот же самый список по работе API можно найти в официальной справке. Это если вы не хотите запрашивать его через R.
На следующем этапе создаем переменную «my_property_id», указываем идентификатор. В дальнейшем мы будем использовать эту переменную для запроса отчетов из какого-то определенного аккаунта Google Analytics 4.
Все отчеты запрашиваются с помощью функции «gaa_data», которая имеет достаточно большой набор аргументов. И сейчас мы рассмотрим самые актуальные, которые приходится использовать чаще всего.
В первую очередь мы должны передать идентификатор аккаунта, из которого мы будем запрашивать данные «my_property_id». Далее перечисляем список показателей и параметров, по которым будем получать отчет. В самом конце в аргумент «date_range» передаем дату начала и завершения отчетного периода.
Обратите внимание, все параметры мы передаем с помощью конструкции «С». Эта функция создает массив значений.
Следующим шагом выделяем фрагмент нашего кода и нажимаем сочетание клавиш Ctrl+Enter. Полученный результат присваиваем объекту под названием «basic». Через правый верхний блок можно открыть таблицу и посмотреть, что полученный отчет действительно состоит из полей, которые мы запросили.
Дальше переходим к функции «qplot», которая дает нам возможность построить график в R. В число базовых аргументов этой функции входят «x» и «y». В них необходимо передать поля, которые будут соответствовать одноименным осям. Следом нужно передать название таблицы, откуда предстоит брать данные. В нашем примере это basic. Передать типы графиков, цвет для закрашивания линий, наименования графиков и осей. В нижней правой части экрана появляется график.
На самом деле разновидностей таких графиков очень много. При желании можно ознакомиться с галереей данного пакета и посмотреть примеры кодов.
Дополнительно мы можем запросить отчет о каких-либо событиях. При этом также используется функция «gaa_data», где в «metrics» мы передаем поле «event count» (количество совершенных событий). А в параметры мы опять же передаем дату, наименование событий и, к примеру, группу источников по умолчанию.
В результате мы получаем еще одну таблицу «events» с необходимыми нам полями. Но работать с данными в таком виде крайне неудобно. Потому что мы предполагали, что каждое событие у нас будет отдельным полем. Но в итоге получили данные, в которых под названия событий есть только одно выделенное поле «event name». Такую таблицу достаточно сложно использовать для визуализации или какой-то дальнейшей работы.
Но решение есть — эти данные мы можем переформатировать. Для этого мы будем использовать функцию «pivot wider». Функция у нас идет из пакета «tidyr», который мы установили и подключили. По сути, она аналогична сводным таблицам в Excel.
Здесь мы задаем параметры, которые будут у нас в строках «id.cois». Указываем, откуда необходимо получить «names_from», а также задаем область столбцов «values_from». После выполнения наша таблица оказывается переформатированной. Теперь каждое событие отображается в отдельном поле.
В результате по событиям мы также можем построить соответствующую визуализацию. Здесь мы используем другой тип графика — столбчатую диаграмму. В ней мы видим количество сеансов по источникам из каждой группы каналов.
Как работает Call Tracking: обзор технологии Статья
7 лучших книг по контекстной рекламе и веб-аналитике Статья
Всё, что нужно знать про новые типы целей в Яндекс.Метрике Статья
Как удалить отзыв на Яндекс Картах? Статья
Проверяем, есть ли монетизация контента на Рутубе на 2024 год Статья
Как провести технический аудит сайта: чек-лист с полезными сервисами от SEO-специалиста Статья
Как стабильно получать результат с помощью таргета в Telegram Статья
Сеошное фаталити: кейс по продвижению сайта сети компьютерных клубов с нуля до 10К + визитов в месяц Статья
Как качественно работать в сфере нутра арбитража и какие офферы лучше выбирать? Статья