Образовательный центр
интернет профессий
Навигация по статье
Что такое язык R и в чем его преимуществаУстановка языка R и среды установки RStudio на WindowsНастраиваем проект в Google Cloud Console для работы с Google Analytics APIПример работы с API Google Analytics 4 на языке R
Маркетинг

Как работать с API Google Analytics 4 на языке R: воркшоп от эксперта Netpeak

135

Что такое язык R и в чем его преимущества

Язык R — это язык программирования для статистической обработки данных и работы с графикой. В числе его выраженных преимуществ:

  • кроссплатформенность. Его можно установить на Windows, MacOS, Linux. Скрипты, которые будут написаны на одной из этих операционных систем, можно практически без изменений запускать на другой;
  • язык R имеет более 15 000 дополнительных пакетов, которые существенно расширяют его базовые возможности. Т. е. практически под любую вашу задачу на R вы найдете на 80% готовое решение;
  • язык R — это Open Source. Бесплатный инструмент с открытым исходным кодом. При работе с ним платить не придется;
  • также язык R имеет удобную среду разработки RStudio.

Установка языка R и среды установки RStudio на Windows

При установке никаких особо сложных манипуляций не потребуется. Просто запустите установщик языка R. Здесь все предельно просто, остается дождаться завершения процесса установки.

А непосредственно скачать инструмент можно на сайте проекта CRAN, на котором хранятся все файлы языка R.

RStudio можно скачать с официальной страницы. Программа здесь представлена в нескольких вариантах. Но для 99% ваших задач будет достаточно версии RStudio Desktop. Это бесплатное приложение, которое делает разработку R-скриптов гораздо более комфортным.

Обратите внимание, в первую очередь необходимо установить сам язык R, только потом среду разработки RStudio. Действия, выполняемые в процессе установки стандартные, как у подавляющего большинства программ, устанавливаемых на компьютер.

Настраиваем проект в Google Cloud Console для работы с Google Analytics API

Пока идет установка открываем Google Cloud Platform. Для того чтобы работать с Google Analytics или любым другим доступным Google API, необходимо создать проект в Google Cloud. Создается он предельно просто.

  1. Выбираем выпадающее меню «API project» со списком проектов, который будет пуст, если создается первый проект. Далее нажимаем клавишу «New project» и задаем произвольное имя проекта.
  2. Теперь открываем наш новый проект. В нашем примере это Yaglavebinar. Следом открываем основное меню, находящееся под значком трех горизонтальных линий, выбираем раздел «API&Services» и через пункт «congent screen» переходим на экран авторизации. Здесь нам необходимо заполнить несколько полей и нажать «Create».
  3. Далее в первой строке вводим имя нашего приложения, оно может быть произвольным. Во второй строке вводим почтовый адрес, сохраняем введенную информацию.
  4. Следующий экран можно пропустить без внесения изменений. А уже на вкладке «Test users» добавить дополнительные почтовые адреса, через которые у нас есть доступ к Google Analytics. Теперь снова сохраняем данные и возвращаемся к основной панели.
  5. Экран авторизации у нас создан, на следующем этапе необходимо создать клиент для авторизации. Для этого нажимаем на клавишу «Credentials» и тапаем «Create Credentials». В выпадающем окне выбираем вторую сверху позицию «Create OAuth client ID». И там, где идет выбор типа приложения, кликаем «Desktop app». Задаем имя приложению.
  6. Теперь нажимаем «Create», и на этом в принципе процесс создания завершен. Остается скачать клиент для авторизации в виде JSON-файла.

И последнее, что нам предстоит сделать в Google Cloud консоли, это активация всех API, связанных с Google Analytics. Для этого переходим в меню «Library», пишем в поисковой строке «Google Analytics». Перед нами открывается экран с API интерфейсами. Теперь заходим в каждый из них поочереди и нажимаем кнопку «ENABLE».

На этом процесс настройки проекта в Google Cloud завершен.

Пример работы с API Google Analytics 4 на языке R

Далее запускаем RStudio. В работе нам понадобится три окна. Поэтому заходим в меню «View» и выбираем пункт «Show».

Код, как правило, прописывается в верхней левой панели. Внизу слева располагается консоль, в которой мы будем видеть вывод команд. В верхней правой части будут отображаться объекты, которые мы будем создавать в ходе R-сессии. А нижняя правая часть отвечает за построение графиков и справку по любой из функций.

Установка дополнительных пакетов расширяющих возможности языка R

Для начала нам необходимо установить дополнительные пакеты расширений, которые устанавливаются одной командой. Вводим «install packages» и перечисляем наименования паков, которые нам предстоит установить. В нашем примере это: google analytics, dplyr, tidyr, ggplot2.

Пакеты следует рассматривать как дополнительное программное обеспечение, которое необходимо установить один раз, а подключать или отключать по необходимости. Осуществляется это при помощи команды «Library» с указанием наименований пакетов в скобках. Выполнение кода задается совместным нажатием клавиш Ctrl+Enter по нужной строке.

Двигаемся дальше. Для того чтобы пройти авторизацию, необходимо использовать клиент, который создавался в Google Cloud и был сохранен в виде JSON-файла. Воспользовавшись функцией «Google AuthR», передаем путь к этому файлу. Далее запускаем выполнение нашей функции авторизации, которая проходит уже через браузер.

В браузере мы выбираем нужный нам аккаунт, указываем пакет разрешений, которые будут работать с API. Если все сделано верно, появится сообщение об успешной авторизации. После этого можно возвращаться к работе с языком R.

И первое, что мы здесь можем сделать, это запросить, к примеру, список аккаунтов Google Analytics 4, который доступен под логином авторизации (или несколькими логинами). Выполняется это с помощью функции «gaa_account_list», в которую передается значение ga4. Таким образом вы получите ваши аккаунты.

Обратите внимание, что при указании пути задается именно ga4. В противном случае получите совершенно другой перечень аккаунтов, не предназначенных для работы с Google Analytics 4. На самом деле язык R позволяет работать не только с 4 версией Google Analytics, но и с универсальной. Но в сегодняшнем примере мы рассматриваем именно четверку.

Далее, чтобы запросить какой-либо отчет из Google Analytics, мы должны получить список всех доступных полей. Делается это с помощью функции «gaa_meta». Получаем вот такую табличку с наименованиями полей, которые есть в app и названиями в веб-интерфейсе. Также здесь есть пункты «описание», «категории» и некоторые другие данные о каждом из полей.

Кроме того, тот же самый список по работе API можно найти в официальной справке. Это если вы не хотите запрашивать его через R.

На следующем этапе создаем переменную «my_property_id», указываем идентификатор. В дальнейшем мы будем использовать эту переменную для запроса отчетов из какого-то определенного аккаунта Google Analytics 4.

Все отчеты запрашиваются с помощью функции «gaa_data», которая имеет достаточно большой набор аргументов. И сейчас мы рассмотрим самые актуальные, которые приходится использовать чаще всего.

В первую очередь мы должны передать идентификатор аккаунта, из которого мы будем запрашивать данные «my_property_id». Далее перечисляем список показателей и параметров, по которым будем получать отчет. В самом конце в аргумент «date_range» передаем дату начала и завершения отчетного периода.

Обратите внимание, все параметры мы передаем с помощью конструкции «С». Эта функция создает массив значений.

Следующим шагом выделяем фрагмент нашего кода и нажимаем сочетание клавиш Ctrl+Enter. Полученный результат присваиваем объекту под названием «basic». Через правый верхний блок можно открыть таблицу и посмотреть, что полученный отчет действительно состоит из полей, которые мы запросили.

Дальше переходим к функции «qplot», которая дает нам возможность построить график в R. В число базовых аргументов этой функции входят «x» и «y». В них необходимо передать поля, которые будут соответствовать одноименным осям. Следом нужно передать название таблицы, откуда предстоит брать данные. В нашем примере это basic. Передать типы графиков, цвет для закрашивания линий, наименования графиков и осей. В нижней правой части экрана появляется график.

На самом деле разновидностей таких графиков очень много. При желании можно ознакомиться с галереей данного пакета и посмотреть примеры кодов.

Дополнительно мы можем запросить отчет о каких-либо событиях. При этом также используется функция «gaa_data», где в «metrics» мы передаем поле «event count» (количество совершенных событий). А в параметры мы опять же передаем дату, наименование событий и, к примеру, группу источников по умолчанию.

В результате мы получаем еще одну таблицу «events» с необходимыми нам полями. Но работать с данными в таком виде крайне неудобно. Потому что мы предполагали, что каждое событие у нас будет отдельным полем. Но в итоге получили данные, в которых под названия событий есть только одно выделенное поле «event name». Такую таблицу достаточно сложно использовать для визуализации или какой-то дальнейшей работы.

Но решение есть — эти данные мы можем переформатировать. Для этого мы будем использовать функцию «pivot wider». Функция у нас идет из пакета «tidyr», который мы установили и подключили. По сути, она аналогична сводным таблицам в Excel.

Здесь мы задаем параметры, которые будут у нас в строках «id.cois». Указываем, откуда необходимо получить «names_from», а также задаем область столбцов «values_from». После выполнения наша таблица оказывается переформатированной. Теперь каждое событие отображается в отдельном поле.

В результате по событиям мы также можем построить соответствующую визуализацию. Здесь мы используем другой тип графика — столбчатую диаграмму. В ней мы видим количество сеансов по источникам из каждой группы каналов.

Хотите тоже написать статью для читателей Yagla? Если вам есть что рассказать про маркетинг, аналитику, бизнес, управление, карьеру для новичков, маркетологов и предпринимателей. Тогда заведите себе блог на Yagla прямо сейчас и пишите статьи. Это бесплатно и просто
Алексей Селезнев, Netpeak
135
0