В первую очередь загляните в CRAN Task View: Web Technologies and Services -- на этой странице содержится список пакетов, позволяющих получить доступ и извлечь данные из Интернет.
dplyr
dplyr -- пакет для работы с таблицами (data frames) в R. Основные возможности:
- Фильтрация строк:
filter() - Упорядочение строк:
arrange() - Выбор колонок:
select() - Извлечение уникальных строк:
select() %>% distinct() - Добавление новых колонок:
mutate() - Вычисление итогов:
summarise() - Выбор случайного набора строк:
sample_n(),sample_frac() - Поддержка последовательных операций:
%>%
Виньетка "Введение в dplyr".
datamart
datamart -- содержит набор классов, упрощающих сбор и обработку данных из различных веб-хранилищ. Пример работы с данными из Gapminder.
Комментарии
comments powered by Disqus