Разное

R язык: The R Project for Statistical Computing

Содержание

Язык R для пользователей Excel (бесплатный видео курс) / Хабр

В связи с карантином многие сейчас львиную долю времени проводят дома, и это время можно, и даже нужно провести с пользой.

В начале карантина я решил довести до ума некоторые проекты начатые несколько месяцев назад. Одним из таких проектов был видео курс «Язык R для пользователей Excel». Этим курсом я хотел снизить порог вхождения в R, и немного восполнить существующий дефицит обучающих материалов по данной теме на русском языке.

Если всю работу с данными в компании, в котороый вы работаете принято по-прежнему вести в Excel, то предлагаю вам познакомится с более современным, и при этом совершенно бесплатным инструментом анализа данных.

Если вы интересуетесь анализом данных возможно вам будут интересны мои telegram и youtube каналы. Большая часть контента которых посвящены языку R.

  1. Ссылки
  2. О курсе
  3. Для кого этот курс
  4. Программа курса

    4.1. Урок 1: Установка языка R и среды разработки RStudio

    4.2. Урок 2: Основные структуры данных в R

    4.3. Урок 3: Чтение данных из TSV, CSV, Excel файлов и Google Таблиц

    4.4. Урок 4: Фильтрация строк, выбор и переименование столбцов, пайпланы в R

    4.5. Урок 5: Добавление вычисляемых столбцов в таблицу на языке R

    4.6. Урок 6: Группировка и агрегация данных на языке R

    4.7. Урок 7: Вертикальное и горизонтальное объединение таблиц на языке R

    4.8. Урок 8: Оконные функции в R

    4.9. Урок 9: Вращение таблиц или аналог сводных таблиц в R

    4.10. Урок 10: Загрузка JSON файлов в R и преобразование списков в таблицы

    4.11. Урок 11: Быстрое построение графиков с помощью функции qplot()

    4.12. Урок 12: Построение графиков слой за слоем с помощью пакета ggplot2

    4.13. Урок 13: Изменение элементов графика и применение тем в ggplot2
  5. Заключение

Курс построен вокруг архитектуры tidyverse, и входящих в неё пакетов: readr, vroom, dplyr, tidyr, ggplot2. Конечно в R есть и другие хорошие пакеты выполняющие подобные операции, например data.table, но синтаксис tidyverse интуитивно понятен, его легко читать даже неподготовленному пользователю, поэтому я думаю, что начинать обучение языку R лучше именно с tidyverse.

Курс проведёт вас через все операции анализа данных, от загрузки до визуализации готового результата.

Почему именно язык R, а не Python? Потому, что R функциональный язык, пользователям Excel на него перейти легче, т.к. не надо вникать в традиционное объектно-ориентированное программирование.

На данный момент запланировано 13 видео уроков длительностью от 5 до 20 минут каждый.

Уроки будут открываться постепенно. Каждый понедельник я буду открывать доступ к новому уроку у себя на YouTube канале в отдельном плей листе.

Думаю это понятно из названия, тем не менее опишу более подробно.

Курс ориентирован на тех, кто в работе активно использует Microsoft Excel и там же реализует всю работу с данными. В общем, если вы открываете приложение Microsoft Excel хотя бы раз в неделю то курс вам подойдёт.

Навыков программирования для прохождения курса от вас не требуется, т.к. курс ориентирован на начинающих.

Но, возможно начиная с 4 урока найдётся материал интересный и для активных пользователей R, т.к. основной функционал таких пакетов как dplyr и tidyr будет рассмотрен достаточно подробно.


Урок 1: Установка языка R и среды разработки RStudio

Дата публикации: 23 марта 2020

Ссылки:

Видео:

Описание:

Вступительный урок в ходе которого мы скачаем и установим необходимое программное обеспечение, и немного разберём возможности и интерфейс среды разработки RStudio.

Тест
Ссылка на тест для проверки знаний.


Урок 2: Основные структуры данных в R

Дата публикации: 30 марта 2020

Ссылки:

Видео:

Описание:

Этот урок поможет вам разобраться с тем, какие структуры данных есть в языке R. Мы подробно разберём векторы, дата фреймы и списки. Научимся их создавать и обращаться к их отдельным элементам.

Тест
Ссылка на тест для проверки знаний.


Урок 3: Чтение данных из TSV, CSV, Excel файлов и Google Таблиц

Дата публикации: 6 апреля 2020

Ссылки:

Видео:

Описание:

Работа с данными, не зависимо от инструмента, начинается с их добычи. В ходе урока используются пакеты vroom, readxl, googlesheets4 для загрузки данных в среду R из csv, tsv, Excel файлов и Google Таблиц.

Тест
Ссылка на тест для проверки знаний.


Урок 4: Фильтрация строк, выбор и переименование столбцов, пайпланы в R

Дата публикации: 13 апреля 2020

Ссылки:

Видео:

Описание:

Этот урок посвящён пакету dplyr. В нём мы разберёмся как фильтровать датафреймы, выбирать нужные столбцы и переименовывать их.

Также узнаем что такое пайпланы и как они помогают делать ваш код на языке R более читабельным.

Тест
Ссылка на тест для проверки знаний.


Урок 5: Добавление вычисляемых столбцов в таблицу на языке R

Дата публикации: 20 апреля 2020

Ссылки:

Видео:

Описание:

В этом видео мы продолжаем знакомство с библиотекой tidyverse и пакетом dplyr.

Разберём семейство функций mutate(), и научимся с их помощью добавлять в таблицу новые вычисляемые столбцы.

Тест
Ссылка на тест для проверки знаний.


Урок 6: Группировка и агрегация данных на языке R

Дата публикации: 27 апреля 2020

Ссылки:

Видео:

Описание:

Данный урок посвящён одной из основных операций анализа данных, группировке и агрегации. В ходе урока мы будем использовать пакет dplyr и функции group_by() и summarise().

Мы рассмотрим всё семейство функций summarise(), т.е. summarise(), summarise_if() и summarise_at().

Тест
Ссылка на тест для проверки знаний.


Урок 7: Вертикальное и горизонтальное объединение таблиц на языке R

Дата публикации: 4 мая 2020

Ссылки:

Видео:

Описание:

Этот урок поможет вам разобраться с операциями вертикального и горизонтального объединения таблиц.

Вертикальное объединение является аналогом операции UNION в языке запросов SQL.

Горизонтальное объединение пользователям Excel более известно благодаря функции ВПР, в SQL такие операции осуществляются оператором JOIN.

В ходе урока мы решим практическую задачу, в ходе которой будем использовать пакеты dplyr, readxl, tidyr и stringr.

Основные функции которые мы рассмотрим:

  • bind_rows() — вертикальное объединение таблиц
  • left_join() — горизонтальное объединение таблиц
  • semi_join() — включающее объединение таблиц
  • anti_join() — исключающее объединение таблиц

Тест
Ссылка на тест для проверки знаний.


Урок 8: Оконные функции в R

Дата публикации: 11 мая 2020

Ссылки:

Видео:

Описание:

Оконные функции по смыслу похожи на агрегирующие, они также принимают на вход массив значений и проводят над ними арифметические операции, но в исходящем результате не изменяют количество строк.

В этом уроке мы продолжаем изучать пакет dplyr, и функции group_by(), mutate(), а также новые cumsum(), lag(), lead() и arrange().

Тест
Ссылка на тест для проверки знаний.


Урок 9: Вращение таблиц или аналог сводных таблиц в R

Дата публикации: 18 мая 2020

Ссылки:

Видео:

Описание:

Большинство пользователей Excel используют сводные таблицы, это удобный инструмент с помощью которого вы можете в считанные секунды превратить массив сырых данных в читабельные отчёты.

В этом уроке мы разберёмся с тем как вращать таблицы в R, и преобразовывать их из широко формата в длинный и наоборот.

Большая часть урока посвящена пакету tidyr и функциям pivot_longer() и pivot_wider().

Тест
Ссылка на тест для проверки знаний.


Урок 10: Загрузка JSON файлов в R и преобразование списков в таблицы

Дата публикации: 25 мая 2020

Ссылки:

Видео:

Описание:

JSON и XML являются чрезвычайно популярными форматами хранения и обмена информацией, как правило, за счёт своей компактности.

Но анализировать данные представленные в таких форматах сложно, поэтому их перед анализом необходимо привести к табличному виду, именно этому мы и научимся в данном видео.

Урок посвящён пакету tidyr, входящему в ядро библиотеки tidyverse, и функциям unnest_longer(), unnest_wider() и hoist().

Тест
Ссылка на тест для проверки знаний.


Урок 11: Быстрое построение графиков с помощью функции qplot()

Дата публикации: 1 июня 2020

Ссылки:

Видео:

Описание:

Пакет ggplot2 является одним из наиболее популярных средств визуализации данных не только в R.

В этом уроке мы научимся построению простейших графиков с помощью функции qplot(), и разберём все её аргументы.

Тест
Ссылка на тест для проверки знаний.


Урок 12: Построение графиков слой за слоем с помощью пакета ggplot2

Дата публикации: 8 июня 2020

Ссылки:

Видео:

Описание:

В уроке продемонстрирована вся мощь пакета ggplot2 и заложенной в него грамматики построения графиков слоями.

Мы разберём основные геометрии которые присутствуют в пакете и научимся накладывать слои для построения графика.

Тест
Ссылка на тест для проверки знаний.


Урок 13: Изменение элементов графика и применение тем в ggplot2

Дата публикации: 15 июня 2020

Ссылки:

Описание:

Заключительный урок курса посвящён приведению готовых графиков к корпоративному стилю, мы научимся применять готовые темы из пакетов ggthemes и ggthemr, и разберёмся со слоем theme().

Видео:

Тест
Ссылка на тест для проверки знаний.


Я старался подойти к формированию программы курса максимально лаконично, выделить только самую необходимую информацию которая понадобится вам для того, что бы сделать первые шаги в изучении такого мощного инструмента анализа данных как язык R.

Курс не является исчерпывающим руководством по анализу данных с помощью языка R, но поможет вам разобраться со всеми необходимыми для этого приёмами.

Пока программа курса рассчитана на 12 недель, каждую неделю, по понедельникам я буду открывать доступ к новым урокам, поэтому рекомендую подписаться на YouTube канал, что бы не пропустить публикацию нового урока.

Язык R — стандарт для обработки данных

Недавно столкнулся с таким феноменом — про язык программирования R слышали многие. Но знают что это такое очень мало людей.

Поскольку являюсь носителем этого языка и заинтересован в его популяризации, попытаюсь немного раскрыть тему в этом посте. Будет интересно!

План простой:

1) Что такое язык R

2) Популярность в России

Что такое язык R

R (вики) — язык программирования для статистической обработки данных и работы с графикой, а также свободная программная среда вычислений с открытым исходным кодом в рамках проекта GNU.

По нашему: Язык идеально подходящий для поиска рыночных закономерностей. Бесплатный, быстрый и свободный.

Он позволяет вести статистические исследования всего до чего могут дотянуться руки. За годы его существования появились десятки и сотни расширений для решения практически любых прикладных задач.

Это САМЫЙ популярный язык программирования алготрейдеров на западе. Это передовая того что сейчас доступно в области машинного обучения и статистики.

Для того чтобы писать программы на R, достаточно скачать R-Studio и всё

 

Некоторое время назад, в рамках популяризации языка, записал мини-курс «R для каждого». Бесплатный. Посмотрите как просто всё это работает и как быстро на нём писать скрипты. Это просто великолепно!

Популярность в России

Оставляет желать лучшего.

Если на западе 90% всех исследований проводиться с помощью этого языка, то в России редкая неделя проходит на СмартЛабе, в которой можно найти хоть одно упоминание о нём. Т.е. число людей знающих R — критически мало.

В числе причин такой ситуации: отсутствие пособий на русском до недавнего времени, отсутствие обучающий курсов, низкая грамотность трейдеров и ещё много чего. Не будем об этом.

Важно лишь то, что популярность этого языка в России и СНГ неуклонно растёт.

Российские пользователи устали от неработающих АПИ и дорогих торговых систем. Бесплатный язык R, в контексте трейденга, очень скоро займёт достойное место в их инструментарии. Присоединяйся!

На этом сегодня всё. Надеюсь было интересно.

Смотрите мой бесплатный курс, чтобы понять, как просто писать код. Пишите роботов!

Тестируйте Ваши торговые идеи при помощи лучшего для этого инструмента!

Ссылки:

1) Википедия про R

2) Мой бесплатный мини-курс по R

3) Прекрасная возможность выучить его за два месяца

Функции в R | Андрей Акиньшин

Функции в R


  R
R-functions

В R очень много разных полезных функций. И многие большие вещи можно сделать весьма быстро, написав очень мало кода. На официальном сайте есть замечательная шпаргалка на английском языке: R reference card. В сети есть несколько вольных урезанных переводов, но они не очень удобные. Ниже вашему вниманию представляется русифицированная модифицированная версия обзора основных функций R. Команды снабжены ссылками на online-мануал.

Оглавление

Помощь

Текущее окружение

  • ls() — список всех объектов
  • rm(x) — удалить объект
  • dir() — показать все файлы в текущей директории
  • getwd() — получить текущую директорию
  • setwd(dir) — поменять текущую директорию на dir

Общая работа с объектами

  • str(object) — внутренняя структура объекта object
  • summary(object) — общая информация об объекте object
  • dput(x) — получить представление объекта в R-синтаксисе
  • head(x) — посмотреть начальные строки объекта
  • tail(x) — посмотреть последние строки объекта

Ввод и вывод

  • library(package) — подключить пакет package
  • save(file, …) — сохраняет указанные объекты в двочином XDR-формате, который не зависит от платформы
  • load() — загружает данные, сохранённые ранее с помощью команды save()
  • read.table — считывает таблицу данных и создаёт по ним data.frame
  • write.table — печатает объект, конвертируя его в data.frame
  • read.csv — считывает csv-файл
  • read.delim — считывание данных, разделённых знаками табуляции
  • save.image — сохраняет все объекты в файл
  • cat(…, file= , sep= ) — сохраняет аргументы, конкатенируя их через sep
  • sink(file) — выводит результаты выполнения других команд в файл в режиме реального времени до момента вызова этой же команды без аргументов

Создание объектов

  • from:to — генерирует последовательность чисел от from до to с шагом 1, например 1:3
  • с(…) — объединяет аргументы в вектор, например c(1, 2, 3)
  • seq(from, to, by = ) — генерирует последовательность числел от from до to с шагом by
  • seq(from, to, len = ) — генерирует последовательность числел от from до to длины len
  • rep(x, times) — повторяет x ровно times раз
  • list(…) — создаёт список объектов
  • data.frame(…) — создаёт фрейм данных
  • array(data, dims) — создаёт из data многомерные массив размерностей dim
  • matrix(data, nrow = , ncol = , byrow = ) — создаёт из data матрицу nrow на ncol, порядок заполнения определяется byrow
  • factor(x, levels = ) — создаёт из x фактор с уровнями levels
  • gl(n, k, length = n*k, labels = 1:n) — создаёт фактор из n уровней, каждый из которых повторяется k раз длины
    length с именами labels
  • rbind(…) — объединяет аргументы по строкам
  • cbind(…) — объединяет аргументы по столбцам

Индексирование

Векторы
x[n] n-ый элемент
x[-n] все элементы, кроме n-го
x[1:n] первые n элементов
x[-(1:n)] все элементы, кроме первых n
x[c(1,4,2)] элементы с заданными индексами
x["name"] элемент с заданным именем
x[x > 3] все элементы, большие 3
x[x > 3 & x все элементы между 3 и 5
x[x %in% c("a","and","the")] все элементы из заданного множества
Списки
x[n] список, состоящий из элемента n
x[[n]] n-ый элемент списка
x[["name"]] элемент списка с именем name
x$name элемент списка с именем name
Матрицы
x[i, j] элемент на пересечении i-ой строки и j-го столбца
x[i,] i-ая строка
x[,j] j-ый столбец
x[,c(1,3)] заданное подмножество столбцов
x["name", ] строка с именем name
Фреймы
x[["name"]] столбец с именем name
x$name столбец с именем name

Работа с переменными

  • as.array(x), as.data.frame(x), as.numeric(x), as.logical(x), as.complex(x), as.character(x) — преобразование переменной к заданному типу is.na(x), is.null(x),
    is.array(x), is.data.frame(x), is.numeric(x), is.complex(x), is.character(x) — проверка на то, что данный объект обладает указанным типом
  • length(x) — число элементов в x
  • dim(x) — размерности объекта x
  • di

R (язык программирования) — R (programming language)

Язык и среда для статистических вычислений и графики

R — это язык программирования и бесплатная программная среда для статистических вычислений и графики, поддерживаемая R Foundation for Statistical Computing. Язык R широко используется статистиками и специалистами по добыче данных для разработки статистического программного обеспечения и анализа данных . Опросы, исследования данных и исследования баз данных научной литературы показывают существенный рост популярности; по состоянию на сентябрь 2020 года R занимает 9-е место в индексе TIOBE , измеряющем популярность языков программирования.

Пакет GNU , официальная программная среда R написана в основном на C , Fortran и сам R (таким образом, он частично размещается на собственном хостинге ) и находится в свободном доступе под Стандартной общественной лицензией GNU . Предварительно скомпилированные исполняемые файлы предоставляются для различных операционных систем . Хотя R имеет интерфейс командной строки , существует несколько сторонних графических пользовательских интерфейсов , таких как RStudio , интегрированная среда разработки и Jupyter , интерфейс ноутбука .

История

R — это реализация языка программирования S в сочетании с семантикой лексической области видимости , вдохновленная Scheme . S был создан Джоном Чемберсом в 1976 году в Bell Labs . Есть некоторые важные отличия, но большая часть кода, написанного для S, работает без изменений.

R был создан Россом Ихакой и Робертом Джентльманом в Университете Окленда , Новая Зеландия, и разработан основной командой разработчиков R (по состоянию на август 2018 года членом которой был Чемберс). R назван частично по именам первых двух авторов R, а частично как игра с именем S. Проект был задуман в 1992 году, его первоначальная версия была выпущена в 1995 году, а стабильная бета- версия (v1.0) — на 29 февраля 2000 г.

Статистические характеристики

R и его библиотеки реализуют широкий спектр статистических и графических методов, включая линейное и нелинейное моделирование, классические статистические тесты, анализ временных рядов , классификацию, кластеризацию и другие. R легко расширяется с помощью функций и расширений, а сообщество R известно своим активным вкладом в виде пакетов. Многие из стандартных функций R написаны на самом R, что позволяет пользователям легко следовать выбранным алгоритмам. Для задач с интенсивными вычислениями код C , C ++ и Fortran может быть связан и вызван во время выполнения. Опытные пользователи могут написать код C, C ++, Java , .NET или Python для непосредственного управления объектами R. R обладает высокой расширяемостью за счет использования пакетов, представленных пользователем, для определенных функций или конкретных областей исследования. Благодаря наследию S , R имеет более сильные возможности объектно-ориентированного программирования , чем большинство языков статистических вычислений. Расширение R также облегчается его правилами лексической области видимости .

Еще одна сильная сторона R — статическая графика, которая может создавать графики качества публикации, включая математические символы. Динамическая и интерактивная графика доступна через дополнительные пакеты.

R имеет Rd, собственный формат документации, подобный LaTeX , который используется для предоставления исчерпывающей документации, как в интерактивном режиме в различных форматах, так и в печатном виде.

Возможности программирования

R — интерпретируемый язык ; пользователи обычно обращаются к нему через интерпретатор командной строки . Если пользователь вводит 2+2в командной строке R и нажимает клавишу ВВОД, компьютер отвечает 4, как показано ниже:

Этот расчет интерпретируется как сумма двух одноэлементных векторов, в результате чего получается одноэлементный вектор. Префикс [1]указывает, что список элементов, следующих за ним в одной строке, начинается с первого элемента вектора (функция, которая полезна, когда вывод распространяется на несколько строк).

Как и другие подобные языки, такие как APL и MATLAB , R поддерживает матричную арифметику . Структуры данных R включают векторы , матрицы , массивы, фреймы данных (аналогичные таблицам в реляционной базе данных ) и списки . Массивы хранятся в порядке столбцов . Расширяемая объектная система R включает объекты для (среди прочего): регрессионных моделей , временных рядов и геопространственных координат . Скалярный тип данных никогда не был структурой данных R. Вместо этого скаляр представлен как вектор с длиной один.

Многие особенности R происходят от Scheme . R использует S-выражения для представления как данных, так и кода. Функции являются первоклассными, и ими можно управлять так же, как и объектами данных, что облегчает метапрограммирование и допускает множественную отправку . Переменные в R имеют лексическую область видимости и динамически типизируются . Аргументы функции передаются по значению и являются ленивыми — то есть они оцениваются только при использовании, а не при вызове функции.

R поддерживает процедурное программирование с функциями и, для некоторых функций, объектно-ориентированное программирование с универсальными функциями . Универсальная функция действует по-разному в зависимости от переданных ей классов аргументов. Другими словами, общая функция отправляет функцию ( метод ) , относящихся к данному классу от объекта . Например, R имеет общую print функцию , которая может печатать почти каждый класс из объекта в R с простым print(objectname)синтаксисом.

Хотя он используется в основном статистиками и другими практиками, которым требуется среда для статистических вычислений и разработки программного обеспечения, R также может работать как общий набор инструментов для вычисления матриц — с тестами производительности, сопоставимыми с GNU Octave или MATLAB .

Пакеты

Возможности R расширяются за счет созданных пользователями пакетов , которые позволяют использовать специализированные статистические методы, графические устройства, возможности импорта / экспорта, инструменты отчетности ( Rmarkdown , knitr , Sweave ) и т. Д. Эти пакеты разрабатываются в основном на R, а иногда и на Java. , C , C ++ и Фортран . Система упаковки R также используется исследователями для создания сборников, чтобы систематизировать данные исследований, код и файлы отчетов для совместного использования и публичного архивирования.

Основной набор пакетов включен в установку R, и более 15000 дополнительных пакетов (по состоянию на сентябрь 2018 г.) доступны в Comprehensive R Archive Network (CRAN), Bioconductor , Omegahat, GitHub и других репозиториях.

На странице «Представления задач» (список тем) на веб-сайте CRAN представлен широкий спектр задач (в таких областях, как финансы, генетика, высокопроизводительные вычисления, машинное обучение, медицинская визуализация, социальные науки и пространственная статистика), для которых R использовался применены и для каких пакетов доступны. R также был определен FDA как подходящий для интерпретации данных клинических исследований.

Другие ресурсы пакетов R включают Crantastic, сайт сообщества для оценки и обзора всех пакетов CRAN, и R-Forge, центральную платформу для совместной разработки пакетов R, программного обеспечения, связанного с R, и проектов. R-Forge также содержит множество неопубликованных бета-пакетов и разрабатываемых версий пакетов CRAN. Microsoft ведет ежедневный снимок CRAN, начиная с 17 сентября 2014 года.

Проект Bioconductor предоставляет пакеты R для анализа геномных данных. Сюда входят инструменты объектно-ориентированной обработки и анализа данных из Affymetrix , микрочипа кДНК и высокопроизводительные методы секвенирования нового поколения .

Группа пакетов под названием Tidyverse , которую можно рассматривать как «диалект языка R», становится все более популярной в экосистеме R. Группа пакетов стремится предоставить связный набор функций для решения общих задач науки о данных, включая импорт, очистку, преобразование и визуализацию данных (особенно с пакетом ggplot2 ).

R — один из 5 языков с API Apache Spark , остальные — это Scala , Java , Python и SQL .

Вехи

Список изменений в выпусках R поддерживается в различных «новостных» файлах CRAN. Некоторые основные моменты перечислены ниже для нескольких основных выпусков.

Релиз Дата Описание
0,16 Это последняя альфа- версия, разработанная в основном Ихакой и Джентльменом. Реализована большая часть основных функций из «Белой книги» (см. Историю S ). Списки рассылки начались 1 апреля 1997 года.
0,49 1997-04-23 Это самый старый исходный выпуск, доступный в настоящее время на CRAN. CRAN запускается в этот день с 3-мя зеркалами, на которых изначально размещалось 12 пакетов. Альфа-версии R для Microsoft Windows и классической Mac OS станут доступны вскоре после выхода этой версии.
0,60 1997-12-05 R становится официальной частью проекта GNU . Код размещен и поддерживается на CVS .
0,65,1 1999-10-07 Первые версии функций update.packages и install.packages для загрузки и установки пакетов из CRAN.
1.0 2000-02-29 Считается разработчиками достаточно стабильным для промышленного использования.
1.4 2001-12-19 Представлены методы S4, и вскоре после этого станет доступна
первая версия для Mac OS X.
1,8 2003-10-08 Введен гибкий механизм обработки условий для сигнализации и обработки объектов условий.
2.0 2004-10-04 Введена отложенная загрузка , которая обеспечивает быструю загрузку данных с минимальными затратами системной памяти.
2.1 2005-04-18 Поддержка кодировки UTF-8 и начало интернационализации и локализации для разных языков.
2.6.2 2008-02-08 Последняя версия для поддержки Windows 95, 98, Me и NT 4.0
2.11 2010-04-22 Поддержка 64-битных систем Windows.
2.12.2 2011-02-25 Последняя версия с поддержкой Windows 2000
2,13 2011-04-14 Добавление новой функции компилятора, которая позволяет ускорить функции, преобразовав их в байт-код.
2,14 2011-10-31 Добавлены обязательные пространства имен для пакетов. Добавлен новый параллельный пакет.
2,15 2012-03-30 Новые функции балансировки нагрузки. Повышена скорость сериализации для длинных векторов.
3.0.0 2013-04-03 Поддержка значений числового индекса 2 31 и больше в 64-битных системах.
3.3.3 2017-03-06 Последняя версия для поддержки Microsoft Windows XP.
3.4.0 2017-04-21 Своевременная компиляция (JIT) функций и циклов в байтовый код включена по умолчанию.
3.5.0 2018-04-23 Пакеты по умолчанию компилируются в байтах при установке. Компактное внутреннее представление целочисленных последовательностей. Добавлен новый формат сериализации для поддержки компактных внутренних представлений.
3.6.0 2019-04-26
4.0.0 2020-04-24 R теперь использует значение по stringsAsFactors = FALSEумолчанию и, следовательно, по умолчанию больше не преобразует строки в факторы при вызовах data.frame()и read.table().

Интерфейсы

Самой специализированной интегрированной средой разработки (IDE) для R является RStudio . Похожий интерфейс разработки — это R Tools для Visual Studio . Некоторые общие IDE, такие как Eclipse , также предлагают функции для работы с R. R также часто используется в Jupyter Notebook.

Графические пользовательские интерфейсы, основанные на принципах «укажи и щелкни», включают Rattle GUI , R Commander и RKWard .

Некоторые из наиболее распространенных редакторов с различными уровнями поддержки R включают Emacs ( Emacs Speaks Statistics ), Vim (плагин Nvim-R), Neovim (плагин Nvim-R), Kate , LyX , Notepad ++ , Visual Studio Code , WinEdt и Тинн-Р.

Функциональность R доступна из нескольких языков сценариев, таких как Python , Perl , Ruby , F # и Julia . Также доступны интерфейсы для других языков программирования высокого уровня, таких как Java и .NET C # .

Реализации

Основная реализация R написана на R, C и Fortran, и есть несколько других реализаций, направленных на повышение скорости или расширяемости. Близко родственная реализация — pqR (довольно быстрый R) Рэдфорда М. Нила с улучшенным управлением памятью и поддержкой автоматической многопоточности. Renjin и FastR — это Java- реализации R для использования в виртуальной машине Java. CXXR, rho и Riposte — это реализации R на C ++ . Renjin, Riposte и pqR пытаются повысить производительность за счет использования нескольких ядер процессора и некоторой формы отложенной оценки. Большинство этих альтернативных реализаций являются экспериментальными и неполными, с относительно небольшим количеством пользователей, по сравнению с основной реализацией, поддерживаемой основной группой разработчиков R.

TIBCO построила механизм выполнения под названием TERR, который является частью Spotfire.

Microsoft R Open — это полностью совместимый дистрибутив R с модификациями для многопоточных вычислений.

Сообщества

R имеет местные сообщества по всему миру, где пользователи могут общаться, делиться идеями и учиться.

Растет число мероприятий R, объединяющих пользователей, таких как конференции (например, useR!, WhyR ?, conectaR, SatRdays), встречи, а также группы R-Ladies, которые продвигают гендерное разнообразие, и рабочая группа R Foundation по вопросам женщин и другие недопредставленные группы.

useR! конференции

Официальное ежегодное собрание пользователей R называется «useR!». Первым таким мероприятием было useR! 2004 г., май 2004 г., Вена , Австрия. Пропустив 2005 год, файл useR! конференция проводится ежегодно, как правило, чередуя места в Европе и Северной Америке. Последующие конференции включали:

  • useR! 2006, Вена, Австрия
  • useR! 2007, Эймс, Айова, США
  • useR! 2008, Дортмунд, Германия
  • useR! 2009, Ренн, Франция
  • useR! 2010, Гейтерсбург, Мэриленд, США
  • useR! 2011, Ковентри, Великобритания
  • useR! 2012, Нэшвилл, Теннесси, США
  • useR! 2013, Альбасете, Испания
  • useR! 2014 г., Лос-Анджелес, Калифорния, США
  • useR! 2015, Ольборг, Дания
  • useR! 2016, Стэнфорд, Калифорния, США
  • useR! 2017, Брюссель, Бельгия
  • useR! 2018, Брисбен, Австралия
  • useR! 2019, Тулуза, Франция
  • useR! 2020, Сент-Луис, Миссури, США (Отменено)

На будущее запланированы следующие конференции:

  • useR! 2021, Цюрих, Швейцария

Журнал R

R Журнал является открытым доступом , реферативный журналом R проекта статистических вычислений. В нем представлены короткие и средние статьи об использовании и разработке R, включая пакеты, советы по программированию, новости CRAN и фундаментальные новости.

Сравнение с SAS, SPSS и Stata

R сопоставим с популярными коммерческими статистическими пакетами, такими как SAS , SPSS и Stata , но R доступен пользователям бесплатно по лицензии на бесплатное программное обеспечение .

В январе 2009 года в New York Times была опубликована статья, описывающая рост R, причины его популярности среди специалистов по обработке данных и угрозу, которую он представляет для коммерческих статистических пакетов, таких как SAS. В июне 2017 года аналитик данных Роберт Мюнхен опубликовал более подробное сравнение R и других программных пакетов «Популярность программного обеспечения для обработки данных».

R в большей степени ориентирован на процедурный код, чем SAS или SPSS, оба из которых интенсивно используют заранее запрограммированные процедуры (называемые «procs»), встроенные в языковую среду и настраиваемые параметрами каждого вызова. R обычно обрабатывает данные в памяти, что ограничивает его полезность при обработке очень больших файлов.

Коммерческая поддержка R

Хотя R — это проект с открытым исходным кодом, поддерживаемый развивающимся сообществом, некоторые компании стремятся предоставить своим клиентам коммерческую поддержку и / или расширения. В этом разделе приведены несколько примеров таких компаний.

В 2007 году Ричард Шульц, Мартин Шульц, Стив Уэстон и Кирк Меттлер основали Revolution Analytics для обеспечения коммерческой поддержки Revolution R, их распространения R, который также включает компоненты, разработанные компанией. Основные дополнительные компоненты включают в себя: ParallelR, среду R Productivity Environment IDE, RevoScaleR (для анализа больших данных ), RevoDeployR, структуру веб-сервисов и возможность чтения и записи данных в формате файла SAS. Revolution Analytics также предлагает распространение R, разработанное в соответствии с установленными критериями IQ / OQ / PQ, что позволяет клиентам в фармацевтическом секторе подтверждать свою установку REvolution R. В 2015 году корпорация Microsoft завершила приобретение Revolution Analytics. и с тех пор интегрировал язык программирования R в SQL Server 2016, SQL Server 2017, Power BI, базу данных SQL Azure, Azure Cortana Intelligence, Microsoft R Server и Visual Studio 2017 .

В октябре 2011 года Oracle анонсировала Big Data Appliance , которая объединяет R, Apache Hadoop , Oracle Linux и базу данных NoSQL с оборудованием Exadata . С 2012 года Oracle R Enterprise стал одним из двух компонентов «Oracle Advanced Analytics Option» (наряду с Oracle Data Mining ).

IBM предлагает поддержку выполнения R в Hadoop и модель программирования для массовой параллельной аналитики в базе данных на R.

Tibco предлагает версию R во время выполнения как часть Spotfire .

Mango Solutions предлагает пакет проверки для R, ValidR, чтобы он соответствовал требованиям агентств по одобрению лекарственных средств, таких как FDA. Эти агентства разрешают использовать любое статистическое программное обеспечение в представленных материалах, если только программное обеспечение проверено либо поставщиком, либо самим спонсором.

Примеры

Базовый синтаксис

Следующие примеры иллюстрируют базовый синтаксис языка и использование интерфейса командной строки.

В R обычно предпочтительным оператором присваивания является стрелка, состоящая из двух символов <-, хотя =обычно ее можно использовать.

> x <- 1:6  # Create vector.
> y <- x^2  # Create vector by formula.
> print(y)  # Print the vector’s contents.
[1]  1  4  9 16 25 36

> mean(y)  # Arithmetic mean of vector.
[1] 15.16667

> var(y)  # Sample variance of vector.
[1] 178.9667

> model <- lm(y ~ x)  # Linear regression model y = A + B * x.
> print(model)  # Print the model’s results.

Call:
lm(formula = y ~ x)

Coefficients:
(Intercept)            x 
     -9.333        7.000

> summary(model)  # Display an in-depth summary of the model.

Call:
lm(formula = y ~ x)

Residuals:
      1       2       3       4       5       6
 3.3333 -0.6667 -2.6667 -2.6667 -0.6667  3.3333

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  -9.3333     2.8441  -3.282 0.030453 * 
x             7.0000     0.7303   9.585 0.000662 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.055 on 4 degrees of freedom
Multiple R-squared:  0.9583, Adjusted R-squared:  0.9478
F-statistic: 91.88 on 1 and 4 DF,  p-value: 0.000662

> par(mfrow = c(2, 2))  # Create a 2 by 2 layout for figures.
> plot(model)  # Output diagnostic plots of the model.

Структура функции

Одна из сильных сторон R — простота создания новых функций. Объекты в теле функции остаются локальными для функции, и может быть возвращен любой тип данных. Вот пример функции, созданной пользователем:

# Declare function “f” with parameters “x”, “y“
# that returns a linear combination of x and y.
f <- function(x, y) {
  z <- 3 * x + 4 * y
  return(z)
}
> f(1, 2)
[1] 11

> f(c(1,2,3), c(5,3,4))
[1] 23 18 25

> f(1:3, 4)
[1] 19 22 25

Набор Мандельброта

Короткий код R, вычисляющий множество Мандельброта через первые 20 итераций уравнения z = z 2 + c, построенного для различных комплексных констант c . Этот пример демонстрирует:

  • использование внешних библиотек, разработанных сообществом (называемых пакетами), в данном случае пакет caTools
  • обработка комплексных чисел
  • многомерные массивы чисел , используемых в качестве основного типа данных, см переменных C, Zи X.
install.packages("caTools")  # install external package
library(caTools)             # external package providing write.gif function
jet.colors <- colorRampPalette(c("red", "blue", "#007FFF", "cyan", "#7FFF7F",
                                 "yellow", "#FF7F00", "red", "#7F0000"))
dx <- 1500                    # define width
dy <- 1400                    # define height
C  <- complex(real = rep(seq(-2.2, 1.0, length.out = dx), each = dy),
              imag = rep(seq(-1.2, 1.2, length.out = dy), dx))
C <- matrix(C, dy, dx)       # reshape as square matrix of complex numbers
Z <- 0                       # initialize Z to zero
X <- array(0, c(dy, dx, 20)) # initialize output 3D array
for (k in 1:20) {            # loop with 20 iterations
  Z <- Z^2 + C               # the central difference equation
  X[, , k] <- exp(-abs(Z))   # capture results
}
write.gif(X, "Mandelbrot.gif", col = jet.colors, delay = 100)

Смотрите также

Заметки

Ссылки

внешняя ссылка

Что такое язык программирования R? Введение и основы R

  • Home
  • Тестирование

      • Back
      • Agile Testing
      • BugZilla
      • Cucumber
      • Тестирование базы данных
      • 000
      • 000 JR
      • 000
      • 000 J2000
      • 000
      • 000 J2000
      • JUnit
      • LoadRunner
      • Ручное тестирование
      • Мобильное тестирование
      • Mantis
      • Почтальон
      • QTP
      • Назад
      • Центр качества (ALM)
      • RPA
      • SAP Testing
      • RPA
      • Управление тестированием

      • TestLink
  • SAP

      • Назад
      • ABAP
      • APO
      • Начинающий
      • Basis
      • BODS
      • BI
      • BPC
      • CO
      • Назад
      • CRM
      • Crystal Reports
      • FICO
      • 000
      • 000 HRM
      • 000
      • 000
      • HANA 9000 MM
        • Назад
        • PI / PO
        • PP
        • SD
        • SAPUI5
        • Безопасность
        • Менеджер решений
        • Successfactors
        • SAP Tutorials

      Назад

    • Web

      • Web
      • Интернет AngularJS

      • ASP.Net
      • C
      • C #
      • C ++
      • CodeIgniter
      • СУБД
      • JavaScript
      • Назад
      • Java
      • JSP
      • Kotlin
      • Linux
      • Linux
      • Kotlin
      • Linux
      • js

      • Perl
      • Назад
      • PHP
      • PL / SQL
      • PostgreSQL
      • Python
      • ReactJS
      • Ruby & Rails
      • Scala
      • SQL
      • 000

      • SQL
      • 000

        0003 SQL

        000

        0003 SQL

        000

      • UML
      • VB.Net
      • VBScript
      • Веб-службы
      • WPF
  • Обязательно учите!

      • Назад
      • Бухгалтерский учет
      • Алгоритмы
      • Android
      • Блокчейн
      • Business Analyst
      • Создание веб-сайта
      • CCNA
      • Облачные вычисления
      • 00030003 COBOL 9000 Compiler
          9000 Встроенные системы

        • 00030002 9000 Compiler 9000
        • Ethical Hacking
        • Учебники по Excel
        • Программирование на Go
        • IoT
        • ITIL
        • Jenkins
        • MIS
        • Сеть
        • Операционная система
        • Назад
        • Управление проектами Обзоры
        • Salesforce
        • SEO
        • Разработка программного обеспечения
        • VB A
    • Big Data

        • Назад
        • AWS
        • BigData
        • Cassandra
        • Cognos
        • Хранилище данных
        • 0003

        • HBOps
        • 0003

        • HBOps
        • MicroStrategy

    .

    Значение «I» в языке R

    Переполнение стека

    1. Около
    2. Продукты

    3. Для команд
    1. Переполнение стека
      Общественные вопросы и ответы

    2. Переполнение стека для команд
      Где разработчики и технологи делятся частными знаниями с коллегами

    3. Вакансии
      Программирование и связанные с ним технические возможности карьерного роста

    4. Талант
      Нанимайте технических специалистов и создавайте свой бренд работодателя

    5. Реклама
      Обратитесь к разработчикам и технологам со всего мира

    6. О компании

    Загрузка…

    1. Авторизоваться
      зарегистрироваться

    .

    R Учебное пособие для начинающих: Изучите язык программирования R

    • Home
    • Testing

        • Back
        • Agile Testing
        • BugZilla
        • Cucumber
        • Database Testing
        • 9000 J2
          • Назад
          • JUnit
          • LoadRunner
          • Ручное тестирование
          • Мобильное тестирование
          • Mantis
          • Почтальон
          • QTP
          • Назад
          • Центр качества
          • 000300030003 SoapUI
          • Управление тестированием
          • TestLink
      • SAP

          • Назад
          • 900 03 ABAP

          • APO
          • Начинающий
          • Basis
          • BODS
          • BI
          • BPC
          • CO
          • Назад
          • CRM
          • Crystal Reports
          • Crystal Reports
          • FICO3
          • Заработная плата
          • Назад
          • PI / PO
          • PP
          • SD
          • SAPUI5
          • Безопасность
          • Менеджер решений
          • Successfactors
          • SAP Back Tutorials
          • 9007
              • Apache
              • AngularJS
              • ASP.Net
              • C
              • C #
              • C ++
              • CodeIgniter
              • СУБД
              • JavaScript
              • Назад
              • Java
              • JSP
              • Kotlin
              • Linux
              • Linux
              • Kotlin
              • Linux
              • js

              • Perl
              • Назад
              • PHP
              • PL / SQL
              • PostgreSQL
              • Python
              • ReactJS
              • Ruby & Rails
              • Scala
              • SQL
              • 000

              • SQL
              • 000

                0003 SQL

                000

                0003 SQL

                000

              • UML
              • VB.Net
              • VBScript
              • Веб-службы
              • WPF
          • Обязательно учите!

              • Назад
              • Бухгалтерский учет
              • Алгоритмы
              • Android
              • Блокчейн
              • Business Analyst
              • Создание веб-сайта
              • CCNA
              • Облачные вычисления
              • 00030003 COBOL 9000 Compiler
                  9000 Встроенные системы

                • 00030002 9000 Compiler 9000
                • Ethical Hacking
                • Учебники по Excel
                • Программирование на Go
                • IoT
                • ITIL
                • Jenkins
                • MIS
                • Сеть
                • Операционная система
                • Назад
                • Управление проектами Обзоры
                • Salesforce
                • SEO
                • Разработка программного обеспечения
                • VB A
            • Big Data

                • Назад
                • AWS
                • BigData
                • Cassandra
                • Cognos
                • Хранилище данных
                • 0003

                • HBOps
                • 0003

                • HBOps
                • MicroStrategy
                • MongoDB

            .

            R Language — Начало работы с R Language

            Общие правила создания документации см. В руководстве по документации.

            • В отличие от других языков переменные в R не требуют объявления типа.
            • Одной и той же переменной можно назначать разные типы данных в разных
              экземпляры времени, если требуется.
            • Индексирование атомарных векторов и списков начинается с 1, а не с 0.
            • R Массивы (и особый случай матриц) имеют атрибут dim , который отделяет их от «атомарных векторов» R, не имеющих атрибутов.
            • Список в R позволяет вам упорядоченным образом собирать множество объектов под одним именем (то есть именем списка). Эти объекты могут быть матрицей , векторами , кадрами данных , даже другими списками и т. Д. Даже не требуется, чтобы эти объекты были связаны друг с другом каким-либо образом.
            • Переработка
            • Отсутствующие значения

            Получение справки

            Вы можете использовать функцию help () или ? для доступа к документации и поиска справки в R. Для более общего поиска вы можете использовать help.search () или ?? .

              # За справкой по справочной функции R
            Помогите()
            
            # Для справки по функции вставки
            help (вставить) #OR
            help ("вставить") # ИЛИ
            ? вставить # ИЛИ
            ?"вставить"
              

            Посетите https: // www.r-project.org/help.html для получения дополнительной информации

            Привет, мир!

              «Привет, мир!»
              

            Также ознакомьтесь с подробным обсуждением того, как, когда, нужно ли и зачем печатать строку.

            Установка R

            Вы можете установить RStudio после того, как вы установили R. RStudio — это среда разработки для R, которая упрощает многие задачи программирования.

            Только Windows:

            Visual Studio (начиная с версии 2015 Update 3) теперь включает среду разработки для R под названием R Tools, которая включает живой интерпретатор, IntelliSense и модуль отладки.Если вы выберете этот метод, вам не придется устанавливать R, как указано в следующем разделе.

            1. Перейдите на веб-сайт CRAN, щелкните по загрузке R для Windows и загрузите последнюю версию R.
            2. Щелкните правой кнопкой мыши файл установщика и ЗАПУСТИТЕ от имени администратора.
            3. Выберите рабочий язык для установки.
            4. Следуйте инструкциям по установке.

            Альтернатива 1

            (0. Убедитесь, что XQuartz установлен)

            1. Зайдите на сайт CRAN и скачайте последнюю версию R.
            2. Откройте образ диска и запустите установщик.
            3. Следуйте инструкциям по установке.

            При этом будут установлены R и R-MacGUI. Он поместит графический интерфейс в папку / Applications / как R.app, где его можно будет либо дважды щелкнуть, либо перетащить в документ. Когда выпускается новая версия, процесс (пере) установки перезапишет R.app, но предыдущие основные версии R будут сохранены. Фактический код R будет в каталоге /Library/Frameworks/R.Framework/Versions/.Также возможно использование R в RStudio, при этом будет использоваться тот же код R с другим графическим интерфейсом.

            Альтернатива 2

            1. Установите homebrew (отсутствующий менеджер пакетов для macOS), следуя инструкциям на https://brew.sh/
            2. установка для варки R

            Те, кто выбирает второй метод, должны знать, что разработчик форка Mac не рекомендует его, и не будет отвечать на вопросы о трудностях в списке рассылки R-SIG-Mac.

            Вы можете получить версию R, соответствующую вашему дистрибутиву, через apt-get . Однако эта версия часто будет значительно отставать от последней версии, доступной на CRAN. Вы можете добавить CRAN в свой список признанных «источников».

              sudo apt-get install r-base
              

            Вы можете получить более свежую версию прямо из CRAN, добавив CRAN в свой список источников. Следуйте инструкциям CRAN для получения более подробной информации. Обратите внимание, в частности, на необходимость выполнить это, чтобы можно было использовать установку .пакеты () . Пакеты Linux обычно распространяются в виде исходных файлов и требуют компиляции:

              sudo apt-get install r-base-dev
              
              sudo dnf установить R
              

            R доступен непосредственно в репо пакета Extra .

             судо пакман -S r
             

            Более подробную информацию об использовании R в Archlinux можно найти на странице ArchWiki R.

            Интерактивный режим и сценарии R

            Самый простой способ использования R — это интерактивный режим .Вы набираете команды и сразу получаете результат от р.

            .

            Использование R в качестве калькулятора

            Запустите R, набрав R в командной строке операционной системы или выполнив RGui в Windows. Ниже вы можете увидеть снимок экрана интерактивного сеанса R в Linux:

            Это RGui для Windows, самая простая рабочая среда для R под Windows:

            После знака > можно вводить выражения.После ввода выражения результат отображается буквой R. На скриншоте выше R используется в качестве калькулятора: Тип

              1 + 1
              

            , чтобы сразу увидеть результат, 2 . Ведущий [1] указывает, что R возвращает вектор. В этом случае вектор содержит только одно число (2).

            Первый участок

            R можно использовать для создания графиков. В следующем примере используется набор данных PlantGrowth , который является примером набора данных вместе с R

            .

            Введите в командной строке R следующие все строки, которые не начинаются с ## .Строки, начинающиеся с ## , предназначены для документирования результата, который возвращает R.

              данные (PlantGrowth)
            str (PlantGrowth)
            ## 'data.frame': 30 набл. из 2 переменных:
            ## $ weight: число 4,17 5,58 5,18 6,11 4,5 4,61 5,17 4,53 5,33 5,14 ...
            ## $ group: Фактор с 3 уровнями "ctrl", "trt1", ..: 1 1 1 1 1 1 1 1 1 1 ...
            anova (lm (вес ~ группа, данные = PlantGrowth))
            ## Таблица дисперсионного анализа
            ##
            ## Ответ: вес
            ## Df Sum Sq Среднее значение Sq F Pr (> F)
            ## группа 2 3.7663 1,8832 4,8461 0,01591 *
            ## Остатки 27 10,4921 0,3886
            ## ---
            ## Signif. коды: 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’ 0,1 ‘’ 1
            boxplot (вес ~ группа, данные = PlantGrowth, ylab = "Сухой вес")
              

            Создается следующий участок:

            data (PlantGrowth) загружает примерный набор данных PlantGrowth , который представляет собой записи сухих масс растений, которые были подвергнуты двум различным условиям обработки или вообще не подвергались обработке (контрольная группа).Набор данных доступен под названием PlantGrowth . Такое имя также называется переменной.

            Для загрузки собственных данных могут быть полезны следующие две страницы документации:

            str (PlantGrowth) показывает информацию о загруженном наборе данных. Выходные данные показывают, что PlantGrowth — это data.frame , который является именем R для таблицы. data.frame содержит два столбца и 30 строк. В этом случае каждый ряд соответствует одному растению.Детали двух столбцов показаны в строках, начинающихся с $ : Первый столбец называется вес и содержит
            числа ( num , сухой вес соответствующего растения). Второй столбец, группа , содержит обработку, которой подверглось растение. Это категориальные данные, которые в R.
            Подробнее о фреймах данных.

            Чтобы сравнить сухие массы трех разных групп, выполняется односторонний дисперсионный анализ с использованием anova (lm (...)) . weight ~ group означает «Сравните значения столбца с весом , группируя значения столбца с группой ». Это называется формулой в R.
            data = ... указывает имя таблицы, в которой могут быть найдены данные.

            Результат показывает, среди прочего, что существует значительная разница (столбец Pr (> F) ), p = 0,01591 ) между некоторыми из трех групп. Апостериорные тесты, такие как тест Тьюки, должны выполняться, чтобы определить, средние значения каких групп значительно различаются.

            boxplot (...) создает коробчатую диаграмму данных. откуда берутся отображаемые значения. weight ~ group означает: «Постройте значения веса столбца по сравнению с значениями столбца , группа . ylab = ... задает метку оси Y. Подробнее: Базовый график

            Введите q () или Ctrl D для выхода из сеанса R.

            Для документирования вашего исследования желательно сохранить команды, которые вы используете для вычислений, в файл.Для этого вы можете создать сценарии R . Сценарий R — это простой текстовый файл, содержащий команды R.

            Создайте текстовый файл с именем plant.R и заполните его следующим текстом, в котором некоторые команды знакомы из блока кода выше:

              данные (PlantGrowth)
            
            anova (lm (вес ~ группа, данные = PlantGrowth))
            
            png ("plant_boxplot.png", ширина = 400, высота = 300)
            boxplot (вес ~ группа, данные = PlantGrowth, ylab = "Сухой вес")
            разработчиквыкл ()
              

            Выполните сценарий, введя в свой терминал (терминал вашей операционной системы, , а не интерактивный сеанс R, как в предыдущем разделе!)

              R --no-save  plant_result.txt
              

            Файл plant_result.txt содержит результаты ваших вычислений, как если бы вы ввели их в интерактивную подсказку R. Тем самым ваши расчеты оформляются документально.

            Новые команды png и dev.off используются для сохранения блочной диаграммы на диск. Две команды должны включать команду построения графика, как показано в примере выше. png ("FILENAME", width = ..., height = ...) открывает новый файл PNG с указанным именем файла, шириной и высотой в пикселях. dev.off () завершит построение и сохранит график на диск. Выходные данные не сохраняются, пока не будет вызвана dev.off () .

            .

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *