ΠΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ python: Π¨ΠΏΠ°ΡΠ³Π°Π»ΠΊΠ° ΠΏΠΎ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ Π² Python Ρ ΠΏΠΎΠΌΠΎΡΡΡ Plotly / Π₯Π°Π±Ρ
Π¨ΠΏΠ°ΡΠ³Π°Π»ΠΊΠ° ΠΏΠΎ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ Π² Python Ρ ΠΏΠΎΠΌΠΎΡΡΡ Plotly / Π₯Π°Π±Ρ
Plotly β Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Π΄Π»Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ , ΡΠΎΡΡΠΎΡΡΠ°Ρ ΠΈΠ· Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΡ ΡΠ°ΡΡΠ΅ΠΉ:
- Front-End Π½Π° JS
- Back-End Π½Π° Python (Π·Π° ΠΎΡΠ½ΠΎΠ²Ρ Π²Π·ΡΡΠ° Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Seaborn)
- Back-End Π½Π° R
Π ΡΡΠΎΠΉ ΠΏΡΠΎΡΡΡΠ½Π΅ Π²ΡΠ΅ ΠΏΡΠΈΠΌΠ΅ΡΡ ΡΠ°Π·ΠΎΠ±ΡΠ°Π½Ρ ΠΎΡ ΡΠΎΠ²ΡΠ΅ΠΌ ΠΏΡΠΎΡΡΡΡ ΠΊ Π±ΠΎΠ»Π΅Π΅ ΡΠ»ΠΎΠΆΠ½ΡΠΌ, ΡΠ°ΠΊ ΡΡΠΎ ΡΠ°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊΠ°ΠΌ Ρ ΠΎΠΏΡΡΠΎΠΌ Π±ΡΠ΄Π΅Ρ ΡΠΊΡΡΠ½ΠΎ. Π’Π°ΠΊ ΠΆΠ΅ ΡΡΠ° Β«ΡΠΏΠ°ΡΠ³Π°Π»ΠΊΠ°Β» Π½Π΅ Π·Π°ΠΌΠ΅Π½ΠΈΡ Π½Π° 100% ΠΏΡΠΈΠΌΠ΅ΡΡ ΠΈΠ· Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ.
ΠΠ·Π²ΠΈΠ½ΡΡΡΡ Π·Π° Π·Π°ΠΌΡΠ»Π΅Π½Π½ΡΠ΅ gif’ΠΊΠΈ ΡΡΠΎ ΠΏΡΠΎΠΈΡΡ ΠΎΠ΄ΠΈΡ ΠΏΡΠΈ ΠΊΠΎΠ½Π²Π΅ΡΡΠ°ΡΠΈΠΈ ΠΈΠ· Π²ΠΈΠ΄Π΅ΠΎ, Π·Π°ΠΏΠΈΡΠ°Π½Π½ΠΎΠ³ΠΎ Ρ ΡΠΊΡΠ°Π½Π°.
Jupyter Notebook ΡΠΎ Π²ΡΠ΅ΠΌΠΈ ΠΏΡΠΈΠΌΠ΅ΡΠ°ΠΌΠΈ ΠΈΠ· ΡΡΠ°ΡΡΠΈ:
ΠΠΎΠΊΡΠΌΠ΅Π½ΡΠ°ΡΠΈΡ
Π’Π°ΠΊ ΠΆΠ΅ Π½Π° Π±Π°Π·Π΅ plotly ΠΈ Π²Π΅Π±-ΡΠ΅ΡΠ²Π΅ΡΠ° Flask ΡΡΡΠ΅ΡΡΠ²ΡΠ΅Ρ ΡΠΏΠ΅ΡΠΈΠ°Π»ΡΠ½Π°Ρ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π΄Π°ΡΠ±ΠΎΡΠ΄ΠΎΠ² Dash.
- Plotly β Π±Π΅ΡΠΏΠ»Π°ΡΠ½Π°Ρ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ°, ΠΊΠΎΡΠΎΡΡΡ Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π² ΠΊΠΎΠΌΠΌΠ΅ΡΡΠ΅ΡΠΊΠΈΡ ΡΠ΅Π»ΡΡ
- Plotly ΡΠ°Π±ΠΎΡΠ°Π΅Ρ offline
- Plotly ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΡΡΡΠΎΠΈΡΡ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΠ΅ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ
Π’. Π΅. Ρ ΠΏΠΎΠΌΠΎΡΡΡ Plotly ΠΌΠΎΠΆΠ½ΠΎ ΠΊΠ°ΠΊ ΠΈΠ·ΡΡΠ°ΡΡ ΠΊΠ°ΠΊΠΈΠ΅-ΡΠΎ Π΄Π°Π½Π½ΡΠ΅ Β«Π½Π° Π»Π΅ΡΡΒ» (Π½Π΅ ΠΏΠ΅ΡΠ΅ΡΡΡΠ°ΠΈΠ²Π°Ρ Π³ΡΠ°ΡΠΈΠΊ Π² matplotlib, ΠΈΠ·ΠΌΠ΅Π½ΡΡ ΠΌΠ°ΡΡΡΠ°Π±, Π²ΠΊΠ»ΡΡΠ°Ρ/Π²ΡΠΊΠ»ΡΡΠ°Ρ ΠΊΠ°ΠΊΠΈΠ΅-ΡΠΎ Π΄Π°Π½Π½ΡΠ΅), ΡΠ°ΠΊ ΠΈ ΠΏΠΎΡΡΡΠΎΠΈΡΡ ΠΏΠΎΠ»Π½ΠΎΡΠ΅Π½Π½ΡΠΉ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΠΉ ΠΎΡΡΡΡ (Π΄Π°ΡΠ±ΠΎΡΠ΄).
ΠΠ»Ρ Π½Π°ΡΠ°Π»Π° Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΡ, Ρ.ΠΊ. ΠΎΠ½Π° Π½Π΅ Π²Ρ ΠΎΠ΄ΠΈΡ Π½ΠΈ Π² ΡΡΠ°Π½Π΄Π°ΡΡΠ½ΡΠΉ ΠΏΠ°ΠΊΠ΅Ρ, Π½ΠΈ Π² Anaconda. ΠΠ»Ρ ΡΡΠΎΠ³ΠΎ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡΠ΅ΡΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ pip:
pip install plotly
ΠΡΠ»ΠΈ Π²Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΠ΅ Jupyter Notebook, ΡΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΌΡΠ΄ΠΆΠΈΠΊ «!», ΠΏΠΎΡΡΠ°Π²ΠΈΠ² Π΄Π°Π½Π½ΡΠΉ ΡΠΈΠΌΠ²ΠΎΠ» ΠΏΠ΅ΡΠ΅Π΄ ΠΊΠΎΠΌΠ°Π½Π΄ΠΎΠΉ:
!pip install plotly
ΠΠ΅ΡΠ΅Π΄ Π½Π°ΡΠ°Π»ΠΎΠΌ ΡΠ°Π±ΠΎΡΡ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎ ΠΈΠΌΠΏΠΎΡΡΠΈΡΠΎΠ²Π°ΡΡ ΠΌΠΎΠ΄ΡΠ»Ρ. Π ΡΠ°Π·Π½ΡΡ ΡΠ°ΡΡΡΡ ΡΠΏΠ°ΡΠ³Π°Π»ΠΊΠΈ Π΄Π»Ρ ΡΠ°Π·Π½ΡΡ Π·Π°Π΄Π°Ρ Π½Π°ΠΌ ΠΏΠΎΠ½Π°Π΄ΠΎΠ±ΡΡΡΡ ΠΊΠ°ΠΊ ΠΎΡΠ½ΠΎΠ²Π½ΠΎΠΉ ΠΌΠΎΠ΄ΡΠ»Ρ, ΡΠ°ΠΊ ΠΈ ΠΎΠ΄ΠΈΠ½ ΠΈΠ· Π΅Π³ΠΎ ΠΏΠΎΠ΄ΠΌΠΎΠ΄ΡΠ»Π΅ΠΉ, ΠΏΠΎΡΡΠΎΠΌΡ ΠΏΠΎΠ»Π½ΡΠΉ Π½Π°Π±ΠΎΡ ΠΈΠ½ΡΡΡΡΠΊΡΠΈΠΉ ΠΈΠΌΠΏΠΎΡΡΠ° Ρ Π½Π°Ρ.
Π’Π°ΠΊ ΠΆΠ΅ Π½Π°ΠΌ ΠΏΠΎΠ½Π°Π΄ΠΎΠ±ΡΡΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ Pandas ΠΈ Numpy Π΄Π»Ρ ΡΠ°Π±ΠΎΡΡ Ρ ΡΡΡΡΠΌΠΈ Π΄Π°Π½Π½ΡΠΌΠΈ
ΠΠΎΠ΄ ΠΈΠΌΠΏΠΎΡΡΠ° ΡΡΠ½ΠΊΡΠΈΠΉ
import plotly
import plotly.graph_objs as go
import plotly. express as px
from plotly.subplots import make_subplots
import numpy as np
import pandas as pd
ΠΠΈΠ½Π΅ΠΉΠ½ΡΠΉ Π³ΡΠ°ΡΠΈΠΊ
ΠΠ°ΡΠ½ΡΠΌ Ρ ΠΏΡΠΎΡΡΠΎΠΉ Π·Π°Π΄Π°ΡΠΈ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠ° ΠΏΠΎ ΡΠΎΡΠΊΠ°ΠΌ.
ΠΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ ΡΡΠ½ΠΊΡΠΈΡ f(x)=x2
Π‘ΠΏΠ΅ΡΠ²Π° ΠΏΠΎΡΡΡΠΏΠΈΠΌ ΡΠΎΠ²ΡΠ΅ΠΌ ΠΏΡΠΎΡΡΠΎ ΠΈ Β«Π² Π»ΠΎΠ±Β»:
- Π‘ΠΎΠ·Π΄Π°Π΄ΠΈΠΌ Π³ΡΠ°ΡΠΈΠΊ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΡΡΠ½ΠΊΡΠΈΠΈ scatter ΠΈΠ· ΠΏΠΎΠ΄ΠΌΠΎΠ΄ΡΠ»Ρ plotly.express (Π²Π½ΡΡΡΡ ΠΏΠ΅ΡΠ΅Π΄Π°Π΄ΠΈΠΌ 2 ΡΠΏΠΈΡΠΊΠ° ΡΠΎΡΠ΅ΠΊ: ΠΊΠΎΠΎΡΠ΄ΠΈΠ½Π°ΡΡ X ΠΈ Y)
- Π’ΡΡ ΠΆΠ΅ Β«ΠΏΠΎΠΊΠ°ΠΆΠ΅ΠΌΒ» Π΅Π³ΠΎ Ρ ΠΏΠΎΠΌΠΎΠ·ΡΡ ΠΌΠ΅ΡΠΎΠ΄Π° show()
ΠΠ±ΡΠ°ΡΠΈΡΠ΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ β Π³ΡΠ°ΡΠΈΠΊ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΠΉ, Π΅ΡΠ»ΠΈ Π½Π°Π²Π΅ΡΡΠΈ Π½Π° Π½Π΅Π³ΠΎ ΠΊΡΡΡΠΎΡ, ΡΠΎ ΠΌΠΎΠΆΠ½ΠΎ Π΅Π³ΠΎ ΠΏΡΠΈΠ±Π»ΠΈΠΆΠ°ΡΡ ΠΈ ΡΠ΄Π°Π»ΡΡΡ, Π²ΡΠ΄Π΅Π»ΡΡΡ ΡΡΠ°ΡΡΠΊΠΈ, ΠΏΠΎ Π½Π°Π²Π΅Π΄Π΅Π½ΠΈΡ ΠΊΡΡΡΠΎΡΠ° Π½Π° ΡΠΎΡΠΊΡ ΠΏΠΎΠ»ΡΡΠ°ΡΡ ΠΏΠΎΠ΄ΡΠΎΠ±Π½ΡΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ, Π²ΠΎΠ·Π²ΡΠ°ΡΠ°ΡΡ ΠΊΠ°ΡΡΠΈΠ½ΠΊΡ Π² ΠΈΡΡ ΠΎΠ΄Π½ΠΎΠ΅ ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅, Π° ΠΏΡΠΈ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎΡΡΠΈ Β«ΡΠΊΡΠΈΠ½ΡΠΎΡΠΈΡΡΒ» ΠΈ ΡΠΎΡ ΡΠ°Π½ΡΡΡ ΠΊΠ°ΠΊ ΡΠ°ΠΉΠ».
ΠΡΡ ΡΡΠΎ Π΄Π΅Π»Π°Π΅ΡΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ JS Π² Π²Π°ΡΠ΅ΠΌ Π±ΡΠ°ΡΠ·Π΅ΡΠ΅. Π Π·Π½Π°ΡΠΈΡ, ΠΏΡΠΈ ΠΆΠ΅Π»Π°Π½ΠΈΠΈ Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΡΡΠΈΠΌ ΡΠΏΡΠ°Π²Π»ΡΡΡ ΡΠΆΠ΅ ΠΏΠΎΡΠ»Π΅ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ ΡΠΈΠ³ΡΡΡ (Π½ΠΎ ΠΌΡ ΡΡΠΎΠ³ΠΎ Π΄Π΅Π»Π°ΡΡ ΠΏΠΎΠΆΠ°Π»ΡΠΉ Π½Π΅ Π±ΡΠ΄Π΅ΠΌ, Ρ.ΠΊ. JS != Python)
ΠΠΎΠ΄
x = np. arange(0, 5, 0.1)
def f(x):
return x**2
px.scatter(x=x, y=f(x)).show()
ΠΠΎΠ»Π΅Π΅ ΡΠΈΡΠ°Π±Π΅Π»ΡΠ½ΠΎ ΠΈ ΠΏΡΠ°Π²ΠΈΠ»ΡΠ½ΠΎ Π·Π°ΠΏΠΈΡΠ°ΡΡ ΡΠΎΡ ΠΆΠ΅ Π² ΠΊΠΎΠ΄ Π² ΡΠ»Π΅Π΄ΡΡΡΠ΅ΠΌ Π²ΠΈΠ΄Π΅:
fig = px.scatter(x=x, y=f(x))
fig.show()
- Π‘ΠΎΠ·Π΄Π°ΡΠΌ ΡΠΈΠ³ΡΡΡ
- Π ΠΈΡΡΠ΅ΠΌ Π³ΡΠ°ΡΠΈΠΊ
- ΠΠΎΠΊΠ°Π·ΡΠ²Π°Π΅ΠΌ ΡΠΈΠ³ΡΡΡ
2 ΡΡΡΠΎΡΠΊΠΈ ΠΈ Π³ΠΎΡΠΎΠ²ΡΠΉ ΡΠ΅Π·ΡΠ»ΡΡΠ°Ρ. Π’.ΠΊ. ΠΌΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ Express. ΠΡΡΡΡΠΎ ΠΈ ΠΏΡΠΎΡΡΠΎ.
ΠΠΎ ΠΌΠ°Π»ΠΎΠ²Π°ΡΠΎ Π³ΠΈΠ±ΠΊΠΎΡΡΠΈ, ΠΏΠΎΡΡΠΎΠΌΡ ΠΌΡ ΠΏΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈ ΡΡΠ°Π·Ρ ΠΏΠ΅ΡΠ΅Ρ ΠΎΠ΄ΠΈΠΌ ΠΊ Π±ΠΎΠ»Π΅Π΅ ΠΏΡΠΎΠ΄Π²ΠΈΠ½ΡΡΠΎΠΌΡ ΡΡΠΎΠ²Π½Ρ β ΡΡΠ°Π·Ρ ΡΠΎΠ·Π΄Π°Π΄ΠΈΠΌ ΡΠΈΠ³ΡΡΡ ΠΈ Π½Π°Π½Π΅ΡΡΠΌ Π½Π° Π½Π΅Ρ ΠΎΠ±ΡΠ΅ΠΊΡΡ.
Π’Π°ΠΊ ΠΆΠ΅ ΡΡΠ°Π·Ρ Π²ΡΠ²Π΅Π΄Π΅ΠΌ ΡΠΈΠ³ΡΡΡ Π΄Π»Ρ ΠΏΠΎΠΊΠ°Π·Π° Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΠΌΠ΅ΡΠΎΠ΄Π° show().
Π ΠΎΡΠ»ΠΈΡΠΈΠ΅ ΠΎΡ Matplotlib ΠΎΡΠ΄Π΅Π»ΡΠ½ΡΠ΅ ΠΎΠ±ΡΠ΅ΠΊΡΡ ΠΎΡΠ΅ΠΉ Π½Π΅ ΡΠΎΠ·Π΄Π°ΡΡΡΡ, Ρ ΠΎΡΡ ΠΌΡ Ρ Π½ΠΈΠΌΠΈ Π΅ΡΡ ΡΡΠΎΠ»ΠΊΠ½ΡΠΌΡΡ, ΠΊΠΎΠ³Π΄Π° Π·Π°Ρ ΠΎΡΠΈΠΌ ΠΏΠΎΡΡΡΠΎΠΈΡΡ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π²ΠΌΠ΅ΡΡΠ΅
fig = go.Figure()
#ΠΠ΄Π΅ΡΡ Π±ΡΠ΄Π΅Ρ ΠΊΠΎΠ΄
fig.show()
ΠΠ°ΠΊ Π²ΠΈΠ΄ΠΈΠΌ, ΠΏΠΎΠΊΠ° ΠΏΡΡΡΠΎ.
Π§ΡΠΎΠ±Ρ Π΄ΠΎΠ±Π°Π²ΠΈΡΡ ΡΡΠΎ Π½Π° Π³ΡΠ°ΡΠΈΠΊ Π½Π°ΠΌ ΠΏΠΎΠ½Π°Π΄ΠΎΠ±ΠΈΡΡΡ ΠΌΠ΅ΡΠΎΠ΄ ΡΠΈΠ³ΡΡΡ add_trace.
fig. add_trace(Π’Π£Π’_Π’Π_Π§Π’Π_Π₯ΠΠ’ΠΠ_ΠΠΠ ΠΠΠΠ’Π¬_ΠΠΠ―_ΠΠ’ΠΠΠ ΠΠΠΠΠΠ―_Π_ΠΠΠ)
ΠΠΎ Π§Π’Π ΠΌΡ Ρ ΠΎΡΠΈΠΌ Π½Π°ΡΠΈΡΠΎΠ²Π°ΡΡ? ΠΡΠ°ΡΠΈΠΊ ΠΏΠΎ ΡΠΎΡΠΊΠ°ΠΌ. ΠΡΠ°ΡΠΈΠΊ ΠΌΡ ΡΠΆΠ΅ ΡΠΈΡΠΎΠ²Π°Π»ΠΈ Ρ ΠΏΠΎΠΌΠΎΡΡΡ Scatter Π² ΠΠΊΡΠΏΡΠ΅ΡΡΠ΅, Ρ ΠΠ±ΡΠ΅ΠΊΡΠΎΠ² Π΅ΡΡΡ ΡΠ²ΠΎΠΉ Scatter, Π΄Π°Π²Π°ΠΉΡΠ΅ Π³Π»ΡΠ½Π΅ΠΌ ΡΡΠΎ ΠΎΠ½ Π΄Π΅Π»Π°Π΅Ρ:
go.Scatter(x=x, y=f(x))
Π ΡΠ΅ΠΏΠ΅ΡΡ ΠΎΠ±ΡΠ΅Π΄ΠΈΠ½ΠΈΠΌ:
fig = go.Figure()
fig.add_trace(go.Scatter(x=x, y=f(x)))
fig.show()
ΠΠ°ΠΊ Π²ΠΈΠ΄ΠΈΠΌ, ΠΎΡΠ»ΠΈΡΠΈΡ Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ Π² ΠΊΠΎΠ΄Π΅, Π½ΠΎ ΠΈ Π² ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ΅ β ΠΏΠΎΠ»ΡΡΠΈΠ»Π°ΡΡ Π³Π»Π°Π΄ΠΊΠ°Ρ ΠΊΡΠΈΠ²Π°Ρ.
ΠΡΠΎΠΌΠ΅ ΡΠΎΠ³ΠΎ, ΡΠ°ΠΊΠΎΠΉ ΡΠΏΠΎΡΠΎΠ± ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ Π½Π°ΠΌ Π½Π°Π½Π΅ΡΡΠΈ Π½Π° Π³ΡΠ°ΡΠΈΠΊ ΡΡΠΎΠ»ΡΠΊΠΎ ΠΊΡΠΈΠ²ΡΡ , ΡΠΊΠΎΠ»ΡΠΊΠΎ ΠΌΡ Ρ ΠΎΡΠΈΠΌ:
ΠΠΎΠ΄
fig = go.Figure()
fig.add_trace(go.Scatter(x=x, y=f(x)))
fig.add_trace(go.Scatter(x=x, y=x))
fig.show()
ΠΠΎΠ³ΠΎΠ΄ΠΈΡΠ΅, ΡΡΠΎ ΡΡΠΎ ΡΠ°ΠΊΠΎΠ΅? Π‘ΠΏΡΠ°Π²Π° ΠΏΠΎΡΠ²ΠΈΠ»Π°ΡΡ Π΅ΡΡ ΠΈ Π»Π΅Π³Π΅Π½Π΄Π°!
ΠΠΏΡΠΎΡΠ΅ΠΌ, Π»ΠΎΠ³ΠΈΡΠ½ΠΎ, ΠΏΠΎΠΊΠ° Π³ΡΠ°ΡΠΈΠΊ Π±ΡΠ» ΠΎΠ΄ΠΈΠ½, Π·Π°ΡΠ΅ΠΌ Π½Π°ΠΌ Π»Π΅Π³Π΅Π½Π΄Π°?
ΠΠΎ ΠΌΠ°Π³ΠΈΡ Plotly ΡΡΡ Π½Π΅ Π·Π°ΠΊΠ°Π½ΡΠΈΠ²Π°Π΅ΡΡΡ. ΠΠ°ΠΆΠΌΠΈΡΠ΅ Π½Π° Π»ΡΠ±ΡΡ ΠΈΠ· ΠΏΠΎΠ΄ΠΏΠΈΡΠ΅ΠΉ Π² Π»Π΅Π³Π΅Π½Π΄Π΅ ΠΈ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡΠΈΠΉ Π³ΡΠ°ΡΠΈΠΊ ΠΈΡΡΠ΅Π·Π½Π΅Ρ, Π° Π½Π°Π΄ΠΏΠΈΡΡ ΡΡΠ°Π½Π΅Ρ Π±ΠΎΠ»Π΅Π΅ Π±Π»Π΅Π΄Π½ΠΎΠΉ. 2$$’))
fig.add_trace(go.Scatter(x=x, y=x, name=’$$g(x)=x$$’))
fig.show()
Π ΡΠΎΠΆΠ°Π»Π΅Π½ΠΈΡ, ΡΡΠΎ ΠΈΠΌΠ΅Π΅Ρ ΡΠ²ΠΎΠΈ ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½ΠΈΡ, ΠΊΠ°ΠΊ ΠΌΠΎΠΆΠ½ΠΎ Π·Π°ΠΌΠ΅ΡΠΈΡΡ ΠΏΠΎΠ΄ΡΠΊΠ°Π·ΠΊΠ° ΠΏΡΠΈ Π½Π°Π²Π΅Π΄Π΅Π½ΠΈΠΈ Π½Π° Π³ΡΠ°ΡΠΈΠΊ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ°Π΅ΡΡΡ Π² Β«ΡΡΡΠΎΠΌΒ» Π²ΠΈΠ΄Π΅, Π° Π½Π΅ Π² LATEX.
ΠΠΎΠ±Π΅Π΄ΠΈΡΡ ΡΡΠΎ ΠΌΠΎΠΆΠ½ΠΎ, Π΅ΡΠ»ΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ HTML ΡΠ°Π·ΠΌΠ΅ΡΠΊΡ Π² ΠΏΠΎΠ΄ΠΏΠΈΡΡΡ . Π Π΄Π°Π½Π½ΠΎΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅ Ρ Π±ΡΠ΄Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΡΠ΅Π³ sup. Π’Π°ΠΊ ΠΆΠ΅ Π·Π°ΠΌΠ΅ΡΡΡΠ΅, ΡΡΠΎ ΡΡΠΈΡΡ Π΄Π»Ρ LATEX ΠΈ HTML ΠΎΡΠ»ΠΈΡΠ°Π΅ΡΡΡ Π½Π°ΡΠ΅ΡΡΠ°Π½ΠΈΠ΅ΠΌ.
ΠΠΎΠ΄
fig = go.Figure()
fig.add_trace(go.Scatter(x=x, y=f(x), name='f(x)=x<sup>2</sup>'))
fig.add_trace(go.Scatter(x=x, y=x, name='$$g(x)=x$$'))
fig.show()
ΠΠ±Π·ΠΎΡ ΠΏΠ°ΠΊΠ΅ΡΠΎΠ² Π΄Π»Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ Π½Π° Python
ΠΡΡΡ ΠΌΠ½ΠΎΠ³ΠΎ ΡΠΏΠΎΡΠΎΠ±ΠΎΠ² ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π½Π° Python, Π½ΠΎ ΠΊΠ°ΠΊΠΎΠΉ ΠΈΠ· Π½ΠΈΡ Π»ΡΡΡΠ΅? ΠΠΎΠ³Π΄Π° Π²Ρ Π΄Π΅Π»Π°Π΅ΡΠ΅ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ, Π²Π°ΠΆΠ½ΠΎ Π·Π°Π΄Π°ΡΡ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ Π²ΠΎΠΏΡΠΎΡΠΎΠ² ΠΎ ΡΠ΅Π»ΠΈ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠ°: ΠΏΡΡΠ°Π΅ΡΠ΅ΡΡ Π»ΠΈ Π²Ρ ΡΠΎΠ·Π΄Π°ΡΡ ΠΏΠ΅ΡΠ²ΠΈΡΠ½ΠΎΠ΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ Π²Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ Π΄Π»Ρ Π΄Π°Π»ΡΠ½Π΅ΠΉΡΠ΅Π³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π°, ΠΈΠ»ΠΈ ΠΏΡΡΠ°Π΅ΡΠ΅ΡΡ ΠΏΡΠΎΠΈΠ·Π²Π΅ΡΡΠΈ Π²ΠΏΠ΅ΡΠ°ΡΠ»Π΅Π½ΠΈΠ΅ Π½Π° ΠΏΡΠ΅Π·Π΅Π½ΡΠ°ΡΠΈΠΈ?
Π ΡΡΠΎΠΉ ΡΡΠ°ΡΡΠ΅ Ρ ΡΠ°ΡΡΠΊΠ°ΠΆΡ ΠΎ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΡ ΠΏΠΎΠΏΡΠ»ΡΡΠ½ΡΡ ΠΏΠ°ΠΊΠ΅ΡΠ°Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Python, ΠΈΡ ΠΏΠ»ΡΡΠ°Ρ ΠΈ ΠΌΠΈΠ½ΡΡΠ°Ρ , Π° ΡΠ°ΠΊΠΆΠ΅ ΡΠΈΡΡΠ°ΡΠΈΡΡ , Π² ΠΊΠΎΡΠΎΡΡΡ ΠΊΠ°ΠΆΠ΄ΡΠΉ ΠΌΠΎΠΆΠ΅Ρ Π²ΡΠ³ΠΎΠ΄Π½ΠΎ ΠΏΡΠΎΡΠ²ΠΈΡΡ ΡΠ΅Π±Ρ. Π― Π²ΠΊΠ»ΡΡΡ Π² ΡΡΠΎΡ ΠΎΠ±Π·ΠΎΡ ΠΎΠ±ΡΡΠΆΠ΄Π΅Π½ΠΈΠ΅ ΡΠΎΠ»ΡΠΊΠΎ Π΄Π²ΡΠΌΠ΅ΡΠ½ΡΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ², Ρ ΠΎΡΡ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ ΠΈΠ· ΡΡΠΈΡ ΠΏΠ°ΠΊΠ΅ΡΠΎΠ² ΡΠ°ΠΊΠΆΠ΅ Ρ ΠΎΡΠΎΡΠΎ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΈΠ²Π°ΡΡ 3D.
ΠΠ΅ΡΠ΅Π²ΠΎΠ΄ ΡΡΠ°ΡΡΠΈ Β«Reviewing Python Visualization PackagesΒ», Π°Π²ΡΠΎΡ β Aaron Frederick, ΡΡΡΠ»ΠΊΠ° Π½Π° ΠΎΡΠΈΠ³ΠΈΠ½Π°Π» β Π² ΠΏΠΎΠ΄Π²Π°Π»Π΅ ΡΡΠ°ΡΡΠΈ.
Matplotlib, Seaborn ΠΈ Pandas
Π― ΡΠΎΠ±ΠΈΡΠ°ΡΡΡ Π²ΠΊΠ»ΡΡΠΈΡΡ ΠΈΡ Π² ΠΎΠ΄Π½Ρ Π³ΡΡΠΏΠΏΡ ΠΏΠΎ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΠΌ ΠΏΡΠΈΡΠΈΠ½Π°ΠΌ. ΠΠΎ-ΠΏΠ΅ΡΠ²ΡΡ , ΠΈΠ·-Π·Π° ΡΠΎΠ³ΠΎ, ΡΡΠΎ Π³ΡΠ°ΡΠΈΠΊΠΈ Seaborn ΠΈ Pandas Π±ΡΠ»ΠΈ ΠΏΠΎΡΡΡΠΎΠ΅Π½Ρ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Matplotlib β ΠΊΠΎΠ³Π΄Π° Π²Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΠ΅ Seaborn ΠΈΠ»ΠΈ df.plot() Π² Pandas, Π²Ρ ΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΠ΅ ΠΊΠΎΠ΄, ΠΊΠΎΡΠΎΡΡΠΉ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ Π΄Π»Ρ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Matplotlib.Β Π’Π°ΠΊΠΈΠΌ ΠΎΠ±ΡΠ°Π·ΠΎΠΌ, ΡΡΡΠ΅ΡΠΈΠΊΠ° Π΄Π»Ρ Π½ΠΈΡ ΡΡ ΠΎΠΆΠ°, ΠΈ Π½Π°ΡΡΡΠΎΠΉΠΊΠ° Π²Π°ΡΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π±ΡΠ΄Π΅Ρ Π²ΡΠ³Π»ΡΠ΄Π΅ΡΡ ΠΎΡΠ΅Π½Ρ ΠΏΠΎΡ ΠΎΠΆΠΈΠΌ ΠΎΠ±ΡΠ°Π·ΠΎΠΌ.
ΠΠΎΠ³Π΄Π° Ρ Π΄ΡΠΌΠ°Ρ ΠΎΠ± ΡΡΠΈΡ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠ°Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ, Ρ Π΄ΡΠΌΠ°Ρ ΠΎ ΡΡΠ΅Ρ ΡΠ»ΠΎΠ²Π°Ρ : ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»ΡΡΠΊΠΈΠΉ Π°Π½Π°Π»ΠΈΠ· Π΄Π°Π½Π½ΡΡ .Β ΠΡΠΈ ΠΏΠ°ΠΊΠ΅ΡΡ ΠΎΡΠ»ΠΈΡΠ½ΠΎ ΠΏΠΎΠ΄Ρ ΠΎΠ΄ΡΡ Π΄Π»Ρ ΠΏΠ΅ΡΠ²ΠΎΠ³ΠΎ Π²Π·Π³Π»ΡΠ΄Π° Π½Π° Π²Π°ΡΠΈ Π΄Π°Π½Π½ΡΠ΅, Π½ΠΎ ΠΈΡ Π½Π΅ Ρ Π²Π°ΡΠ°Π΅Ρ, ΠΊΠΎΠ³Π΄Π° Π΄Π΅Π»ΠΎ Π΄ΠΎΡ ΠΎΠ΄ΠΈΡ Π΄ΠΎ ΠΏΡΠ΅Π·Π΅Π½ΡΠ°ΡΠΈΠΈ.Β Matplotlib β ΡΡΠΎ Π½ΠΈΠ·ΠΊΠΎΡΡΠΎΠ²Π½Π΅Π²Π°Ρ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ°, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΎΠ±Π΅ΡΠΏΠ΅ΡΠΈΠ²Π°Π΅Ρ Π½Π΅Π²Π΅ΡΠΎΡΡΠ½ΡΠ΅ ΡΡΠΎΠ²Π½ΠΈ Π½Π°ΡΡΡΠΎΠΉΠΊΠΈ (ΡΠ°ΠΊ ΡΡΠΎ Π½Π΅ ΡΡΠΎΠΈΡ ΠΈΡΠΊΠ»ΡΡΠ°ΡΡ Π΅Π΅ ΠΊΠ°ΠΊ Π²Π°ΡΠΈΠ°Π½Ρ Π΄Π»Ρ ΠΏΡΠ΅Π·Π΅Π½ΡΠ°ΡΠΈΠΈ!), ΠΠΎ Π΅ΡΡΡ ΠΌΠ½ΠΎΠ³ΠΎ Π΄ΡΡΠ³ΠΈΡ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠ², ΠΊΠΎΡΠΎΡΡΠ΅ Π΄Π΅Π»Π°ΡΡ Π²Π΅Π»ΠΈΠΊΠΎΠ»Π΅ΠΏΠ½ΡΡ Π³ΡΠ°ΡΠΈΠΊΡ, Π΄ΠΎΡΡΠΎΠΉΠ½ΡΡ ΠΏΡΠ΅Π·Π΅Π½ΡΠ°ΡΠΈΠΈ, Π½Π°ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΡΠΎΡΠ΅. Β Matplotlib ΡΠ°ΠΊΠΆΠ΅ ΠΈΠΌΠ΅Π΅Ρ Π½Π°Π±ΠΎΡΒ ΡΡΠΈΠ»Π΅ΠΉ,Β ΠΊΠΎΡΠΎΡΡΠ΅ ΠΏΠΎ Π²Π½Π΅ΡΠ½Π΅ΠΌΡ ΡΡΠΈΠ»Ρ ΠΈΠΌΠΈΡΠΈΡΡΡΡ Π΄ΡΡΠ³ΠΈΠ΅ ΠΏΠΎΠΏΡΠ»ΡΡΠ½ΡΠ΅ ΠΏΠ°ΠΊΠ΅ΡΡ, ΡΠ°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ ggplot2 ΠΈ xkcd.Β ΠΠΈΠΆΠ΅ ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½Ρ Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ ΠΏΡΠΈΠΌΠ΅ΡΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ², ΡΠΎΠ·Π΄Π°Π½Π½ΡΡ Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ Matplotlib ΠΈ Π΅Π³ΠΎ Π΄Π²ΠΎΡΡΠΎΠ΄Π½ΡΡ Π±ΡΠ°ΡΡΠ΅Π².
ΠΡΠΈ ΡΠ°Π±ΠΎΡΠ΅ Ρ Π΄Π°ΡΠ°ΡΠ΅ΡΠΎΠΌ, ΡΠΎΠ΄Π΅ΡΠΆΠ°ΡΠΈΠΌ Π΄Π°Π½Π½ΡΠ΅ ΠΎ Π·Π°ΡΠΏΠ»Π°ΡΠ΅ Π² Π±Π°ΡΠΊΠ΅ΡΠ±ΠΎΠ»Π΅, Ρ Ρ ΠΎΡΠ΅Π» Π½Π°ΠΉΡΠΈ ΠΊΠΎΠΌΠ°Π½Π΄Ρ, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΈΠΌΠ΅Π»ΠΈ ΡΠ°ΠΌΡΠ΅ Π²ΡΡΠΎΠΊΠΈΠ΅ Π΄Π°Π½Π½ΡΠ΅ ΠΎ ΡΡΠ΅Π΄Π½Π΅ΠΉ Π·Π°ΡΠΏΠ»Π°ΡΠ΅.Β Π§ΡΠΎΠ±Ρ ΠΏΠΎΠΊΠ°Π·Π°ΡΡ ΡΡΠΎ, Ρ Π²ΡΠ²Π΅Π» ΡΠ²Π΅ΡΠΎΠ²ΡΡ Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΡ Ρ Π·Π°ΡΠΏΠ»Π°ΡΠΎΠΉ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΊΠΎΠΌΠ°Π½Π΄Ρ Π½ΠΈΠΆΠ΅, ΡΡΠΎΠ±Ρ ΠΏΠΎΠΊΠ°Π·Π°ΡΡ, ΠΊ ΠΊΠ°ΠΊΠΈΠΌ ΠΊΠΎΠΌΠ°Π½Π΄Π°ΠΌ ΡΠ»Π΅Π΄ΡΠ΅Ρ ΠΎΠ±ΡΠ°ΡΠ°ΡΡΡΡ, ΡΡΠΎΠ±Ρ Π±ΡΡΡ Π² ΠΊΠΎΠΌΠ°Π½Π΄Π΅, ΠΊΠΎΡΠΎΡΠ°Ρ Ρ ΠΎΡΠΎΡΠΎ ΠΏΠ»Π°ΡΠΈΡ.
import seaborn as sns import matplotlib.pyplot as plt color_order = ['xkcd:cerulean', 'xkcd:ocean', 'xkcd:black','xkcd:royal purple', 'xkcd:royal purple', 'xkcd:navy blue', 'xkcd:powder blue', 'xkcd:light maroon', 'xkcd:lightish blue','xkcd:navy'] sns.barplot(x=top10.Team, y=top10.Salary,
ΠΡΠΎΡΡΠ°Ρ Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΠ° Π² matplotlib
ΠΡΠΎΡ Π²ΡΠΎΡΠΎΠΉ Π³ΡΠ°ΡΠΈΠΊ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΠ΅Ρ ΡΠΎΠ±ΠΎΠΉ Π³ΡΠ°ΡΠΈΠΊ Q-Q ΠΎΡΡΠ°ΡΠΊΠΎΠ² ΡΠ΅Π³ΡΠ΅ΡΡΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠ°.Β ΠΡΠ½ΠΎΠ²Π½Π°Ρ ΡΠ΅Π»Ρ ΡΡΠΎΠΉ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ β ΠΏΠΎΠΊΠ°Π·Π°ΡΡ, ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΡΡΠΎΠΊ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎ Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ΠΏΠΎΠ»Π΅Π·Π½ΠΎΠΉ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ, Π΄Π°ΠΆΠ΅ Π΅ΡΠ»ΠΈ ΡΡΡΠ΅ΡΠΈΠΊΠ° Π½Π΅ ΡΠ½ΠΎΠ³ΡΡΠΈΠ±Π°ΡΠ΅Π»ΡΠ½Π°.
import matplotlib.pyplot as plt import scipy.stats as stats #model2 is a regression model log_resid = model2.predict(X_test)-y_test stats.probplot(log_resid, dist="norm", plot=plt) plt.title("Normal Q-Q plot") plt.show()
Π ΠΊΠΎΠ½Π΅ΡΠ½ΠΎΠΌ ΡΡΠ΅ΡΠ΅, Matplotlib ΠΈ Π΅Π³ΠΎ ΡΠΎΠ΄ΡΡΠ²Π΅Π½Π½ΠΈΠΊΠΈ ΠΎΡΠ΅Π½Ρ ΡΡΡΠ΅ΠΊΡΠΈΠ²Π½Ρ, Π½ΠΎ, ΠΊΠ°ΠΊ ΠΏΡΠ°Π²ΠΈΠ»ΠΎ, Π½Π΅ ΡΠ²Π»ΡΡΡΡΡ ΠΊΠΎΠ½Π΅ΡΠ½ΡΠΌ ΠΏΡΠΎΠ΄ΡΠΊΡΠΎΠΌ Π² ΠΏΠ»Π°Π½Π΅ ΠΏΡΠ΅Π·Π΅Π½ΡΠ°ΡΠΈΠΈ.
ggplot (2)
Β«ΠΠΎΡΠ΅ΠΌΡ ΡΡ Π³ΠΎΠ²ΠΎΡΠΈΡΡ ΠΎ ggplot, ΡΠ°ΠΌΠΎΠΌ ΠΏΠΎΠΏΡΠ»ΡΡΠ½ΠΎΠΌ ΠΏΠ°ΠΊΠ΅ΡΠ΅ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ R?Β Π Π°Π·Π²Π΅ ΡΡΠΎ Π½Π΅ ΠΎΠ±Π·ΠΎΡ ΠΏΠ°ΠΊΠ΅ΡΠΎΠ² Π΄Π»Ρ Python? Β»- ΡΠΏΡΠΎΡΠΈΡΠ΅ Π²Ρ.Β ΠΡΠ΄ΠΈ ΡΠ΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π»ΠΈ ggplot2 Π² Python, ΠΊΠΎΠΏΠΈΡΡΡ Π²ΡΠ΅ ΠΎΡ ΡΡΡΠ΅ΡΠΈΠΊΠΈ Π΄ΠΎ ΡΠΈΠ½ΡΠ°ΠΊΡΠΈΡΠ°.Β ΠΠ½ Π²ΡΠ³Π»ΡΠ΄ΠΈΡ ΠΈ ΠΎΡΡΡΠ°Π΅ΡΡΡ ΠΊΠ°ΠΊ ggplot2, Π½ΠΎ Ρ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΡΠΌ Π±ΠΎΠ½ΡΡΠΎΠΌ Π½Π°Π»ΠΈΡΠΈΡ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΠΎΡ ΡΠΆΠ΅ ΡΡΡΠ°ΡΠ΅Π²ΡΠ΅ΠΉ Π²Π΅ΡΡΠΈΠΈ ΠΏΠ°ΠΊΠ΅ΡΠ° Pandas.Β ΠΡΠ»ΠΈ Π²Ρ Ρ ΠΎΡΠΈΡΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΠΠ‘Π’ΠΠ―Π©ΠΠ ggplot Π² R (ΠΊΠΎΡΠΎΡΡΠΉ ΠΈΠΌΠ΅Π΅Ρ ΡΠ°ΠΊΠΎΠΉ ΠΆΠ΅ ΡΠΈΠ½ΡΠ°ΠΊΡΠΈΡ ΠΈ Π²Π½Π΅ΡΠ½ΠΈΠΉ Π²ΠΈΠ΄, Π½ΠΎ Π±Π΅Π· Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠ΅ΠΉ),Β Ρ ΡΠ°ΡΡΠΊΠ°ΠΆΡ ΠΎ Π½Π΅ΠΊΠΎΡΠΎΡΡΡ Π΅Π³ΠΎ ΠΏΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π°Ρ Π·Π΄Π΅ΡΡ!Β Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅, Π΅ΡΠ»ΠΈ Π²Ρ Π΄Π΅ΠΉΡΡΠ²ΠΈΡΠ΅Π»ΡΠ½ΠΎ Ρ ΠΎΡΠΈΡΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ggplot Π² Python, Π²Ρ Π΄ΠΎΠ»ΠΆΠ½Ρ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ Pandas Π²Π΅ΡΡΠΈΠΈ 0. 19.2, Π½ΠΎ Ρ Π±Ρ ΠΏΡΠ΅Π΄ΠΎΡΡΠ΅ΡΠ΅Π³ Π²Π°Ρ ΠΎΡ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΡ Π²Π΅ΡΡΠΈΠΈ Π²Π°ΡΠ΅Π³ΠΎ Pandas.
Π ΡΠ΅ΠΌ ggplot2 (ΠΈ, Ρ Π΄ΡΠΌΠ°Ρ, ggplot Π΄Π»Ρ Python) ΠΌΠ΅Π½ΡΠ΅Ρ ΠΏΡΠ°Π²ΠΈΠ»Π° ΠΈΠ³ΡΡ, ΡΠ°ΠΊ ΡΡΠΎ ΡΠΎ, ΡΡΠΎ ΠΎΠ½ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ Β«ΠΡΠ°ΠΌΠΌΠ°ΡΠΈΠΊΡ Π³ΡΠ°ΡΠΈΠΊΠΈΒ» Π΄Π»Ρ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ ΡΠΈΠ³ΡΡΡ.Β ΠΡΠ½ΠΎΠ²Π½Π°Ρ ΠΏΡΠ΅Π΄ΠΏΠΎΡΡΠ»ΠΊΠ° Π·Π°ΠΊΠ»ΡΡΠ°Π΅ΡΡΡ Π² ΡΠΎΠΌ, ΡΡΠΎ Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΡΠΎΠ·Π΄Π°ΡΡ ΡΠΊΠ·Π΅ΠΌΠΏΠ»ΡΡ ΡΠ²ΠΎΠ΅Π³ΠΎ Π³ΡΠ°ΡΠΈΠΊΠ°, Π° Π·Π°ΡΠ΅ΠΌ ΠΎΡΠ΄Π΅Π»ΡΠ½ΠΎ Π΄ΠΎΠ±Π°Π²ΠΈΡΡ ΠΊ Π½Π΅ΠΌΡ ΡΠ°Π·Π»ΠΈΡΠ½ΡΠ΅ ΡΡΠ½ΠΊΡΠΈΠΈ, Ρ.Π΅. ΠΠ°Π³ΠΎΠ»ΠΎΠ²ΠΎΠΊ, ΠΎΡΠΈ, ΡΠΎΡΠΊΠΈ Π΄Π°Π½Π½ΡΡ ΠΈ Π»ΠΈΠ½ΠΈΡ ΡΡΠ΅Π½Π΄Π° Π΄ΠΎΠ±Π°Π²Π»ΡΡΡΡΡ ΠΏΠΎ ΠΎΡΠ΄Π΅Π»ΡΠ½ΠΎΡΡΠΈ ΡΠΎ ΡΠ²ΠΎΠΈΠΌΠΈ ΡΠΎΠ±ΡΡΠ²Π΅Π½Π½ΡΠΌΠΈ ΡΡΡΠ΅ΡΠΈΡΠ΅ΡΠΊΠΈΠΌΠΈ ΡΠ²ΠΎΠΉΡΡΠ²Π°ΠΌΠΈ.Β ΠΠΈΠΆΠ΅ ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½ ΠΏΡΠΎΡΡΠΎΠΉ ΠΏΡΠΈΠΌΠ΅Ρ ΠΊΠΎΠ΄Π° ggplot Π½Π° R.Β Π‘Π½Π°ΡΠ°Π»Π° ΠΌΡ ΡΠΎΠ·Π΄Π°Π΅ΠΌ Π½Π°Ρ ΡΠΈΡΡΠ½ΠΎΠΊ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ggplot, ΡΡΡΠ°Π½Π°Π²Π»ΠΈΠ²Π°Π΅ΠΌ Π½Π°ΡΠ΅ ΠΎΡΠΎΡΠΌΠ»Π΅Π½ΠΈΠ΅ ΠΈ Π΄Π°Π½Π½ΡΠ΅, Π·Π°ΡΠ΅ΠΌ Π΄ΠΎΠ±Π°Π²Π»ΡΠ΅ΠΌ ΡΠΎΡΠΊΠΈ, ΡΠ΅ΠΌΡ ΠΈ ΠΌΠ΅ΡΠΊΠΈ ΠΎΡΠΈ/Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠ°.
#All Salaries ggplot(data=df, aes(x=season_start, y=salary, colour=team)) + geom_point() + theme(legend.position="none") + labs(title = 'Salary Over Time', x='Year', y='Salary ($)')
Bokeh
Bokeh ΡΡΠΎ ΠΊΡΠ°ΡΠΈΠ²ΠΎ.Β ΠΠΎΠ½ΡΠ΅ΠΏΡΡΠ°Π»ΡΠ½ΠΎ ΠΏΠΎΡ ΠΎΠΆ Π½Π° ggplot Π² ΡΠΎΠΌ,ΡΡΠΎ ΠΎΠ½ ΡΠΎΠΆΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ Π³ΡΠ°ΠΌΠΌΠ°ΡΠΈΠΊΡ Π³ΡΠ°ΡΠΈΠΊΠΈ Π΄Π»Ρ ΡΡΡΡΠΊΡΡΡΠΈΡΠΎΠ²Π°Π½ΠΈΡ ΡΠ²ΠΎΠΈΡ ΡΠΈΠ³ΡΡ. Bokeh ΠΈΠΌΠ΅Π΅Ρ ΠΏΡΠΎΡΡΠΎΠΉ Π² ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠΈ ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡ, ΠΊΠΎΡΠΎΡΡΠΉ ΡΠΎΠ·Π΄Π°Π΅Ρ ΠΎΡΠ΅Π½Ρ ΠΏΡΠΎΡΠ΅ΡΡΠΈΠΎΠ½Π°Π»ΡΠ½ΡΠ΅ Π³ΡΠ°ΡΠΈΠΊΠΈ ΠΈ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΡΠ΅ ΠΏΠ°Π½Π΅Π»ΠΈ.Β Π§ΡΠΎΠ±ΡΒ ΠΏΡΠΎΠΈΠ»Π»ΡΡΡΡΠΈΡΠΎΠ²Π°ΡΡΒ ΠΌΠΎΡ ΡΠΎΡΠΊΡ Π·ΡΠ΅Π½ΠΈΡ (ΠΈΠ·Π²ΠΈΠ½ΠΈΡΠ΅!), ΠΠΈΠΆΠ΅ ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½ ΠΏΡΠΈΠΌΠ΅Ρ ΠΊΠΎΠ΄Π° Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΡ ΠΈΠ· Π½Π°Π±ΠΎΡΠ° Π΄Π°Π½Π½ΡΡ 538 Masculinity Survey.
import pandas as pd from bokeh.plotting import figure from bokeh.io import show # is_masc is a one-hot encoded dataframe of responses to the question: # "Do you identify as masculine?" #Dataframe Prep counts = is_masc.sum() resps = is_masc.columns #Bokeh p2 = figure(title='Do You View Yourself As Masculine?', x_axis_label='Response', y_axis_label='Count', x_range=list(resps)) p2.vbar(x=resps, top=counts, width=0.6, fill_color='red', line_color='black') show(p2) #Pandas counts.plot(kind='bar')
ΠΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΠ° Π² Bokeh
ΠΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΠ° ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°Π΅Ρ ΠΎΡΠ²Π΅ΡΡ Π½Π° Π²ΠΎΠΏΡΠΎΡ Β«ΠΡ ΠΈΠ΄Π΅Π½ΡΠΈΡΠΈΡΠΈΡΡΠ΅ΡΠ΅ ΡΠ΅Π±Ρ ΠΊΠ°ΠΊ ΠΌΡΠΆΡΠΊΠΎΠ³ΠΎ ΠΏΠΎΠ»Π°?Β», ΠΊΠ°ΠΊ Π±ΡΠ»ΠΎ Π·Π°Π΄Π°Π½ΠΎ Π² Π½Π΅Π΄Π°Π²Π½Π΅ΠΌ ΠΎΠΏΡΠΎΡΠ΅ (538 Masculinity Survey).Β ΠΠΎΠ΄ Bokeh ΡΠΎΠ·Π΄Π°Π΅Ρ ΡΠ»Π΅Π³Π°Π½ΡΠ½ΡΡ ΠΈ ΠΏΡΠΎΡΠ΅ΡΡΠΈΠΎΠ½Π°Π»ΡΠ½ΡΡ Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΡ ΠΏΠΎΠ΄ΡΡΠ΅ΡΠ° ΠΎΡΠ²Π΅ΡΠΎΠ² Ρ ΡΠ°Π·ΡΠΌΠ½ΡΠΌ ΡΠ°Π·ΠΌΠ΅ΡΠΎΠΌ ΡΡΠΈΡΡΠ°, Π·Π°ΡΠ΅ΡΠΊΠ°ΠΌΠΈ ΠΏΠΎ ΠΎΡΡΠΌ ΠΈ ΡΠΎΡΠΌΠ°ΡΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ. Β ΠΠΎΠ»ΡΡΠ°Ρ ΡΠ°ΡΡΡ ΠΊΠΎΠ΄Π°, ΠΊΠΎΡΠΎΡΡΠΉ Ρ Π½Π°ΠΏΠΈΡΠ°Π», Π±ΡΠ»Π° ΠΏΠΎΡΠ²ΡΡΠ΅Π½Π° ΠΌΠ°ΡΠΊΠΈΡΠΎΠ²ΠΊΠ΅ ΠΎΡΠ΅ΠΉ ΠΈ Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠΎΠ², Π° ΡΠ°ΠΊΠΆΠ΅ ΠΏΡΠΈΠ΄Π°Π½ΠΈΡ ΡΡΠΎΠ»Π±ΡΠ°ΠΌ ΡΠ²Π΅ΡΠ° ΠΈ Π³ΡΠ°Π½ΠΈΡΡ.Β ΠΠ΅Π»Π°Ρ ΠΊΡΠ°ΡΠΈΠ²ΡΠ΅, ΠΏΡΠ΅Π·Π΅Π½ΡΠ°Π±Π΅Π»ΡΠ½ΡΠ΅ ΡΠΈΠ³ΡΡΡ, Ρ ΠΎΡΠ΅Π½Ρ ΡΠΈΠ»ΡΠ½ΠΎ ΡΠΊΠ»ΠΎΠ½ΡΡΡΡ ΠΊ Bokeh β ΠΌΠ½ΠΎΠ³ΠΎ ΡΡΡΠ΅ΡΠΈΡΠ΅ΡΠΊΠΎΠΉ ΡΠ°Π±ΠΎΡΡ ΡΠΆΠ΅ ΡΠ΄Π΅Π»Π°Π½ΠΎ Π΄Π»Ρ Π½Π°Ρ!
Π’Π° ΠΆΠ΅ Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΠ° ΠΏΠΎ ΡΠΌΠΎΠ»ΡΠ°Π½ΠΈΡ Π² Pandas
Π‘ΠΈΠ½ΠΈΠΉ Π³ΡΠ°ΡΠΈΠΊ β ΡΡΠΎ ΡΠΎ, ΡΡΠΎ ΠΏΡΠΎΠΈΡΡ ΠΎΠ΄ΠΈΡ ΠΈΠ· Π΅Π΄ΠΈΠ½ΡΡΠ²Π΅Π½Π½ΠΎΠΉ ΠΏΠΎΡΠ»Π΅Π΄Π½Π΅ΠΉ ΡΡΡΠΎΠΊΠΈ ΠΈΠ· ΠΊΠΎΠ΄Π° Π²ΡΡΠ΅.Β ΠΠ±Π΅ Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΡ ΠΈΠΌΠ΅ΡΡ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΡΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΡ, Π½ΠΎ ΡΠ»ΡΠΆΠ°Ρ ΡΠ°Π·Π½ΡΠΌ ΡΠ΅Π»ΡΠΌ.Β Π ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»ΡΡΠΊΠΎΠΉ ΠΎΠ±ΡΡΠ°Π½ΠΎΠ²ΠΊΠ΅ Π³ΠΎΡΠ°Π·Π΄ΠΎ ΡΠ΄ΠΎΠ±Π½Π΅Π΅ Π½Π°ΠΏΠΈΡΠ°ΡΡ ΠΎΠ΄Π½Ρ ΡΡΡΠΎΠΊΡ Π² Pandas, ΡΡΠΎΠ±Ρ ΡΠ²ΠΈΠ΄Π΅ΡΡ Π΄Π°Π½Π½ΡΠ΅, Π½ΠΎ ΡΡΡΠ΅ΡΠΈΠΊΠ° Bokeh ΡΠ²Π½ΠΎ ΡΠ²Π½ΠΎ Π»ΡΡΡΠ΅.Β ΠΠ°ΠΆΠ΄ΠΎΠ΅ ΡΠ΄ΠΎΠ±ΡΡΠ²ΠΎ, ΠΊΠΎΡΠΎΡΠΎΠ΅ ΠΎΠ±Π΅ΡΠΏΠ΅ΡΠΈΠ²Π°Π΅Ρ Bokeh ΠΏΠΎ ΡΠΌΠΎΠ»ΡΠ°Π½ΠΈΡ, ΡΡΠ΅Π±ΡΠ΅Ρ Π½Π°ΡΡΡΠΎΠΉΠΊΠΈ Π² matplotlib, Π±ΡΠ΄Ρ ΡΠΎ ΡΠ³ΠΎΠ» Π½Π°Π»ΠΎΠΆΠ΅Π½ΠΈΡ ΠΌΠ΅ΡΠΎΠΊ Π²Π΄ΠΎΠ»Ρ Π³ΠΎΡΠΈΠ·ΠΎΠ½ΡΠ°Π»ΡΠ½ΠΎΠΉ ΠΎΡΠΈ, ΡΠΎΠ½ΠΎΠ²ΡΠ΅ Π»ΠΈΠ½ΠΈΠΈ, ΡΠ°Π·Π±ΡΠΎΡ Π΄Π΅Π»Π΅Π½ΠΈΠΉ ΠΏΠΎ Π²Π΅ΡΡΠΈΠΊΠ°Π»ΡΠ½ΠΎΠΉ ΠΎΡΠΈ, ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΡΠ°Π·ΠΌΠ΅ΡΠ° ΡΡΠΈΡΡΠ°/Π²ΡΠ΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΊΡΡΡΠΈΠ²ΠΎΠΌ/Π²ΡΠ΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΆΠΈΡΠ½ΡΠΌ ΠΈ Ρ.Π΄.
ΠΠ° ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠΌ Π½ΠΈΠΆΠ΅ Π³ΡΠ°ΡΠΈΠΊΠ΅ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΠ»ΡΡΠ°ΠΉΠ½ΡΡ ΡΡΠ΅Π½Π΄ΠΎΠ² Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΡ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΡΡ Π½Π°ΡΡΡΠΎΠ΅ΠΊ Ρ Π»Π΅Π³Π΅Π½Π΄Π°ΠΌΠΈ ΠΈ ΡΠ°Π·Π»ΠΈΡΠ½ΡΠΌΠΈ ΡΠΈΠΏΠ°ΠΌΠΈ Π»ΠΈΠ½ΠΈΠΉ ΠΈ ΡΠ²Π΅ΡΠ°ΠΌΠΈ:
Π’ΡΠ΅Π½Π΄Ρ Ρ Π»Π΅Π³Π΅Π½Π΄ΠΎΠΉ Π² Bokeh
Bokeh ΡΠ°ΠΊΠΆΠ΅ ΠΎΡΠ»ΠΈΡΠ½ΡΠΉ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½Ρ Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² (dashboards). Β Π― Π½Π΅ Ρ ΠΎΡΡ Π²Π΄Π°Π²Π°ΡΡΡΡ Π² ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΠ΅ Π³ΡΠ°ΡΠΈΠΊΠΈ Π² ΡΡΠΎΠΌ ΠΏΠΎΡΡΠ΅, Π½ΠΎ Π΅ΡΡΡ ΠΎΡΠ»ΠΈΡΠ½ΡΠ΅ ΠΏΠΎΡΡΡ (Π²ΡΠΎΠ΄Π΅ ΡΡΠΎΠ³ΠΎ), ΠΊΠΎΡΠΎΡΡΠ΅ Π±ΠΎΠ»ΡΡΠ΅ ΡΠ°ΡΡΠΊΠ°Π·ΡΠ²Π°ΡΡ ΠΎ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠΈ ΠΈ ΡΠ΅Π°Π»ΠΈΠ·Π°ΡΠΈΠΈ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π² Bokeh.
Plotly
Plotly ΡΡΠ΅Π·Π²ΡΡΠ°ΠΉΠ½ΠΎ ΠΌΠΎΡΠ½ΡΠΉ, Π½ΠΎ Π½Π°ΡΡΡΠΎΠΉΠΊΠ° ΠΈ ΡΠΎΠ·Π΄Π°Π½ΠΈΠ΅ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π² Π½Π΅ΠΌ Π·Π°Π½ΠΈΠΌΠ°ΡΡ ΠΌΠ½ΠΎΠ³ΠΎ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ, ΠΈ ΡΡΠ° Π½Π°ΡΡΡΠΎΠΉΠΊΠ° Π½Π΅ ΡΠ²Π»ΡΠ΅ΡΡΡ ΠΈΠ½ΡΡΠΈΡΠΈΠ²Π½ΠΎ ΠΏΠΎΠ½ΡΡΠ½ΠΎΠΉ.Β ΠΡΠΎΠ²Π΅Π΄Ρ Π±ΠΎΠ»ΡΡΡΡ ΡΠ°ΡΡΡ ΡΡΡΠ°, ΡΠ°Π±ΠΎΡΠ°Ρ Ρ Plotly, Ρ ΠΏΠΎΡΠ΅Π» Π½Π° ΠΎΠ±Π΅Π΄, ΠΏΠΎΡΡΠΈ Π½ΠΈΡΠ΅Π³ΠΎ Π½Π΅ ΠΏΠΎΠΊΠ°Π·Π°Π² Π² ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ΅.Β Π― ΡΠΎΠ·Π΄Π°Π» Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΡ Π±Π΅Π· ΠΌΠ΅ΡΠΎΠΊ Π½Π° ΠΎΡΡΡ ΠΈ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ ΡΠ°ΡΡΠ΅ΡΠ½ΠΈΡ, Π² ΠΊΠΎΡΠΎΡΠΎΠΉ Π±ΡΠ»ΠΈ Π»ΠΈΠ½ΠΈΠΈ, ΠΊΠΎΡΠΎΡΡΠ΅ Ρ Π½Π΅ ΠΌΠΎΠ³ ΡΠ΄Π°Π»ΠΈΡΡ.Β ΠΠ΅ΠΊΠΎΡΠΎΡΡΠ΅ Π·Π°ΠΌΠ΅ΡΠ½ΡΠ΅ ΠΌΠΈΠ½ΡΡΡ ΠΏΡΠΈ Π½Π°ΡΠ°Π»Π΅ ΡΠ°Π±ΠΎΡΡ Ρ Plotly:
- Π’ΡΠ΅Π±ΡΠ΅ΡΡΡ ΠΊΠ»ΡΡ API ΠΈ ΡΠ΅Π³ΠΈΡΡΡΠ°ΡΠΈΡ, Π° Π½Π΅ ΠΏΡΠΎΡΡΠΎ ΡΡΡΠ°Π½ΠΎΠ²ΠΊΠ° ΡΠ΅ΡΠ΅Π· pip
- ΠΠ½ ΡΡΡΠΎΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΈ Π΄Π°Π½Π½ΡΡ /ΡΠ»ΠΎΠ΅Π² (layouts), ΠΊΠΎΡΠΎΡΡΠ΅ ΡΠ²Π»ΡΡΡΡΡ ΡΠ½ΠΈΠΊΠ°Π»ΡΠ½ΡΠΌΠΈ Π΄Π»Ρ Plotly ΠΈ Π½Π΅ ΡΠ²Π»ΡΡΡΡΡ ΠΈΠ½ΡΡΠΈΡΠΈΠ²Π½ΠΎ ΠΏΠΎΠ½ΡΡΠ½ΡΠΌΠΈ
- Π‘Π»ΠΎΠΉ Π½Π° Π³ΡΠ°ΡΠΈΠΊΠ΅ Ρ ΠΌΠ΅Π½Ρ Π½Π΅ ΡΡΠ°Π±ΠΎΡΠ°Π» (40 ΡΡΡΠΎΠΊ ΠΊΠΎΠ΄Π° Π±ΡΠΊΠ²Π°Π»ΡΠ½ΠΎ Π½ΠΈΡΠ΅Π³ΠΎ!)
ΠΠ΄Π½Π°ΠΊΠΎ Π΄Π»Ρ Π²ΡΠ΅Ρ Π΅Π³ΠΎ Π½Π΅Π΄ΠΎΡΡΠ°ΡΠΊΠΎΠ² Π½Π°ΡΡΡΠΎΠΉΠΊΠΈ Π΅ΡΡΡ ΡΠ²ΠΎΠΈ ΠΏΠ»ΡΡΡ ΠΈ ΠΎΠ±Ρ ΠΎΠ΄Π½ΡΠ΅ ΠΏΡΡΠΈ:
- ΠΡ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΡΠ΅Π΄Π°ΠΊΡΠΈΡΠΎΠ²Π°ΡΡ Π³ΡΠ°ΡΠΈΠΊΠΈ Π½Π° Π²Π΅Π±-ΡΠ°ΠΉΡΠ΅ Plotly, Π° ΡΠ°ΠΊΠΆΠ΅ Π² ΡΡΠ΅Π΄Π΅ Python.
- ΠΠ½ΠΎΠ³ΠΎ ΡΡΠ½ΠΊΡΠΈΠΎΠ½Π°Π»Π° ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠΈ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ²/ΠΏΠ°Π½Π΅Π»Π΅ΠΉ
- Plotly ΡΠΎΡΡΡΠ΄Π½ΠΈΡΠ°Π΅Ρ Ρ Mapbox, ΡΡΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΡΠΎΠ·Π΄Π°Π²Π°ΡΡ ΠΈΠ½Π΄ΠΈΠ²ΠΈΠ΄ΡΠ°Π»ΡΠ½ΡΠ΅ ΠΊΠ°ΡΡΡ
- ΠΠΎΡΡΡΡΠ°ΡΡΠΈΠΉ ΠΏΠΎΡΠ΅Π½ΡΠΈΠ°Π» Π΄Π»Ρ ΠΎΡΠ»ΠΈΡΠ½ΠΎΠΉ Π³ΡΠ°ΡΠΈΠΊΠΈ
ΠΠ»Ρ ΠΌΠ΅Π½Ρ Π±ΡΠ»ΠΎ Π±Ρ Π½Π΅ΡΠΏΡΠ°Π²Π΅Π΄Π»ΠΈΠ²ΠΎ ΠΏΡΠΎΡΡΠΎ Π²ΡΡΠΊΠ°Π·Π°ΡΡ ΡΠ²ΠΎΠΈ ΠΏΡΠ΅ΡΠ΅Π½Π·ΠΈΠΈ ΠΊ Plotly, Π½Π΅ ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°Ρ ΠΊΠ°ΠΊΠΎΠΉ-ΡΠΎ ΠΊΠΎΠ΄ ΠΈ ΡΠΎ, ΡΡΠΎ Ρ ΡΠΌΠΎΠ³ Π΄ΠΎΡΡΠΈΡΡ ΠΏΠΎ ΡΡΠ°Π²Π½Π΅Π½ΠΈΡ Ρ ΡΠ΅ΠΌ, ΡΡΠΎ ΡΠ΄Π΅Π»Π°Π»ΠΈ Π»ΡΠ΄ΠΈ, Π±ΠΎΠ»Π΅Π΅ ΡΠΏΠΎΡΠΎΠ±Π½ΡΠ΅ Ρ ΡΡΠΈΠΌ ΠΏΠ°ΠΊΠ΅ΡΠΎΠΌ.
#plot 1 - barplot # **note** - the layout lines do nothing and trip no errors data = [go.Bar(x=team_ave_df.team, y=team_ave_df.turnovers_per_mp)] layout = go.Layout( title=go.layout.Title( text='Turnovers per Minute by Team', xref='paper', x=0 ), xaxis=go.layout.XAxis( title = go.layout.xaxis.Title( text='Team', font=dict( family='Courier New, monospace', size=18, color='#7f7f7f' ) ) ), yaxis=go.layout.YAxis( title = go.layout.yaxis.Title( text='Average Turnovers/Minute', font=dict( family='Courier New, monospace', size=18, color='#7f7f7f' ) ) ), autosize=True, hovermode='closest') py. iplot(figure_or_data=data, layout=layout, filename='jupyter-plot', sharing='public', fileopt='overwrite') #plot 2 - attempt at a scatterplot data = [go.Scatter(x=player_year.minutes_played, y=player_year.salary, marker=go.scatter.Marker(color='red', size=3))] layout = go.Layout(title="test", xaxis=dict(title='why'), yaxis=dict(title='plotly')) py.iplot(figure_or_data=data, layout=layout, filename='jupyter-plot2', sharing='public')
ΠΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΠ°, ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΡΡΠ°Ρ ΡΡΠ΅Π΄Π½Π΅Π΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΎΠ±ΠΎΡΠΎΡΠΎΠ² Π² ΠΌΠΈΠ½ΡΡΡ Ρ ΡΠ°Π·Π»ΠΈΡΠ½ΡΡ Π±Π°ΡΠΊΠ΅ΡΠ±ΠΎΠ»ΡΠ½ΡΡ ΠΊΠΎΠΌΠ°Π½Π΄ΠΠΎΠΏΡΡΠΊΠ° ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ ΡΠ°ΡΡΠ΅ΡΠ½ΠΈΡ, ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΡΡΠ΅ΠΉ Π·Π°ΡΠΏΠ»Π°ΡΡ ΠΊΠ°ΠΊ ΡΡΠ½ΠΊΡΠΈΡ ΠΎΡ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ ΠΈΠ³ΡΡ Π² Π±Π°ΡΠΊΠ΅ΡΠ±ΠΎΠ»
Π ΡΠ΅Π»ΠΎΠΌ, ΡΡΡΠ΅ΡΠΈΠΊΠ° ΠΈΠ· ΠΊΠΎΡΠΎΠ±ΠΊΠΈ Π²ΡΠ³Π»ΡΠ΄ΠΈΡ Ρ ΠΎΡΠΎΡΠΎ, Π½ΠΎ ΠΌΠ½ΠΎΠ³ΠΎΡΠΈΡΠ»Π΅Π½Π½ΡΠ΅ ΠΏΠΎΠΏΡΡΠΊΠΈ ΠΈΡΠΏΡΠ°Π²ΠΈΡΡ ΠΌΠ΅ΡΠΊΠΈ ΠΎΡΠ΅ΠΉ, Π΄ΠΎΡΠ»ΠΎΠ²Π½ΠΎ ΠΊΠΎΠΏΠΈΡΡΡΡΠΈΠ΅ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°ΡΠΈΡ, Π½Π΅ Π΄Π°Π»ΠΈ Π½ΠΈΠΊΠ°ΠΊΠΈΡ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΉ.Β ΠΠ΄Π½Π°ΠΊΠΎ, ΠΊΠ°ΠΊ Ρ ΠΈ ΠΎΠ±Π΅ΡΠ°Π» ΡΠ°Π½Π΅Π΅, Π²ΠΎΡ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ Π³ΡΠ°ΡΠΈΠΊΠΎΠ², Π½Π° ΠΊΠΎΡΠΎΡΡΡ ΠΏΠΎΠΊΠ°Π·Π°Π½ ΠΏΠΎΡΠ΅Π½ΡΠΈΠ°Π» Plotly ΠΈ ΠΏΠΎΡΠ΅ΠΌΡ ΡΡΠΎΠΈΡ ΠΏΠΎΡΡΠ°ΡΠΈΡΡ Π±ΠΎΠ»ΡΡΠ΅ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΡ ΡΠ°ΡΠΎΠ²:
ΠΠΎΡΠ΅Π½ΡΠΈΠ°Π» Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π² Plotly
Pygal
Pygal β Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ ΠΌΠ΅Π½Π΅Π΅ ΠΈΠ·Π²Π΅ΡΡΠ½ΡΠΉ ΠΏΠ°ΠΊΠ΅Ρ Π΄Π»Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΉ, ΠΊΠΎΡΠΎΡΡΠΉ, ΠΊΠ°ΠΊ ΠΈ Π΄ΡΡΠ³ΠΈΠ΅ ΠΏΠΎΠΏΡΠ»ΡΡΠ½ΡΠ΅ ΠΏΠ°ΠΊΠ΅ΡΡ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ Π³ΡΠ°ΠΌΠΌΠ°ΡΠΈΠΊΡ Π³ΡΠ°ΡΠΈΠΊΠΈ Π΄Π»Ρ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ ΡΠ²ΠΎΠΈΡ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠΉ. Β ΠΡΠΎ ΠΎΡΠ½ΠΎΡΠΈΡΠ΅Π»ΡΠ½ΠΎ ΠΏΡΠΎΡΡΠΎΠΉ ΠΏΠ°ΠΊΠ΅Ρ ΠΈΠ·-Π·Π° ΡΠΎΠ³ΠΎ, ΡΡΠΎ Π²ΡΠ΅ ΠΎΠ±ΡΠ΅ΠΊΡΡ Π½Π° Π³ΡΠ°ΡΠΈΠΊΠ΅ ΠΎΡΠ΅Π½Ρ ΠΏΡΠΈΠΌΠΈΡΠΈΠ²Π½ΡΠ΅.Β ΠΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ Pygal ΠΎΡΠ΅Π½Ρ ΠΏΡΠΎΡΡΠΎΠ΅:
- ΠΠ½ΠΈΡΠΈΠ°Π»ΠΈΠ·Π°ΡΠΈΡ Ρ ΠΎΠ»ΡΡΠ°
- Π€ΠΎΡΠΌΠ°ΡΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ² ΡΠΈΡΡΠ½ΠΊΠ° Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ Π°ΡΡΠΈΠ±ΡΡΠΎΠ²
- ΠΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠ΅ Π΄Π°Π½Π½ΡΡ ΠΊ ΡΠ²ΠΎΠ΅ΠΉ ΡΠΈΠ³ΡΡΠ΅, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ figure.add()
ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ ΠΏΡΠΎΠ±Π»Π΅ΠΌΡ, ΠΊΠΎΡΠΎΡΡΠ΅ Ρ ΠΌΠ΅Π½Ρ Π±ΡΠ»ΠΈ Ρ Pygal, Π·Π°ΠΊΠ»ΡΡΠ°Π»ΠΈΡΡ Π² ΡΠ΅Π½Π΄Π΅ΡΠ΅ Π³ΡΠ°ΡΠΈΠΊΠΎΠ².Β ΠΠ½Π΅ ΠΏΡΠΈΡΠ»ΠΎΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΈΡ ΠΌΠ΅ΡΠΎΠ΄ render_to_file, Π° Π·Π°ΡΠ΅ΠΌ ΠΎΡΠΊΡΡΡΡ ΡΡΠΎΡ ΡΠ°ΠΉΠ» Π² Π²Π΅Π±-Π±ΡΠ°ΡΠ·Π΅ΡΠ΅, ΡΡΠΎΠ±Ρ ΡΠ²ΠΈΠ΄Π΅ΡΡ, ΡΡΠΎ Ρ ΠΏΠΎΡΡΡΠΎΠΈΠ».Β Π ΠΊΠΎΠ½Π΅ΡΠ½ΠΎΠΌ ΠΈΡΠΎΠ³Π΅ ΡΡΠΎ ΡΠΎΠ³ΠΎ ΡΡΠΎΠΈΠ»ΠΎ, ΠΏΠΎΡΠΊΠΎΠ»ΡΠΊΡ Π³ΡΠ°ΡΠΈΠΊΠΈ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½Ρ ΠΈ ΠΈΠΌΠ΅ΡΡ ΠΏΡΠΈΡΡΠ½ΡΡ ΠΈ Π»Π΅Π³ΠΊΠΎ Π½Π°ΡΡΡΠ°ΠΈΠ²Π°Π΅ΠΌΡΡ ΡΡΡΠ΅ΡΠΈΠΊΡ.Β Π ΡΠ΅Π»ΠΎΠΌ, ΠΏΠ°ΠΊΠ΅Ρ ΠΊΠ°ΠΆΠ΅ΡΡΡ Ρ ΠΎΡΠΎΡΠΈΠΌ, Π½ΠΎ ΠΈΠΌΠ΅Π΅Ρ Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΠΈ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ/ΡΠ΅Π½Π΄Π΅ΡΠ° ΡΠ°ΠΉΠ»ΠΎΠ², ΠΊΠΎΡΠΎΡΡΠ΅ ΠΎΠ³ΡΠ°Π½ΠΈΡΠΈΠ²Π°ΡΡ Π΅Π³ΠΎ ΠΏΡΠΈΠ²Π»Π΅ΠΊΠ°ΡΠ΅Π»ΡΠ½ΠΎΡΡΡ.
Networkx
Networkx β ΠΎΡΠ»ΠΈΡΠ½ΠΎΠ΅ ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ Π΄Π»Ρ Π°Π½Π°Π»ΠΈΠ·Π° ΠΈ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π³ΡΠ°ΡΠΎΠ², Ρ ΠΎΡΡ Π²ΠΈΠ·ΡΠ°Π»ΡΠ½ΠΎ ΠΎΠ½ΠΎ ΠΎΡΠ½ΠΎΠ²Π°Π½ΠΎ Π½Π° matplotlib.Β ΠΡΠ°ΡΡ ΠΈ ΡΠ΅ΡΠΈ β ΡΡΠΎ Π½Π΅ ΠΌΠΎΡ ΠΏΡΠ΅Π΄ΠΌΠ΅ΡΠ½Π°Ρ ΠΎΠ±Π»Π°ΡΡΡ, Π½ΠΎ Networkx ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π±ΡΡΡΡΠΎ ΠΈ Π»Π΅Π³ΠΊΠΎ Π³ΡΠ°ΡΠΈΡΠ΅ΡΠΊΠΈ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΡΡ ΠΏΠΎΠ΄ΠΊΠ»ΡΡΠ΅Π½Π½ΡΠ΅ ΡΠ΅ΡΠΈ. Β ΠΠΈΠΆΠ΅ ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½Ρ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΠ°Π·Π»ΠΈΡΠ½ΡΡ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠΉ ΠΏΡΠΎΡΡΠΎΠ³ΠΎ Π³ΡΠ°ΡΠ°, ΠΊΠΎΡΠΎΡΡΠΉ Ρ ΠΏΠΎΡΡΡΠΎΠΈΠ», ΠΈ ΠΊΠΎΠ΄, Π½Π°ΡΠΈΠ½Π°ΡΡΠΈΠΉ ΡΡΡΠΎΠΈΡΡ Π½Π΅Π±ΠΎΠ»ΡΡΡΡ
ΠΡΡΡΠΈΠ΅ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΡ Python ETL — Python 3 | Data Science | ΠΠ΅ΠΉΡΠΎΠ½Π½ΡΠ΅ ΡΠ΅ΡΠΈ | AI
Π‘ΠΎΠ΄Π΅ΡΠΆΠ°Π½ΠΈΠ΅ ΡΡΡΠ°Π½ΠΈΡΡ
ΠΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² ETL
ETL ΡΠ²Π»ΡΠ΅ΡΡΡ ΡΠ΅ΡΠ΄ΡΠ΅ΠΌ Π»ΡΠ±ΠΎΠ³ΠΎ ΠΏΡΠΎΠ΅ΠΊΡΠ° Ρ ΡΠ°Π½ΠΈΠ»ΠΈΡΠ° Π΄Π°Π½Π½ΡΡ . ΠΡΠ±ΠΎΠΉ ΡΡΠΏΠ΅ΡΠ½ΡΠΉ ΠΏΡΠΎΠ΅ΠΊΡ Π΄Π°Π½Π½ΡΡ Π±ΡΠ΄Π΅Ρ Π²ΠΊΠ»ΡΡΠ°ΡΡ Π² ΡΠ΅Π±Ρ ΠΏΡΠΈΠ΅ΠΌ ΠΈ/ΠΈΠ»ΠΈ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΠ΅ Π±ΠΎΠ»ΡΡΠΎΠ³ΠΎ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π° Π΄Π°Π½Π½ΡΡ (ΡΡΠ°Π½Π·Π°ΠΊΡΠΈΠΉ), Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ ΠΈΠ· ΠΊΠΎΡΠΎΡΡΡ Π½Π΅ Π±ΡΠ΄ΡΡ Π΄ΠΎΠ»ΠΆΠ½ΡΠΌ ΠΎΠ±ΡΠ°Π·ΠΎΠΌ ΠΎΡΡΠΎΡΠΌΠ°ΡΠΈΡΠΎΠ²Π°Π½Ρ Π΄Π»Ρ ΡΠ²ΠΎΠ΅Π³ΠΎ ΠΊΠΎΠ½Π΅ΡΠ½ΠΎΠ³ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ. Π ΡΡΠ°ΡΡΡΡ Π΄Π»Ρ ΠΏΡΠΎΡΠ΅ΡΡΠΈΠΎΠ½Π°Π»ΠΎΠ² Π² ΠΎΠ±Π»Π°ΡΡΠΈ Π΄Π°Π½Π½ΡΡ , ΡΠΎΠΎΠ±ΡΠ΅ΡΡΠ²ΠΎ ΡΠ°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊΠΎΠ² Python ΡΠΎΠ·Π΄Π°Π»ΠΎ ΡΠΈΡΠΎΠΊΠΈΠΉ ΡΠΏΠ΅ΠΊΡΡ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠ² Ρ ΠΎΡΠΊΡΡΡΡΠΌ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΌ ΠΊΠΎΠ΄ΠΎΠΌ, ΠΊΠΎΡΠΎΡΡΠ΅ Π΄Π΅Π»Π°ΡΡ ETL ΠΏΡΠΎΡΠ΅. Π ΡΡΠ°ΡΡΠ΅ Π±ΡΠ΄Π΅Ρ ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½ ΠΎΠ±Π·ΠΎΡ Π»ΡΡΡΠΈΡ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠ² Python ETL, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΏΠΎΠΌΠΎΠ³ΡΡ ΠΠ°ΠΌ ΡΠΎΠ±ΠΈΡΠ°ΡΡ, ΠΎΡΠΈΡΠ°ΡΡ ΠΈ Π·Π°Π³ΡΡΠΆΠ°ΡΡ Π²Π°ΡΠΈ Π΄Π°Π½Π½ΡΠ΅ Π² Ρ ΡΠ°Π½ΠΈΠ»ΠΈΡΠ΅ Π΄Π°Π½Π½ΡΡ Π² ΠΏΡΠ΅ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½Π½ΠΎΠΌ Π²ΠΈΠ΄Π΅ (Π² Π½ΡΠΆΠ½ΠΎΠΌ ΡΠΎΡΠΌΠ°ΡΠ΅). ΠΠ΅ΠΊΠΎΡΠΎΡΡΠ΅ ΠΈΠ· ΡΡΠΈΡ ΠΏΠ°ΠΊΠ΅ΡΠΎΠ² ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡΡ Π²Π°ΠΌ ΡΠΏΡΠ°Π²Π»ΡΡΡ ΠΊΠ°ΠΆΠ΄ΡΠΌ ΡΠ°Π³ΠΎΠΌ ΠΏΡΠΎΡΠ΅ΡΡΠ° ETL, Π² ΡΠΎ Π²ΡΠ΅ΠΌΡ ΠΊΠ°ΠΊ Π΄ΡΡΠ³ΠΈΠ΅ Ρ ΠΎΡΠΎΡΠΈ Π½Π° ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΌ ΡΡΠ°ΠΏΠ΅ ETL ΠΏΡΠΎΡΠ΅ΡΡΠ°. Π Π»ΡΠ±ΠΎΠΌ ΡΠ»ΡΡΠ°Π΅, Π²Ρ ΠΎΠ±ΡΠ·Π°ΡΠ΅Π»ΡΠ½ΠΎ Π½Π°ΠΉΠ΄Π΅ΡΠ΅ ΡΡΠΎ-ΡΠΎ ΠΏΠΎΠ»Π΅Π·Π½ΠΎΠ΅ ΠΈΠ· ΡΡΠ°ΡΡΠΈ.
Apache Airflow
Apache Airflow (ΠΈΠ»ΠΈ ΠΏΡΠΎΡΡΠΎ Airflow) β ΡΡΠΎ ΠΏΠ»Π°ΡΡΠΎΡΠΌΠ° Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ, ΠΏΠ»Π°Π½ΠΈΡΠΎΠ²Π°Π½ΠΈΡ ΠΈ ΠΌΠΎΠ½ΠΈΡΠΎΡΠΈΠ½Π³Π° ΡΠ°Π±ΠΎΡΠΈΡ ΠΏΡΠΎΡΠ΅ΡΡΠΎΠ².
ΠΠΎΠ³Π΄Π° ΡΠ°Π±ΠΎΡΠΈΠ΅ ΠΏΡΠΎΡΠ΅ΡΡΡ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΡΡΡΡ ΠΊΠ°ΠΊ ΠΊΠΎΠ΄, ΠΎΠ½ΠΈ ΡΡΠ°Π½ΠΎΠ²ΡΡΡΡ Π±ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ½ΡΡΠ½ΡΠΌΠΈ, ΡΠΏΡΠ°Π²Π»ΡΠ΅ΠΌΡΠΌΠΈ, ΡΠ΅ΡΡΠΈΡΡΠ΅ΠΌΡΠΌΠΈ ΠΏΡΠΈ ΡΠΎΠ²ΠΌΠ΅ΡΡΠ½ΠΎΠΉ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠΊΠ΅.
ΠΡΠΏΠΎΠ»ΡΠ·ΡΠΉΡΠ΅ Airflow Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ΡΠ°Π±ΠΎΡΠΈΡ ΠΏΡΠΎΡΠ΅ΡΡΠΎΠ² Π² Π²ΠΈΠ΄Π΅ Π½Π°ΠΏΡΠ°Π²Π»Π΅Π½Π½ΡΡ Π°ΡΠΈΠΊΠ»ΠΈΡΠ΅ΡΠΊΠΈΡ Π³ΡΠ°ΡΠΎΠ² (DAG) Π·Π°Π΄Π°Ρ. ΠΠ»Π°Π½ΠΈΡΠΎΠ²ΡΠΈΠΊ Airflow Π²ΡΠΏΠΎΠ»Π½ΡΠ΅Ρ Π²Π°ΡΠΈ Π·Π°Π΄Π°ΡΠΈ, ΡΠ»Π΅Π΄ΡΡ ΡΠΊΠ°Π·Π°Π½Π½ΡΠΌ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΡΠΌ. ΠΠΎΠ³Π°ΡΡΠ΅ ΡΡΠΈΠ»ΠΈΡΡ ΠΊΠΎΠΌΠ°Π½Π΄Π½ΠΎΠΉ ΡΡΡΠΎΠΊΠΈ Π΄Π΅Π»Π°ΡΡ Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ ΡΠ»ΠΎΠΆΠ½ΡΡ ΠΎΠΏΠ΅ΡΠ°ΡΠΈΠΉ Π½Π° DAG ΠΏΡΠΎΡΠ΅. ΠΠΎΠ³Π°ΡΡΠΉ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»ΡΡΠΊΠΈΠΉ ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π»Π΅Π³ΠΊΠΎ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅ΡΡ, ΡΠ°Π±ΠΎΡΠ°ΡΡΠΈΠ΅ Π½Π° ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΡΡΠ²Π΅, ΠΎΡΡΠ»Π΅ΠΆΠΈΠ²Π°ΡΡ ΠΏΡΠΎΠ³ΡΠ΅ΡΡ ΠΈ ΡΡΡΡΠ°Π½ΡΡΡ ΠΏΡΠΎΠ±Π»Π΅ΠΌΡ ΠΏΡΠΈ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎΡΡΠΈ.
Apache Spark & PySpark
Spark β ΡΡΠΎ ΡΠ½ΠΈΠ²Π΅ΡΡΠ°Π»ΡΠ½Π°Ρ ΠΈ Π²ΡΡΠΎΠΊΠΎΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡΠ΅Π»ΡΠ½Π°Ρ ΠΊΠ»Π°ΡΡΠ΅ΡΠ½Π°Ρ Π²ΡΡΠΈΡΠ»ΠΈΡΠ΅Π»ΡΠ½Π°Ρ ΠΏΠ»Π°ΡΡΠΎΡΠΌΠ°. Spark ΡΠ΅Ρ Π½ΠΈΡΠ΅ΡΠΊΠΈ Π½Π΅ ΡΠ²Π»ΡΠ΅ΡΡΡ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠΌ Python, Π½ΠΎ API PySpark ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π»Π΅Π³ΠΊΠΎ ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°ΡΡ Π·Π°Π΄Π°Π½ΠΈΡ Spark Π² Π²Π°ΡΠ΅ΠΌ workflow Π΄Π»Ρ Python.
PySpark ΠΏΡΠ΅Π΄Π½Π°Π·Π½Π°ΡΠ΅Π½ Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅ΡΠΎΠ² ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ ΠΈ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ETL Π΄Π»Ρ ΠΏΠ»Π°ΡΡΠΎΡΠΌΡ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ . Π PySpark Π²ΡΡΡΠΎΠ΅Π½Ρ Π²ΡΠ΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΡΠ΅ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΡ Π΄Π»Ρ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ ΠΈ ΠΏΡΠ΅ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ , ΠΈ ΠΎΠ½ ΠΏΡΠ΅Π΄Π½Π°Π·Π½Π°ΡΠ΅Π½ Π΄Π»Ρ ΠΏΠ°ΡΠ°Π»Π»Π΅Π»ΡΠ½ΠΎΠ³ΠΎ Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΠΉ, ΠΏΠΎΡΡΠΎΠΌΡ Π΄Π°ΠΆΠ΅ Π±ΠΎΠ»ΡΡΠΈΠ΅ Π·Π°Π΄Π°Π½ΠΈΡ ΠΌΠΎΠ³ΡΡ Π²ΡΠΏΠΎΠ»Π½ΡΡΡΡΡ ΠΎΡΠ΅Π½Ρ Π±ΡΡΡΡΠΎ. ΠΠ½ ΠΏΡΠ΅ΠΊΡΠ°ΡΠ½ΠΎ ΠΌΠ°ΡΡΡΠ°Π±ΠΈΡΡΠ΅ΡΡΡ Π΄Π»Ρ Π΄Π΅ΠΉΡΡΠ²ΠΈΡΠ΅Π»ΡΠ½ΠΎ Π±ΠΎΠ»ΡΡΠΈΡ ΠΎΠΏΠ΅ΡΠ°ΡΠΈΠΉ Ρ Π΄Π°Π½Π½ΡΠΌΠΈ, Π° ΡΠ°Π±ΠΎΡΠ° ΡΠ΅ΡΠ΅Π· API PySpark ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π²Π°ΠΌ ΠΏΠΈΡΠ°ΡΡ ΠΊΡΠ°ΡΠΊΠΈΠΉ, ΡΠΈΡΠ°Π±Π΅Π»ΡΠ½ΡΠΉ ΠΈ ΡΠΎΠ²ΠΌΠ΅ΡΡΠ½ΡΠΉ ΠΊΠΎΠ΄ Π΄Π»Ρ Π²Π°ΡΠΈΡ Π·Π°Π΄Π°Π½ΠΈΠΉ ETL. Π Π°ΡΡΠΌΠΎΡΡΠΈΡΠ΅ PySpark, Π΅ΡΠ»ΠΈ Π²Π°ΠΌ Π²Π°ΠΆΠ½Π° ΡΠΊΠΎΡΠΎΡΡΡ ΠΈ ΠΎΠ±ΡΠ΅ΠΌ Π΄Π°Π½Π½ΡΡ Π² Π²Π°ΡΠΈΡ ΡΠ°ΡΡΠ΅ΡΠ°Ρ .
ΠΠ±Π·ΠΎΡ Spark
Apache Spark β ΡΡΠΎ ΠΌΠΎΠ»Π½ΠΈΠ΅Π½ΠΎΡΠ½Π°Ρ ΡΡΠ΅Π΄Π° ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π² ΡΠ΅Π°Π»ΡΠ½ΠΎΠΌ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ. ΠΠ½ Π²ΡΠΏΠΎΠ»Π½ΡΠ΅Ρ Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΡ Π² ΠΏΠ°ΠΌΡΡΠΈ Π΄Π»Ρ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ Π² ΡΠ΅ΠΆΠΈΠΌΠ΅ ΡΠ΅Π°Π»ΡΠ½ΠΎΠ³ΠΎ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ. ΠΡΠΎΡ ΠΏΠΎΠ΄Ρ ΠΎΠ΄ ΡΡΠ°Π» ΠΎΡΠ΅Π²ΠΈΠ΄Π½ΡΠΌ, ΠΏΠΎΡΠΊΠΎΠ»ΡΠΊΡ Apache Hadoop MapReduce Π²ΡΠΏΠΎΠ»Π½ΡΠ» ΡΠΎΠ»ΡΠΊΠΎ ΠΏΠ°ΠΊΠ΅ΡΠ½ΡΡ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΡ ΠΈ Π½Π΅ ΠΈΠΌΠ΅Π» ΡΡΠ½ΠΊΡΠΈΠΉ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π² ΡΠ΅Π°Π»ΡΠ½ΠΎΠΌ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ. ΠΠΎΡΡΠΎΠΌΡ Π±ΡΠ» ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ Apache Spark, ΠΏΠΎΡΠΊΠΎΠ»ΡΠΊΡ ΠΎΠ½ ΠΌΠΎΠΆΠ΅Ρ Π²ΡΠΏΠΎΠ»Π½ΡΡΡ ΠΏΠΎΡΠΎΠΊΠΎΠ²ΡΡ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΡ Π² ΡΠ΅ΠΆΠΈΠΌΠ΅ ΡΠ΅Π°Π»ΡΠ½ΠΎΠ³ΠΎ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ, Π° ΡΠ°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ Π²ΡΠΏΠΎΠ»Π½ΡΡΡ ΠΏΠ°ΠΊΠ΅ΡΠ½ΡΡ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΡ.
ΠΠΎΠΌΠΈΠΌΠΎ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π² ΡΠ΅Π°Π»ΡΠ½ΠΎΠΌ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ ΠΈ ΠΏΠ°ΠΊΠ΅ΡΠ½ΠΎΠΉ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ, Apache Spark ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΈΠ²Π°Π΅Ρ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΠ΅ Π·Π°ΠΏΡΠΎΡΡ ΠΈ ΠΈΡΠ΅ΡΠ°ΡΠΈΠΎΠ½Π½ΡΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ. Apache Spark ΠΈΠΌΠ΅Π΅Ρ ΡΠ²ΠΎΠΉ ΡΠΎΠ±ΡΡΠ²Π΅Π½Π½ΡΠΉ ΠΌΠ΅Π½Π΅Π΄ΠΆΠ΅Ρ ΠΊΠ»Π°ΡΡΠ΅ΡΠΎΠ², Π³Π΄Π΅ ΠΎΠ½ ΠΌΠΎΠΆΠ΅Ρ ΡΠ°Π·ΠΌΠ΅ΡΡΠΈΡΡ ΡΠ²ΠΎΠ΅ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅. ΠΠ½ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ Apache Hadoop Π΄Π»Ρ Ρ ΡΠ°Π½Π΅Π½ΠΈΡ ΠΈ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ. ΠΠ½ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ HDFS (Hadoop Distributed File system β ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½Π½ΡΡ ΡΠ°ΠΉΠ»ΠΎΠ²ΡΡ ΡΠΈΡΡΠ΅ΠΌΡ Hadoop) Π΄Π»Ρ Ρ ΡΠ°Π½Π΅Π½ΠΈΡ ΠΈ ΠΌΠΎΠΆΠ΅Ρ ΡΠ°ΠΊΠΆΠ΅ Π·Π°ΠΏΡΡΠΊΠ°ΡΡ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡ Spark Π½Π° YARN.
PySpark β ΠΠ±Π·ΠΎΡ
Apache Spark Π½Π°ΠΏΠΈΡΠ°Π½ Π½Π° ΡΠ·ΡΠΊΠ΅ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ Scala. ΠΠ»Ρ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠΈ Python Ρ ΠΏΠΎΠΌΠΎΡΡΡ Spark ΡΠΎΠΎΠ±ΡΠ΅ΡΡΠ²ΠΎ Apache Spark Π²ΡΠΏΡΡΡΠΈΠ»ΠΎ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½Ρ PySpark. ΠΡΠΏΠΎΠ»ΡΠ·ΡΡ PySpark, Π²Ρ ΡΠ°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ RDD Π½Π° ΡΠ·ΡΠΊΠ΅ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ Python. ΠΠΌΠ΅Π½Π½ΠΎ Π±Π»Π°Π³ΠΎΠ΄Π°ΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ΅ ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ Py4j ΠΎΠ½ΠΈ ΠΌΠΎΠ³ΡΡ Π΄ΠΎΡΡΠΈΡΡ ΡΡΠΎΠ³ΠΎ.
PySpark ΠΏΡΠ΅Π΄Π»Π°Π³Π°Π΅Ρ PySpark Shell, ΠΊΠΎΡΠΎΡΡΠΉ ΡΠ²ΡΠ·ΡΠ²Π°Π΅Ρ Python API Ρ ΡΠ΄ΡΠΎΠΌ Spark ΠΈ ΠΈΠ½ΠΈΡΠΈΠ°Π»ΠΈΠ·ΠΈΡΡΠ΅Ρ ΠΊΠΎΠ½ΡΠ΅ΠΊΡΡ Spark. ΠΠΎΠ»ΡΡΠΈΠ½ΡΡΠ²ΠΎ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»Π΅ΠΉ Π΄Π°Π½Π½ΡΡ ΠΈ Π°Π½Π°Π»ΠΈΡΠΈΠΊΠΎΠ² ΡΠ΅Π³ΠΎΠ΄Π½Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡ Python ΠΈΠ·-Π·Π° Π΅Π³ΠΎ Π±ΠΎΠ³Π°ΡΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡΠ° Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ. ΠΠ½ΡΠ΅Π³ΡΠ°ΡΠΈΡ Python Ρ Spark ΡΠ²Π»ΡΠ΅ΡΡΡ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎΡΡΡΡ Π΄Π»Ρ Π½ΠΈΡ .
SparkContext β ΡΡΠΎ ΡΠΎΡΠΊΠ° Π²Ρ ΠΎΠ΄Π° Π² Π»ΡΠ±ΡΡ ΡΡΠ½ΠΊΡΠΈΠΎΠ½Π°Π»ΡΠ½ΠΎΡΡΡ Spark. ΠΠΎΠ³Π΄Π° ΠΌΡ Π·Π°ΠΏΡΡΠΊΠ°Π΅ΠΌ Π»ΡΠ±ΠΎΠ΅ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ Spark, Π·Π°ΠΏΡΡΠΊΠ°Π΅ΡΡΡ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠ° Π΄ΡΠ°ΠΉΠ²Π΅ΡΠ°, ΠΊΠΎΡΠΎΡΠ°Ρ Π²ΡΠΏΠΎΠ»Π½ΡΠ΅Ρ ΠΎΡΠ½ΠΎΠ²Π½ΡΡ ΡΡΠ½ΠΊΡΠΈΡ, ΠΈ Π·Π΄Π΅ΡΡ Π·Π°ΠΏΡΡΠΊΠ°Π΅ΡΡΡ Π²Π°Ρ SparkContext. ΠΠ°ΡΠ΅ΠΌ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠ° Π΄ΡΠ°ΠΉΠ²Π΅ΡΠ° Π·Π°ΠΏΡΡΠΊΠ°Π΅Ρ ΠΎΠΏΠ΅ΡΠ°ΡΠΈΠΈ Π²Π½ΡΡΡΠΈ ΠΈΡΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»Π΅ΠΉ Π½Π° ΡΠ°Π±ΠΎΡΠΈΡ ΡΠ·Π»Π°Ρ . SparkContext ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ Py4J Π΄Π»Ρ Π·Π°ΠΏΡΡΠΊΠ° JVM ΠΈ ΡΠΎΠ·Π΄Π°Π΅Ρ JavaSparkContext.
petl
petl β ΡΡΠΎ ΡΠ½ΠΈΠ²Π΅ΡΡΠ°Π»ΡΠ½ΡΠΉ ΠΏΠ°ΠΊΠ΅Ρ Python Π΄Π»Ρ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΡ, ΠΏΡΠ΅ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΡ ΠΈ Π·Π°Π³ΡΡΠ·ΠΊΠΈ ΡΠ°Π±Π»ΠΈΡ Π΄Π°Π½Π½ΡΡ
.
petl β ΡΡΠΎ ΠΏΠ°ΠΊΠ΅Ρ Python Π΄Π»Ρ ETL (ΠΎΡΡΡΠ΄Π° ΠΈ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ βpetlβ). ΠΠ°ΠΊ ΠΈ Π² ΡΠ»ΡΡΠ°Π΅ Ρ Pandas, petl ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ ΡΠΎΠ·Π΄Π°Π²Π°ΡΡ ΡΠ°Π±Π»ΠΈΡΡ Π² Python, ΠΈΠ·Π²Π»Π΅ΠΊΠ°Ρ ΠΈΡ
ΠΈΠ· ΡΠ°Π·Π»ΠΈΡΠ½ΡΡ
ΠΈΡΡΠΎΡΠ½ΠΈΠΊΠΎΠ² Π΄Π°Π½Π½ΡΡ
(csv, xls, html, txt, json ΠΈ Ρ.Π΄.). Π Π·Π°ΠΏΠΈΡΡΠ²Π°Ρ ΠΈΡ
Π² Π²ΡΠ±ΡΠ°Π½Π½ΡΡ Π²Π°ΠΌΠΈ Π±Π°Π·Ρ Π΄Π°Π½Π½ΡΡ
ΠΈΠ»ΠΈ ΡΠΎΡΠΌΠ°Ρ Ρ
ΡΠ°Π½Π΅Π½ΠΈΡ. Π£ petl ΠΌΠ½ΠΎΠ³ΠΎ ΡΠ΅Ρ
ΠΆΠ΅ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠ΅ΠΉ, ΡΡΠΎ ΠΈ Ρ pandas, Π½ΠΎ ΠΎΠ½ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½ Π΄Π»Ρ ΡΠ°Π±ΠΎΡΡ Ρ ETL ΠΈ Π½Π΅ Π²ΠΊΠ»ΡΡΠ°Π΅Ρ Π²ΡΡΡΠΎΠ΅Π½Π½ΡΡ
ΡΡΠ½ΠΊΡΠΈΠΉ Π°Π½Π°Π»ΠΈΠ·Π°, ΠΏΠΎΡΡΠΎΠΌΡ ΠΎΠ½ ΠΌΠΎΠΆΠ΅Ρ ΠΏΠΎΠ΄ΠΎΠΉΡΠΈ ΠΠ°ΠΌ, Π΅ΡΠ»ΠΈ Π²Ρ Π·Π°ΠΈΠ½ΡΠ΅ΡΠ΅ΡΠΎΠ²Π°Π½Ρ ΠΈΡΠΊΠ»ΡΡΠΈΡΠ΅Π»ΡΠ½ΠΎ Π² ETL.
ΠΡΠΎΡ ΠΏΠ°ΠΊΠ΅Ρ ΠΏΡΠ΅Π΄Π½Π°Π·Π½Π°ΡΠ΅Π½ Π² ΠΏΠ΅ΡΠ²ΡΡ ΠΎΡΠ΅ΡΠ΅Π΄Ρ Π΄Π»Ρ ΡΠ΄ΠΎΠ±ΡΡΠ²Π° ΠΈ ΠΏΡΠΎΡΡΠΎΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ, ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎ ΠΏΡΠΈ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΠΎΠΉ ΡΠ°Π±ΠΎΡΠ΅ Ρ Π½Π΅Π·Π½Π°ΠΊΠΎΠΌΡΠΌΠΈ, Π½Π΅ΠΎΠ΄Π½ΠΎΡΠΎΠ΄Π½ΡΠΌΠΈ ΠΈ/ΠΈΠ»ΠΈ ΡΠΌΠ΅ΡΠ°Π½Π½ΡΠΌΠΈ ΠΏΠΎ ΠΊΠ°ΡΠ΅ΡΡΠ²Ρ Π΄Π°Π½Π½ΡΠΌΠΈ.
ΠΡΠ΅ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΡ petl ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡ ΡΠΈΡΡΠ΅ΠΌΠ½ΡΡ ΠΏΠ°ΠΌΡΡΡ ΠΈ ΠΌΠΎΠ³ΡΡ ΠΌΠ°ΡΡΡΠ°Π±ΠΈΡΠΎΠ²Π°ΡΡΡΡ Π΄ΠΎ ΠΌΠΈΠ»Π»ΠΈΠΎΠ½ΠΎΠ² ΡΡΡΠΎΠΊ, Π΅ΡΠ»ΠΈ ΡΠΊΠΎΡΠΎΡΡΡ Π½Π΅ ΡΠ²Π»ΡΠ΅ΡΡΡ ΠΏΡΠΈΠΎΡΠΈΡΠ΅ΡΠΎΠΌ. ΠΠ΄Π½Π°ΠΊΠΎ, Π΅ΡΠ»ΠΈ Π²Ρ ΡΠ°Π±ΠΎΡΠ°Π΅ΡΠ΅ Ρ ΠΎΡΠ΅Π½Ρ Π±ΠΎΠ»ΡΡΠΈΠΌΠΈ Π½Π°Π±ΠΎΡΠ°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ ΠΈ/ΠΈΠ»ΠΈ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡΠΌΠΈ, Π΄Π»Ρ ΠΊΠΎΡΠΎΡΡΡ ΠΊΡΠΈΡΠΈΡΠ΅ΡΠΊΠΈ Π²Π°ΠΆΠ½Π° ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΡ, ΡΠΎ ΡΠ°ΡΡΠΌΠΎΡΡΠΈΡΠ΅ Π΄ΡΡΠ³ΠΈΠ΅ ΠΏΠ°ΠΊΠ΅ΡΡ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΡΠΌ. Pandas, pytables, bcolz ΠΈ blaze.
Panoply
Panoply ΡΠΏΡΠΎΠ΅ΠΊΡΠΈΡΠΎΠ²Π°Π½, ΠΊΠ°ΠΊ ΠΏΠΎΠ»Π½ΠΎΡΡΠ½ΠΊΡΠΈΠΎΠ½Π°Π»ΡΠ½ΠΎΠ΅ ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ Π΄Π»Ρ Ρ ΡΠ°Π½Π΅Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ . Π‘ ΠΏΠΎΠΌΠΎΡΡΡ Panoply ΠΌΠΎΠΆΠ½ΠΎ ΡΠ΅Π°Π»ΠΈΠ·ΠΎΠ²Π°ΡΡ ETL ΠΎΡΠ΅Π½Ρ ΠΏΡΠΎΡΡΠΎ. Panoply ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°Π΅Ρ ΠΊΠ°ΠΆΠ΄ΡΠΉ ΡΠ°Π³ ΠΏΡΠΎΡΠ΅ΡΡΠ°, ΡΠΏΡΠΎΡΠ°Ρ ΠΏΡΠΈΠ΅ΠΌ Π΄Π°Π½Π½ΡΡ ΠΈΠ· Π»ΡΠ±ΠΎΠ³ΠΎ ΠΈΡΡΠΎΡΠ½ΠΈΠΊΠ° Π΄Π°Π½Π½ΡΡ (ΠΎΡ CSV Π΄ΠΎ Amazon S3-ΠΊΠΎΠ½ΡΠ΅ΠΉΠ½Π΅ΡΠΎΠ² ΠΈ Π΄ΠΎ Google Analytics).
https://panoply.io/docs/collect-data/python-sdk/ β Python SDK Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ SQS Π΄Π»Ρ ΠΏΠΎΡΠΎΠΊΠΎΠ²ΠΎΠΉ ΠΏΠ΅ΡΠ΅Π΄Π°ΡΠΈ Π΄Π°Π½Π½ΡΡ Π² ΡΠ΅Π°Π»ΡΠ½ΠΎΠΌ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ Π½Π° ΠΏΠ»Π°ΡΡΠΎΡΠΌΠ΅ Panoply. ΠΡΠΎΡ SDK Π²ΠΊΠ»ΡΡΠ°Π΅Ρ Π² ΡΠ΅Π±Ρ ΡΡΡΠΎΠΈΡΠ΅Π»ΡΠ½ΡΠ΅ Π±Π»ΠΎΠΊΠΈ Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π²Π°ΡΠΈΡ ΡΠΎΠ±ΡΡΠ²Π΅Π½Π½ΡΡ ΠΈΡΡΠΎΡΠ½ΠΈΠΊΠΎΠ² Π΄Π°Π½Π½ΡΡ .
Pandas
ΠΡΠ»ΠΈ Π²Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π»ΠΈ Python Π΄Π»Ρ ΡΠ°Π±ΠΎΡΡ Ρ Π΄Π°Π½Π½ΡΠΌΠΈ, Π²Ρ, Π²Π΅ΡΠΎΡΡΠ½ΠΎ, Π·Π½Π°ΠΊΠΎΠΌΡ Ρ pandas, ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠ°ΡΠΈΠ΅ΠΌ Π΄Π»Ρ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ ΠΈ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ . ΠΡΠ»ΠΈ Π½Π΅Ρ, ΡΠΎ Π²Ρ Π΄ΠΎΠ»ΠΆΠ½Ρ ΡΠ°Π·ΡΠ·Π½Π°ΡΡ ΠΎ pandas. ΠΡΠ° Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π΄ΠΎΠ±Π°Π²Π»ΡΡΡ Π² Python ΡΡΠ΅ΠΉΠΌΡ Π΄Π°Π½Π½ΡΡ Π² ΡΡΠΈΠ»Π΅ R, ΡΡΠΎ Π΄Π΅Π»Π°Π΅Ρ ΠΌΠ°Π½ΠΈΠΏΡΠ»ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅, ΠΎΡΠΈΡΡΠΊΡ ΠΈ Π°Π½Π°Π»ΠΈΠ· Π΄Π°Π½Π½ΡΡ Π³ΠΎΡΠ°Π·Π΄ΠΎ ΠΏΡΠΎΡΠ΅, ΡΠ΅ΠΌ Π² ΡΡΡΠΎΠΌ Python. ΠΠ°ΠΊ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½Ρ ETL, pandas ΠΌΠΎΠΆΠ΅Ρ ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°ΡΡ ΠΊΠ°ΠΆΠ΄ΡΠΉ ΡΠ°Π³ ΠΏΡΠΎΡΠ΅ΡΡΠ°, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡ ΠΈΠ·Π²Π»Π΅ΠΊΠ°ΡΡ Π΄Π°Π½Π½ΡΠ΅ ΠΈΠ· Π±ΠΎΠ»ΡΡΠΈΠ½ΡΡΠ²Π° ΡΠΎΡΠΌΠ°ΡΠΎΠ² Ρ ΡΠ°Π½Π΅Π½ΠΈΡ ΠΈ Π±ΡΡΡΡΠΎ ΠΈ Π»Π΅Π³ΠΊΠΎ ΠΌΠ°Π½ΠΈΠΏΡΠ»ΠΈΡΠΎΠ²Π°ΡΡ Π΄Π°Π½Π½ΡΠΌΠΈ Π² ΠΏΠ°ΠΌΡΡΠΈ. ΠΠΎΠ³Π΄Π° Π²Ρ ΠΎΠ±ΡΠ°Π±ΠΎΡΠ°Π΅ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅, Pandas Ρ Π»Π΅Π³ΠΊΠΎΡΡΡΡ Π·Π°ΠΏΠΈΡΠ΅Ρ ΠΠ°Ρ DataFrame Π² CSV, Microsoft Excel ΠΈΠ»ΠΈ Π±Π°Π·Ρ Π΄Π°Π½Π½ΡΡ SQL.
Pandas Python For Data Science cheat sheet
Bubbles
Bubbles β ΡΡΠΎ ΠΏΠΎΠΏΡΠ»ΡΡΠ½Π°Ρ ΡΡΠ΅Π΄Π° Python ETL, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π»Π΅Π³ΠΊΠΎ ΡΠΎΠ·Π΄Π°Π²Π°ΡΡ ETL-ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅ΡΡ. Bubbles Π½Π°ΠΏΠΈΡΠ°Π½Π° Π½Π° Python, Π½ΠΎ Π½Π° ΡΠ°ΠΌΠΎΠΌ Π΄Π΅Π»Π΅ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½Π°, ΡΡΠΎΠ±Ρ Π±ΡΡΡ Π½Π΅Π·Π°Π²ΠΈΡΠΈΠΌΠΎΠΉ ΠΎΡ ΡΠ΅Ρ Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ. ΠΠ½ Π½Π°ΡΡΡΠΎΠ΅Π½ Π΄Π»Ρ ΡΠ°Π±ΠΎΡΡ Ρ ΠΎΠ±ΡΠ΅ΠΊΡΠ°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ β ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΡΠΌΠΈ Π½Π°Π±ΠΎΡΠΎΠ² Π΄Π°Π½Π½ΡΡ , ΡΠ²Π»ΡΡΡΠΈΡ ΡΡ ETL, ΡΡΠΎΠ±Ρ ΠΌΠ°ΠΊΡΠΈΠΌΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ Π³ΠΈΠ±ΠΊΠΎΡΡΡ Π² ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅ΡΠ΅ ETL ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ. ΠΡΠ»ΠΈ Π² Π²Π°ΡΠ΅ΠΌ ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅ΡΠ΅ ETL ΠΌΠ½ΠΎΠ³ΠΎ ΡΠ·Π»ΠΎΠ² Ρ ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ΠΌ, Π·Π°Π²ΠΈΡΡΡΠΈΠΌ ΠΎΡ ΡΠΎΡΠΌΠ°ΡΠ°, Bubbles ΠΌΠΎΠ³ΡΡ ΡΡΠ°ΡΡ Π²Π°ΡΠΈΠΌ ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ΠΌ. ΠΠ΄Π½Π°ΠΊΠΎ ΡΠ΅ΠΏΠΎΠ·ΠΈΡΠΎΡΠΈΠΉ github Π½Π΅ ΡΠ°Π·Π²ΠΈΠ²Π°Π»ΡΡ Π°ΠΊΡΠΈΠ²Π½ΠΎ Ρ 2015 Π³ΠΎΠ΄Π°, ΠΏΠΎΡΡΠΎΠΌΡ Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ ΡΡΠ½ΠΊΡΠΈΠΈ ΠΌΠΎΠ³ΡΡ Π±ΡΡΡ ΡΡΡΠ°ΡΠ΅Π²ΡΠΈΠΌΠΈ.
Bonobo (ΠΠΎΠ½ΠΎΠ±ΠΎ)
Bonobo β ΡΡΠΎ ΠΎΠ±Π»Π΅Π³ΡΠ΅Π½Π½Π°Ρ ETL-ΠΈΠ½ΡΡΠ°ΡΡΡΡΠΊΡΡΡΠ° Ρ ΠΊΠΎΠ΄ΠΎΠΌ Π² Π²ΠΈΠ΄Π΅ ΠΊΠΎΠ½ΡΠΈΠ³ΡΡΠ°ΡΠΈΠΈ Π΄Π»Ρ Python. ΠΠ½ ΠΈΠΌΠ΅Π΅Ρ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΡ Π΄Π»Ρ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅ΡΠΎΠ² Π΄Π°Π½Π½ΡΡ , ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΠΎΠ³ΡΡ ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°ΡΡ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΠΈΡΡΠΎΡΠ½ΠΈΠΊΠΎΠ² Π΄Π°Π½Π½ΡΡ ΠΏΠ°ΡΠ°Π»Π»Π΅Π»ΡΠ½ΠΎ, ΠΈ ΠΈΠΌΠ΅Π΅Ρ ΡΠ°ΡΡΠΈΡΠ΅Π½ΠΈΠ΅ SQLAlchemy (Π² Π½Π°ΡΡΠΎΡΡΠ΅Π΅ Π²ΡΠ΅ΠΌΡ Π² Π°Π»ΡΡΠ°-Π²Π΅ΡΡΠΈΠΈ), ΠΊΠΎΡΠΎΡΠΎΠ΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΏΠΎΠ΄ΠΊΠ»ΡΡΠ°ΡΡ Π²Π°Ρ ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ Π½Π°ΠΏΡΡΠΌΡΡ ΠΊ Π±Π°Π·Π°ΠΌ Π΄Π°Π½Π½ΡΡ SQL. Bonobo ΡΠΏΡΠΎΠ΅ΠΊΡΠΈΡΠΎΠ²Π°Π½ ΡΠ°ΠΊ, ΡΡΠΎΠ±Ρ Π΅Π³ΠΎ Π±ΡΠ»ΠΎ Π»Π΅Π³ΠΊΠΎ Π·Π°ΠΏΡΡΡΠΈΡΡ, ΡΠΎΠ΄Π΅ΡΠΆΠΈΡ UNIX-ΠΏΠΎΠ΄ΠΎΠ±Π½ΡΡ Π°ΡΠΎΠΌΠ½ΡΡ ΡΡΡΡΠΊΡΡΡΡ Π΄Π»Ρ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΏΡΠΎΡΠ΅ΡΡΠ° ΠΏΡΠ΅ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΡ (ΠΠ°ΠΆΠ΄ΠΎΠ΅ ΠΏΡΠ΅ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΈΠΌΠ΅Π΅Ρ ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½Π½ΡΡ, ΡΠ½ΠΈΠΊΠ°Π»ΡΠ½ΡΡ, Π½Π΅Π±ΠΎΠ»ΡΡΡΡ ΠΈ ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½Π½ΡΡ ΡΠ΅Π»Ρ). ΠΡΠ° Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Π΄ΠΎΠ»ΠΆΠ½Π° Π±ΡΡΡ Π΄ΠΎΡΡΡΠΏΠ½Π° Π΄Π»Ρ Π²ΡΠ΅Ρ , ΠΊΡΠΎ ΠΈΠΌΠ΅Π΅Ρ Π±Π°Π·ΠΎΠ²ΡΠΉ ΡΡΠΎΠ²Π΅Π½Ρ Π²Π»Π°Π΄Π΅Π½ΠΈΡ Python, Π° ΡΠ°ΠΊΠΆΠ΅ Π²ΠΊΠ»ΡΡΠ°Π΅Ρ Π² ΡΠ΅Π±Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΎΡ Π³ΡΠ°ΡΠΈΠΊΠ° ΠΏΡΠΎΡΠ΅ΡΡΠ° ETL, ΠΊΠΎΡΠΎΡΡΠΉ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π»Π΅Π³ΠΊΠΎ ΠΎΡΡΠ»Π΅ΠΆΠΈΠ²Π°ΡΡ Π²Π°Ρ ΠΏΡΠΎΡΠ΅ΡΡ.
BonoboΒ β ΡΡΠΎ ΠΎΠ±Π»Π΅Π³ΡΠ΅Π½Π½Π°ΡΒ Β ΡΡΠ΅Π΄Π°Β Extract-Transform-LoadΒ (ETL) Π΄Π»Ρ Python 3.5+.Β
ΠΠ½ ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»ΡΠ΅Ρ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΡ Π΄Π»Ρ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅ΡΠΎΠ² ΠΏΡΠ΅ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ
, ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ ΠΏΡΠΎΡΡΡΡ
ΠΏΡΠΈΠΌΠΈΡΠΈΠ²ΠΎΠ² Python ΠΈ ΠΈΡ
ΠΏΠ°ΡΠ°Π»Π»Π΅Π»ΡΠ½ΠΎΠ³ΠΎ Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ.
BonoboΒ βΒ ΡΠ²Π΅ΠΉΡΠ°ΡΡΠΊΠΈΠΉ Π°ΡΠΌΠ΅ΠΉΡΠΊΠΈΠΉ Π½ΠΎΠΆΒ Π΄Π»ΡΒ ΠΏΠΎΠ²ΡΠ΅Π΄Π½Π΅Π²Π½ΡΡ
Π΄Π°Π½Π½ΡΡ
.
ΠΡΠΏΠΎΠ»ΡΠ·ΡΠΉΡΠ΅ Π²ΡΡΡΠΎΠ΅Π½Π½ΡΠ΅ ΡΠΊΡΡΡΠ°ΠΊΡΠΎΡΡ (CSV, JSON, XML, XLS, β¦), ΠΎΡΠΈΡΠΈΠ°Π»ΡΠ½ΡΠ΅ Π΄ΠΎΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ (SQL).
ΠΡΡΡ Π²ΡΡΡΠΎΠ΅Π½Π½ΡΠ΅ ΠΊΠ»Π°ΡΡΡ Π΄Π»Ρ ΠΏΡΠ΅ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ .
Luigi ΠΡΠΈΠ΄ΠΆΠΈ
Luigi β ΡΡΠΎ ΠΏΠ°ΠΊΠ΅Ρ Python Ρ ΠΎΡΠΊΡΡΡΡΠΌ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΌ ΠΊΠΎΠ΄ΠΎΠΌ, ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½Π½ΡΠΉ Spotify. ΠΠ½ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½, ΡΡΠΎΠ±Ρ ΡΠΏΡΠΎΡΡΠΈΡΡ ΡΠΏΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ Π΄Π»ΠΈΡΠ΅Π»ΡΠ½ΡΠΌΠΈ ΠΏΠ°ΠΊΠ΅ΡΠ½ΡΠΌΠΈ ΠΏΡΠΎΡΠ΅ΡΡΠ°ΠΌΠΈ, ΠΏΠΎΡΡΠΎΠΌΡ ΠΎΠ½ ΠΌΠΎΠΆΠ΅Ρ Π²ΡΠΏΠΎΠ»Π½ΡΡΡ Π·Π°Π΄Π°ΡΠΈ, Π²ΡΡ ΠΎΠ΄ΡΡΠΈΠ΅ Π΄Π°Π»Π΅ΠΊΠΎ Π·Π° ΡΠ°ΠΌΠΊΠΈ ETL, Π½ΠΎ ΠΎΠ½ ΡΠ°ΠΊΠΆΠ΅ Π΄Π΅Π»Π°Π΅Ρ ETL Π΄ΠΎΠ²ΠΎΠ»ΡΠ½ΠΎ Ρ ΠΎΡΠΎΡΠΎ. Luigi ΠΏΠΎΡΡΠ°Π²Π»ΡΠ΅ΡΡΡ Ρ Π²Π΅Π±-ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡΠΎΠΌ, ΠΊΠΎΡΠΎΡΡΠΉ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ Π·Π°Π΄Π°ΡΠΈ ΠΈ ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°ΡΡ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ. ΠΠΎΠ½ΡΠ΅ΠΏΡΡΠ°Π»ΡΠ½ΠΎ ΠΎΠ½ ΠΏΠΎΡ ΠΎΠΆ Π½Π° GNU Make, Π½ΠΎ Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ Π΄Π»Ρ Hadoop (Ρ ΠΎΡΡ ΠΈ ΠΎΠ±Π»Π΅Π³ΡΠ°Π΅Ρ ΡΠ°Π±ΠΎΡΡ Hadoop). Luigi ΠΌΠΎΠΆΠ΅Ρ ΡΡΠ°ΡΡ Π²Π°ΡΠΈΠΌ ETL-ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠΌ, Π΅ΡΠ»ΠΈ Ρ Π²Π°Ρ Π΅ΡΡΡ Π±ΠΎΠ»ΡΡΠΈΠ΅ ΠΈ Π΄Π»ΠΈΡΠ΅Π»ΡΠ½ΡΠ΅ Π·Π°Π΄Π°Π½ΠΈΡ ΠΏΠΎ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠ΅ Π΄Π°Π½Π½ΡΡ , ΠΊΠΎΡΠΎΡΡΠ΅ ΠΏΡΠΎΡΡΠΎ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎ Π²ΡΠΏΠΎΠ»Π½ΠΈΡΡ.
Odo β ΠΠ΄ΠΎ
Odo β ΡΡΠΎ ΠΏΠ°ΠΊΠ΅Ρ Python, ΠΊΠΎΡΠΎΡΡΠΉ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π»Π΅Π³ΠΊΠΎ ΠΏΠ΅ΡΠ΅ΠΌΠ΅ΡΠ°ΡΡ Π΄Π°Π½Π½ΡΠ΅ ΠΌΠ΅ΠΆΠ΄Ρ ΡΠ°Π·Π»ΠΈΡΠ½ΡΠΌΠΈ ΡΠΈΠΏΠ°ΠΌΠΈ ΠΊΠΎΠ½ΡΠ΅ΠΉΠ½Π΅ΡΠΎΠ². ΠΠΎΡΠ»Π΅ ΡΡΡΠ°Π½ΠΎΠ²ΠΊΠΈ Odo ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»ΡΠ΅Ρ Π΅Π΄ΠΈΠ½ΡΡΠ²Π΅Π½Π½ΡΡ ΡΡΠ½ΠΊΡΠΈΡ, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΌΠΎΠΆΠ΅Ρ ΠΏΠ΅ΡΠ΅Π½ΠΎΡΠΈΡΡ Π΄Π°Π½Π½ΡΠ΅ ΠΌΠ΅ΠΆΠ΄Ρ ΡΡΡΡΠΊΡΡΡΠ°ΠΌΠΈ Π² ΠΏΠ°ΠΌΡΡΠΈ (ΡΠΏΠΈΡΠΊΠΈ, ΠΏΡΡΡΡΠ΅ ΠΌΠ°ΡΡΠΈΠ²Ρ, dataframes pandas ΠΈ Ρ.Π΄.), Π€ΠΎΡΠΌΠ°ΡΠ°ΠΌΠΈ Ρ ΡΠ°Π½Π΅Π½ΠΈΡ (CSV, JSON, HDF5 ΠΈ Ρ.Π΄.) Π ΡΠ΄Π°Π»Π΅Π½Π½ΡΠΌΠΈ Π±Π°Π·Π°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ , ΡΠ°ΠΊΠΈΠΌΠΈ ΠΊΠ°ΠΊ Postgres ΠΈ Hadoop. Odo ΡΠΊΠΎΠ½ΡΠΈΠ³ΡΡΠΈΡΠΎΠ²Π°Π½ Π΄Π»Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ ΡΠΎΠ±ΡΡΠ²Π΅Π½Π½ΡΡ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠ΅ΠΉ Π·Π°Π³ΡΡΠ·ΠΊΠΈ ΡΡΠΈΡ CSV-Π±Π°Π· Π΄Π°Π½Π½ΡΡ , ΠΊΠΎΡΠΎΡΡΠ΅ Π·Π½Π°ΡΠΈΡΠ΅Π»ΡΠ½ΠΎ Π±ΡΡΡΡΠ΅Π΅, ΡΠ΅ΠΌ ΠΏΠΎΠ΄Ρ ΠΎΠ΄Ρ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡΠΈΠ΅ ΡΠΈΡΡΡΠΉ Python. ΠΠ΄ΠΈΠ½ ΠΈΠ· ΡΠ΅ΡΡΠΎΠ² ΡΠ°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊΠΎΠ² ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°Π΅Ρ, ΡΡΠΎ Pandas ΡΠ°Π±ΠΎΡΠ°Π΅Ρ Π² 11 ΡΠ°Π· ΠΌΠ΅Π΄Π»Π΅Π½Π½Π΅Π΅, ΡΠ΅ΠΌ ΡΠ°ΠΌΡΠΉ ΠΌΠ΅Π΄Π»Π΅Π½Π½ΡΠΉ Π½Π°ΡΠΈΠ²Π½ΡΠΉ Π·Π°Π³ΡΡΠ·ΡΠΈΠΊ CSV-to-SQL. ΠΡΠ»ΠΈ Π²Ρ ΠΎΠ±Π½Π°ΡΡΠΆΠΈΡΠ΅, ΡΡΠΎ Π·Π°Π³ΡΡΠΆΠ°Π΅ΡΠ΅ ΠΌΠ½ΠΎΠ³ΠΎ Π΄Π°Π½Π½ΡΡ ΠΈΠ· CSV Π² Π±Π°Π·Ρ Π΄Π°Π½Π½ΡΡ SQL, Odo ΠΌΠΎΠΆΠ΅Ρ ΡΡΠ°ΡΡ Π΄Π»Ρ Π²Π°Ρ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠΌ ETL.
etlalchemy
etlalchemy β ΡΡΠΎ Π»Π΅Π³ΠΊΠΈΠΉ ΠΏΠ°ΠΊΠ΅Ρ Python, ΠΊΠΎΡΠΎΡΡΠΉ ΡΠΏΡΠ°Π²Π»ΡΠ΅Ρ ΠΌΠΈΠ³ΡΠ°ΡΠΈΠ΅ΠΉ Π±Π°Π· Π΄Π°Π½Π½ΡΡ SQL. ΠΡΠΎΠ΅ΠΊΡ Π±ΡΠ» Π·Π°Π΄ΡΠΌΠ°Π½, ΠΊΠΎΠ³Π΄Π° ΡΠ°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊ ΠΏΠΎΠ½ΡΠ», ΡΡΠΎ Π±ΠΎΠ»ΡΡΠ°Ρ ΡΠ°ΡΡΡ Π΄Π°Π½Π½ΡΡ Π΅Π³ΠΎ ΠΎΡΠ³Π°Π½ΠΈΠ·Π°ΡΠΈΠΈ Ρ ΡΠ°Π½ΠΈΡΡΡ Π² Π±Π°Π·Π΅ Π΄Π°Π½Π½ΡΡ Oracle 9i, ΠΊΠΎΡΠΎΡΠ°Ρ Π½Π΅ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΈΠ²Π°Π΅ΡΡΡ Ρ 2010 Π³ΠΎΠ΄Π°. ΠΡΠΎΠ³ΡΠ°ΠΌΠΌΠ° etlalchemy Π±ΡΠ»Π° ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½Π° Π΄Π»Ρ ΡΠΏΡΠΎΡΠ΅Π½ΠΈΡ ΠΈ ΡΡΠΊΠΎΡΠ΅Π½ΠΈΡ ΠΌΠΈΠ³ΡΠ°ΡΠΈΠΈ ΠΌΠ΅ΠΆΠ΄Ρ ΡΠ΅Π»ΡΡΠΈΠΎΠ½Π½ΡΠΌΠΈ Π±Π°Π·Π°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ Ρ ΡΠ°Π·Π»ΠΈΡΠ½ΡΠΌΠΈ Π΄ΠΈΠ°Π»Π΅ΠΊΡΠ°ΠΌΠΈ. Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅, ΠΏΡΠ΅Π΄ΠΎΡΡΠ΅ΡΠ΅ΠΆΠ΅Π½ΠΈΠ΅: ΡΡΠΎΡ ΠΏΠ°ΠΊΠ΅Ρ Π½Π΅ Π±ΡΠ΄Π΅Ρ ΡΠ°Π±ΠΎΡΠ°ΡΡ Π² Windows ΠΈ ΠΈΠΌΠ΅Π΅Ρ ΠΏΡΠΎΠ±Π»Π΅ΠΌΡ Ρ Π·Π°Π³ΡΡΠ·ΠΊΠΎΠΉ Π² ββMSSQL, ΡΡΠΎ ΠΎΠ·Π½Π°ΡΠ°Π΅Ρ, ΡΡΠΎ Π²Ρ Π·Π°Ρ ΠΎΡΠΈΡΠ΅ ΠΏΠΎΡΠΌΠΎΡΡΠ΅ΡΡ ΠΊΡΠ΄Π°-Π½ΠΈΠ±ΡΠ΄Ρ Π΅ΡΠ΅, Π΅ΡΠ»ΠΈ Π²Π°Ρ ΡΠ°Π±ΠΎΡΠΈΠΉ ΠΏΡΠΎΡΠ΅ΡΡ Π²ΠΊΠ»ΡΡΠ°Π΅Ρ Π² ΡΠ΅Π±Ρ Windows ΠΈ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, Azure.
mETL
mETL β ΡΡΠΎ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½Ρ Python ETL, ΠΊΠΎΡΠΎΡΡΠΉ Π°Π²ΡΠΎΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΈ ΡΠΎΠ·Π΄Π°Π΅Ρ ΡΠ°ΠΉΠ» Yaml Π΄Π»Ρ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ ΠΈΠ· Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΡΠ°ΠΉΠ»Π° ΠΈ Π·Π°Π³ΡΡΠ·ΠΊΠΈ Π² Π±Π°Π·Ρ Π΄Π°Π½Π½ΡΡ SQL. ΠΠΎΠΆΠ΅Ρ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ ΡΠΈΡΠΎΠΊΠΈΠΌ ΡΠΏΠ΅ΠΊΡΡΠΎΠΌ ΠΈΡΡΠΎΡΠ½ΠΈΠΊΠΎΠ² Π΄Π°Π½Π½ΡΡ ΠΈ ΡΠ΅Π»Π΅ΠΉ, Π²ΠΊΠ»ΡΡΠ°Ρ ΡΡΠ°Π½Π΄Π°ΡΡΠ½ΡΠ΅ ΠΏΠ»ΠΎΡΠΊΠΈΠ΅ ΡΠ°ΠΉΠ»Ρ, Google Sheets ΠΈ ΠΏΠΎΠ»Π½ΡΠΉ Π½Π°Π±ΠΎΡ ΠΏΠΎΠ΄ΠΊΠ»ΡΡΠ΅Π½ΠΈΠΉ SQL (Π²ΠΊΠ»ΡΡΠ°Ρ Microsoft SQL Server). ΠΠ΅Π΄Π°Π²Π½ΠΈΠ΅ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΡ ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²ΠΈΠ»ΠΈ Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ ΡΠ²ΠΈΠΊΠΈ Π΄Π»Ρ ΠΎΠ±Ρ ΠΎΠ΄Π° Π·Π°ΠΌΠ΅Π΄Π»Π΅Π½ΠΈΠΉ, Π²ΡΠ·Π²Π°Π½Π½ΡΡ Π½Π΅ΠΊΠΎΡΠΎΡΡΠΌΠΈ Π΄ΡΠ°ΠΉΠ²Π΅ΡΠ°ΠΌΠΈ Python SQL, ΠΏΠΎΡΡΠΎΠΌΡ ΡΡΠΎΡ ΠΏΠ°ΠΊΠ΅Ρ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ Π²Π°ΠΌ ΠΏΠΎΠ»Π΅Π·Π΅Π½, Π΅ΡΠ»ΠΈ Π²Ρ Ρ ΠΎΡΠΈΡΠ΅, ΡΡΠΎΠ±Ρ Π²Π°Ρ ΠΏΡΠΎΡΠ΅ΡΡ ETL Π±ΡΠ» ΠΏΠΎΡ ΠΎΠΆ Π½Π° Python, Π½ΠΎ Π±ΡΡΡΡΠ΅Π΅.
Open Semantic ETL
Open Semantic ETL β ΡΡΠΎ ΠΏΠ»Π°ΡΡΠΎΡΠΌΠ° Python Ρ ΠΎΡΠΊΡΡΡΡΠΌ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΌ ΠΊΠΎΠ΄ΠΎΠΌ Π΄Π»Ρ ΡΠΏΡΠ°Π²Π»Π΅Π½ΠΈΡ ETL, ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎ ΠΈΠ· Π±ΠΎΠ»ΡΡΠΎΠ³ΠΎ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π° ΠΎΡΠ΄Π΅Π»ΡΠ½ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ². ΠΠ½ΡΡΠ°ΡΡΡΡΠΊΡΡΡΠ° ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ ΡΠΎΠ·Π΄Π°Π²Π°ΡΡ ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅ΡΡ, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΠΎΠ³ΡΡ ΡΠΊΠ°Π½ΠΈΡΠΎΠ²Π°ΡΡ ΡΠ΅Π»ΡΠ΅ ΠΊΠ°ΡΠ°Π»ΠΎΠ³ΠΈ ΡΠ°ΠΉΠ»ΠΎΠ², Π°Π½Π°Π»ΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ ΠΈΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΡΠ°Π·Π»ΠΈΡΠ½ΡΡ Π½Π°Π΄ΡΡΡΠΎΠ΅ΠΊ (Π² ΡΠΎΠΌ ΡΠΈΡΠ»Π΅, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΠΎΠ³ΡΡ ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°ΡΡ OCR Π΄Π»Ρ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎ ΡΠ»ΠΎΠΆΠ½ΡΡ PDF-ΡΠ°ΠΉΠ»ΠΎΠ²) ΠΈ Π·Π°Π³ΡΡΠΆΠ°ΡΡ ΠΈΡ Π² Π²ΡΠ±ΡΠ°Π½Π½ΡΡ Π²Π°ΠΌΠΈ ΡΠ΅Π»ΡΡΠΈΠΎΠ½Π½ΡΡ Π±Π°Π·Ρ Π΄Π°Π½Π½ΡΡ .
Mara
Mara β ΡΡΠΎ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Python, ΠΊΠΎΡΠΎΡΠ°Ρ ΡΠΎΡΠ΅ΡΠ°Π΅Ρ Π² ΡΠ΅Π±Π΅ ΠΎΠ±Π»Π΅Π³ΡΠ΅Π½Π½ΡΡ ΡΡΠ΅Π΄Ρ ETL Ρ Ρ ΠΎΡΠΎΡΠΎ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½Π½ΡΠΌ Π²Π΅Π±-ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡΠΎΠΌ, ΠΊΠΎΡΠΎΡΡΠΉ ΠΌΠΎΠΆΠ½ΠΎ Π²ΡΡΠ°Π²ΠΈΡΡ Π² Π»ΡΠ±ΠΎΠ΅ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ Flask. ΠΠ°ΠΊ ΠΈ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ Π΄ΡΡΠ³ΠΈΠ΅ ΠΏΠ»Π°ΡΡΠΎΡΠΌΡ, ΠΎΠΏΠΈΡΠ°Π½Π½ΡΠ΅ Π·Π΄Π΅ΡΡ, Mara ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ ΡΠΎΠ·Π΄Π°Π²Π°ΡΡ ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅ΡΡ Π΄Π»Ρ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΡ ΠΈ ΠΏΠ΅ΡΠ΅Π½ΠΎΡΠ° Π΄Π°Π½Π½ΡΡ . Mara ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ PostgreSQL Π² ΠΊΠ°ΡΠ΅ΡΡΠ²Π΅ ΠΌΠ΅Ρ Π°Π½ΠΈΠ·ΠΌΠ° ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π΄Π°Π½Π½ΡΡ ΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ ΠΏΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π° ΠΌΠ½ΠΎΠ³ΠΎΠΏΡΠΎΡΠ΅ΡΡΠΎΡΠ½ΠΎΠ³ΠΎ ΠΏΠ°ΠΊΠ΅ΡΠ° Python Π΄Π»Ρ ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅ΡΠ½ΠΎΠ³ΠΎ Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ. Π Π°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊΠΈ ΠΎΠΏΠΈΡΡΠ²Π°ΡΡ Π΅Π³ΠΎ ΠΊΠ°ΠΊ Β«Π½Π° ΠΏΠΎΠ»ΠΏΡΡΠΈ ΠΌΠ΅ΠΆΠ΄Ρ ΠΏΡΠΎΡΡΡΠΌΠΈ ΡΡΠ΅Π½Π°ΡΠΈΡΠΌΠΈ ΠΈ Apache AirflowΒ», ΠΏΠΎΡΡΠΎΠΌΡ, Π΅ΡΠ»ΠΈ Π²Ρ ΠΈΡΠ΅ΡΠ΅ ΡΡΠΎ-ΡΠΎ ΡΡΠ΅Π΄Π½Π΅Π΅ ΠΌΠ΅ΠΆΠ΄Ρ ΡΡΠΈΠΌΠΈ Π΄Π²ΡΠΌΡ ΠΊΡΠ°ΠΉΠ½ΠΎΡΡΡΠΌΠΈ, ΠΏΠΎΠΏΡΠΎΠ±ΡΠΉΡΠ΅ Mara. ΠΡΠΈΠΌΠ΅ΡΠ°Π½ΠΈΠ΅. Π Π½Π°ΡΡΠΎΡΡΠ΅Π΅ Π²ΡΠ΅ΠΌΡ Mara Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ ΡΠ°Π±ΠΎΡΠ°ΡΡ Π² Windows.
riko
Π₯ΠΎΡΡΒ ΡΠ΅Ρ Π½ΠΈΡΠ΅ΡΠΊΠΈΒ rikoΒ Π½Π΅ ΡΠ²Π»ΡΠ΅ΡΡΡ ΠΏΠΎΠ»Π½ΠΎΡΠ΅Π½Π½ΡΠΌ ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ΠΌ ETL, ΠΎΠ½ΠΎ ΠΌΠΎΠΆΠ΅Ρ Π²ΡΠΏΠΎΠ»Π½ΡΡΡ Π±ΠΎΠ»ΡΡΠΈΠ½ΡΡΠ²ΠΎ ΠΎΠΏΠ΅ΡΠ°ΡΠΈΠΉ ΠΏΠΎ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ ΠΈ Π²ΠΊΠ»ΡΡΠ°Π΅Ρ Π² ΡΠ΅Π±Ρ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎ ΡΡΠ½ΠΊΡΠΈΠΉ, ΠΎΠ±Π»Π΅Π³ΡΠ°ΡΡΠΈΡ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΠ΅ ΠΏΠΎΡΠΎΠΊΠΎΠ² Π½Π΅ΡΡΡΡΠΊΡΡΡΠΈΡΠΎΠ²Π°Π½Π½ΡΡ Π΄Π°Π½Π½ΡΡ Π² Python.Β ΠΠ½ΡΡΡΡΠΌΠ΅Π½Ρ Π±ΡΠ» ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½, ΡΡΠΎΠ±Ρ Π·Π°ΠΌΠ΅Π½ΠΈΡΡ Π½ΡΠ½Π΅ Π½Π΅ΡΡΡΠ΅ΡΡΠ²ΡΡΡΠΈΠΉ Yahoo!Β ΠΠ΅Π±-ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ Pipes Π΄Π»Ρ ΡΠ°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊΠΎΠ² Π½Π° ΡΠΈΡΡΠΎΠΌ Python, ΠΈΠΌΠ΅ΡΡΠ΅Π΅ ΠΊΠ°ΠΊ ΡΠΈΠ½Ρ ΡΠΎΠ½Π½ΡΠ΅, ΡΠ°ΠΊ ΠΈ Π°ΡΠΈΠ½Ρ ΡΠΎΠ½Π½ΡΠ΅ API.Β Π£ riko Π΄ΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ Π½Π΅Π±ΠΎΠ»ΡΡΠΎΠΉ Π²ΡΡΠΈΡΠ»ΠΈΡΠ΅Π»ΡΠ½ΡΠΉ ΠΎΠ±ΡΠ΅ΠΌ, Π²ΡΡΡΠΎΠ΅Π½Π½Π°Ρ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° RSS / Atom ΠΈ ΡΠΈΡΡΠ°Ρ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Python
Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ Π² Python Π²ΠΌΠ΅ΡΡΠ΅ Ρ plotly
ΠΡΠ°ΡΠΎΡΠ½ΠΎΠ΅ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΠΎΠ΅ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ Π΄Π°ΡΠ°ΡΠ΅ΡΠ° Π² ΠΎΠ΄Π½Ρ ΡΡΡΠΎΠΊΡ? ΠΠ΅ ΠΏΡΠΎΠ±Π»Π΅ΠΌΠ° Ρ plotly! Π Π°Π·Π±ΠΈΡΠ°Π΅ΠΌΡΡ Ρ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ΠΌ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² ΠΈ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌ.
ΠΡΠ»ΠΈ ΡΠΏΡΠΎΡΠΈΡΡ ΠΏΠΈΡΠΎΠ½ΠΈΡΡΠΎΠ², ΠΊΠ°ΠΊΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π΄Π»Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ , ΡΠΎ Π±ΠΎΠ»ΡΡΠΈΠ½ΡΡΠ²ΠΎ, Π½Π΅ΡΠΎΠΌΠ½Π΅Π½Π½ΠΎ, ΠΎΡΠ²Π΅ΡΡΡ: matplotlib. ΠΡΠ²Π΅ΡΡΡ, ΠΏΡΠ°Π²Π΄Π°, Π±Π΅Π· ΠΎΡΠΎΠ±ΠΎΠ³ΠΎ ΡΠ΄ΠΎΠ²ΠΎΠ»ΡΡΡΠ²ΠΈΡ. ΠΠ½ΠΎΠ³ΠΎΠ΅ Π² matplotlib Π½Π΅ ΡΠ°ΠΊ ΡΠΆ ΠΎΡΠ΅Π²ΠΈΠ΄Π½ΠΎ ΠΈ ΡΡΠ΅Π±ΡΠ΅Ρ Π½Π΅ ΡΠ°Π· ΠΎΠ±ΡΠ°ΡΠΈΡΡΡΡ ΠΊ StackOverflow. ΠΠ°ΡΠ°Π΅ΡΡΡ ΡΡΠΎ ΠΈ ΡΠ°ΠΊΠΈΡ ΡΠ°ΡΠΏΡΠΎΡΡΡΠ°Π½Π΅Π½Π½ΡΡ ΡΠΈΡΡΠ°ΡΠΈΠΉ, ΠΊΠ°ΠΊ ΡΠΎΠ·Π΄Π°Π½ΠΈΠ΅ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΡΡ ΠΎΡΠ΅ΠΉ ΠΈΠ»ΠΈ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ Π½Π° Π½ΠΈΡ Π΄Π°Ρ.
ΠΡΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΌΠ°ΡΡ, ΡΡΠΎ matplotlib ΡΠΎΠ·Π΄Π°Π²Π°Π»ΡΡ Π·Π°Π΄ΠΎΠ»Π³ΠΎ Π΄ΠΎ Π±ΡΡΠ½ΠΎΠ³ΠΎ ΡΠ°Π·Π²ΠΈΡΠΈΡ Data Science, ΠΈ Π² Π±ΠΎΠ»ΡΡΠ΅ΠΉ ΠΌΠ΅ΡΠ΅ ΠΎΡΠΈΠ΅Π½ΡΠΈΡΠΎΠ²Π°Π»ΡΡ Π½Π° ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ ΠΌΠ°ΡΡΠΈΠ²ΠΎΠ² NumPy ΠΈ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΈΡΠ΅ΡΠΊΠΈΡ ΡΡΠ½ΠΊΡΠΈΠΉ SciPy. Π ΡΠΎ ΠΆΠ΅ Π²ΡΠ΅ΠΌΡ Π² Data Science ΡΠ°ΡΠΏΡΠΎΡΡΡΠ°Π½Π΅Π½ ΠΎΠ±ΠΎΠ±ΡΠ°ΡΡΠΈΠΉ ΡΠΈΠΏ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ² β Π΄Π°ΡΠ°ΡΠ΅ΡΡ, ΠΊΡΡΠΏΠ½ΡΠ΅ ΡΠ°Π±Π»ΠΈΡΡ Ρ Π΄Π°Π½Π½ΡΠΌΠΈ. Π ΡΡΠΎΠΉ ΡΡΠ°ΡΡΠ΅ ΠΌΡ Π½ΡΡΠ½Π΅ΠΌ Π² ΡΠ°Π±ΠΎΡΡ Ρ Π°Π»ΡΡΠ΅ΡΠ½Π°ΡΠΈΠ²Π½ΠΎΠΉ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΎΠΉ β plotlyΒ β ΠΈ Π½Π°ΡΡΠΈΠΌΡΡ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎ ΡΠ°ΠΌΡΡ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΡΡ Π²Π΅ΡΠ΅ΠΉ.
ΠΠ΅ΡΡ ΠΊΠΎΠ΄Β Π΄ΠΎΡΡΡΠΏΠ΅Π½ Π½Π° GitHub. ΠΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΠ΅ Π³ΡΠ°ΡΠΈΠΊΠΈ ΠΌΠΎΠΆΠ½ΠΎ (ΠΈ Π½ΡΠΆΠ½ΠΎ) ΡΠΌΠΎΡΡΠ΅ΡΡ Π½Π°Β NBViewer. ΠΡΠΈΠ²ΠΎΠ΄ΠΈΠΌΡΠ΅ ΠΊΡΡΠΊΠΈ ΠΊΠΎΠ΄Π° Π±ΡΠ΄ΡΡ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ°ΡΡ ΡΠΎΠ»ΡΠΊΠΎ ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡΠ½ΡΡ ΡΠ°ΡΡΡ, Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΡΡ Π΄Π»Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ . ΠΡΠ΅Π΄ΠΏΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΊΠ° Π΄Π°Π½Π½ΡΡ β Π² ΡΠΊΠ°Π·Π°Π½Π½ΡΡ ΠΈΡΡΠΎΡΠ½ΠΈΠΊΠ°Ρ .
ΠΠ°ΠΊΠ΅Ρ plotly β Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Ρ ΠΎΡΠΊΡΡΡΡΠΌ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΌ ΠΊΠΎΠ΄ΠΎΠΌ, ΠΏΠΎΡΡΡΠΎΠ΅Π½Π½Π°Ρ Π½Π° plotly.js, ΠΊΠΎΡΠΎΡΠ°Ρ, Π² ΡΠ²ΠΎΡ ΠΎΡΠ΅ΡΠ΅Π΄Ρ, Π±Π°Π·ΠΈΡΡΠ΅ΡΡΡ Π½Π° d3. js. Π ΡΠ²ΠΎΠΈΡ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠ°Ρ Ρ ΠΊΠΎΠ΄ΠΎΠΌ Π±ΡΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΎΠ±Π΅ΡΡΠΊΡ Π½Π°Π΄ plotlyΒ cufflinks. ΠΠ½Π° ΡΠΏΡΠΎΡΠ°Π΅Ρ ΡΠ°Π±ΠΎΡΡ Ρ Π΄Π°ΡΠ°ΡΡΠ΅ΠΉΠΌΠ°ΠΌΠΈ pandas. Plotly β ΡΡΠΎ Π³ΡΠ°ΡΠΈΡΠ΅ΡΠΊΠ°Ρ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΡ, ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΡΡΠ°Ρ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΠΏΡΠΎΠ΄ΡΠΊΡΠΎΠ² ΠΈ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠ² Ρ ΠΎΡΠΊΡΡΡΡΠΌ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΌ ΠΊΠΎΠ΄ΠΎΠΌ. ΠΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Π±Π΅ΡΠΏΠ»Π°ΡΠ½Π° Π΄Π»Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ ΠΈ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΡΠΎΠ·Π΄Π°Π²Π°ΡΡ Π½Π΅ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½Π½ΠΎΠ΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π² Π°Π²ΡΠΎΠ½ΠΎΠΌΠ½ΠΎΠΌ ΡΠ΅ΠΆΠΈΠΌΠ΅, Π° ΡΠ°ΠΊΠΆΠ΅ Π΄ΠΎ 25 Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌ ΠΎΠ½Π»Π°ΠΉΠ½.
ΠΡΡ ΡΠ°Π±ΠΎΡΠ° ΡΡΠ°ΡΡΠ΅ Π±ΡΠ»Π° ΡΠ΄Π΅Π»Π°Π½Π° Π² Π±Π»ΠΎΠΊΠ½ΠΎΡΠ΅ JupyterΒ Π² ΡΠ²ΡΠ·ΠΊΠ΅ plotly+cufflinks, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΠΎΠΆΠ½ΠΎ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ ΡΡΠ°Π½Π΄Π°ΡΡΠ½ΡΠΌ ΠΎΠ±ΡΠ°Π·ΠΎΠΌ Ρ ΠΏΠΎΠΌΠΎΡΡΡ pip:
pip install cufflinks plotly
Π‘ΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡΠΈΠΉ ΠΈΠΌΠΏΠΎΡΡ Python Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ:
# Π‘ΡΠ°Π½Π΄Π°ΡΡΠ½ΠΎΠ΅ ΠΈΠΌΠΏΠΎΡΡΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ plotly import plotly.plotly as py import plotly.graph_objs as go from plotly.offline import iplot # ΠΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ cufflinks Π² ΠΎΡΠ»Π°ΠΉΠ½-ΡΠ΅ΠΆΠΈΠΌΠ΅ import cufflinks cufflinks.go_offline() # ΠΠ°ΡΡΡΠΎΠΉΠΊΠ° Π³Π»ΠΎΠ±Π°Π»ΡΠ½ΠΎΠΉ ΡΠ΅ΠΌΡ cufflinks cufflinks.set_config_file(world_readable=True, theme='pearl', offline=True)
ΠΠ΅ΡΠ΅ΠΉΠ΄Π΅ΠΌ ΠΊ ΠΏΡΠΈΠΌΠ΅ΡΠ°ΠΌ.
ΠΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΡ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ β ΡΡΠ°Π½Π΄Π°ΡΡΠ½ΡΠΉ ΡΠΏΠΎΡΠΎΠ± Π½Π°ΡΠ°Π»ΡΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ . ΠΡΠΈ ΠΏΠΎΠΌΠΎΡΠΈ plotly Π»Π΅Π³ΠΊΠΎ ΡΠ΄Π΅Π»Π°ΡΡ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΠΎΠ΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌ ΠΈ ΠΏΡΠΎΡΠΈΡ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΠΉ. ΠΠ»Ρ ΡΠ΅Ρ , ΠΊΡΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π» ΡΠ°Π½Π΅Π΅ matplotlib, Π½ΡΠΆΠ½ΠΎ Π²ΠΌΠ΅ΡΡΠΎ ΠΊΠΎΠΌΠ°Π½Π΄Ρ plotΒ ΠΏΡΠΎΡΡΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ iplot:
df['claps'].iplot(kind='hist', xTitle='claps', yTitle='count', title='Claps Distribution')
ΠΡΠ»ΠΈ ΠΌΡ Ρ ΠΎΡΠΈΠΌ ΡΡΠ°Π²Π½ΠΈΡΡ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π΄Π²ΡΡ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ , ΠΌΠΎΠΆΠ΅ΠΌ Π½Π°Π»ΠΎΠΆΠΈΡΡ Π΄Π²Π΅ Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΡ Π΄ΡΡΠ³ Π½Π° Π΄ΡΡΠ³Π°:
df[['time_started', 'time_published']].iplot( kind='hist', histnorm='percent', barmode='overlay', xTitle='Time of Day', yTitle='(%) of Articles', title='Time Started and Time Published')
ΠΡΠΎΠ²Π΅Π΄Ρ Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΠ°Π½ΠΈΠΏΡΠ»ΡΡΠΈΠΈ Π² pandas, ΠΏΠΎΠ»ΡΡΠ°Π΅ΠΌ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ Ρ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ΠΌ ΠΎΡΠ½ΠΎΡΠΈΡΠ΅Π»ΡΠ½ΠΎ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ:
df2 = df[['view','reads','published_date']].\ set_index('published_date'). \ resample('M').mean() df2.iplot(kind='bar', xTitle='Date', yTitle='Average', title='Monthly Average Views and Reads')
ΠΠΎΠΌΠ±ΠΈΠ½ΠΈΡΡΡ ΠΌΠΎΡΡ pandas ΠΈ plotly, Π»Π΅Π³ΠΊΠΎ ΠΏΠΎΠ»ΡΡΠ°ΡΡ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΠ΅ ΡΠ²ΠΎΠ΄Π½ΡΠ΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ:
df.pivot(columns='publication', values='fans').iplot( kind='box', yTitle='fans', title='Fans Distribution by Publication')
ΠΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΠΎΠ΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π½Π΅ Π·Π°Π³ΡΠΎΠΌΠΎΠΆΠ΄Π°ΡΡ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΉ Π³ΡΠ°ΡΠΈΠΊ ΠΈΠ·Π±ΡΡΠΎΡΠ½ΠΎΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠ΅ΠΉ, ΠΎΠ±ΡΠ°ΡΠ°ΡΡΡ ΠΊ Π½Π΅ΠΉ ΠΏΠΎ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎΡΡΠΈ.
ΠΠ΄Π½Π° ΠΈΠ· ΡΠ°ΡΠΏΡΠΎΡΡΡΠ°Π½Π΅Π½Π½ΡΡ Π·Π°Π΄Π°Ρ β ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ Π΄Π°Π½Π½ΡΡ ΠΎΡΠ½ΠΎΡΠΈΡΠ΅Π»ΡΠ½ΠΎ Π²ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ ΡΠΊΠ°Π»Ρ. ΠΠ΄Π΅ΡΡ Π°ΠΊΡΡΠ°Π»ΡΠ½Π° Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡ Π²ΡΠ±ΠΎΡΠ° ΠΈΠ½ΡΠ΅ΡΠ΅ΡΡΡΡΠ΅Π³ΠΎ ΠΈΠ½ΡΠ΅ΡΠ²Π°Π»Π° Π΄Π»Ρ ΠΎΡΡΠ»Π΅ΠΆΠΈΠ²Π°Π½ΠΈΡ ΡΡΠ΅Π½Π΄Π°.
tds = df[df['publication'] == 'Towards Data Science'].\ set_index('published_date') tds[['claps', 'fans', 'title']].iplot( y='claps', mode='lines+markers', secondary_y = 'fans', secondary_y_title='Fans', xTitle='Date', yTitle='Claps', text='title', title='Fans and Claps over Time')
Π ΠΎΠ΄Π½ΠΎΠΉ ΡΡΡΠΎΠΊΠ΅ Π±ΡΠ»ΠΈ ΡΠ΄Π΅Π»Π°Π½Ρ ΡΡΠ°Π·Ρ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ Π²Π΅ΡΠ΅ΠΉ:
- ΠΠ°Π΄Π°Π½ΠΈΠ΅ ΡΠΎΡΠΌΠ°ΡΠ° ΠΎΡΠΈ Π°Π±ΡΡΠΈΡΡ.
- Π‘ΠΎΠ·Π΄Π°Π½ΠΈΠ΅ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΠΎΠΉ ΠΎΡΠΈ ΠΎΡΠ΄ΠΈΠ½Π°Ρ, ΡΠ°ΠΊ ΠΊΠ°ΠΊ ΠΈΡΡΠ»Π΅Π΄ΡΠ΅ΠΌΡΠ΅ Π΄Π°Π½Π½ΡΠ΅ ΠΈΠΌΠ΅ΡΡ ΡΠ°Π·Π½ΡΠΉ ΠΌΠ°ΡΡΡΠ°Π± Π²Π΅Π»ΠΈΡΠΈΠ½ (secondary_y = ‘fans’).
- ΠΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠ΅ Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠΎΠ² ΡΡΠ°ΡΠ΅ΠΉ ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΡΠΎΡΠΊΠ΅, ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ°Π΅ΠΌΡΡ ΠΏΡΠΈ Π½Π°Π²Π΅Π΄Π΅Π½ΠΈΠΈ ΠΊΡΡΡΠΎΡΠ° (ΡΠ°ΡΡΠΌΠ°ΡΡΠΈΠ²Π°Π΅ΡΡΡ Π΄Π°ΡΠ°ΡΡΠ΅ΠΉΠΌ ΠΏΡΠ±Π»ΠΈΠΊΠ°ΡΠΈΠΈ ΡΡΠ°ΡΠ΅ΠΉ (text=’title’)).
Π§ΡΠΎΠ±Ρ ΡΠΎΠ·Π΄Π°ΡΡ ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΡΠΎΡΠΊΠ΅ ΡΠ΅ΠΊΡΡΠΎΠ²ΡΠ΅ Π°Π½Π½ΠΎΡΠ°ΡΠΈΠΈ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ ΡΠ΅ΠΆΠΈΠΌΒ lines+markers+text:
tds_monthly_totals.iplot( mode='lines+markers+text', text=text, y='word_count', opacity=0.8, xTitle='Date', yTitle='Word Count', title='Total Word Count by Month')
ΠΠ΅Π³ΠΊΠΎ ΡΠΎΡΠ΅ΡΠ°ΡΡ ΠΈ ΡΠ°Π·Π»ΠΈΡΠ½ΡΠ΅ ΡΠΈΠΏΡ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ. ΠΠ°ΠΏΡΠΈΠΌΠ΅Ρ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΡΠ²Π΅Ρ Π΄Π»Ρ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΠΎΠΉ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ.
df.pivot_table( values='views', index='published_date', columns='publication').cumsum().iplot( mode='markers+lines', size=8, symbol=[1, 2, 3, 4, 5], layout=dict( xaxis=dict(title='Date'), yaxis=dict(type='log', title='Total Views'), title='Total Views over Time by Publication'))
Π‘ΠΎΠ²ΠΌΠ΅ΡΡΠΈΠΌ Π΄Π°Π½Π½ΡΠ΅ Π΄Π²ΡΡ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ (Π΄Π»Ρ ΡΠ°ΡΡΠΌΠ°ΡΡΠΈΠ²Π°Π΅ΠΌΠΎΠ³ΠΎ Π΄Π°ΡΠ°ΡΠ΅ΡΠ° ΡΡΠΎ Π²ΡΠ΅ΠΌΡ ΡΡΠ΅Π½ΠΈΡ ΠΈ ΠΏΡΠΎΡΠ΅Π½Ρ ΠΏΡΠΎΡΠΈΡΠ°Π½Π½ΠΎΠ³ΠΎ). ΠΠ»Ρ ΡΡΠ΅ΡΡΠ΅Π³ΠΎ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠ° (ΡΠ΅ΠΌΠ°ΡΠΈΠΊΠ° ΡΡΠ°ΡΡΠΈ) ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ ΡΠ²Π΅Ρ:
df.iplot( x='read_time', y='read_ratio', # Specify the category categories='publication', xTitle='Read Time', yTitle='Reading Percent', title='Reading Percent vs Read Ratio by Publication')
ΠΡΠ»ΠΈ Π²Π΅Π»ΠΈΡΠΈΠ½Π° ΠΌΠ΅Π½ΡΠ΅ΡΡΡ Π² ΡΠΈΡΠΎΠΊΠΎΠΌ Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½Π΅ Π»ΠΎΠ³ΠΈΡΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π»ΠΎΠ³Π°ΡΠΈΡΠΌΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΠΎΡΠΈ. Π ΠΏΡΠΈΠΌΠ΅ΡΠ΅ Π½ΠΈΠΆΠ΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ ΠΊΠΎΠ΄ Ρ Π»ΠΎΠ³Π°ΡΠΈΡΠΌΠΈΡΠ΅ΡΠΊΠΎΠΉ ΠΎΡΡΡ Π°Π±ΡΡΠΈΡΡ (ΠΊΠΎΠΌΠ°Π½Π΄Π°Β type=’log’). Π’ΡΠ΅ΡΡΡ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½Π°Ρ ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°Π΅ΡΡΡ ΠΏΡΠΈ ΠΏΠΎΠΌΠΎΡΠΈ ΡΠ°Π·ΠΌΠ΅ΡΠ° ΠΌΠ°ΡΠΊΠ΅ΡΠΎΠ² (size=’read_ratio’).
tds.iplot( x='word_count', y='reads', size='read_ratio', text=text, mode='markers', layout=dict( xaxis=dict(type='log', title='Word Count'), yaxis=dict(title='Reads'), title='Reads vs Log Word Count Sized by Read Ratio'))
ΠΠΏΠΈΡΠ°Π½Π½ΡΠ΅ ΡΡΡΠ°ΡΠ΅Π³ΠΈΠΈ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΠΎΠΉ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π΄Π»Ρ ΠΎΠ΄Π½ΠΎΠ²ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ ΡΠ΅ΡΡΡΠ΅Ρ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ : Π΄Π²ΡΡ β ΠΏΡΠΈ ΠΏΠΎΠΌΠΎΡΠΈ ΠΊΠΎΠΎΡΠ΄ΠΈΠ½Π°Ρ, ΠΈ Π΅ΡΠ΅ Π΄Π²ΡΡ β Π·Π° ΡΡΠ΅Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ ΡΠ²Π΅ΡΠ° ΠΈ ΡΠ°Π·ΠΌΠ΅ΡΠ°. Π Π΅Π·ΡΠ»ΡΡΠ°Ρ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ Π½Π° ΡΠΈΡΡΠ½ΠΊΠ΅ Π½ΠΈΠΆΠ΅.
ΠΠ»Ρ ΡΠ»Π΅Π΄ΡΡΡΠΈΡ ΡΠΎΡΠΌ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ Π±ΡΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΌΠΎΠ΄ΡΠ»ΡΒ plotly.figure_factory.
ΠΠ°ΡΡΠΈΡΠ° Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌ ΡΠ°ΡΡΠ΅ΡΠ½ΠΈΡ
ΠΠΎΠΊΠ°Π·Π°ΡΡ Π²Π·Π°ΠΈΠΌΠΎΡΠ²ΡΠ·Ρ ΠΌΠ΅ΠΆΠ΄Ρ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠ°ΠΌΠΈ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ ΠΌΠ°ΡΡΠΈΡΠ° Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌ ΡΠ°ΡΡΠ΅ΡΠ½ΠΈΡ. Π ΠΊΠ°ΡΠ΅ΡΡΠ²Π΅ Π΄ΠΈΠ°Π³ΠΎΠ½Π°Π»ΡΠ½ΠΎΠ³ΠΎ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ Π΅Π΄ΠΈΠ½ΡΡΠ²Π΅Π½Π½ΠΎΠΉ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΡ (diag=’histogram’). ΠΠ°ΠΌΠ΅ΡΠΈΠΌ, ΡΡΠΎ ΠΈ Π·Π΄Π΅ΡΡ ΠΌΡ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΡΠ²Π΅Ρ Π² ΠΊΠ°ΡΠ΅ΡΡΠ²Π΅ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΠΎΠΉ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ.
import plotly.figure_factory as ff figure = ff.create_scatterplotmatrix( df[['claps', 'publication', 'views', 'read_ratio','word_count']], diag='histogram', index='publication')
Π¦Π²Π΅ΡΠΎΠ²Π°Ρ ΠΊΠ°ΡΡΠ° ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΡ
ΠΡΡΠ³ΠΎΠΉ ΡΠΏΠΎΡΠΎΠ±, ΡΠ΄ΠΎΠ±Π½ΡΠΉ Π΄Π»Ρ Π±ΠΎΠ»ΡΡΠΎΠ³ΠΎ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π° ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ β ΡΠ²Π΅ΡΠΎΠ²Π°Ρ ΠΊΠ°ΡΡΠ° ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΡ Π²Π΅Π»ΠΈΡΠΈΠ½Ρ. Π’Π°ΠΊΠΎΠΉ ΠΏΠΎΠ΄Ρ ΠΎΠ΄ ΡΠ΄ΠΎΠ±Π΅Π½, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, Π΄Π»Ρ ΠΊΠΎΡΡΠ΅Π»ΡΡΠΈΠΎΠ½Π½ΠΎΠΉ ΠΌΠ°ΡΡΠΈΡΡ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ² Π΄Π°ΡΠ°ΡΠ΅ΡΠ° df.corr():
corrs = df. corr() figure = ff.create_annotated_heatmap( z=corrs.values, x=list(corrs.columns), y=list(corrs.index), annotation_text=corrs.round(2).values, showscale=True)
ΠΡΠΈΡΡΠ½ΠΎΠΉ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΡΡ cufflinks ΡΠ²Π»ΡΠ΅ΡΡΡ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡ Π²ΡΠ±ΠΎΡΠ° ΡΡΠΈΠ»Ρ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΡΠ°Π·Π»ΠΈΡΠ½ΡΡ ΡΠ΅ΠΌ. ΠΠΈΠΆΠ΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½Ρ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ Π² ΡΠ΅ΠΌΠ°Ρ space ΠΈ ggplot:
ΠΡΡΡ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π² ΡΡΠ΅Ρ ΠΌΠ΅ΡΠ½ΠΎΠΌ ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π΅:
ΠΡΡΡ ΠΈ Π²ΡΠ΅, ΡΡΠΎ ΠΏΡΠΈΠ²ΡΡΠ½ΠΎ Π²ΠΈΠ΄Π΅ΡΡ Π² ΡΡΠ°Π½Π΄Π°ΡΡΠ½ΠΎΠΌ Π½Π°Π±ΠΎΡΠ΅ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌ. ΠΠΎ Π΄Π°ΠΆΠ΅ ΠΊΡΡΠ³ΠΎΠ²ΡΠ΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ Π²ΡΠ³Π»ΡΠ΄ΡΡ Π·Π΄Π΅ΡΡ Π±ΠΎΠ»Π΅Π΅ ΡΡΠΈΠ»ΡΠ½ΠΎ, ΡΠ΅ΠΌ Π² matplotlib:
ΠΡΠ»ΠΈ Π²Ρ Π·Π°ΠΏΡΡΠΊΠ°Π»ΠΈ ΡΠΊΡΠΈΠΏΡΡ Π² Jupyter-Π±Π»ΠΎΠΊΠ½ΠΎΡΠ΅, Π²Ρ ΠΌΠΎΠ³Π»ΠΈ Π·Π°ΠΌΠ΅ΡΠΈΡΡ Π½Π΅Π±ΠΎΠ»ΡΡΡΡ ΡΡΡΠ»ΠΊΡ Π² ΠΏΡΠ°Π²ΠΎΠΉ ΡΠ°ΡΡΠΈ Π³ΡΠ°ΡΠΈΠΊΠ°Β Export to plot.ly. ΠΠ°ΠΆΠ°Π² Π½Π° Π½Π΅Π΅, Π²Ρ ΠΏΠ΅ΡΠ΅Π½Π΅ΡΠ΅ΡΠ΅ΡΡ Π² Chart Studio, Π³Π΄Π΅ ΠΌΠΎΠΆΠ½ΠΎ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΠΎ ΠΏΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΈΡΡ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ Π΄Π»Ρ ΠΊΠΎΠ½Π΅ΡΠ½ΠΎΠΉ ΠΏΡΠ΅Π·Π΅Π½ΡΠ°ΡΠΈΠΈ. ΠΡ ΠΌΠΎΠΆΠ΅ΡΠ΅ Π΄ΠΎΠ±Π°Π²ΠΈΡΡ Π°Π½Π½ΠΎΡΠ°ΡΠΈΡ, ΠΈΠ·ΠΌΠ΅Π½ΠΈΡΡ ΡΠ²Π΅ΡΠ° ΠΈ ΠΏΡ. ΠΠΈΠΆΠ΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½Ρ Π΄Π²Π΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ, ΠΏΠΎΠ΄Π³ΠΎΡΠΎΠ²Π»Π΅Π½Π½ΡΠ΅ Π² Chart Studio.
ΠΠ°ΠΆΠ΅ Π²ΡΠ΅ Π²ΡΡΠ΅ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½Π½ΠΎΠ΅ Π½Π΅ ΠΎΠΏΠΈΡΡΠ²Π°Π΅Ρ Π²ΡΠ΅Ρ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠ΅ΠΉ ΠΎΠΏΠΈΡΡΠ²Π°Π΅ΠΌΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ. Π§ΡΠΎΠ±Ρ ΡΠ²ΠΈΠ΄Π΅ΡΡ Π±ΠΎΠ»ΡΡΠ΅ ΠΊΡΠ°ΡΠΎΡΠ½ΡΡ ΠΏΡΠΈΠΌΠ΅ΡΠΎΠ², ΠΈΠ·ΡΡΠΈΡΠ΅ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ plotly ΠΈ cufflinks.
ΠΡΠ°ΠΊ, ΡΡΠΎ ΠΌΡ ΠΈΠΌΠ΅Π΅ΠΌ:
- ΠΠ΄Π½ΠΎΡΡΡΠΎΡΠ½ΡΠΉ ΠΊΠΎΠ΄ Π΄Π»Ρ ΠΊΡΠ°ΡΠΎΡΠ½ΠΎΠΉ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°ΡΠ°ΡΠ΅ΡΠΎΠ².
- ΠΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΠ΅ ΡΠ»Π΅ΠΌΠ΅Π½ΡΡ Π΄Π»Ρ Π²ΡΠ΄Π΅Π»Π΅Π½ΠΈΡ ΠΈ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ .
- ΠΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡ ΡΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠΉ Π΄Π΅ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ°Π΅ΠΌΠΎΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ.
- ΠΡΠΎΡΡΠ°Ρ Π½Π°ΡΡΡΠΎΠΉΠΊΠ° ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ Π΄Π»Ρ
Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ Π³ΡΠ°ΡΠΈΠΊΠΈ ΠΏΡΠΈ ΠΏΠΎΠΌΠΎΡΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ Python: Π±ΡΡΡΡΠΎ ΠΈ ΠΊΡΠ°ΡΠΈΠ²ΠΎ
ΠΡΠ° ΡΡΠ°ΡΡΡ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΠ΅Ρ ΡΠΎΠ±ΠΎΠΉ ΠΏΠΎΠ΄ΡΠΎΠ±Π½ΠΎΠ΅ ΡΡΠΊΠΎΠ²ΠΎΠ΄ΡΡΠ²ΠΎ ΠΏΠΎ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ Π² Python. ΠΡ ΡΠ°ΡΡΠΊΠ°ΠΆΠ΅ΠΌ ΠΏΡΠΎ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² ΠΏΡΠΈ ΠΏΠΎΠΌΠΎΡΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ Pandas, Seaborn ΠΈ Plotly, Π° ΡΠ°ΠΊΠΆΠ΅ Π½Π°Π³Π»ΡΠ΄Π½ΠΎ ΠΏΠΎΠΊΠ°ΠΆΠ΅ΠΌ, ΡΡΠΎ ΡΡΠ°ΡΡΡΠ΅ ΠΈΠΌΠ΅Π½Π½ΠΎ Π² Π΄Π΅Π½ΡΠ³Π°Ρ .
Π Π΄Π°Π½Π½ΠΎΠΉ ΡΡΠ°ΡΡΠ΅ ΠΌΡ ΡΠ°ΡΡΠΌΠΎΡΡΠΈΠΌ ΡΡΠΈ ΡΠ°Π·Π½ΡΡ ΡΠΏΠΎΡΠΎΠ±Π° ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π² Python. Π Π΄Π΅Π»Π°ΡΡ ΡΡΠΎ ΠΌΡ Π±ΡΠ΄Π΅ΠΌ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ Π΄Π°Π½Π½ΡΠ΅ ΠΡΠ΅ΠΌΠΈΡΠ½ΠΎΠ³ΠΎ Π΄ΠΎΠΊΠ»Π°Π΄Π° ΠΎ ΡΡΠ°ΡΡΡΠ΅ Π·Π° 2019 Π³ΠΎΠ΄ (Π΅ΠΆΠ΅Π³ΠΎΠ΄Π½ΠΎ ΠΏΡΠ±Π»ΠΈΠΊΡΠ΅ΡΡΡ ΠΠΠ). ΠΡ ΡΠ°ΠΊΠΆΠ΅ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΠ»ΠΈ ΡΡΠΈ Π΄Π°Π½Π½ΡΠ΅ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠ΅ΠΉ Ρ ΡΠ°ΠΉΡΠ° https://www.gapminder.org/ ΠΈ ΠΈΠ· ΠΠΈΠΊΠΈΠΏΠ΅Π΄ΠΈΠΈ, ΡΡΠΎΠ±Ρ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΡ ΠΈ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ Π½ΠΎΠ²ΡΠ΅ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ.
ΠΡΠ΅ΠΌΠΈΡΠ½ΡΠΉ Π΄ΠΎΠΊΠ»Π°Π΄ ΠΎ ΡΡΠ°ΡΡΡΠ΅ ΠΏΡΡΠ°Π΅ΡΡΡ ΠΎΡΠ²Π΅ΡΠΈΡΡ Π½Π° Π²ΠΎΠΏΡΠΎΡ ΠΎ ΡΠΎΠΌ, ΠΊΠ°ΠΊΠΈΠ΅ ΠΈΠΌΠ΅Π½Π½ΠΎ ΡΠ°ΠΊΡΠΎΡΡ Π²Π»ΠΈΡΡΡ Π½Π° ΡΡΠ°ΡΡΡΠ΅ Π²ΠΎ Π²ΡΠ΅ΠΌ ΠΌΠΈΡΠ΅.
ΠΠ°Π½Π½ΡΠΉ Π΄ΠΎΠΊΠ»Π°Π΄ ΠΎ ΡΡΠ°ΡΡΡΠ΅ ΡΡΠΎΡΠΌΠΈΡΠΎΠ²Π°Π½ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΠΎΡΠ²Π΅ΡΠΎΠ² Π½Π° Π²ΠΎΠΏΡΠΎΡ, Π·Π°Π΄Π°Π½Π½ΡΠΉ ΠΏΠΎ ΡΠΈΡΡΠ΅ΠΌΠ΅ Β«Π»Π΅ΡΡΠ½ΠΈΡΡ ΠΡΠ½Π΄ΠΈΠ»Π°Β» (ΡΠΊΠ°Π»Π° ΠΡΠ½Π΄ΠΈΠ»Π°). Π Π΅ΡΠΏΠΎΠ½Π΄Π΅Π½ΡΠΎΠ² ΡΠΏΡΠ°ΡΠΈΠ²Π°Π»ΠΈ, ΠΊΠ°ΠΊ Π±Ρ ΠΎΠ½ΠΈ ΠΎΡΠ΅Π½ΠΈΠ»ΠΈ ΡΠΎΠ±ΡΡΠ²Π΅Π½Π½ΡΡ ΠΆΠΈΠ·Π½Ρ ΠΏΠΎ ΡΠΊΠ°Π»Π΅ ΠΎΡ 0
Π΄ΠΎ 10
, Π³Π΄Π΅ 0
ΡΠ²Π»ΡΠ΅ΡΡΡ Ρ
ΡΠ΄ΡΠ΅ΠΉ ΠΈΠ· Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΡΡ
ΠΎΡΠ΅Π½ΠΎΠΊ, Π° 10
β Π½Π°ΠΈΠ»ΡΡΡΠ΅ΠΉ.
Π‘ΡΡΡΠΊΡΡΡΠ° ΡΡΠ°ΡΡΠΈ
ΠΠ°Π½Π½Π°Ρ ΡΡΠ°ΡΡΡ Π·Π°Π΄ΡΠΌΡΠ²Π°Π»Π°ΡΡ ΠΎΠ΄Π½ΠΎΠ²ΡΠ΅ΠΌΠ΅Π½Π½ΠΎ ΠΈ ΠΊΠ°ΠΊ ΠΏΠΎΡΠΎΠ±ΠΈΠ΅ ΠΏΠΎ Π½Π°ΠΏΠΈΡΠ°Π½ΠΈΡ ΠΊΠΎΠ΄Π°, ΠΈ ΠΊΠ°ΠΊ ΡΠ²ΠΎΠ΅Π³ΠΎ ΡΠΎΠ΄Π° Π½Π΅Π±ΠΎΠ»ΡΡΠΎΠΉ ΡΠΏΡΠ°Π²ΠΎΡΠ½ΠΈΠΊ, Π² ΠΊΠΎΡΠΎΡΠΎΠΌ ΠΌΠΎΠΆΠ½ΠΎ Π²ΡΠ΅ΠΌΡ ΠΎΡ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ ΠΈΡΠΊΠ°ΡΡ Π½ΡΠΆΠ½ΡΠΉ ΡΠΈΠΏ Π³ΡΠ°ΡΠΈΠΊΠ°. ΠΠ»Ρ ΡΠΊΠΎΠ½ΠΎΠΌΠΈΠΈ ΠΌΠ΅ΡΡΠ° ΠΌΡ ΠΈΠ½ΠΎΠ³Π΄Π° ΠΏΠΎΠΌΠ΅ΡΠ°Π»ΠΈ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π² ΠΎΠ΄Π½Ρ ΠΊΠ°ΡΡΠΈΠ½ΠΊΡ, Π½ΠΎ Π²Ρ Π²ΡΠ΅Π³Π΄Π° ΠΌΠΎΠΆΠ΅ΡΠ΅ Π½Π°ΠΉΡΠΈ Π½Π°Ρ ΠΊΠΎΠ΄ Π»ΠΈΠ±ΠΎ Π·Π΄Π΅ΡΡ, Π»ΠΈΠ±ΠΎ Π² ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡΠ΅ΠΌ Π΅ΠΌΡ Jupyter Π½ΠΎΡΡΠ±ΡΠΊΠ΅.
ΠΠ³Π»Π°Π²Π»Π΅Π½ΠΈΠ΅
ΠΠ° ΠΊΠ°ΠΆΠ΄ΡΡ ΡΠ΅ΠΊΡΠΈΡ ΠΌΡ ΠΏΠΎΡΡΠ°Π²ΠΈΠ»ΠΈ Π³ΠΈΠΏΠ΅ΡΡΡΡΠ»ΠΊΡ, ΡΠ°ΠΊ ΡΡΠΎ ΠΌΠΎΠΆΠ΅ΡΠ΅ Π½Π΅ ΡΠΈΡΠ°ΡΡ ΠΏΡΠ΅Π΄ΠΈΡΠ»ΠΎΠ²ΠΈΠΉ, Π° ΡΡΠ°Π·Ρ ΠΏΠ΅ΡΠ΅Ρ ΠΎΠ΄ΠΈΡΡ ΠΊ Π³ΡΠ°ΡΠΈΠΊΠ°ΠΌ. ΠΡ Π½Π΅ ΠΎΠ±ΠΈΠ΄ΠΈΠΌΡΡ.
ΠΠΎΡ ΠΈΡΡΠΎΡΠΈΡ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π² Python
ΠΠΎΠ»Π΅Π΅ ΠΈΠ»ΠΈ ΠΌΠ΅Π½Π΅Π΅ ΡΠ΅ΡΡΠ΅Π·Π½ΠΎ Ρ Π½Π°ΡΠ°Π» ΠΈΠ·ΡΡΠ°ΡΡ Python ΠΎΠΊΠΎΠ»ΠΎ Π΄Π²ΡΡ Π»Π΅Ρ Π½Π°Π·Π°Π΄. ΠΠ°ΡΠΈΠ½Π°Ρ Ρ ΡΡΠΎΠ³ΠΎ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ, Π΅Π΄Π²Π° Π»ΠΈ Π½Π΅ ΠΊΠ°ΠΆΠ΄ΡΡ Π½Π΅Π΄Π΅Π»Ρ Ρ Π²ΠΎΡΡΠΎΡΠ³Π°Π»ΡΡ Π΅Π³ΠΎ ΠΏΡΠΎΡΡΠΎΡΠΎΠΉ ΠΈ Π»Π΅Π³ΠΊΠΎΡΡΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ, Π° ΡΠ°ΠΊΠΆΠ΅ ΠΎΠ±ΠΈΠ»ΠΈΠ΅ΠΌ Π²Π΅Π»ΠΈΠΊΠΎΠ»Π΅ΠΏΠ½ΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ Ρ ΠΎΡΠΊΡΡΡΡΠΌ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΌ ΠΊΠΎΠ΄ΠΎΠΌ. Π ΡΠ΅ΠΌ Π±ΠΎΠ»ΡΡΠ΅ Ρ Π·Π½Π°ΠΊΠΎΠΌΠΈΠ»ΡΡ Ρ ΡΠ°Π±Π»ΠΎΠ½Π°ΠΌΠΈ ΠΈ ΠΊΠΎΠ½ΡΠ΅ΠΏΡΠΈΡΠΌΠΈ ΡΠ·ΡΠΊΠ°, ΡΠ΅ΠΌ Π±ΠΎΠ»ΡΡΠ΅ Π²ΡΠ΅ ΡΡΠΎ ΠΎΠ±ΡΠ΅ΡΠ°Π»ΠΎ ΡΠΌΡΡΠ».
Matplotlib
ΠΠΎ Ρ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ΠΌ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π²ΡΠ΅ ΠΏΡΠΎΠΈΡΡ ΠΎΠ΄ΠΈΠ»ΠΎ ΡΠΎΠ²Π½ΠΎ Π½Π°ΠΎΠ±ΠΎΡΠΎΡ. Π Π½Π°ΡΠ°Π»Π΅ ΠΏΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈ ΠΊΠ°ΠΆΠ΄ΡΠΉ ΠΌΠΎΠΉ Π³ΡΠ°ΡΠΈΠΊ, ΠΏΠΎΡΡΡΠΎΠ΅Π½Π½ΡΠΉ Π² Matplotlib, Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°Π» ΠΌΠ½Π΅ ΠΊΠ°ΠΊΠΎΠ³ΠΎ-ΡΠΎ ΠΏΡΠ΅ΡΡΡΠΏΠ½ΠΈΠΊΠ°, ΡΠ±Π΅ΠΆΠ°Π²ΡΠ΅Π³ΠΎ ΠΈΠ· 80-Ρ Π³ΠΎΠ΄ΠΎΠ². ΠΠΎΠ»Π΅Π΅ ΡΠΎΠ³ΠΎ, ΡΡΠΎΠ±Ρ ΠΏΠΎΡΡΡΠΎΠΈΡΡ ΡΠ°ΠΊΡΡ ΠΌΠ΅ΡΠ·ΠΎΡΡΡ, ΠΌΠ½Π΅ ΠΏΡΠΈΡ ΠΎΠ΄ΠΈΠ»ΠΎΡΡ ΠΏΡΠΎΠ²ΠΎΠ΄ΠΈΡΡ ΡΠ΅Π»ΡΠ΅ ΡΠ°ΡΡ Π½Π° Stackoverflow. Π Π΄Π°ΠΆΠ΅ Π½Π΅ Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°ΠΉΡΠ΅ ΠΌΠ½Π΅ ΠΏΡΠΎ ΠΌΡΠ»ΡΡΠΈΠ΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ. ΠΠΎΠ½Π΅ΡΠ½ΠΎ, ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ Π²ΡΠ³Π»ΡΠ΄ΡΡ Π²ΠΏΠ΅ΡΠ°ΡΠ»ΡΡΡΠ΅, ΠΈ ΡΡ ΡΡΠ²ΡΡΠ²ΡΠ΅ΡΡ ΡΠ΅Π±Ρ ΠΏΠΎΡΡΡΡΠ°ΡΡΠ΅, ΡΠΎΠ·Π΄Π°Π²Π°Ρ ΡΠ°ΠΊΠΈΠ΅ Π²Π΅ΡΠΈ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠ½ΠΎ. ΠΠ°ΠΏΡΠΈΠΌΠ΅Ρ, ΡΡΡΠΎΡ 50 Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌ Π΄Π»Ρ ΡΠ°Π·Π½ΡΡ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ Π·Π° ΠΎΠ΄ΠΈΠ½ ΡΠ°Π·. ΠΠΎ Π΄Π»Ρ ΡΡΠΎΠ³ΠΎ Π½ΡΠΆΠ½ΠΎ ΠΏΡΠΎΠ΄Π΅Π»Π°ΡΡ ΠΊΡΡΡ ΡΠ°Π±ΠΎΡΡ ΠΈ Π·Π°ΠΏΠΎΠΌΠ½ΠΈΡΡ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎ Π±Π΅ΡΠΏΠΎΠ»Π΅Π·Π½ΡΡ ΠΊΠΎΠΌΠ°Π½Π΄.
Seaborn
ΠΠ½Π°ΠΊΠΎΠΌΡΡΠ²ΠΎ Ρ Seaborn ΠΏΡΠΈΠ½Π΅ΡΠ»ΠΎ Π±ΠΎΠ»ΡΡΠΎΠ΅ ΠΎΠ±Π»Π΅Π³ΡΠ΅Π½ΠΈΠ΅. Π‘ ΠΏΠΎΠΌΠΎΡΡΡ ΡΡΠΎΠΉ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ ΠΌΠΎΠΆΠ½ΠΎ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ Π°Π±ΡΡΡΠ°Π³ΠΈΡΠΎΠ²Π°ΡΡΡΡ ΠΎΡ ΡΠΎΠ½ΠΊΠΎΠΉ Π½Π°ΡΡΡΠΎΠΉΠΊΠΈ. Π Ρ ΡΠΎΡΠΊΠΈ Π·ΡΠ΅Π½ΠΈΡ ΡΡΡΠ΅ΡΠΈΠΊΠΈ ΠΏΠΎΠ»ΡΡΠ°ΡΡΠΈΡ ΡΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² ΡΡΠΎ Π±ΠΎΠ»ΡΡΠΎΠΉ ΡΠ°Π³ Π²ΠΏΠ΅ΡΠ΅Π΄. ΠΠΎ Π²ΡΠ΅ ΠΆΠ΅ Seaborn ΠΏΠΎΡΡΡΠΎΠ΅Π½Π° Π½Π° Π±Π°Π·Π΅ Matplotlib. Π Π·Π°ΡΠ°ΡΡΡΡ, Π΄Π»Ρ Π½Π΅ΡΡΠ°Π½Π΄Π°ΡΡΠ½ΡΡ Π½Π°ΡΡΡΠΎΠ΅ΠΊ, ΠΏΡΠΈΡ ΠΎΠ΄ΠΈΡΡΡ ΠΏΠ΅ΡΠ΅Ρ ΠΎΠ΄ΠΈΡΡ ΠΊ ΠΊΠΎΠ΄Ρ Matplotlib.
Bokeh
ΠΠ° ΠΊΠΎΡΠΎΡΠΊΠΈΠΉ ΠΌΠΎΠΌΠ΅Π½Ρ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ Ρ Π±ΡΠ»ΠΎ ΠΏΠΎΠ΄ΡΠΌΠ°Π», ΡΡΠΎ ΠΌΠΎΠΈΠΌ ΡΠΏΠ°ΡΠ΅Π½ΠΈΠ΅ΠΌ Π±ΡΠ΄Π΅Ρ Bokeh. Π― Π½Π°ΡΠΊΠ½ΡΠ»ΡΡ Π½Π° ΡΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΡ, ΠΊΠΎΠ³Π΄Π° ΡΠ°Π±ΠΎΡΠ°Π» Π½Π°Π΄ Π³Π΅ΠΎΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π΅Π½Π½ΠΎΠΉ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠ΅ΠΉ. ΠΠΎ Ρ ΠΎΡΠ΅Π½Ρ Π±ΡΡΡΡΠΎ ΠΎΠ±Π½Π°ΡΡΠΆΠΈΠ», ΡΡΠΎ Bokeh, Ρ ΠΎΡΡ ΠΈ ΠΎΡΠ»ΠΈΡΠ°Π΅ΡΡΡ ΠΎΡ Matplotlib, Π½ΠΎ ΠΏΠΎΡΡΡΠΎΠ΅Π½Π° ΡΠ°ΠΊ ΠΆΠ΅ Π³Π»ΡΠΏΠΎ ΠΈ Π·Π°ΠΏΡΡΠ°Π½Π½ΠΎ.
Plotly
ΠΠ΅ΠΊΠΎΡΠΎΡΠΎΠ΅ Π²ΡΠ΅ΠΌΡ Π½Π°Π·Π°Π΄, ΠΎΠΏΡΡΡ-ΡΠ°ΠΊΠΈ ΡΠ°Π±ΠΎΡΠ°Ρ Π½Π°Π΄ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠ΅ΠΉ Π³Π΅ΠΎΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π΅Π½Π½ΡΡ Π΄Π°Π½Π½ΡΡ , Ρ ΠΏΠΎΠΏΡΠΎΠ±ΠΎΠ²Π°Π» plot.ly (Π΄Π°Π»Π΅Π΅ Π²Π΅Π·Π΄Π΅ Π±ΡΠ΄Π΅ΠΌ Π½Π°Π·ΡΠ²Π°ΡΡ Π΅Π΅ ΠΏΡΠΎΡΡΠΎ plotly). Π’ΠΎΠ³Π΄Π° ΡΡΠ° Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° ΠΏΠΎΠΊΠ°Π·Π°Π»Π°ΡΡ ΠΌΠ½Π΅ Π΅ΡΠ΅ Π±ΠΎΠ»Π΅Π΅ Π°Π±ΡΡΡΠ΄Π½ΠΎΠΉ, ΡΠ΅ΠΌ Π²ΡΠ΅ ΠΏΡΠ΅Π΄ΡΠ΄ΡΡΠΈΠ΅. ΠΠ°ΠΌ Π½ΡΠΆΠ½ΠΎ Π±ΡΠ»ΠΎ Π·Π°Π²Π΅ΡΡΠΈ ΡΠ°ΠΌ Π°ΠΊΠΊΠ°ΡΠ½Ρ, Π²ΠΎΠΉΡΠΈ Π² Π½Π΅Π³ΠΎ Π½Π° Π²Π°ΡΠ΅ΠΌ Π½ΠΎΡΡΠ±ΡΠΊΠ΅, ΠΈ ΡΠΎΠ»ΡΠΊΠΎ ΠΏΠΎΡΠΎΠΌ plotly Π½Π°ΡΠΈΠ½Π°Π΅Ρ ΡΡΡΠΎΠΈΡΡ Π³ΡΠ°ΡΠΈΠΊΠΈ Π² ΠΎΠ½Π»Π°ΠΉΠ½ ΡΠ΅ΠΆΠΈΠΌΠ΅. Π Π·Π°ΡΠ΅ΠΌ Π²Π°ΠΌ Π½ΡΠΆΠ½ΠΎ Π΅ΡΠ΅ Π·Π°Π³ΡΡΠ·ΠΈΡΡ ΡΡΠΈ Π³ΡΠ°ΡΠΈΠΊΠΈ. Π― ΠΎΡΠ΅Π½Ρ Π±ΡΡΡΡΠΎ ΠΎΡΠ±ΡΠΎΡΠΈΠ» ΡΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΡ. ΠΠΎ Π½Π΅Π΄Π°Π²Π½ΠΎ Ρ Π½Π°ΡΠΊΠ½ΡΠ»ΡΡ Π½Π° YouTube-Π²ΠΈΠ΄Π΅ΠΎ ΠΏΡΠΎ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ plotly express ΠΈ plotly 4.0, Π² ΠΊΠΎΡΠΎΡΠΎΠΌ Π² ΡΠΎΠΌ ΡΠΈΡΠ»Π΅ Π³ΠΎΠ²ΠΎΡΠΈΠ»ΠΎΡΡ, ΡΡΠΎ ΠΎΠ½ΠΈ ΠΈΠ·Π±Π°Π²ΠΈΠ»ΠΈΡΡ ΠΎΡ ΡΡΠΎΠΉ ΠΎΠ½Π»Π°ΠΉΠ½-ΡΠ΅ΠΏΡΡ ΠΈ. Π― Π½Π°ΡΠ°Π» ΠΈΠ³ΡΠ°ΡΡΡΡ Ρ ΡΡΠΎΠΉ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΎΠΉ ΠΈ Π² ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ΅ ΠΏΠΎΡΠ²ΠΈΠ»Π°ΡΡ ΡΡΠ° ΡΡΠ°ΡΡΡ. ΠΠ°ΠΊ Π³ΠΎΠ²ΠΎΡΠΈΡΡΡ, Π»ΡΡΡΠ΅ ΠΏΠΎΠ·Π΄Π½ΠΎ, ΡΠ΅ΠΌ Π½ΠΈΠΊΠΎΠ³Π΄Π°.
Kepler.gl
ΠΠ΅ Π±ΡΠ΄ΡΡΠΈ Π½ΠΈΠΊΠΎΠΈΠΌ ΠΎΠ±ΡΠ°Π·ΠΎΠΌ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΎΠΉ Python, Kepler.gl, ΡΠ΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅, ΡΠ²Π»ΡΠ΅ΡΡΡ ΠΎΡΠ»ΠΈΡΠ½ΡΠΌ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠΌ Π΄Π»Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π³Π΅ΠΎΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π΅Π½Π½ΡΡ Π΄Π°Π½Π½ΡΡ . ΠΡΠ΅ ΡΡΠΎ Π²Π°ΠΌ Π½ΡΠΆΠ½ΠΎ, ΡΡΠΎ CSV-ΡΠ°ΠΉΠ», ΠΊΠΎΡΠΎΡΡΠΉ Π²Ρ Π»Π΅Π³ΠΊΠΎ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΡΠΎΠ·Π΄Π°ΡΡ ΠΏΡΠΈ ΠΏΠΎΠΌΠΎΡΠΈ Python.
ΠΠΎΠΈ ΡΠ΅ΠΊΡΡΠΈΠ΅ ΠΏΡΠ΅Π΄ΠΏΠΎΡΡΠ΅Π½ΠΈΡ
Π ΠΊΠΎΠ½ΡΠ΅ ΠΊΠΎΠ½ΡΠΎΠ² Ρ ΠΎΡΡΠ°Π½ΠΎΠ²ΠΈΠ»ΡΡ Π½Π° Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ΅ Pandas Π΄Π»Ρ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π½Π° ΡΠΊΠΎΡΡΡ ΡΡΠΊΡ, ΠΈ Π½Π° Seaborn Π΄Π»Ρ ΠΏΡΠ΅Π·Π΅Π½ΡΠ°ΡΠΈΠΉ ΠΈ ΠΎΡΡΠ΅ΡΠΎΠ² (ΠΊΠΎΠ³Π΄Π° Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ ΠΎΡΠ΅Π½Ρ Π²Π°ΠΆΠ½Π°).
ΠΠ°ΠΆΠ½ΠΎΡΡΡ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈΡ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΠΉ
Π― Π½Π°ΡΠ°Π» ΠΈΠ·ΡΡΠ°ΡΡ ΡΡΠ°ΡΠΈΡΡΠΈΠΊΡ (ΠΊΡΡΡ Stats 119), ΡΡΠ°ΡΡ Π² Π‘Π°Π½-ΠΠΈΠ΅Π³ΠΎ. ΠΡΠΎΡ ΠΊΡΡΡ ΡΠ²Π»ΡΠ΅ΡΡΡ Π²Π²ΠΎΠ΄Π½ΡΠΌ ΠΈ Π²ΠΊΠ»ΡΡΠ°Π΅Ρ Π² ΡΠ΅Π±Ρ ΡΠ°ΠΌΡΠ΅ ΠΎΡΠ½ΠΎΠ²Ρ ΡΡΠ°ΡΠΈΡΡΠΈΠΊΠΈ, ΠΊΠ°ΠΊ Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, Π°Π³ΡΠ΅Π³Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ (Π²ΠΈΠ·ΡΠ°Π»ΡΠ½ΡΡ ΠΈ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π΅Π½Π½ΡΡ), ΠΊΠΎΠ½ΡΠ΅ΠΏΡΠΈΡ ΡΠ°Π½ΡΠΎΠ² ΠΈ Π²Π΅ΡΠΎΡΡΠ½ΠΎΡΡΠ΅ΠΉ, ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ, Π²ΡΠ±ΠΎΡΠΊΠΈ ΠΈ, ΡΠ°ΠΌΠΎΠ΅ Π³Π»Π°Π²Π½ΠΎΠ΅, ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΡ. Π ΡΡΠΎ Π²ΡΠ΅ΠΌΡ ΠΌΠΎΠ΅ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ ΡΠ΅Ρ ΠΈΠ»ΠΈ ΠΈΠ½ΡΡ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π΅Π½Π½ΡΡ ΡΠ΅Π½ΠΎΠΌΠ΅Π½ΠΎΠ² ΠΏΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈ ΠΏΠΎΠ»Π½ΠΎΡΡΡΡ ΡΠ΄Π²ΠΈΠ½ΡΠ»ΠΎΡΡ Π² ΡΡΠΎΡΠΎΠ½Ρ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΡ ΠΈΡ Π² Π²ΠΈΠ΄Π΅ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈΡ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΠΉ (ΠΊΠ°ΠΊ ΠΏΡΠ°Π²ΠΈΠ»ΠΎ, Π³Π°ΡΡΡΠΎΠ²ΡΡ ).
Π ΠΏΠΎ ΡΠ΅ΠΉ Π΄Π΅Π½Ρ Ρ Π½Π°Ρ ΠΎΠΆΡ ΠΏΠΎΡΡΡΡΠ°ΡΡΠΈΠΌ, ΠΊΠ°ΠΊ Π²ΡΠ΅Π³ΠΎ Π΄Π²Π΅ Π²Π΅Π»ΠΈΡΠΈΠ½Ρ, ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΠΎΠΆΠΈΠ΄Π°Π½ΠΈΠ΅ ΠΈ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΡ, ΠΌΠΎΠ³ΡΡ ΠΏΠΎΠΌΠΎΡΡ Π²Π°ΠΌ ΠΏΠΎΡΡΠΈΡΡ ΡΡΡΡ ΡΠ²Π»Π΅Π½ΠΈΡ. ΠΡΠΎΡΡΠΎ Π·Π½Π°Ρ ΡΡΠΈ Π΄Π²Π° ΡΠΈΡΠ»Π°, Π»Π΅Π³ΠΊΠΎ ΡΠ΄Π΅Π»Π°ΡΡ Π²ΡΠ²ΠΎΠ΄, Π½Π°ΡΠΊΠΎΠ»ΡΠΊΠΎ Π²Π΅ΡΠΎΡΡΠ΅Π½ ΡΠΎΡ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠΉ ΡΠ΅Π·ΡΠ»ΡΡΠ°Ρ. ΠΡ ΡΡΠ°Π·Ρ Π·Π½Π°Π΅ΠΌ, Π² ΠΊΠ°ΠΊΠΎΠΉ ΠΎΠ±Π»Π°ΡΡΠΈ Π±ΡΠ΄ΡΡ ΠΎΡΠ½ΠΎΠ²Π½ΡΠ΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ. ΠΡΠΎ Π΄Π°Π΅Ρ Π½Π°ΠΌ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡ Π±ΡΡΡΡΠΎ Π²ΡΠ΄Π΅Π»ΡΡΡ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈ Π·Π½Π°ΡΠΈΠΌΡΠ΅ ΡΠ²Π»Π΅Π½ΠΈΡ, Π½Π΅ ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄Ρ ΠΏΡΠΈ ΡΡΠΎΠΌ ΡΠ»ΠΎΠΆΠ½ΡΡ Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΠΉ.
Π ΠΎΠ±ΡΠ΅ΠΌ, ΡΠ΅ΠΏΠ΅ΡΡ ΠΏΡΠΈ ΡΠ°Π±ΠΎΡΠ΅ Ρ Π»ΡΠ±ΡΠΌΠΈ Π½ΠΎΠ²ΡΠΌΠΈ Π΄Π°Π½Π½ΡΠΌΠΈ ΠΌΠΎΠΈΠΌ ΠΏΠ΅ΡΠ²ΡΠΌ ΡΠ°Π³ΠΎΠΌ Π²ΡΠ΅Π³Π΄Π° ΡΠ²Π»ΡΠ΅ΡΡΡ ΠΏΠΎΠΏΡΡΠΊΠ° Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ ΠΈΡ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅.
ΠΠ°Π³ΡΡΠ·ΠΊΠ° Π΄Π°Π½Π½ΡΡ ΠΈ ΠΈΠΌΠΏΠΎΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ
ΠΠ»Ρ Π½Π°ΡΠ°Π»Π° Π΄Π°Π²Π°ΠΉΡΠ΅ Π·Π°Π³ΡΡΠ·ΠΈΠΌ Π΄Π°Π½Π½ΡΠ΅, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΡ Π±ΡΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π² ΡΡΠΎΠΉ ΡΡΠ°ΡΡΠ΅. Π― ΡΠ°ΠΊΠΆΠ΅ ΠΏΡΠΎΠΈΠ·Π²Π΅Π» ΠΏΡΠ΅Π΄ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΡ Π΄Π°Π½Π½ΡΡ (ΠΈΠ½ΡΠ΅ΡΠΏΠΎΠ»ΡΡΠΈΡ ΠΈ ΡΠΊΡΡΡΠ°ΠΏΠΎΠ»ΡΡΠΈΡ β ΡΠ°ΠΌ, Π³Π΄Π΅ ΡΡΠΎ Π±ΡΠ»ΠΎ ΡΠΌΠ΅ΡΡΠ½ΠΎ).
# Π·Π°Π³ΡΡΠΆΠ°Π΅ΠΌ Π΄Π°Π½Π½ΡΠ΅ data = pd.read_csv('https://raw.githubusercontent.com/FBosler/AdvancedPlotting/master/combined_set.csv') # ΠΏΡΠΈΡΠ²Π°ΠΈΠ²Π°Π΅ΠΌ ΠΌΠ΅ΡΠΊΠΈ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡ Π³ΠΎΠ΄Ρ data['Mean Log GDP per capita'] = data.groupby('Year')['Log GDP per capita'].transform( pd.qcut, q=5, labels=(['Lowest','Low','Medium','High','Highest']) )
ΠΠ°Π³ΡΡΠΆΠ΅Π½Π½ΡΠΉ Π΄Π°ΡΠ°ΡΠ΅Ρ ΡΠΎΠ΄Π΅ΡΠΆΠΈΡ Π΄Π°Π½Π½ΡΠ΅ Π² ΡΠ»Π΅Π΄ΡΡΡΠΈΡ ΠΊΠΎΠ»ΠΎΠ½ΠΊΠ°Ρ :
- Year (Π³ΠΎΠ΄): Π³ΠΎΠ΄, Π² ΠΊΠΎΡΠΎΡΠΎΠΌ ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΠ»ΠΈΡΡ ΠΈΠ·ΠΌΠ΅ΡΠ΅Π½ΠΈΡ (Ρ 2007 ΠΏΠΎ 2018).
- Life Ladder (Β«Π»Π΅ΡΡΠ½ΠΈΡΠ° ΠΆΠΈΠ·Π½ΠΈΒ»): ΡΠ΅ΡΠΏΠΎΠ½Π΄Π΅Π½Ρ ΠΈΠ·ΠΌΠ΅ΡΡΠ΅Ρ ΠΊΠ°ΡΠ΅ΡΡΠ²ΠΎ ΡΠ²ΠΎΠΉ ΠΆΠΈΠ·Π½ΠΈ ΠΏΠΎ ΡΠΊΠ°Π»Π΅ ΠΎΡ 0 Π΄ΠΎ 10 (Π½Π°ΠΈΠ»ΡΡΡΠ°Ρ ΠΎΡΠ΅Π½ΠΊΠ°). ΠΡΠΎ ΡΠ°ΠΊ Π½Π°Π·ΡΠ²Π°Π΅ΠΌΠ°Ρ Π»Π΅ΡΡΠ½ΠΈΡΠ° ΠΈΠ»ΠΈ ΡΠΊΠ°Π»Π° ΠΡΠ½ΡΡΠΈΠ»Π°.
- Log GDP per capita (Π»ΠΎΠ³Π°ΡΠΈΡΠΌ ΠΠΠ Π½Π° Π΄ΡΡΡ Π½Π°ΡΠ΅Π»Π΅Π½ΠΈΡ): ΠΠΠ Π½Π° Π΄ΡΡΡ Π½Π°ΡΠ΅Π»Π΅Π½ΠΈΡ, ΠΏΠΎΠ΄ΡΡΠΈΡΠ°Π½Π½ΡΠΉ ΠΏΠΎ ΠΏΠ°ΡΠΈΡΠ΅ΡΡ ΠΏΠΎΠΊΡΠΏΠ°ΡΠ΅Π»ΡΠ½ΠΎΠΉ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡΠΈ Π΄ΠΎΠ»Π»Π°ΡΠ° Π² 2011 Π³ΠΎΠ΄Ρ. ΠΠ·ΡΡΠΎ ΠΈΠ· ΠΈΠ½Π΄ΠΈΠΊΠ°ΡΠΎΡΠΎΠ² ΠΌΠΈΡΠΎΠ²ΠΎΠ³ΠΎ ΡΠ°Π·Π²ΠΈΡΠΈΡ (WDI β World Development Indicators), ΠΎΠΏΡΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½Π½ΡΡ ΠΡΠ΅ΠΌΠΈΡΠ½ΡΠΌ ΠΠ°Π½ΠΊΠΎΠΌ 14 Π½ΠΎΡΠ±ΡΡ 2018 Π³ΠΎΠ΄Π°.
- Social support (ΡΠΎΡΠΈΠ°Π»ΡΠ½Π°Ρ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ°): ΠΡΠ²Π΅Ρ Π½Π° Π²ΠΎΠΏΡΠΎΡ: Β«ΠΡΠ»ΠΈ Π±Ρ Π²Ρ Π±ΡΠ»ΠΈ Π² Π±Π΅Π΄Π΅, ΡΠΎ ΠΌΠΎΠ³Π»ΠΈ Π±Ρ ΡΠ°ΡΡΡΠΈΡΡΠ²Π°ΡΡ Π½Π° ΠΏΠΎΠΌΠΎΡΡ Π΄ΡΡΠ·Π΅ΠΉ ΠΈΠ»ΠΈ ΡΠΎΠ΄ΡΡΠ²Π΅Π½Π½ΠΈΠΊΠΎΠ² ΠΈΠ»ΠΈ Π½Π΅Ρ?Β»
- Healthy life expectancy at birth (ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΠ°Ρ ΠΏΡΠΎΠ΄ΠΎΠ»ΠΆΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΡ Π·Π΄ΠΎΡΠΎΠ²ΠΎΠΉ ΠΆΠΈΠ·Π½ΠΈ): ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΠΎΠ΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ Π»Π΅Ρ, Π² ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ ΠΊΠΎΡΠΎΡΡΡ ΡΠ΅Π»ΠΎΠ²Π΅ΠΊ ΡΠΌΠΎΠΆΠ΅Ρ Π²Π΅ΡΡΠΈ Π°ΠΊΡΠΈΠ²Π½ΡΠΉ ΠΎΠ±ΡΠ°Π· ΠΆΠΈΠ·Π½ΠΈ Π±Π΅Π· Π²ΡΡΠΊΠΈΡ ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½ΠΈΠΉ ΠΏΠΎ Π·Π΄ΠΎΡΠΎΠ²ΡΡ. ΠΠΎΠΊΠ°Π·Π°ΡΠ΅Π»ΠΈ β Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π΄Π°Π½Π½ΡΡ ΠΡΠ΅ΠΌΠΈΡΠ½ΠΎΠΉ ΠΎΡΠ³Π°Π½ΠΈΠ·Π°ΡΠΈΠΈ Π·Π΄ΡΠ°Π²ΠΎΠΎΡ ΡΠ°Π½Π΅Π½ΠΈΡ (WHO β World Health Organization) Π·Π° 2005, 2010, 2015 ΠΈ 2016 Π³ΠΎΠ΄Ρ.
- Freedom to make life choices (ΡΠ²ΠΎΠ±ΠΎΠ΄Π° Π΄Π΅Π»Π°ΡΡ ΠΆΠΈΠ·Π½Π΅Π½Π½ΡΠΉ Π²ΡΠ±ΠΎΡ): ΠΡΠ²Π΅Ρ Π½Π° Π²ΠΎΠΏΡΠΎΡ: Β«Π£Π΄ΠΎΠ²Π»Π΅ΡΠ²ΠΎΡΠ΅Π½Ρ Π»ΠΈ Π²Ρ Π²Π°ΡΠΈΠΌ ΡΡΠΎΠ²Π½Π΅ΠΌ ΡΠ²ΠΎΠ±ΠΎΠ΄Ρ Π²ΡΠ±ΠΈΡΠ°ΡΡ, ΡΡΠΎ Π΄Π΅Π»Π°ΡΡ ΡΠΎ ΡΠ²ΠΎΠ΅ΠΉ ΠΆΠΈΠ·Π½ΡΡ?Β»
- Generosity (ΡΠ΅Π΄ΡΠΎΡΡΡ): ΠΡΠ²Π΅Ρ Π½Π° Π²ΠΎΠΏΡΠΎΡ: Β«ΠΠ΅ΡΡΠ²ΠΎΠ²Π°Π»ΠΈ Π»ΠΈ Π²Ρ Π΄Π΅Π½ΡΠ³ΠΈ Π½Π° Π±Π»Π°Π³ΠΎΡΠ²ΠΎΡΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΡ Π² ΠΏΡΠΎΡΠ»ΠΎΠΌ ΠΌΠ΅ΡΡΡΠ΅?Β» (Π² ΠΏΡΠΈΠ²ΡΠ·ΠΊΠ΅ ΠΊ ΠΠΠ Π½Π° Π΄ΡΡΡ Π½Π°ΡΠ΅Π»Π΅Π½ΠΈΡ).
- Perceptions of corruption (Π²ΠΎΡΠΏΡΠΈΡΡΠΈΠ΅ ΠΊΠΎΡΡΡΠΏΡΠΈΠΈ): ΠΡΠ²Π΅ΡΡ Π½Π° Π²ΠΎΠΏΡΠΎΡΡ: Β«Π¨ΠΈΡΠΎΠΊΠΎ Π»ΠΈ ΡΠ°ΡΠΏΡΠΎΡΡΡΠ°Π½Π΅Π½Π° ΠΊΠΎΡΡΡΠΏΡΠΈΡ Π² ΠΏΡΠ°Π²ΠΈΡΠ΅Π»ΡΡΡΠ²Π΅Π½Π½ΡΡ ΠΊΡΡΠ³Π°Ρ ?Β» ΠΈ Β«Π¨ΠΈΡΠΎΠΊΠΎ Π»ΠΈ ΡΠ°ΡΠΏΡΠΎΡΡΡΠ°Π½Π΅Π½Π° ΠΊΠΎΡΡΡΠΏΡΠΈΡ Π² Π±ΠΈΠ·Π½Π΅ΡΠ΅?Β»
- Positive affect (ΠΏΠΎΠ»ΠΎΠΆΠΈΡΠ΅Π»ΡΠ½ΡΠΉ Π°ΡΡΠ΅ΠΊΡ): Π²ΠΊΠ»ΡΡΠ°Π΅Ρ Π² ΡΠ΅Π±Ρ ΡΡΠ΅Π΄Π½ΡΡ ΡΠ°ΡΡΠΎΡΡ ΡΡΠ°ΡΡΡΡ, ΡΠΌΠ΅Ρ Π° ΠΈ ΡΠ°Π΄ΠΎΡΡΠΈ Π² ΠΏΡΠ΅Π΄ΡΠ΄ΡΡΠΈΠΉ Π΄Π΅Π½Ρ.
- Negative affect (ΠΎΡΡΠΈΡΠ°ΡΠ΅Π»ΡΠ½ΡΠΉ Π°ΡΡΠ΅ΠΊΡ): Π²ΠΊΠ»ΡΡΠ°Π΅Ρ Π² ΡΠ΅Π±Ρ ΡΡΠ΅Π΄Π½ΡΡ ΡΠ°ΡΡΠΎΡΡ Π±Π΅ΡΠΏΠΎΠΊΠΎΠΉΡΡΠ²Π°, Π³ΡΡΡΡΠΈ ΠΈ Π³Π½Π΅Π²Π° Π² ΠΏΡΠ΅Π΄ΡΠ΄ΡΡΠΈΠΉ Π΄Π΅Π½Ρ.
- Confidence in national government (Π΄ΠΎΠ²Π΅ΡΠΈΠ΅ ΡΠΎΠ±ΡΡΠ²Π΅Π½Π½ΠΎΠΌΡ ΠΏΡΠ°Π²ΠΈΡΠ΅Π»ΡΡΡΠ²Ρ): Π½Π΅ Π½ΡΠΆΠ΄Π°Π΅ΡΡΡ Π² ΠΏΠΎΡΡΠ½Π΅Π½ΠΈΡΡ .
- Democratic Quality (ΠΊΠ°ΡΠ΅ΡΡΠ²ΠΎ Π΄Π΅ΠΌΠΎΠΊΡΠ°ΡΠΈΠΈ): Π½Π°ΡΠΊΠΎΠ»ΡΠΊΠΎ Π΄Π΅ΠΌΠΎΠΊΡΠ°ΡΠΈΡΠ½Π° ΡΡΡΠ°Π½Π°.
- Delivery Quality (ΠΊΠ°ΡΠ΅ΡΡΠ²ΠΎ ΡΠΏΡΠ°Π²Π»Π΅Π½ΠΈΡ): Π½Π°ΡΠΊΠΎΠ»ΡΠΊΠΎ Ρ ΠΎΡΠΎΡΠΎ ΡΡΡΠ°Π½Π° ΡΠΏΡΠ°Π²Π»ΡΠ΅ΡΡΡ.
- Gapminder Life Expectancy (ΠΏΡΠΎΠ΄ΠΎΠ»ΠΆΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΡ ΠΆΠΈΠ·Π½ΠΈ ΠΎΡ Gapminder): Π΄Π°Π½Π½ΡΠ΅ ΠΎ ΠΏΡΠΎΠ΄ΠΎΠ»ΠΆΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΠΈ ΠΆΠΈΠ·Π½ΠΈ ΠΎΡ Gapminder.
- Gapminder Population (Π½Π°ΡΠ΅Π»Π΅Π½ΠΈΠ΅ ΡΡΡΠ°Π½Ρ ΠΎΡ Gapminder): Π½Π°ΡΠ΅Π»Π΅Π½ΠΈΠ΅ ΡΡΡΠ°Π½Ρ.
ΠΠΌΠΏΠΎΡΡΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅
import plotly
import pandas as pd
import numpy as np
import seaborn as sns
import plotly.express as pximport matplotlib%matplotlib inlineassert matplotlib.__version__ == "3.1.0","""
Please install matplotlib version 3.1.0 by running:
1) !pip uninstall matplotlib
2) !pip install matplotlib==3.1.0
"""
ΠΡΡΡΡΠΎ: ΠΏΡΠΎΡΡΡΠ΅ Π³ΡΠ°ΡΠΈΠΊΠΈ Π² Pandas
Pandas ΠΈΠΌΠ΅Π΅Ρ Π²ΡΡΡΠΎΠ΅Π½Π½ΡΠ΅ ΡΡΠ½ΠΊΡΠΈΠΈ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ², ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΠΎΠΆΠ½ΠΎ Π²ΡΠ·ΡΠ²Π°ΡΡ Π½Π΅ΠΏΠΎΡΡΠ΅Π΄ΡΡΠ²Π΅Π½Π½ΠΎ ΠΈΠ· Series ΠΈ DataFrame. ΠΠ° ΡΡΠΎ Ρ ΠΎΠ±ΠΎΠΆΠ°Ρ ΡΡΠΈ ΡΡΠ½ΠΊΡΠΈΠΈ, ΡΡΠΎ Π·Π° ΠΈΡ ΠΊΡΠ°ΡΠΊΠΎΡΡΡ, Π·Π° ΡΠ°Π·ΡΠΌΠ½ΡΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΠΏΠΎ ΡΠΌΠΎΠ»ΡΠ°Π½ΠΈΡ ΠΈ Π·Π° ΡΠΎ, ΡΡΠΎ Ρ ΠΈΡ ΠΏΠΎΠΌΠΎΡΡΡ ΠΌΠΎΠΆΠ½ΠΎ Π±ΡΡΡΡΠΎ ΠΏΠΎΠ½ΡΡΡ, ΡΡΠΎ ΠΏΡΠΎΠΈΡΡ ΠΎΠ΄ΠΈΡ Ρ Π΄Π°Π½Π½ΡΠΌΠΈ.
ΠΠ»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠ° ΠΏΡΠΎΡΡΠΎ Π²ΡΠ·ΠΎΠ²ΠΈΡΠ΅ ΠΌΠ΅ΡΠΎΠ΄ .plot(kind=<TYPE OF PLOT>)
ΡΠ»Π΅Π΄ΡΡΡΠΈΠΌ ΠΎΠ±ΡΠ°Π·ΠΎΠΌ:
np.exp(data[data['Year']==2018]['Log GDP per capita']).plot( kind='hist' )
Π ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ΅ Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ ΡΡΠΎΠΉ ΠΊΠΎΠΌΠ°Π½Π΄Ρ ΠΏΠΎΠ»ΡΡΠΈΡΡΡ ΡΠ»Π΅Π΄ΡΡΡΠΈΠΉ Π³ΡΠ°ΡΠΈΠΊ:
2018: ΠΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΠ° ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π° ΡΡΡΠ°Π½ Π² Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΠΎΡ ΠΠΠ Π½Π° Π΄ΡΡΡ Π½Π°ΡΠ΅Π»Π΅Π½ΠΈΡ. Π’ΡΡ Π½ΠΈΠΊΠ°ΠΊΠΈΡ ΡΡΡΠΏΡΠΈΠ·ΠΎΠ²: Π±ΠΎΠ»ΡΡΠΈΠ½ΡΡΠ²ΠΎ ΡΡΡΠ°Π½ Π±Π΅Π΄Π½Ρ!
ΠΡΠΈ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΠΈ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π² Pandas Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ ΠΏΡΡΡ ΠΎΡΠ½ΠΎΠ²Π½ΡΡ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ²:
kind
: Pandas Π΄ΠΎΠ»ΠΆΠ½Π° Π·Π½Π°ΡΡ, ΠΊΠ°ΠΊΠΎΠ³ΠΎ ΡΠΈΠΏΠ° Π³ΡΠ°ΡΠΈΠΊ Π²Ρ Ρ ΠΎΡΠΈΡΠ΅ ΡΡΡΠΎΠΈΡΡ. ΠΠΎΠ·ΠΌΠΎΠΆΠ½Ρ ΡΠ»Π΅Π΄ΡΡΡΠΈΠ΅ Π²Π°ΡΠΈΠ°Π½ΡΡ:hist, bar, barh, scatter, area, kde, line, box, hexbin, pie
.figsize
: ΠΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΏΠ΅ΡΠ΅ΠΎΠΏΡΠ΅Π΄Π΅Π»ΠΈΡΡ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΡΠ°Π·ΠΌΠ΅ΡΠ°, Π·Π°Π΄Π°Π½Π½ΠΎΠ΅ ΠΏΠΎ ΡΠΌΠΎΠ»ΡΠ°Π½ΠΈΡ (6 Π΄ΡΠΉΠΌΠΎΠ² Π² ΡΠΈΡΠΈΠ½Ρ ΠΈ 4 Π΄ΡΠΉΠΌΠ° Π² Π²ΡΡΠΎΡΡ). ΠΠ°Π½Π½ΡΠΉ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡ ΠΏΡΠΈΠ½ΠΈΠΌΠ°Π΅Ρ Π½Π° Π²Ρ ΠΎΠ΄ ΠΊΠΎΡΡΠ΅ΠΆ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρfigsize=(12,8)
, ΡΡΠΎ Ρ ΡΠ°ΡΡΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ.title
: ΠΠΎΠ±Π°Π²Π»ΡΠ΅Ρ ΠΊ Π³ΡΠ°ΡΠΈΠΊΡ Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΎΠΊ. ΠΠ°ΠΊ ΠΏΡΠ°Π²ΠΈΠ»ΠΎ, Ρ Π΅Π³ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ, ΡΡΠΎΠ±Ρ ΠΊΡΠ°ΡΠΊΠΎ ΠΎΠΏΠΈΡΠ°ΡΡ, ΡΡΠΎ ΠΏΡΠΎΠΈΡΡ ΠΎΠ΄ΠΈΡ Π½Π° Π³ΡΠ°ΡΠΈΠΊΠ΅, Π΄Π°Π±Ρ ΠΏΠΎΡΠΎΠΌ ΡΡΠΎ ΠΌΠΎΠΆΠ½ΠΎ Π±ΡΠ»ΠΎ Π±ΡΡΡΡΠΎ ΠΏΠΎΠ½ΡΡΡ. ΠΠ°Π½Π½ΡΠΉ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡ ΠΏΡΠΈΠ½ΠΈΠΌΠ°Π΅Ρ Π½Π° Π²Ρ ΠΎΠ΄ ΡΡΡΠΎΠΊΡ.bins
: ΠΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΏΠ΅ΡΠ΅ΠΎΠΏΡΠ΅Π΄Π΅Π»ΠΈΡΡ ΡΠΈΡΠΈΠ½Ρ ΠΎΠ±Π»Π°ΡΡΠ΅ΠΉ Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΡ. ΠΠ°Π½Π½ΡΠΉ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡ ΠΏΡΠΈΠ½ΠΈΠΌΠ°Π΅Ρ Π½Π° Π²Ρ ΠΎΠ΄ ΡΠΏΠΈΡΠΎΠΊ ΠΈΠ»ΠΈ ΠΏΠΎΠ΄ΠΎΠ±Π½ΡΡ Π΅ΠΌΡ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»ΡΠ½ΠΎΡΡΡ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρbins=np.arange(2,8,0.25)
.xlim/ylim
: ΠΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΏΠ΅ΡΠ΅ΠΎΠΏΡΠ΅Π΄Π΅Π»ΠΈΡΡ ΠΌΠ°ΠΊΡΠΈΠΌΠ°Π»ΡΠ½ΡΠ΅ ΠΈ ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡΠ½ΡΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΠΎΡΠ΅ΠΉx
ΠΈy
. ΠΠ±Π° ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠ° ΠΏΡΠΈΠ½ΠΈΠΌΠ°ΡΡ Π½Π° Π²Ρ ΠΎΠ΄ ΠΊΠΎΡΡΠ΅ΠΆΠΈ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρxlim=(0,5)
.
ΠΠ°Π²Π°ΠΉΡΠ΅ Π±ΡΡΡΡΠΎ ΠΏΡΠΎΠ±Π΅ΠΆΠΈΠΌΡΡ ΠΏΠΎ Π½Π΅ΠΊΠΎΡΠΎΡΡΠΌ ΡΠΈΠΏΠ°ΠΌ ΡΠ°ΠΊΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ².
ΠΠ΅ΡΡΠΈΠΊΠ°Π»ΡΠ½Π°Ρ Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΠ°
data[ data['Year'] == 2018 ].set_index('Country name')['Life Ladder'].nlargest(15).plot( kind='bar', figsize=(12,8) )
ΠΠ½Π°ΠΊΠΎΠΌΠΈΠΌΡΡ Ρ Π°Π½Π°Π»ΠΈΠ·ΠΎΠΌ Π΄Π°Π½Π½ΡΡ Π½Π° Python. Π§Π°ΡΡΡ 1
Π ΡΡΠΎΠΉ ΡΡΠ°ΡΡΠ΅ ΠΌΠ½Π΅ Ρ ΠΎΡΠ΅Π»ΠΎΡΡ Π±Ρ ΡΠ°ΡΡΠΊΠ°Π·Π°ΡΡ ΠΎ Π²ΡΠΎΡΠΎΠΌ ΡΡΠ°ΠΏΠ΅ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ Π°Π»Π³ΠΎΡΡΠ΅ΠΉΠ΄ΠΈΠ½Π³Ρ, Π½Π°ΡΠ΅Π»Π΅Π½Π½ΠΎΠΌ Π½Π° ΡΠ°ΠΊΡΡ Π²Π°ΠΆΠ½ΡΡ Π²Π΅ΡΡ ΠΊΠ°ΠΊ Π°Π½Π°Π»ΠΈΠ· Π΄Π°Π½Π½ΡΡ . ΠΡ ΡΠ°ΡΡΠΌΠΎΡΡΠΈΠΌ ΠΈΠ·ΡΡΠ΅Π½ΠΈΠ΅ ΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ pandas, matplotlib,Β ΠΏΡΠΎΠ΄ΠΎΠ»ΠΆΠΈΠΌ ΠΎΡΠ²Π°ΠΈΠ²Π°ΡΡ Python ΠΈ Π±ΠΈΡΠΆΠ΅Π²ΠΎΠ΅ Π΄Π΅Π»ΠΎ.
ΠΡΠ»ΠΈ Π²Ρ ΠΏΡΠΎΡΠ»ΠΈ ΠΏΠ΅ΡΠ²ΡΠΉ ΡΡΠ°ΠΏ, ΡΠΎ ΡΠΆΠ΅ Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ ΠΎΡΠ²ΠΎΠΈΠ»ΠΈ Python, ΠΈΠ·ΡΡΠΈΠ»ΠΈ ΡΡΠ°Π½Π΄Π°ΡΡΠ½ΡΠ΅ ΠΊΠΎΠ½ΡΡΡΡΠΊΡΠΈΠΈ ΡΠ·ΡΠΊΠ°, ΠΏΠΎΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π»ΠΈΡΡ Π½Π΅ΠΊΠΎΡΠΎΡΡΠΌΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ°ΠΌΠΈ ΠΈ ΡΠΆΠ΅ Π·Π½Π°Π΅ΡΠ΅, ΡΡΠΎ Π±ΠΈΡΠΆΠ° ΡΡΠΎ Π΄Π°Π»Π΅ΠΊΠΎ Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ Forex. ΠΠΎΡΠ»Π΅ ΠΏΡΠΎΡ ΠΎΠΆΠ΄Π΅Π½ΠΈΡ Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΡΡΠ°ΠΏΠ° Π²Ρ ΡΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΏΡΠΎΠ²ΠΎΠ΄ΠΈΡΡ Π½Π΅ΠΊΠΎΡΠΎΡΡΠΉ Π°Π½Π°Π»ΠΈΠ· Π±ΠΈΡΠΆΠ΅Π²ΡΡ Π΄Π°Π½Π½ΡΡ , ΡΡΡΠΎΠΈΡΡ ΡΠ²ΠΎΠΈ Π³ΡΠ°ΡΠΈΠΊΠΈ ΠΈ ΠΈΠ½Π΄ΠΈΠΊΠ°ΡΠΎΡΡ, Π° ΡΠ°ΠΊ ΠΆΠ΅ ΡΡΠ°Π½Π΅ΡΠ΅ Π±ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ΄ΠΊΠΎΠ²Π°Π½Ρ Π² ΡΠ΅Ρ Π½ΠΈΡΠ΅ΡΠΊΠΎΠΌ Π°Π½Π°Π»ΠΈΠ·Π΅.
ΠΠ½Π°Π»ΠΈΠ· Π΄Π°Π½Π½ΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ Π² ΡΡΠ΅ΠΉΠ΄ΠΈΠ½Π³Π΅, ΠΎΠ½ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌ Π² ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠΌ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠΈ, Π² ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈΡ ΡΠ°ΡΡΠ΅ΡΠ°Ρ , Π² ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠΌ ΠΌΠΎΠ΄Π΅Π»ΠΈΡΠΎΠ²Π°Π½ΠΈΠΈ ΠΈ ΠΌΠ½ΠΎΠ³ΠΎΠΌ Π΄ΡΡΠ³ΠΎΠΌ. ΠΠΎΡΡΠΎΠΌΡ ΠΏΠΎΠ·Π½Π°ΠΊΠΎΠΌΠΈΠ²ΡΠΈΡΡ Ρ ΡΡΠΎΠΉ Π΄ΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ ΡΠ»ΠΎΠΆΠ½ΠΎΠΉ ΡΠ΅ΠΌΠΎΠΉ, Π²Ρ ΡΠΌΠΎΠΆΠ΅ΡΠ΅ Π½Π°ΠΉΡΠΈ Π΅ΠΉ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ ΡΡΠ΅ΡΠ°Ρ .
ΠΠ΅ΡΠ΅Ρ ΠΎΠ΄ΠΈΠΌ ΠΊ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ
ΠΠ°Π½Π½Π°Ρ ΡΡΠ°ΡΡΡ ΡΠ°Π·Π±ΠΈΡΠ° Π½Π° ΡΡΠΈ ΡΠ°ΡΡΠΈ Π΄Π»Ρ ΡΠ΄ΠΎΠ±ΡΡΠ²Π° Π²ΠΎΡΠΏΡΠΈΡΡΠΈΡ. Β Π ΡΡΠΎΠΉ ΡΠ°ΡΡΠΈ Π±ΡΠ΄ΡΡ ΡΠ°ΡΡΠΌΠΎΡΡΠ΅Π½Ρ ΠΈΡΡΠΎΡΠ½ΠΈΠΊΠΈ, Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΡΠ΅ Π΄Π»Ρ ΠΎΡΠ²ΠΎΠ΅Π½ΠΈΡ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ , ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ², ΠΈΠ·ΡΡΠ΅Π½ΠΈΡ Python, Π²ΠΎ Π²ΡΠΎΡΠΎΠΉ β Π·Π½Π°ΠΊΠΎΠΌΡΡΠ²ΠΎ Ρ ΡΠ΅Ρ Π½ΠΈΡΠ΅ΡΠΊΠΈΠΌΠΈ ΠΈΠ½Π΄ΠΈΠΊΠ°ΡΠΎΡΠ°ΠΌΠΈ ΠΈ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ΠΌ ΡΠ²ΠΎΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ², Π° Π² ΡΡΠ΅ΡΡΠ΅ΠΉ β ΡΠ°Π·Π±Π΅ΡΠ΅ΠΌ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ Π±ΠΈΡΠΆΠ΅Π²ΠΎΠΌΡ Π΄Π΅Π»Ρ.
ΠΡΠ°ΠΏ 2.1. ΠΠ½Π°Π»ΠΈΠ· Π΄Π°Π½Π½ΡΡ
1. ΠΠ·ΡΡΠ΅Π½ΠΈΠ΅ pandas
pandas β Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Ρ ΠΎΡΠΊΡΡΡΡΠΌ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΌ ΠΊΠΎΠ΄ΠΎΠΌ Π΄Π»Ρ Python, ΠΏΠΎΡΡΡΠΎΠ΅Π½Π½Π°Ρ ΠΏΠΎΠ²Π΅ΡΡ Π±ΠΎΠ»Π΅Π΅ Π½ΠΈΠ·ΠΊΠΎΡΡΠΎΠ²Π½Π΅Π²ΠΎΠ³ΠΎ ΠΏΠ°ΠΊΠ΅ΡΠ° NumPy, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΠ°Ρ Π΄Π»Ρ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ ΠΈ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ .
ΠΡΠΆΠ΄Π°ΡΡΡ Π² Π±ΡΡΡΡΠΎΠΌ ΠΈ Π³ΠΈΠ±ΠΊΠΎΠΌ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠ΅ Π΄Π»Ρ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° ΡΠΈΠ½Π°Π½ΡΠΎΠ²ΠΎΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ Π£ΡΡ ΠΠ°ΠΊ-ΠΠΈΠ½Π½ΠΈ ΠΏΡΠΈΡΡΡΠΏΠΈΠ» ΠΊ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ pandas Π² 2008 Π³ΠΎΠ΄Ρ, ΡΠ΅ΠΉΡΠ°Ρ Π΄Π°Π½Π½Π°Ρ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° ΡΡΠΈΡΠ°Π΅ΡΡΡ ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ Π΄ΠΈΠ½Π°ΠΌΠΈΡΠ½ΠΎ ΡΠ°Π·Π²ΠΈΠ²Π°ΡΡΠΈΡ ΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ Π΄Π»Ρ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ Π½Π° Python.
ΠΡΠ° Π²ΡΡΠΎΠΊΠΎΡΡΠΎΠ²Π½Π΅Π²Π°Ρ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΡΡΡΠΎΠΈΡΡ ΡΠ²ΠΎΠ΄Π½ΡΠ΅ ΡΠ°Π±Π»ΠΈΡΡ, Π²ΡΠ΄Π΅Π»ΡΡΡ ΠΊΠΎΠ»ΠΎΠ½ΠΊΠΈ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΡΠΈΠ»ΡΡΡΡ, Π²ΡΠΏΠΎΠ»Π½ΡΡΡ Π³ΡΡΠΏΠΏΠΈΡΠΎΠ²ΠΊΡ ΠΏΠΎ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠ°ΠΌ, Π·Π°ΠΏΡΡΠΊΠ°ΡΡ ΡΡΠ½ΠΊΡΠΈΠΈ (ΡΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅, Π½Π°Ρ ΠΎΠΆΠ΄Π΅Π½ΠΈΠ΅ ΠΌΠ΅Π΄ΠΈΠ°Π½Ρ, ΡΡΠ΅Π΄Π½Π΅Π³ΠΎ, ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡΠ½ΠΎΠ³ΠΎ, ΠΌΠ°ΠΊΡΠΈΠΌΠ°Π»ΡΠ½ΠΎΠ³ΠΎ Π·Π½Π°ΡΠ΅Π½ΠΈΠΉ), ΠΎΠ±ΡΠ΅Π΄ΠΈΠ½ΡΡΡ ΡΠ°Π±Π»ΠΈΡΡ ΠΈ ΠΌΠ½ΠΎΠ³ΠΎΠ΅ Π΄ΡΡΠ³ΠΎΠ΅. Π pandas ΠΌΠΎΠΆΠ½ΠΎ ΡΠΎΠ·Π΄Π°Π²Π°ΡΡ ΠΈ ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅ΡΠ½ΡΠ΅ ΡΠ°Π±Π»ΠΈΡΡ.
ΠΠ°ΠΌ Π½Π΅Π±ΠΎΠ»ΡΡΠΎΠ΅ ΠΏΠΎΡΡΠ½Π΅Π½ΠΈΠ΅ ΠΏΠΎ ΠΎΡΠ½ΠΎΠ²Π½ΡΠΌ ΡΡΡΡΠΊΡΡΡΠ°ΠΌ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ Ρ ΠΊΠΎΡΠΎΡΡΠΌΠΈ ΠΏΡΠΈΠ΄Π΅ΡΡΡ ΡΠ°Π±ΠΎΡΠ°ΡΡ.
Series β ΡΡΠΎ ΠΌΠ°ΡΠΊΠΈΡΠΎΠ²Π°Π½Π½Π°Ρ ΠΎΠ΄Π½ΠΎΠΌΠ΅ΡΠ½Π°Ρ ΡΡΡΡΠΊΡΡΡΠ° Π΄Π°Π½Π½ΡΡ , Π΅Π΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡΠ΅Π΄ΡΡΠ°Π²ΠΈΡΡ, ΠΊΠ°ΠΊ ΡΠ°Π±Π»ΠΈΡΡ Ρ ΠΎΠ΄Π½ΠΎΠΉ ΡΡΡΠΎΠΊΠΎΠΉ.
Π‘ΠΎΠ·Π΄Π°ΡΡ Series ΠΌΠΎΠΆΠ½ΠΎ ΡΠ°ΠΊ:
Π‘ΡΠΎΠ»Π±Π΅Ρ ΡΠ»Π΅Π²Π° ΡΡΠΎ ΠΈΠ½Π΄Π΅ΠΊΡ, ΡΠΏΡΠ°Π²Π° β Π·Π½Π°ΡΠ΅Π½ΠΈΡ.
DataFrame β ΡΡΠΎ Π΄Π²ΡΠΌΠ΅ΡΠ½Π°Ρ ΠΌΠ°ΡΠΊΠΈΡΠΎΠ²Π°Π½Π½Π°Ρ ΡΡΡΡΠΊΡΡΡΠ°. ΠΠ΄Π΅ΠΉΠ½ΠΎ ΠΎΠ½Π° ΠΎΡΠ΅Π½Ρ ΠΏΠΎΡ ΠΎΠΆΠ° Π½Π° ΠΎΠ±ΡΡΠ½ΡΡ ΡΠ°Π±Π»ΠΈΡΡ, ΡΡΠΎ Π²ΡΡΠ°ΠΆΠ°Π΅ΡΡΡ Π² ΡΠΏΠΎΡΠΎΠ±Π΅ Π΅Π΅ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ΠΈ ΡΠ°Π±ΠΎΡΠ΅ Ρ Π΅Π΅ ΡΠ»Π΅ΠΌΠ΅Π½ΡΠ°ΠΌΠΈ.
Pandas ΠΌΠΎΠΆΠ΅Ρ ΡΠ°Π±ΠΎΡΠ°ΡΡ ΡΠΎ ΡΠ»Π΅Π΄ΡΡΡΠΈΠΌΠΈ ΡΠΈΠΏΠ°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ :
- Π’Π°Π±Π»ΠΈΡΠ½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅ (Β«ΠΏΠ»ΠΎΡΠΊΠΈΠ΅ ΡΠ°Π±Π»ΠΈΡΡΒ»), ΡΠ°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ SQL ΠΈΠ»ΠΈ Excel.
- Π£ΠΏΠΎΡΡΠ΄ΠΎΡΠ΅Π½Π½ΡΠ΅ ΠΈ Π½Π΅ΡΠΏΠΎΡΡΠ΄ΠΎΡΠ΅Π½Π½ΡΠ΅ Π²ΡΠ΅ΠΌΠ΅Π½Π½ΡΠ΅ ΡΡΠ΄Ρ.
- ΠΡΠΎΠΈΠ·Π²ΠΎΠ»ΡΠ½ΡΠ΅ ΠΌΠ°ΡΡΠΈΡΠ½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅ Ρ ΠΌΠ΅ΡΠΊΠ°ΠΌΠΈ ΡΡΡΠΎΠΊ ΠΈ ΡΡΠΎΠ»Π±ΡΠΎΠ².
- ΠΡΡΠ³ΠΈΠ΅ ΡΠΎΡΠΌΡ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΡ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈΡ Π΄Π°Π½Π½ΡΡ .
Π Π±ΡΠ΄ΡΡΠ΅ΠΌ pandas ΠΏΠ»Π°Π½ΠΈΡΡΠ΅Ρ ΡΡΠ°ΡΡ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠΌ Π°Π½Π°Π»ΠΈΠ·Π° ΠΈ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π΄Π°Π½Π½ΡΡ , Π΄ΠΎΡΡΡΠΏΠ½ΡΠΌ Π΄Π»Ρ Π»ΡΠ±ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ.
ΠΠ°Π»Π΅Π΅ Ρ ΡΠ°ΡΡΠΊΠ°ΠΆΡ ΠΊΠ°ΠΊ ΠΎΡΠ²ΠΎΠΈΡΡ pandas.
1.1. ΠΡΠΎΡ ΠΎΠΆΠ΄Π΅Π½ΠΈΠ΅ ΡΠ΅ΡΠΈΠΈ ΡΡΠΎΠΊΠΎΠ² ΠΏΠΎ pandas Π½Π° ΡΠ°ΠΉΡΠ΅ devpractice.ru
Π ΡΠ°ΠΌΠΎΠΌ Π½Π°ΡΠ°Π»Π΅ Π°Π²ΡΠΎΡ ΡΠ°ΡΡΠΊΠ°Π·ΡΠ²Π°Π΅Ρ ΠΊΠ°ΠΊ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ pandas Π½Π° ΡΠ°Π·Π½ΡΠ΅ ΠΏΠ»Π°ΡΡΠΎΡΠΌΡ ΠΈ Π·Π°ΡΠ΅ΠΌ ΠΏΠ΅ΡΠ΅Ρ ΠΎΠ΄ΠΈΡ ΠΊ ΠΎΠΏΠΈΡΠ°Π½ΠΈΡ Π΄Π²ΡΡ Π³Π»Π°Π²Π½ΡΡ Π² Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ΅ ΡΡΡΡΠΊΡΡΡ Π΄Π°Π½Π½ΡΡ , Series ΠΈ DataFrame.
ΠΠ°Π»Π΅Π΅ ΡΠ΅ΡΡ ΠΈΠ΄Π΅Ρ ΠΎ ΡΠΎΠΌ ΠΊΠ°ΠΊ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ Π½ΠΈΠΌΠΈ, ΠΊΠ°ΠΊ ΡΠΎΠ·Π΄Π°Π²Π°ΡΡ, ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡΡ ΠΎΠΏΠ΅ΡΠ°ΡΠΈΠΈ Ρ ΡΠ»Π΅ΠΌΠ΅Π½ΡΠ°ΠΌΠΈ, ΠΏΠΎΠ»ΡΡΠ°ΡΡ Π΄ΠΎΡΡΡΠΏ ΠΊ Π΄Π°Π½Π½ΡΠΌ ΡΠ°Π·Π»ΠΈΡΠ½ΡΠΌΠΈ ΡΠΏΠΎΡΠΎΠ±Π°ΠΌΠΈ, Π΄ΠΎΠ±Π°Π²Π»ΡΡΡ ΠΈΠ½Π΄Π΅ΠΊΡΡ ΠΈ Π΄ΡΡΠ³ΠΎΠ΅. ΠΠ»Ρ Π½ΠΎΠ²ΠΈΡΠΊΠ° Π΄ΡΠΌΠ°Ρ Π»ΡΡΡΠΈΠΉ ΡΡΡΠΎΡΠΈΠ°Π» Π² ΡΡΠ½Π΅ΡΠ΅.
1.2. ΠΠ·ΡΡΠ΅Π½ΠΈΠ΅ ΡΡΠ°ΡΡΠΈ ΠΎ pandas Π½Π° ΡΠ°ΠΉΡΠ΅ khashtamov.com
ΠΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ ΠΎΠ±ΡΠ΅ΠΌΠ½Π°Ρ ΡΡΠ°ΡΡΡ ΡΠΎ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠΎΠ² ΠΈ ΠΏΡΠΎΡΡΡΠΌ ΠΈΠ·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅ΠΌ. ΠΡΠ΄Π΅Π»ΡΠ½ΠΎΠ΅ ΡΠΏΠΎΠΌΠΈΠ½Π°Π½ΠΈΠ΅ ΡΡΠ°ΡΡΡ Π·Π°ΡΠ»ΡΠΆΠΈΠ²Π°Π΅Ρ Π·Π° ΡΠΎ, ΡΡΠΎ Π² Π½Π΅ΠΉ ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½ Π°Π½Π°Π»ΠΈΠ· Π²ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ ΡΡΠ΄ΠΎΠ² Π½Π° ΠΏΡΠΈΠΌΠ΅ΡΠ΅ Π°ΠΊΡΠΈΠΉ Apple, ΡΡΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΡΠ²ΠΈΠ΄Π΅ΡΡ ΠΊΠ°ΠΊ Π½Π° ΠΏΡΠ°ΠΊΡΠΈΠΊΠ΅ ΠΏΡΠΈΠΌΠ΅Π½ΡΠ΅ΡΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° ΠΈ ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°Π΅ΡΡΡ ΡΠ°Π±ΠΎΡΠ° Ρ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ΠΌ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Ρ ΠΏΠΎΠΌΠΎΡΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ matplotlib, ΠΎ ΠΊΠΎΡΠΎΡΠΎΠΉ ΡΠ΅ΡΡ ΠΏΠΎΠΉΠ΄Π΅Ρ Π½ΠΈΠΆΠ΅.
1.3. ΠΠ·ΡΡΠ΅Π½ΠΈΠ΅ ΡΠΈΠΊΠ»Π° ΡΡΠ°ΡΠ΅ΠΉ ΠΎ pandas Π½Π° ΡΠ°ΠΉΡΠ΅ pythonworld.ru
ΠΠ΅ Π»ΠΈΡΠ½ΠΈΠΌ Π±ΡΠ΄Π΅Ρ ΠΈΠ·ΡΡΠΈΡΡ ΡΡΠΎΡ ΠΈΡΡΠΎΡΠ½ΠΈΠΊ, Ρ.ΠΊ. ΡΠ°ΠΌ Π½Π΅ΠΏΠ»ΠΎΡ ΠΎ ΡΠ°ΡΡΠΊΠ°Π·ΡΠ²Π°Π΅ΡΡΡ ΠΎ ΠΌΠ΅ΡΠΎΠ΄Π΅ read_csv ΠΈ Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ.
1.4. ΠΠ·ΡΡΠ΅Π½ΠΈΠ΅ ΠΎΡΠΈΡΠΈΠ°Π»ΡΠ½ΠΎΠΉ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ pandas
ΠΠΎΠΊΡΠΌΠ΅Π½ΡΠ°ΡΠΈΡ Π½Π°ΠΏΠΈΡΠ°Π½Π° Π½Π° Π°Π½Π³Π»ΠΈΠΉΡΠΊΠΎΠΌ ΡΠ·ΡΠΊΠ΅, Π½ΠΎ ΡΡΠΎ Π½Π΅ ΠΌΠ΅ΡΠ°Π΅Ρ ΡΡΡΠ΅ΠΊΡΠΈΠ²Π½ΠΎ ΠΈΠ·ΡΡΠΈΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΡ. ΠΡΠ»ΠΈ Π²Ρ Π½Π΅ Π·Π½Π°Π΅ΡΠ΅ ΡΠ·ΡΠΊΠ°, ΡΠΎΠ³Π΄Π° ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ ΠΎΠ½Π»Π°ΠΉΠ½-ΠΏΠ΅ΡΠ΅Π²ΠΎΠ΄ΡΠΈΠΊ. Π Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ ΡΠΎΠ΄Π΅ΡΠΆΠΈΡΡΡ Π²ΡΡ, ΡΡΠΎ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎ Π·Π½Π°ΡΡ ΠΎ ΠΏΠ°Π½Π΄Π΅. Π’Π΅ΠΌ Π±ΠΎΠ»Π΅Π΅ Π½Π°ΠΏΠΈΡΠ°Π½Π° ΠΎΠ½Π° Π΄ΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ ΠΏΡΠΎΡΡΡΠΌ ΡΠ·ΡΠΊΠΎΠΌ. Π‘ΡΡΡΠΊΡΡΡΡ Panel ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠΏΡΡΡΠΈΡΡ, Ρ.ΠΊ. ΠΎΠ½Π° Π² Π±ΡΠ΄ΡΡΠ΅ΠΌ Π±ΡΠ΄Π΅Ρ ΡΠ΄Π°Π»Π΅Π½Π° ΠΈΠ· pandas.
1.5. Π§ΡΠ΅Π½ΠΈΠ΅ Π»ΠΈΡΠ΅ΡΠ°ΡΡΡΡ: ΠΠ°ΠΊΠΊΠΈΠ½Π½ΠΈ β βPython ΠΈ Π°Π½Π°Π»ΠΈΠ· Π΄Π°Π½Π½ΡΡ Β»
ΠΠ°Π½Π½Π°Ρ ΠΊΠ½ΠΈΠ³Π° Π±ΡΠ΄Π΅Ρ ΠΏΠΎΠ»Π΅Π·Π½Π° Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ Π΄Π»Ρ ΠΈΠ·ΡΡΠ΅Π½ΠΈΡ pandas, Π² Π½Π΅ΠΉ ΡΠ°ΠΊ ΠΆΠ΅ ΡΠ°ΡΡΠΊΠ°Π·ΡΠ²Π°Π΅ΡΡΡ ΠΎ NumPy, matplotlib ΠΈ ΠΌΠ½ΠΎΠ³ΠΎΠΌ Π΄ΡΡΠ³ΠΎΠΌ. ΠΠ΄ΠΈΠ½ΡΡΠ²Π΅Π½Π½ΠΎΠ΅, ΡΡΠΎ Π·Π° ΠΎΡΠ½ΠΎΠ²Ρ Π²Π·ΡΡ Python 2.7, ΠΏΠΎΡΠΎΠΌΡ ΡΡΠΎ Π±ΠΎΠ»ΡΡΠ°Ρ ΡΠ°ΡΡΡ Π½Π°ΡΡΠ½ΠΎΠ³ΠΎ ΡΠΎΠΎΠ±ΡΠ΅ΡΡΠ²Π° Π½Π° ΠΌΠΎΠΌΠ΅Π½Ρ Π½Π°ΠΏΠΈΡΠ°Π½ΠΈΡ ΠΊΠ½ΠΈΠ³ΠΈ Π΅ΡΡ Π½Π΅ ΠΏΠ΅ΡΠ΅ΡΠ»Π° Π½Π° Python 3. ΠΠΏΡΠΎΡΠ΅ΠΌ, Π΅ΡΠ»ΠΈ Π½Π΅ ΡΡΠΈΡΠ°ΡΡ Π½Π΅ΠΌΠ½ΠΎΠ³ΠΈΡ ΠΈΡΠΊΠ»ΡΡΠ΅Π½ΠΈΠΉ, Ρ Π²Π°Ρ Π½Π΅ Π²ΠΎΠ·Π½ΠΈΠΊΠ½Π΅Ρ ΡΡΡΠ΄Π½ΠΎΡΡΠ΅ΠΉ Ρ ΠΈΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ΠΌ ΠΏΡΠΈΒΠ²Π΅Π΄Π΅Π½Π½ΠΎΠ³ΠΎ Π² ΠΊΠ½ΠΈΠ³Π΅ ΠΊΠΎΠ΄Π°, Π΄Π°ΠΆΠ΅ Π΅ΡΠ»ΠΈ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ Python 3.7.
ΠΠ½ΠΈΠ³Π° ΠΏΠΎΠΊΠ°ΠΆΠ΅ΡΡΡ ΡΠ»ΠΎΠΆΠ½ΠΎΠΉ Π΄Π»Ρ Π½ΠΎΠ²ΠΈΡΠΊΠΎΠ², ΠΏΠΎΡΡΠΎΠΌΡ Π΄ΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ ΡΠΈΡΠ°ΡΡ ΠΏΠΎ 5-10 ΡΡΡΠ°Π½ΠΈΡ Π² Π΄Π΅Π½Ρ.
Π‘ΠΎΠ²Π΅Ρ: ΠΡΠΈ ΡΠ°Π±ΠΎΡΠ΅ Ρ pandas ΡΠ΄ΠΎΠ±Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Jupyter Notebook. ΠΡΠΎ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½Π°Ρ ΡΡΠ΅Π΄Π° Π΄Π»Ρ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ Π½Π° ΡΠ·ΡΠΊΠ΅ Python, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΎΠ±ΡΠ΅Π΄ΠΈΠ½ΠΈΡΡ ΠΊΠΎΠ΄, ΡΠ΅ΠΊΡΡ, Π³ΡΠ°ΡΠΈΠΊΠΈ, ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΡΠΎΡΠΌΡΠ»Ρ ΠΈ ΡΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡΠΎΠ²Π°ΡΡ Π²ΡΡ Π² ΠΎΠ΄Π½ΠΎΠΌ ΠΎΡΡΠ΅ΡΠ΅.
2. matplotlib
ΠΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° matplotlib β ΡΠ°ΠΌΡΠΉ ΠΏΠΎΠΏΡΠ»ΡΡΠ½ΡΠΉ Π² Python ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½Ρ Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² ΠΈ Π΄ΡΡΠ³ΠΈΡ ΡΠΏΠΎΡΠΎΠ±ΠΎΠ² Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π²ΡΠΌΠ΅ΡΠ½ΡΡ Π΄Π°Π½Π½ΡΡ .
ΠΠ°ΠΊΠ΅Ρ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΈΠ²Π°Π΅Ρ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ Π²ΠΈΠ΄Ρ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² ΠΈ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌ:
- ΠΡΠ°ΡΠΈΠΊΠΈ.
- ΠΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ ΡΠ°Π·Π±ΡΠΎΡΠ°.
- Π‘ΡΠΎΠ»Π±ΡΠ°ΡΡΠ΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ ΠΈ Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΡ.
- ΠΡΡΠ³ΠΎΠ²ΡΠ΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ.
- Π‘ΡΠ²ΠΎΠ»-Π»ΠΈΡΡ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ.
- ΠΠΎΠ½ΡΡΡΠ½ΡΠ΅ Π³ΡΠ°ΡΠΈΠΊΠΈ.
- ΠΠΎΠ»Ρ Π³ΡΠ°Π΄ΠΈΠ΅Π½ΡΠΎΠ².
- Π‘ΠΏΠ΅ΠΊΡΡΠ°Π»ΡΠ½ΡΠ΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ.
Π‘ ΠΏΠΎΠΌΠΎΡΡΡ matplotlib ΠΌΠΎΠΆΠ½ΠΎ Π΄Π΅Π»Π°ΡΡ ΠΈ Π°Π½ΠΈΠΌΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ.
ΠΠ°ΠΊ ΠΈΠ·ΡΡΠ°ΡΡ?
2.1. ΠΡΠΎΡΠΈΡΠ°ΡΡ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΠΉ ΡΡΠ΅Π±Π½ΠΈΠΊ βΠΠ°ΡΡΠ½Π°Ρ Π³ΡΠ°ΡΠΈΠΊΠ° Π² Pythonβ
ΠΠ²ΡΠΎΡ ΡΡΠ΅Π±Π½ΠΈΠΊΠ° ΠΠ°Π²Π΅Π» Π¨Π°Π±Π°Π½ΠΎΠ² ΡΡΠ°ΡΠ°Π΅ΡΡΡ ΠΎΠΏΠΈΡΠ°ΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΡ Π²ΠΎ Π²ΡΠ΅Ρ ΠΏΠΎΠ΄ΡΠΎΠ±Π½ΠΎΡΡΡΡ . ΠΠ°ΡΡ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎ ΠΏΡΠΈΠΌΠ΅ΡΠΎΠ² ΠΈ ΠΏΡΠΎΡΡΠΎ Ρ ΠΎΡΠΎΡΠΎ ΠΎΠ±ΡΡΡΠ½ΡΠ΅Ρ. ΠΠ΅ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΡΠΎΡΠΈΡΠΈΡΡΡ: βΠ‘ΠΎΠ·Π΄Π°Π½ΠΈΠ΅ ΡΠΈΡΡΠ½ΠΊΠ° Π² matplotlib ΡΡ ΠΎΠΆΠ΅ Ρ ΡΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ Π² ΡΠ΅Π°Π»ΡΠ½ΠΎΠΉ ΠΆΠΈΠ·Π½ΠΈ. Π’Π°ΠΊ Ρ ΡΠ΄ΠΎΠΆΠ½ΠΈΠΊΡ Π½ΡΠΆΠ½ΠΎ Π²Π·ΡΡΡ ΠΎΡΠ½ΠΎΠ²Ρ (Ρ ΠΎΠ»ΡΡ ΠΈΠ»ΠΈ Π±ΡΠΌΠ°Π³Ρ), ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΡ (ΠΊΠΈΡΡΠΈ ΠΈΠ»ΠΈ ΠΊΠ°ΡΠ°Π½Π΄Π°ΡΠΈ), ΠΈΠΌΠ΅ΡΡ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ ΠΎ Π±ΡΠ΄ΡΡΠ΅ΠΌ ΡΠΈΡΡΠ½ΠΊΠ΅ (ΡΡΠΎ ΠΈΠΌΠ΅Π½Π½ΠΎ ΠΎΠ½ Π±ΡΠ΄Π΅Ρ ΡΠΈΡΠΎΠ²Π°ΡΡ) ΠΈ, Π½Π°ΠΊΠΎΠ½Π΅Ρ, Π²ΡΠΏΠΎΠ»Π½ΠΈΡΡ Π²ΡΡ ΡΡΠΎ ΠΈ Π½Π°ΡΠΈΡΠΎΠ²Π°ΡΡ ΡΠΈΡΡΠ½ΠΎΠΊ Π΄Π΅ΡΠ°Π»Ρ Π·Π° Π΄Π΅ΡΠ°Π»ΡΡ.β
2.2. ΠΠ·ΡΡΠΈΡΡ ΡΠ΅ΡΠΈΡ ΡΠΏΠ°ΡΠ³Π°Π»ΠΎΠΊ ΠΏΠΎ matplotlib
ΠΡΠΎ ΠΌΠΎΠΆΠ½ΠΎ Π½Π°Π·Π²Π°ΡΡ ΡΠ΅ΡΠΈΠ΅ΠΉ ΡΡΠΎΠΊΠΎΠ² Ρ Π΄ΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ ΠΏΠΎΠ΄ΡΠΎΠ±Π½ΡΠΌ ΠΎΠΏΠΈΡΠ°Π½ΠΈΠ΅ΠΌ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠ΅ΠΉ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ, Π³Π΄Π΅ ΠΏΠΎΠ΄ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΡΡΡΠΎΠΊΠΎΠΉ ΠΊΠΎΠ΄Π° Π΄Π°Π΅ΡΡΡ ΠΏΠΎΡΡΠ½Π΅Π½ΠΈΠ΅.
2.3. ΠΠΎΠ΄ΡΠΎΠ±Π½Π΅Π΅ ΠΈΠ·ΡΡΠΈΡΡ pyplot
βΠ’Π°ΠΊ ΠΊΠ°ΠΊ matplotlib ΠΎΡΠ³Π°Π½ΠΈΠ·ΠΎΠ²Π°Π½Π° ΠΈΠ΅ΡΠ°ΡΡ ΠΈΡΠ΅ΡΠΊΠΈ, Π° Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΠΏΡΠΎΡΡΡΠΌΠΈ Π΄Π»Ρ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΡ ΡΠ΅Π»ΠΎΠ²Π΅ΠΊΠΎΠΌ ΡΠ²Π»ΡΡΡΡΡ ΡΠ°ΠΌΡΠ΅ Π²ΡΡΠΎΠΊΠΎΡΡΠΎΠ²Π½Π΅Π²ΡΠ΅ ΡΡΠ½ΠΊΡΠΈΠΈ, ΡΠΎ Π·Π½Π°ΠΊΠΎΠΌΡΡΠ²ΠΎ Ρ matplotlib Π½Π°ΡΠΈΠ½Π°ΡΡ Ρ ΡΠ°ΠΌΠΎΠ³ΠΎ Π²ΡΡΠΎΠΊΠΎΡΡΠΎΠ²Π½Π΅Π²ΠΎΠ³ΠΎ ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡΠ° matplotlib.pyplot. ΠΠ½ΡΠ΅ΡΡΠ΅ΠΉΡ matplotlib.pyplot. ΡΠ²Π»ΡΠ΅ΡΡΡ Π½Π°Π±ΠΎΡΠΎΠΌ ΠΊΠΎΠΌΠ°Π½Π΄ ΠΈ ΡΡΠ½ΠΊΡΠΈΠΉ, ΠΊΠΎΡΠΎΡΡΠ΅ Π΄Π΅Π»Π°ΡΡ ΡΠΈΠ½ΡΠ°ΠΊΡΠΈΡ Π³ΡΠ°ΡΠΈΡΠ΅ΡΠΊΠΈΡ matploltib ΠΊΠΎΠΌΠ°Π½Π΄ ΠΏΠΎΡ ΠΎΠΆΠΈΠΌ Π½Π° ΠΊΠΎΠΌΠ°Π½Π΄Ρ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΡΠ΅ Π² ΡΡΠ΅Π΄Π΅ MATLAB.β β ΠΏΠΎΠ·Π°ΠΈΠΌΡΡΠ²ΠΎΠ²Π°Π½ΠΎ ΠΈΠ· ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΠΎΠ³ΠΎ ΡΡΠ΅Π±Π½ΠΈΠΊΠ° βΠΠ°ΡΡΠ½Π°Ρ Π³ΡΠ°ΡΠΈΠΊΠ° Π² Pythonβ.
ΠΡΠ°ΠΏ 2.2. ΠΡΠΎΠ΄ΠΎΠ»ΠΆΠ΅Π½ΠΈΠ΅ ΠΏΡΠΎΡΠ΅ΡΡΠ° ΠΈΠ·ΡΡΠ΅Π½ΠΈΡ Python
1. ΠΡΠΎΡ ΠΎΠΆΠ΄Π΅Π½ΠΈΠ΅ ΠΊΡΡΡΠ° Π½Π° Stepik.org βPython: ΠΎΡΠ½ΠΎΠ²Ρ ΠΈ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅β
ΠΠΎ ΡΡΡΠΈ ΡΠ²Π»ΡΠ΅ΡΡΡ ΠΏΡΠΎΠ΄ΠΎΠ»ΠΆΠ΅Π½ΠΈΠ΅ΠΌ ΠΊΡΡΡΠ° Β«ΠΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ Π½Π° PythonΒ», ΠΎΠΏΠΈΡΠ°Π½Π½ΠΎΠ³ΠΎ Π² ΠΏΠ΅ΡΠ²ΠΎΠΌ ΡΡΠ°ΠΏΠ΅. ΠΠ°Π΄Π°ΡΠΈ ΠΏΠΎΡΠ»ΠΎΠΆΠ½Π΅Π΅, Π½ΠΎ Π²ΠΏΠΎΠ»Π½Π΅ ΠΏΠΎΠ΄ΡΡΠΌΠ½ΡΠ΅ Π΄Π»Ρ ΡΠ΅Ρ ΠΊΡΠΎ ΠΏΡΠΎΡΠ΅Π» 1 ΡΡΠ°ΠΏ. ΠΠ²ΡΠΎΡ ΠΎΡΠ»ΠΈΡΠ½ΠΎ ΠΎΠ±ΡΡΡΠ½ΡΠ΅Ρ ΠΌΠ΅Ρ Π°Π½ΠΈΠ·ΠΌΡ ΡΠ°Π±ΠΎΡΡ ΡΠ·ΡΠΊΠ°, Π² ΡΠ»Π΅Π΄ΡΡΠ²ΠΈΠΈ ΡΠ΅Π³ΠΎ ΠΏΡΠΈΡ ΠΎΠ΄ΠΈΡ Π»ΡΡΡΠ΅Π΅ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ ΠΏΡΠΎΡΠ΅ΡΡΠ° ΡΠ°Π·ΡΠ°Π±ΠΎΡΠΊΠΈ. ΠΡΠ»ΠΈ Ρ ΠΏΡΠΎΡ ΠΎΠΆΠ΄Π΅Π½ΠΈΠ΅ΠΌ ΠΊΡΡΡΠ° Π²ΠΎΠ·Π½ΠΈΠΊΠ½ΡΡ ΡΠ»ΠΎΠΆΠ½ΠΎΡΡΠΈ, ΡΠΎΠ²Π΅ΡΡΡ ΠΏΠΎΡΠΌΠΎΡΡΠ΅ΡΡ Π²ΠΈΠ΄Π΅ΠΎ ΠΊΡΡΡ ΠΏΠΎ Python ΠΈΠ· ΠΏΡΠΎΡΠ»ΠΎΠ³ΠΎ ΡΡΠ°ΠΏΠ°.
Π Π΄Π΅Π½Ρ Π΄ΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ ΡΠ΄Π΅Π»ΡΡΡ ΡΡΠΎΠΌΡ ΡΠ΅ΡΡΡΡΡ 1 ΡΠ°Ρ.
Π‘ΡΡΠ»ΠΊΠ° Π½Π° ΠΊΡΡΡ: https://stepik.org/course/512/syllabus
2. Π§ΡΠ΅Π½ΠΈΠ΅ Π»ΠΈΡΠ΅ΡΠ°ΡΡΡΡ: ΠΡΡΡ β βΠΠ·ΡΡΠ°Π΅ΠΌ Python. 4 ΠΈΠ·Π΄Π°Π½ΠΈΠ΅β
ΠΡΠΌΠ°Ρ ΠΊΠ½ΠΈΠ³Π° ΠΡΡΡΠ° ΡΡΠ°Π»Π° ΡΠΆΠ΅ ΠΊΠ»Π°ΡΡΠΈΠΊΠΎΠΉ, Π΅Ρ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡΡΡ ΠΏΠΎΡΡΠΈ Π²ΡΠ΅, ΠΊΡΠΎ ΠΊΠΎΠ³Π΄Π° ΡΠΎ ΠΈΠ·ΡΡΠ°Π» Python. Π ΡΡΠΎ ΠΎΠΏΡΠ°Π²Π΄Π°Π½Π½ΠΎ, Π΄Π°Π½Π½Π°Ρ ΠΊΠ½ΠΈΠ³Π° ΠΏΠΎΠ»Π½ΠΎΡΡΡΡ ΡΠ°ΡΠΊΡΡΠ²Π°Π΅Ρ ΡΠΈΠ»ΠΎΡΠΎΡΠΈΡ Python ΠΈ ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°Π΅Ρ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠΈ ΡΠ·ΡΠΊΠ°, ΠΊΠΎΡΠΎΡΡΠ΅ Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΡΠ·Π½Π°ΡΡ, ΡΠΎΠ»ΡΠΊΠΎ Π»ΠΈΡΡ Π² Π°Π½Π³Π»ΠΎΡΠ·ΡΡΠ½ΠΎΠΉ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ. ΠΠΎΡΡΠΈ Π½Π° Π²ΡΠ΅Ρ ΡΠΎΡΡΠΌΠ°Ρ ΠΊΠ½ΠΈΠ³Π° βΠΠ·ΡΡΠ°Π΅ΠΌ Pythonβ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡΠ΅ΡΡΡ ΠΊΠ°ΠΊ ΠΏΠΎΡΠΎΠ±ΠΈΠ΅ Π΄Π»Ρ ΡΠ΅Ρ , ΠΊΡΠΎ ΠΎΡΠ²Π°ΠΈΠ²Π°Π΅Ρ ΡΠ·ΡΠΊ Ρ Π½ΡΠ»Ρ, ΠΎΠ΄Π½Π°ΠΊΠΎ Ρ ΡΡΠΈΡΠ°Ρ, ΡΡΠΎ ΠΎΠ½Π° Ρ ΠΎΡΠΎΡΠΎ ΠΏΠΎΠΉΠ΄Π΅Ρ, ΡΠ΅ΠΌ ΠΊΡΠΎ ΡΠΆΠ΅ ΠΎΡΠ²ΠΎΠΈΠ» Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ Π°Π·Ρ. ΠΠ½ΠΈΠ³Π° Π½Π°ΠΏΠΈΡΠ°Π½Π° Π² 2011 Π³ΠΎΠ΄Ρ, Π½ΠΎ Π½Π΅ ΠΏΠΎΡΠ΅ΡΡΠ»Π° Π°ΠΊΡΡΠ°Π»ΡΠ½ΠΎΡΡΠΈ ΠΈ Π² 2018.
Π Π΄Π΅Π½Ρ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡΡ ΡΠΈΡΠ°ΡΡ ΠΏΠΎ 15 ΡΡΡΠ°Π½ΠΈΡ.
3. Π Π΅ΡΠ΅Π½ΠΈΠ΅ Π·Π°Π΄Π°Ρ Π² Pythontutor.ru
ΠΡΠ»ΠΈ Π²Ρ ΡΠΆΠ΅ ΡΠ΅ΡΠΈΠ»ΠΈ Π²ΡΠ΅ Π·Π°Π΄Π°ΡΠΈ Π² ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΠΎΠΌ ΡΡΠ΅Π±Π½ΠΈΠΊΠ΅ Π½Π° ΠΏΠ΅ΡΠ²ΠΎΠΌ ΡΡΠ°ΠΏΠ΅, ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΏΡΠΎΠΏΡΡΡΠΈΡΡ Π΄Π°Π½Π½ΡΠΉ ΠΏΡΠ½ΠΊΡ, Π΅ΡΠ»ΠΈ Π½Π΅Ρ, ΠΏΡΠΎΠ΄ΠΎΠ»ΠΆΠ°ΠΉΡΠ΅ ΡΠ΅ΡΠ΅Π½ΠΈΠ΅.
ΠΠ°ΠΊΠ»ΡΡΠ΅Π½ΠΈΠ΅
Π‘ΡΠΎΠΊ Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΡΡΠ°ΠΏΠ° ΡΠΎΡΡΠ°Π²Π»ΡΠ΅Ρ ΠΏΡΠΈΠ±Π»ΠΈΠ·ΠΈΡΠ΅Π»ΡΠ½ΠΎ 2-3 ΠΌΠ΅ΡΡΡΠ°. ΠΠΎ ΠΈΠ·ΡΡΠ΅Π½ΠΈΠ΅ pandas ΠΈ matplotlib Π½Π΅ ΠΎΠ³ΡΠ°Π½ΠΈΡΠΈΠ²Π°Π΅ΡΡΡ Π΄Π°Π½Π½ΡΠΌ ΡΡΠ°ΠΏΠΎΠΌ ΠΈ ΠΏΠΎΡΡΠ΅Π±ΡΠ΅Ρ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΠΎΠ³ΠΎ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ, ΠΏΠΎΡΠΎΠΌΡ ΡΡΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ ΠΎΡΠ΅Π½Ρ ΠΎΠ±ΡΠΈΡΠ½Ρ. ΠΠ°ΠΊ Π³ΠΎΠ²ΠΎΡΠΈΡΡΡ Π²Π΅ΠΊ ΠΆΠΈΠ²ΠΈ β Π²Π΅ΠΊ ΡΡΠΈΡΡ.
π¬ Π ΠΊΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΡΡ Π·Π°Π΄Π°Π²Π°ΠΉΡΠ΅ Π²ΠΎΠΏΡΠΎΡΡ. ΠΠΎΡΠΎΠ²Π΅ΡΡΠΉΡΠ΅ ΡΠ²ΠΎΠΈ ΠΊΠ½ΠΈΠ³ΠΈ ΠΈ ΡΡΠ°ΡΡΠΈ ΠΏΠΎ ΡΡΠΎΠΉ ΡΠ΅ΠΌΠ΅.
ΠΠ΅ΡΠ΅Ρ ΠΎΠ΄ΠΈΡΠ΅ ΠΊ ΡΠ»Π΅Π΄ΡΡΡΠ΅ΠΉ ΡΠ°ΡΡΠΈ, ΠΏΠΎΡΠ²ΡΡΠ΅Π½Π½ΠΎΠΉ Π·Π½Π°ΠΊΠΎΠΌΡΡΠ²Ρ Ρ ΡΠ΅Ρ Π½ΠΈΡΠ΅ΡΠΊΠΈΠΌΠΈ ΠΈΠ½Π΄ΠΈΠΊΠ°ΡΠΎΡΠ°ΠΌΠΈ ΠΈ Π³ΡΠ°ΡΠΈΠΊΠ°ΠΌΠΈ Π² ΡΡΠ΅Π΄Π΅ Jupyter.
ΠΡΡΠ³ΠΈΠ΅ ΡΡΠ°ΡΡΠΈ ΠΈΠ· ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΡ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ:
5 Π»ΡΡΡΠΈΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ Python Π΄Π»Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ
ΠΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ Π΄Π°Π΅Ρ ΠΌΠ½ΠΎΠ³ΠΎ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ, Π½Π΅Π΄ΠΎΡΡΡΠΏΠ½ΠΎΠΉ ΡΠΎΠ»ΡΠΊΠΎ Ρ ΠΏΠΎΠΌΠΎΡΡΡ Π΄Π°Π½Π½ΡΡ . Π Python Π΅ΡΡΡ ΠΎΠ΄Π½ΠΈ ΠΈΠ· ΡΠ°ΠΌΡΡ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΡ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠ² Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ . Π‘Π°ΠΌΡΠ΅ ΠΎΡΠ½ΠΎΠ²Π½ΡΠ΅ ΡΠΈΠΏΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡΡΡ Π² Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ°Ρ , Π½ΠΎ Π΄ΡΡΠ³ΠΈΠ΅ Π΄ΠΎΡΡΡΠΏΠ½Ρ ΡΠΎΠ»ΡΠΊΠΎ Π² ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½Π½ΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ°Ρ .
ΠΡΡΠ½Π°Π»ΠΈΡΡ Π΄Π°Π½Π½ΡΡ ΠΈ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΡΠΉ Π΄ΠΈΠ·Π°ΠΉΠ½Π΅Ρ ΠΡΠ²ΠΈΠ΄ ΠΠ°ΠΊΠΡΠ½Π΄Π»Π΅ΡΡ, Π³ΠΎΠ²ΠΎΡΡ ΠΎ Π²Π°ΠΆΠ½ΠΎΡΡΠΈ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ Π² ΡΠ²ΠΎΠ΅ΠΌ Π²ΡΡΡΡΠΏΠ»Π΅Π½ΠΈΠΈ Π½Π° TED, ΡΠΊΠ°Π·Π°Π»: Β«ΠΠΈΠ·ΡΠ°Π»ΠΈΠ·ΠΈΡΡΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ, ΠΌΡ ΠΏΡΠ΅Π²ΡΠ°ΡΠ°Π΅ΠΌ Π΅Π΅ Π² Π»Π°Π½Π΄ΡΠ°ΡΡ, ΠΊΠΎΡΠΎΡΡΠΉ Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΡ ΡΠ²ΠΎΠΈΠΌΠΈ Π³Π»Π°Π·Π°ΠΌΠΈ, ΡΠ²ΠΎΠ΅Π³ΠΎ ΡΠΎΠ΄Π° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΡΡ ΠΊΠ°ΡΡΡ.Π ΠΊΠΎΠ³Π΄Π° Π²Ρ ΡΠ΅ΡΡΠ΅ΡΠ΅ΡΡ Π² ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ, Π²Π°ΠΌ ΠΌΠΎΠΆΠ΅Ρ ΠΏΡΠΈΠ³ΠΎΠ΄ΠΈΡΡΡΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½Π°Ρ ΠΊΠ°ΡΡΠ° Β». ΠΠΎΡ 5 Π»ΡΡΡΠΈΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Python.
ΠΡΡΡΠΈΠ΅ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ Python Π΄Π»Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ
1. Matplotlib
Matplotlib — ΡΠ°ΠΌΠ°Ρ ΠΏΠΎΠΏΡΠ»ΡΡΠ½Π°Ρ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ Π² Python ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Π΄Π»Ρ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ 2D-Π³ΡΠ°ΡΠΈΠΊΠΎΠ². ΠΡΠΎ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΡΠΈΡΠΎΠΊΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΠ°Ρ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Π΄Π»Ρ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Π² ΡΠΎΠΎΠ±ΡΠ΅ΡΡΠ²Π΅ Python, ΠΊΠΎΡΠΎΡΠΎΠΉ Π±ΠΎΠ»Π΅Π΅ Π΄Π΅ΡΡΡΠΈ Π»Π΅Ρ. ΠΠ½ ΠΏΠΎΡΡΠ°Π²Π»ΡΠ΅ΡΡΡ Ρ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΠΎΠΉ ΡΡΠ΅Π΄ΠΎΠΉ Π΄Π»Ρ ΡΠ°Π·Π½ΡΡ ΠΏΠ»Π°ΡΡΠΎΡΠΌ. Matplotlib ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π² ΡΡΠ΅Π½Π°ΡΠΈΡΡ Python, ΠΎΠ±ΠΎΠ»ΠΎΡΠΊΠ°Ρ Python ΠΈ IPython, Π·Π°ΠΏΠΈΡΠ½ΠΎΠΉ ΠΊΠ½ΠΈΠΆΠΊΠ΅ Jupyter, ΡΠ΅ΡΠ²Π΅ΡΠ°Ρ Π²Π΅Π±-ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ ΠΈ ΡΠ΅ΡΡΡΠ΅Ρ Π½Π°Π±ΠΎΡΠ°Ρ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠ² Π³ΡΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»ΡΡΠΊΠΎΠ³ΠΎ ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡΠ°.ΠΡΠΎ ΠΎΡΠ΅Π½Ρ ΡΠ½ΠΈΠ²Π΅ΡΡΠ°Π»ΡΠ½Π°Ρ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ. Π‘ ΠΏΠΎΠΌΠΎΡΡΡ ΡΡΠΎΠΉ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ Ρ ΠΏΠΎΠΌΠΎΡΡΡ Π²ΡΠ΅Π³ΠΎ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΡ ΡΡΡΠΎΠΊ ΠΊΠΎΠ΄Π° ΠΌΠΎΠΆΠ½ΠΎ ΡΠΎΠ·Π΄Π°Π²Π°ΡΡ Π³ΡΠ°ΡΠΈΠΊΠΈ, Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΡ, Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΡ, ΡΠΏΠ΅ΠΊΡΡΡ ΠΌΠΎΡΠ½ΠΎΡΡΠΈ, ΡΡΠ²ΠΎΠ»ΠΎΠ²ΡΠ΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ, Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ ΡΠ°ΡΡΠ΅ΡΠ½ΠΈΡ, Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ ΠΎΡΠΈΠ±ΠΎΠΊ, ΠΊΡΡΠ³ΠΎΠ²ΡΠ΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ ΠΈ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ Π΄ΡΡΠ³ΠΈΠ΅ ΡΠΈΠΏΡ. ΠΠΎΠ΄ΡΠ»Ρ pyplot ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»ΡΠ΅Ρ ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡ, ΠΏΠΎΠ΄ΠΎΠ±Π½ΡΠΉ MATLAB, ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎ Π² ΡΠΎΡΠ΅ΡΠ°Π½ΠΈΠΈ Ρ IPython. Matplotlib ΠΏΡΠ΅Π΄ΡΠ΅ΡΡΠ²ΡΠ΅Ρ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ΅ HTML5 Π΄Π»Ρ ΠΏΠΎΠ»Π½ΠΎΡΡΠ½ΠΊΡΠΈΠΎΠ½Π°Π»ΡΠ½ΡΡ Π²Π΅Π±-ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ, Π²ΠΌΠ΅ΡΡΠΎ ΡΡΠΎΠ³ΠΎ ΡΠΎΡΡΠ΅Π΄ΠΎΡΠΎΡΠΈΠ²ΡΠΈΡΡ Π½Π° ΡΡΠ°ΡΠΈΡΠ΅ΡΠΊΠΈΡ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡΡ Π΄Π»Ρ ΠΏΡΠ±Π»ΠΈΠΊΠ°ΡΠΈΠΈ Π²ΠΌΠ΅ΡΡΠ΅ Ρ ΠΈΠ½ΡΠ΅ΡΠ°ΠΊΡΠΈΠ²Π½ΡΠΌΠΈ ΡΠΈΠ³ΡΡΠ°ΠΌΠΈ Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ ΡΠ°ΠΊΠΈΡ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠ² Π³ΡΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡΠ° ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ, ΠΊΠ°ΠΊ Qt ΠΈ GTK.
ΠΡΡΠΎΡΠ½ΠΈΠΊ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ: Edureka
2. Plotly
Plotly — ΡΡΠΎ Π²Π΅Π±-ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠ°ΡΠΈΠΉ Π΄Π»Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ . ΠΠΎΡΡΡΠΏ ΠΊ Plotly ΡΠ°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΡΡΠΈΡΡ ΠΈΠ· Π·Π°ΠΏΠΈΡΠ½ΠΎΠΉ ΠΊΠ½ΠΈΠΆΠΊΠΈ Python, ΠΈ Ρ Π½Π΅Π³ΠΎ ΠΎΡΠ»ΠΈΡΠ½ΡΠΉ API. ΠΠ±Π»Π°Π΄Π°Ρ ΡΠ½ΠΈΠΊΠ°Π»ΡΠ½ΡΠΌΠΈ ΡΡΠ½ΠΊΡΠΈΡΠΌΠΈ, ΡΠ°ΠΊΠΈΠΌΠΈ ΠΊΠ°ΠΊ ΠΊΠΎΠ½ΡΡΡΠ½ΡΠ΅ Π³ΡΠ°ΡΠΈΠΊΠΈ, Π΄Π΅Π½Π΄ΡΠΎΠ³ΡΠ°ΠΌΠΌΡ ΠΈ ΡΡΠ΅Ρ ΠΌΠ΅ΡΠ½ΡΠ΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ, ΠΎΠ½ ΠΈΠΌΠ΅Π΅Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ, ΡΠ°ΠΊΡΡ ββΠΊΠ°ΠΊ ΡΠΎΡΠ΅ΡΠ½ΡΠ΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ, Π»ΠΈΠ½Π΅ΠΉΠ½ΡΠ΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ, Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΡ, ΡΡΠΎΠ»Π±ΡΡ ΠΎΡΠΈΠ±ΠΎΠΊ, ΠΏΡΡΠΌΠΎΡΠ³ΠΎΠ»ΡΠ½ΡΠ΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ, Π³ΠΈΡΡΠΎΠ³ΡΠ°ΠΌΠΌΡ, Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΠΎΡΠ΅ΠΉ, ΠΏΠΎΠ΄Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠΈ ΠΈ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ Π΄ΡΡΠ³ΠΈΠ΅. ΠΠ½ ΡΠΎΠ΄Π΅ΡΠΆΠΈΡ ΠΎΡΠ»ΠΈΡΠ½ΡΠΉ API, Π² ΡΠΎΠΌ ΡΠΈΡΠ»Π΅ ΠΈ Π΄Π»Ρ Python. Π Π½Π΅ΠΌ ΡΠ°ΠΊΠΆΠ΅ Π΅ΡΡΡ ΠΊΠΎΠ½ΡΡΡΠ½ΡΠ΅ Π³ΡΠ°ΡΠΈΠΊΠΈ, ΡΡΠΎ Π½Π΅ ΠΎΡΠ΅Π½Ρ ΡΠ°ΡΡΠΎ Π²ΡΡΡΠ΅ΡΠ°Π΅ΡΡΡ Π² Π΄ΡΡΠ³ΠΈΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ°Ρ .
3. Π‘ΠΈΠ±ΠΎΡΠ½
ΠΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ Python ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ Seaborn — ΡΡΠΎ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ°, ΠΎΡΠ½ΠΎΠ²Π°Π½Π½Π°Ρ Π½Π° Matplotlib. ΠΠ½ ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»ΡΠ΅Ρ Π³ΠΎΡΠ°Π·Π΄ΠΎ Π±ΠΎΠ»Π΅Π΅ ΡΠΆΠ°ΡΡΠΉ API Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΉ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ KDE. ΠΠ½ ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»ΡΠ΅Ρ ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡ Π²ΡΡΠΎΠΊΠΎΠ³ΠΎ ΡΡΠΎΠ²Π½Ρ Π΄Π»Ρ ΡΠΈΡΠΎΠ²Π°Π½ΠΈΡ ΠΏΡΠΈΠ²Π»Π΅ΠΊΠ°ΡΠ΅Π»ΡΠ½ΡΡ ΠΈ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠ²Π½ΡΡ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ². ΠΠ½ ΡΠ΅ΡΠ½ΠΎ ΠΈΠ½ΡΠ΅Π³ΡΠΈΡΠΎΠ²Π°Π½ ΡΠΎ ΡΡΠ΅ΠΊΠΎΠΌ PyData, Π²ΠΊΠ»ΡΡΠ°Ρ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΡ ΡΡΡΡΠΊΡΡΡ Π΄Π°Π½Π½ΡΡ numpy ΠΈ pandas. ΠΠΎΠΌΠΏΠ°Π½ΠΈΡ Seaborn ΡΡΡΠ΅ΠΌΠΈΡΡΡ ΡΠ΄Π΅Π»Π°ΡΡ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ ΡΠ΅Π½ΡΡΠ°Π»ΡΠ½ΠΎΠΉ ΡΠ°ΡΡΡΡ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΡ ΠΈ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ . ΠΠ³ΠΎ ΠΎΡΠΈΠ΅Π½ΡΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ Π½Π° Π½Π°Π±ΠΎΡΡ Π΄Π°Π½Π½ΡΡ ΡΡΠ½ΠΊΡΠΈΠΈ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ ΡΡΠ΅ΠΉΠΌΠ°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ ΠΈ ΠΌΠ°ΡΡΠΈΠ²Π°ΠΌΠΈ, ΡΠΎΠ΄Π΅ΡΠΆΠ°ΡΠΈΠΌΠΈ ΡΠ΅Π»ΡΠ΅ Π½Π°Π±ΠΎΡΡ Π΄Π°Π½Π½ΡΡ , ΠΈ Π²Π½ΡΡΡΠ΅Π½Π½Π΅ Π²ΡΠΏΠΎΠ»Π½ΡΡΡ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎΠ΅ ΡΠ΅ΠΌΠ°Π½ΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ ΠΈ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΡΡ Π°Π³ΡΠ΅Π³Π°ΡΠΈΡ Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠ²Π½ΡΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ².
Π‘ΠΌΠΎΡΡΠΈΡΠ΅ ΡΠ°ΠΊΠΆΠ΅
ΠΡΡΠΎΡΠ½ΠΈΠΊ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ: Seaborn
4. ggplot
Ggplot — ΡΡΠΎ Python-ΡΠ΅Π°Π»ΠΈΠ·Π°ΡΠΈΡ ΠΡΠ°ΠΌΠΌΠ°ΡΠΈΠΊΠΈ Π³ΡΠ°ΡΠΈΠΊΠΈ ΡΠ·ΡΠΊΠ° ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ R. ΠΡΠΎ ΡΠΈΡΡΠ΅ΠΌΠ° Π΄Π»Ρ Π΄Π΅ΠΊΠ»Π°ΡΠ°ΡΠΈΠ²Π½ΠΎΠ³ΠΎ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΈ, ΠΎΡΠ½ΠΎΠ²Π°Π½Π½Π°Ρ Π½Π° Grammar of Graphics ΠΈ ΡΠ΅ΡΠ½ΠΎ ΠΈΠ½ΡΠ΅Π³ΡΠΈΡΠΎΠ²Π°Π½Π½Π°Ρ Ρ Pandas. ΠΠΎΡΠ»Π΅ ΡΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ Π΅ΠΌΡ ΡΠ°ΡΡΠΊΠ°Π·Π°Π»ΠΈ, ΠΊΠ°ΠΊ ΡΠΎΠΏΠΎΡΡΠ°Π²ΠΈΡΡ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΠ΅ Ρ ΡΡΡΠ΅ΡΠΈΠΊΠΎΠΉ ΠΈ ΠΊΠ°ΠΊΠΈΠ΅ ΠΏΡΠΈΠΌΠΈΡΠΈΠ²Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ, ΠΎΠ½ ΠΏΠΎΠ·Π°Π±ΠΎΡΠΈΡΡΡ ΠΎΠ±ΠΎ Π²ΡΠ΅Ρ Π΄Π΅ΡΠ°Π»ΡΡ . ΠΠ΅ΡΠΎΠ΄ Ggplot Π½Π΅ ΠΏΡΠ΅Π΄Π½Π°Π·Π½Π°ΡΠ΅Π½ Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ΡΠΈΠ»ΡΠ½ΠΎ Π½Π°ΡΡΡΠ°ΠΈΠ²Π°Π΅ΠΌΠΎΠΉ Π³ΡΠ°ΡΠΈΠΊΠΈ.
ΠΡΡΠΎΡΠ½ΠΈΠΊ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ: r4stats.com
5. ΠΠ»ΡΡΠ°ΠΈΡ
ΠΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Python ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ Altair ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΠ΅Ρ ΡΠΎΠ±ΠΎΠΉ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΡ Π΄Π΅ΠΊΠ»Π°ΡΠ°ΡΠΈΠ²Π½ΠΎΠΉ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΎΠΉ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Ρ ΠΏΡΠΎΡΡΡΠΌ API, Π΄ΡΡΠΆΠ΅ΡΡΠ²Π΅Π½Π½ΡΠΌ ΠΈ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»ΡΠ½ΡΠΌ ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡΠΎΠΌ, ΠΏΠΎΡΡΡΠΎΠ΅Π½Π½ΠΎΠΉ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΠΌΠΎΡΠ½ΠΎΠΉ Π³ΡΠ°ΠΌΠΌΠ°ΡΠΈΠΊΠΈ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Vega-Lite. ΠΠ΅ΠΊΠ»Π°ΡΠ°ΡΠΈΠ²Π½ΠΎΠΉ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ΅ Π½ΡΠΆΠ½ΠΎ ΡΠΎΠ»ΡΠΊΠΎ ΡΠΏΠΎΠΌΡΠ½ΡΡΡ ΡΠ²ΡΠ·ΠΈ ΠΌΠ΅ΠΆΠ΄Ρ ΡΡΠΎΠ»Π±ΡΠ°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ ΠΈ ΠΊΠ°Π½Π°Π»Π°ΠΌΠΈ ΠΊΠΎΠ΄ΠΈΡΠΎΠ²Π°Π½ΠΈΡ, Π° ΠΎΡΡΠ°Π»ΡΠ½ΠΎΠ΅ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°Π΅ΡΡΡ Π°Π²ΡΠΎΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΈ. ΠΡΠ° ΡΠ»Π΅Π³Π°Π½ΡΠ½Π°Ρ ΠΏΡΠΎΡΡΠΎΡΠ° ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΡΠΎΠ·Π΄Π°Π²Π°ΡΡ ΠΊΡΠ°ΡΠΈΠ²ΡΠ΅ ΠΈ ΡΡΡΠ΅ΠΊΡΠΈΠ²Π½ΡΠ΅ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Ρ ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡΠ½ΡΠΌ ΠΎΠ±ΡΠ΅ΠΌΠΎΠΌ ΠΊΠΎΠ΄Π°. ΠΡΡ ΠΎΠ΄Π½ΡΠΉ ΠΊΠΎΠ΄ Altair Π΄ΠΎΡΡΡΠΏΠ΅Π½ Π½Π° GitHub.Π‘ ΠΏΠΎΠΌΠΎΡΡΡ Altair Π»Π΅Π³ΠΊΠΎ ΡΠΎΠ·Π΄Π°Π²Π°ΡΡ ΡΡΡΠ΅ΠΊΡΠΈΠ²Π½ΡΠ΅ ΠΈ ΠΊΡΠ°ΡΠΈΠ²ΡΠ΅ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Ρ ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡΠ½ΡΠΌ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎΠΌ ΠΊΠΎΠ΄Π°.
ΠΡΡΠΎΡΠ½ΠΈΠΊ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ: Altair
ΠΡΠ»ΠΈ Π²Π°ΠΌ ΠΏΠΎΠ½ΡΠ°Π²ΠΈΠ»Π°ΡΡ ΡΡΠ° ΠΈΡΡΠΎΡΠΈΡ, ΠΏΡΠΈΡΠΎΠ΅Π΄ΠΈΠ½ΡΠΉΡΠ΅ΡΡ ΠΊ Π½Π°ΡΠ΅ΠΌΡ ΡΠΎΠΎΠ±ΡΠ΅ΡΡΠ²Ρ Telegram.
ΠΡΠΎΠΌΠ΅ ΡΠΎΠ³ΠΎ, Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ Π½Π°ΠΏΠΈΡΠ°ΡΡ Π΄Π»Ρ Π½Π°Ρ ΠΈ ΡΡΠ°ΡΡ ΠΎΠ΄Π½ΠΈΠΌ ΠΈΠ· 500+ ΡΠΊΡΠΏΠ΅ΡΡΠΎΠ², ΠΊΠΎΡΠΎΡΡΠ΅ Π½Π°ΠΏΠΈΡΠ°Π»ΠΈ ΡΡΠ°ΡΡΠΈ Π½Π° AIM. ΠΠΎΠ΄Π΅Π»ΠΈΡΠ΅ΡΡ ΡΠ²ΠΎΠΈΠΌΠΈ Π½ΠΎΠΌΠΈΠ½Π°ΡΠΈΡΠΌΠΈ Π·Π΄Π΅ΡΡ.
ΠΠΈΡΠ° ΠΠΈΡΠ°Π»
ΠΠ°ΡΠ»Π° ΠΏΡΡΡ Π² Π½Π°ΡΠΊΡ ΠΎ Π΄Π°Π½Π½ΡΡ ΠΈ ΠΈΡΠΊΡΡΡΡΠ²Π΅Π½Π½ΡΠΉ ΠΈΠ½ΡΠ΅Π»Π»Π΅ΠΊΡ, Π½Π΅ΡΠΌΠΎΡΡΡ Π½Π° Π΅Π΅ ΡΠ²Π»Π΅ΡΠ΅Π½ΠΈΠ΅ ΡΠ΅Ρ Π½ΠΎΠ»ΠΎΠ³ΠΈΡΠΌΠΈ.ΠΡΠ±ΠΈΡ ΡΠΈΡΠ°ΡΡ, ΡΠΌΠΎΡΡΠ΅ΡΡ ΡΡΡΠ±ΠΎΠ» ΠΈ Π±Π΅Π·ΠΌΠ΅ΡΠ½ΠΎ Π»ΡΠ±ΠΈΡ Π°ΡΡΡΠΎΡΠΈΠ·ΠΈΠΊΡ.
ΠΠ΅ΡΠΏΠ»Π°ΡΠ½Π°Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ Ρ ΠΊΡΡΡΠΎΠΌ Python ΠΎΡ ΠΊΠΎΠ³Π½ΠΈΡΠΈΠ²Π½ΠΎΠ³ΠΎ ΠΊΠ»Π°ΡΡΠ°
ΠΠ± ΡΡΠΎΠΌ ΠΊΡΡΡΠ΅ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ
Β«ΠΠ°ΡΡΠΈΠ½ΠΊΠ° ΡΡΠΎΠΈΡ ΡΡΡΡΡΠΈ ΡΠ»ΠΎΠ²Β». ΠΡΠ΅ ΠΌΡ Π·Π½Π°ΠΊΠΎΠΌΡ Ρ ΡΡΠΈΠΌ Π²ΡΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ΠΌ. ΠΡΠΎ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎ Π°ΠΊΡΡΠ°Π»ΡΠ½ΠΎ ΠΏΡΠΈ ΠΏΠΎΠΏΡΡΠΊΠ΅ ΠΎΠ±ΡΡΡΠ½ΠΈΡΡ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅, ΠΏΠΎΠ»ΡΡΠ΅Π½Π½ΠΎΠ΅ Π² ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ΅ Π°Π½Π°Π»ΠΈΠ·Π° Π²ΡΠ΅ Π±ΠΎΠ»Π΅Π΅ ΠΊΡΡΠΏΠ½ΡΡ Π½Π°Π±ΠΎΡΠΎΠ² Π΄Π°Π½Π½ΡΡ . ΠΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ ΠΈΠ³ΡΠ°Π΅Ρ Π²Π°ΠΆΠ½ΡΡ ΡΠΎΠ»Ρ Π² ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠΈ ΠΊΠ°ΠΊ ΠΌΠ°Π»ΡΡ , ΡΠ°ΠΊ ΠΈ ΠΊΡΡΠΏΠ½ΠΎΠΌΠ°ΡΡΡΠ°Π±Π½ΡΡ Π΄Π°Π½Π½ΡΡ .
ΠΠ΄Π½ΠΈΠΌ ΠΈΠ· ΠΊΠ»ΡΡΠ΅Π²ΡΡ Π½Π°Π²ΡΠΊΠΎΠ² ΡΠΏΠ΅ΡΠΈΠ°Π»ΠΈΡΡΠ° ΠΏΠΎ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠ΅ Π΄Π°Π½Π½ΡΡ ΡΠ²Π»ΡΠ΅ΡΡΡ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡΡ ΡΠ°ΡΡΠΊΠ°Π·ΡΠ²Π°ΡΡ ΡΠ±Π΅Π΄ΠΈΡΠ΅Π»ΡΠ½ΡΡ ΠΈΡΡΠΎΡΠΈΡ, Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ Π΄Π°Π½Π½ΡΠ΅ ΠΈ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ Π² Π΄ΠΎΡΡΡΠΏΠ½ΠΎΠΉ ΠΈ ΡΡΠΈΠΌΡΠ»ΠΈΡΡΡΡΠ΅ΠΉ ΡΠΎΡΠΌΠ΅. ΠΠ·ΡΡΠ΅Π½ΠΈΠ΅ ΡΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠ½ΡΠΉ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½Ρ Π΄Π»Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ , ΡΠ°ΠΊΠΆΠ΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ Π²Π°ΠΌ ΠΈΠ·Π²Π»Π΅ΠΊΠ°ΡΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ, Π»ΡΡΡΠ΅ ΠΏΠΎΠ½ΠΈΠΌΠ°ΡΡ Π΄Π°Π½Π½ΡΠ΅ ΠΈ ΠΏΡΠΈΠ½ΠΈΠΌΠ°ΡΡ Π±ΠΎΠ»Π΅Π΅ ΡΡΡΠ΅ΠΊΡΠΈΠ²Π½ΡΠ΅ ΡΠ΅ΡΠ΅Π½ΠΈΡ.
ΠΡΠ½ΠΎΠ²Π½Π°Ρ ΡΠ΅Π»Ρ ΡΡΠΎΠ³ΠΎ ΠΊΡΡΡΠ° Β«ΠΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ PythonΒ» — Π½Π°ΡΡΠΈΡΡ Π²Π°Ρ Π±ΡΠ°ΡΡ Π΄Π°Π½Π½ΡΠ΅, ΠΊΠΎΡΠΎΡΡΠ΅ Π½Π° ΠΏΠ΅ΡΠ²ΡΠΉ Π²Π·Π³Π»ΡΠ΄ Π½Π΅ ΠΈΠΌΠ΅ΡΡ Π±ΠΎΠ»ΡΡΠΎΠ³ΠΎ Π·Π½Π°ΡΠ΅Π½ΠΈΡ, ΠΈ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΡΡ ΡΡΠΈ Π΄Π°Π½Π½ΡΠ΅ Π² ΡΠΎΡΠΌΠ΅, ΠΏΠΎΠ½ΡΡΠ½ΠΎΠΉ Π»ΡΠ΄ΡΠΌ.ΠΠ»Ρ Π²ΠΈΠ·ΡΠ°Π»ΡΠ½ΠΎΠ³ΠΎ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ Π±ΡΠ»ΠΈ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½Ρ ΡΠ°Π·Π»ΠΈΡΠ½ΡΠ΅ ΠΌΠ΅ΡΠΎΠ΄Ρ, Π½ΠΎ Π² ΡΡΠΎΠΌ ΠΊΡΡΡΠ΅ ΠΌΡ Π±ΡΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π΄Π°Π½Π½ΡΡ Π½Π° Python, Π° ΠΈΠΌΠ΅Π½Π½ΠΎ Matplotlib, Seaborn ΠΈ Folium. ΠΡ ΠΌΠΎΠΆΠ΅ΡΠ΅ Π½Π°ΡΠ°ΡΡ ΡΠΎΠ·Π΄Π°Π²Π°ΡΡ ΡΠ²ΠΎΠΈ ΡΠΎΠ±ΡΡΠ²Π΅Π½Π½ΡΠ΅ ΠΏΡΠΎΠ΅ΠΊΡΡ Π² ΠΎΠ±Π»Π°ΡΡΠΈ Π½Π°ΡΠΊΠΈ ΠΎ Π΄Π°Π½Π½ΡΡ ΠΈ ΡΠΎΡΡΡΠ΄Π½ΠΈΡΠ°ΡΡ Ρ Π΄ΡΡΠ³ΠΈΠΌΠΈ ΡΠΏΠ΅ΡΠΈΠ°Π»ΠΈΡΡΠ°ΠΌΠΈ ΠΏΠΎ Π΄Π°Π½Π½ΡΠΌ Ρ ΠΏΠΎΠΌΠΎΡΡΡ IBM Watson Studio. ΠΡΠΈ ΡΠ΅Π³ΠΈΡΡΡΠ°ΡΠΈΠΈ Π²Ρ ΠΏΠΎΠ»ΡΡΠ°Π΅ΡΠ΅ Π±Π΅ΡΠΏΠ»Π°ΡΠ½ΡΠΉ Π΄ΠΎΡΡΡΠΏ ΠΊ Watson Studio. ΠΠ°ΡΠ½ΠΈΡΠ΅ ΡΠ΅ΠΉΡΠ°Ρ ΠΈ Π²ΠΎΡΠΏΠΎΠ»ΡΠ·ΡΠΉΡΠ΅ΡΡ ΠΏΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π°ΠΌΠΈ ΡΡΠΎΠΉ ΠΏΠ»Π°ΡΡΠΎΡΠΌΡ. ΠΡΠΎΠ³ΡΠ°ΠΌΠΌΠ° ΠΊΡΡΡΠ°
ΠΠΎΠ΄ΡΠ»Ρ 1 — ΠΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΡ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ
- ΠΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ
- ΠΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Matplotlib
- ΠΠ°Π·ΠΎΠ²ΠΎΠ΅ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Ρ ΠΏΠΎΠΌΠΎΡΡΡ Matplotlib
- ΠΠ°Π±ΠΎΡ Π΄Π°Π½Π½ΡΡ ΠΎΠ± ΠΈΠΌΠΌΠΈΠ³ΡΠ°ΡΠΈΠΈ Π² ΠΠ°Π½Π°Π΄Ρ
ΠΠΎΠ΄ΡΠ»Ρ 2 — ΠΠ°Π·ΠΎΠ²ΡΠ΅ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΡ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ
ΠΠΎΠ΄ΡΠ»Ρ 3 — Π‘ΠΏΠ΅ΡΠΈΠ°Π»ΠΈΠ·ΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΡ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ
ΠΠΎΠ΄ΡΠ»Ρ 4 — Π Π°ΡΡΠΈΡΠ΅Π½Π½ΡΠ΅ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΡ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ
- ΠΡΠ°ΡΠΈΠΊΠΈ ΠΌΠΎΡΡΠΊΠΎΠ³ΠΎ Π·Π°Π±ΠΎΡ ΠΈ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΠΈ
ΠΠΎΠ΄ΡΠ»Ρ 5 — Π‘ΠΎΠ·Π΄Π°Π½ΠΈΠ΅ ΠΊΠ°ΡΡ ΠΈ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ Π³Π΅ΠΎΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π΅Π½Π½ΡΡ
Π΄Π°Π½Π½ΡΡ
ΠΠ±ΡΠ°Ρ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ
- ΠΡΠΎΡ ΠΊΡΡΡ Π±Π΅ΡΠΏΠ»Π°ΡΠ½ΡΠΉ.
- Π‘Π°ΠΌΠΎΡΡΠΎΡΡΠ΅Π»ΡΠ½ΠΎΠ΅ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅.
- ΠΠ°Π±ΡΠ°ΡΡ ΠΌΠΎΠΆΠ½ΠΎ Π² Π»ΡΠ±ΠΎΠΉ ΠΌΠΎΠΌΠ΅Π½Ρ.
- ΠΠ³ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡΠΎΠ²Π΅ΡΡΡΡ ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΠ³ΠΎΠ΄Π½ΠΎ ΡΠ°Π·.
Π’ΡΠ΅Π±ΠΎΠ²Π°Π½ΠΈΡ
ΠΠ΅ΡΡΠΎΠ½Π°Π» ΠΊΡΡΡΠ°
ΠΠ»Π΅ΠΊΡ ΠΠΊΠ»ΡΠΎΠ½
ΠΠ»Π΅ΠΊΡ ΠΠΊΠ»ΡΠΎΠ½, Π΄ΠΎΠΊΡΠΎΡ ΡΠΈΠ»ΠΎΡΠΎΡΠΈΠΈ, ΡΠΏΠ΅ΡΠΈΠ°Π»ΠΈΡΡ ΠΏΠΎ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠ΅ Π΄Π°Π½Π½ΡΡ Π² Π³ΡΡΠΏΠΏΠ΅ ΡΠΈΡΡΠΎΠ²ΠΎΠ³ΠΎ Π±ΠΈΠ·Π½Π΅ΡΠ° IBM Canada. ΠΠ»Π΅ΠΊΡ Π°ΠΊΡΠΈΠ²Π½ΠΎ ΡΡΠ°ΡΡΠ²ΠΎΠ²Π°Π» Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ ΠΈΠ½ΡΠ΅ΡΠ΅ΡΠ½ΡΡ ΠΏΡΠΎΠ΅ΠΊΡΠ°Ρ Π² ΠΎΠ±Π»Π°ΡΡΠΈ Π½Π°ΡΠΊΠΈ ΠΎ Π΄Π°Π½Π½ΡΡ , ΡΠ°ΠΊΠΈΡ ΠΊΠ°ΠΊ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠΊΠ° ΠΈΠ½ΡΠ΅Π»Π»Π΅ΠΊΡΡΠ°Π»ΡΠ½ΠΎΠΉ ΡΠΈΡΡΠ΅ΠΌΡ, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΌΠΎΠ³Π»Π° Π±Ρ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΡΡ Π½Π°ΡΠ°Π»ΠΎ Π΄Π΅ΠΌΠ΅Π½ΡΠΈΠΈ Ρ ΠΏΠΎΠΆΠΈΠ»ΡΡ Π»ΡΠ΄Π΅ΠΉ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ ΠΏΡΠΎΠ΄ΠΎΠ»ΡΠ½ΡΠ΅ ΡΡΠ°Π΅ΠΊΡΠΎΡΠΈΠΈ ΡΠΊΠΎΡΠΎΡΡΠΈ Ρ ΠΎΠ΄ΡΠ±Ρ ΠΈ Π΄ΠΎΠΌΠ°ΡΠ½Π΅ΠΉ Π°ΠΊΡΠΈΠ²Π½ΠΎΡΡΠΈ.ΠΠΎ ΠΏΡΠΈΡ ΠΎΠ΄Π° Π² IBM ΠΠ»Π΅ΠΊΡ ΡΠ°Π±ΠΎΡΠ°Π» ΡΠΏΠ΅ΡΠΈΠ°Π»ΠΈΡΡΠΎΠΌ ΠΏΠΎ Π°Π½Π°Π»ΠΈΠ·Ρ Π΄Π°Π½Π½ΡΡ Π² Datascope Analytics, ΠΊΠΎΠ½ΡΠ°Π»ΡΠΈΠ½Π³ΠΎΠ²ΠΎΠΉ ΡΠΈΡΠΌΠ΅ ΠΏΠΎ Π½Π°ΡΠΊΠ΅ ΠΎ Π΄Π°Π½Π½ΡΡ Π² Π§ΠΈΠΊΠ°Π³ΠΎ, ΡΡΠ°Ρ ΠΠ»Π»ΠΈΠ½ΠΎΠΉΡ, Π³Π΄Π΅ ΠΎΠ½ ΡΠ°Π·ΡΠ°Π±Π°ΡΡΠ²Π°Π» ΡΠ΅ΡΠ΅Π½ΠΈΡ ΠΈ ΠΏΡΠΎΠ΄ΡΠΊΡΡ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ ΠΏΠΎΠ΄Ρ ΠΎΠ΄, ΠΎΡΠΈΠ΅Π½ΡΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ Π½Π° ΡΠ΅Π»ΠΎΠ²Π΅ΠΊΠ° ΠΈ ΠΎΡΠΈΠ΅Π½ΡΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ Π½Π° Π΄Π°Π½Π½ΡΠ΅. ΠΠ»Π΅ΠΊΡ ΠΏΠΎΠ»ΡΡΠΈΠ» Π΄ΠΎΠΊΡΠΎΡΡΠΊΡΡ ΡΡΠ΅ΠΏΠ΅Π½Ρ. ΠΏΠΎΠ»ΡΡΠΈΠ» ΡΡΠ΅ΠΏΠ΅Π½Ρ Π΄ΠΎΠΊΡΠΎΡΠ° Π±ΠΈΠΎΠΌΠ΅Π΄ΠΈΡΠΈΠ½ΡΠΊΠΎΠΉ ΠΈΠ½ΠΆΠ΅Π½Π΅ΡΠΈΠΈ Π² Π£Π½ΠΈΠ²Π΅ΡΡΠΈΡΠ΅ΡΠ΅ Π’ΠΎΡΠΎΠ½ΡΠΎ.
ΠΠΆΠ΅ΠΉ Π Π°Π΄ΠΆΠ°ΡΠ΅ΠΊΡ Π°ΡΠ°Π½
ΠΠΆΠ΅ΠΉ Π Π°Π΄ΠΆΠ°ΡΠ΅ΠΊΡ Π°ΡΠ°Π½ Π½Π°ΡΠ°Π» ΡΠ²ΠΎΡ ΠΊΠ°ΡΡΠ΅ΡΡ Π² ΠΊΠ°ΡΠ΅ΡΡΠ²Π΅ ΠΈΠ½ΠΆΠ΅Π½Π΅ΡΠ° ΠΏΠΎ ΠΏΡΠΎΠ΅ΠΊΡΠ°ΠΌ Π² ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ Honeywell Aerospace, Π³Π΄Π΅ ΠΎΠ½ ΡΡΠΊΠΎΠ²ΠΎΠ΄ΠΈΠ» ΠΏΠΎΡΡΡΠ΅Π»Π΅ΠΌ ΠΏΡΠΎΠ΅ΠΊΡΠΎΠ², Π½Π°ΠΏΡΠ°Π²Π»Π΅Π½Π½ΡΡ Π½Π° ΠΏΠΎΠ²ΡΡΠ΅Π½ΠΈΠ΅ ΠΊΠ°ΡΠ΅ΡΡΠ²Π°, ΡΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ Π·Π°ΡΡΠ°Ρ ΠΈ ΡΠ»ΡΡΡΠ΅Π½ΠΈΠ΅ ΠΏΡΠΎΡΠ΅ΡΡΠΎΠ² Π΄Π»Ρ Boeing, Airbus ΠΈ Lockheed Martin.ΠΠΏΠΎΡΠ»Π΅Π΄ΡΡΠ²ΠΈΠΈ ΠΠΆΠ΅ΠΉ ΠΏΠ΅ΡΠ΅ΠΊΠ»ΡΡΠΈΠ»ΡΡ Ρ ΠΏΡΠΎΠ΅ΠΊΡΠΈΡΠΎΠ²Π°Π½ΠΈΡ Π½Π° Π°Π½Π°Π»ΠΈΡΠΈΠΊΡ ΠΈ ΠΏΡΠΈΡΠΎΠ΅Π΄ΠΈΠ½ΠΈΠ»ΡΡ ΠΊ IBM Π² ΠΊΠ°ΡΠ΅ΡΡΠ²Π΅ Π±ΠΈΠ·Π½Π΅Ρ-Π°Π½Π°Π»ΠΈΡΠΈΠΊΠ° Π² ΠΏΠΎΠ΄ΡΠ°Π·Π΄Π΅Π»Π΅Π½ΠΈΠΈ Infrastructure Services. Π Π½Π°ΡΡΠΎΡΡΠ΅Π΅ Π²ΡΠ΅ΠΌΡ ΠΎΠ½ ΡΡΠΊΠΎΠ²ΠΎΠ΄ΠΈΡ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΠΌΠΈ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠ°ΠΌΠΈ ΠΏΠΎΠ²ΡΡΠ΅Π½ΠΈΡ ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΠΈ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ Π°Π½Π°Π»ΠΈΡΠΈΠΊΡ Π΄Π°Π½Π½ΡΡ Π΄Π»Ρ Π°Π½Π°Π»ΠΈΠ·Π° Π±ΠΈΠ·Π½Π΅Ρ-ΠΎΠΏΠ΅ΡΠ°ΡΠΈΠΉ ΠΈ Π²Π½Π΅Π΄ΡΡΡ ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΡ, ΡΠ°ΠΊΡΡ ββΠΊΠ°ΠΊ ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΡ ΡΠ°Π±ΠΎΡΠΈΡ ΠΏΡΠΎΡΠ΅ΡΡΠΎΠ², ΠΏΠΎΠ²ΡΡΠ΅Π½ΠΈΠ΅ ΡΡΠΎΠ²Π½Ρ ΠΎΠ±ΡΠ»ΡΠΆΠΈΠ²Π°Π½ΠΈΡ ΠΈ, Π² ΠΊΠΎΠ½Π΅ΡΠ½ΠΎΠΌ ΠΈΡΠΎΠ³Π΅, ΡΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ Π·Π°ΡΡΠ°Ρ. ΠΠΎΠΌΠΈΠΌΠΎ ΡΠ²ΠΎΠ΅ΠΉ ΠΊΠ°ΡΡΠ΅ΡΡ, ΠΠΆΠ΅ΠΉ ΠΎΡΠ΅Π½Ρ ΡΠ²Π»Π΅ΡΠ΅Π½ ΠΏΡΠ΅ΠΏΠΎΠ΄Π°Π²Π°Π½ΠΈΠ΅ΠΌ — ΠΎΠ½ Π΄ΠΎΠ±ΡΠΎΠ²ΠΎΠ»ΡΠ½ΠΎ ΡΠ°Π±ΠΎΡΠ°Π΅Ρ ΡΠ΅ΠΏΠ΅ΡΠΈΡΠΎΡΠΎΠΌ Π² ΡΠ²ΠΎΠ΅ΠΉ ΠΎΠ±ΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠΉ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ΅ ΠΈ Π½Π°ΡΡΠ°Π²Π½ΠΈΠΊΠΎΠΌ Π²ΡΠΏΡΡΠΊΠ½ΠΈΠΊΠΎΠ² Π² Π£Π½ΠΈΠ²Π΅ΡΡΠΈΡΠ΅ΡΠ΅ Π’ΠΎΡΠΎΠ½ΡΠΎ.
ΠΠΎΠ»ΠΎΠ½Π³ ΠΠΈΠ½
ΠΠΎΠ»ΠΎΠ½Π³ ΠΠΈΠ½Ρ (Polong Lin) — ΡΠΏΠ΅ΡΠΈΠ°Π»ΠΈΡΡ ΠΏΠΎ Π°Π½Π°Π»ΠΈΠ·Ρ Π΄Π°Π½Π½ΡΡ ΠΈ Π²Π΅Π΄ΡΡΠΈΠΉ ΡΠΏΠ΅ΡΠΈΠ°Π»ΠΈΡΡ Π² ΠΎΠ±Π»Π°ΡΡΠΈ Π½Π°ΡΠΊΠΈ ΠΎ Π΄Π°Π½Π½ΡΡ Π² IBM Π² ΠΠ°Π½Π°Π΄Π΅. ΠΠΎΠ»ΠΎΠ½Π³ ΡΠ²Π»ΡΠ΅ΡΡΡ ΡΠΎΠΎΡΠ³Π°Π½ΠΈΠ·Π°ΡΠΎΡΠΎΠΌ ΠΊΡΡΠΏΠ½Π΅ΠΉΡΠ΅ΠΉ Π³ΡΡΠΏΠΏΡ Π²ΡΡΡΠ΅Ρ ΠΏΠΎ Π½Π°ΡΠΊΠ΅ ΠΎ Π΄Π°Π½Π½ΡΡ Π² ΠΠ°Π½Π°Π΄Π΅ ΠΈ ΡΠ΅Π³ΡΠ»ΡΡΠ½ΠΎ Π²ΡΡΡΡΠΏΠ°Π΅Ρ Π½Π° ΠΊΠΎΠ½ΡΠ΅ΡΠ΅Π½ΡΠΈΡΡ ΠΏΠΎ Π½Π°ΡΠΊΠ΅ ΠΎ Π΄Π°Π½Π½ΡΡ . ΠΠΎΠ»ΠΎΠ½Π³ ΠΈΠΌΠ΅Π΅Ρ ΡΡΠ΅ΠΏΠ΅Π½Ρ M.Sc. Π² ΠΊΠΎΠ³Π½ΠΈΡΠΈΠ²Π½ΠΎΠΉ ΠΏΡΠΈΡ ΠΎΠ»ΠΎΠ³ΠΈΠΈ.
ΠΠ»Π°Π³ΠΎΠ΄Π°ΡΠ½ΠΎΡΡΡ
ΠΡΠΎΠ±Π°Ρ Π±Π»Π°Π³ΠΎΠ΄Π°ΡΠ½ΠΎΡΡΡ ΡΠ»Π΅Π΄ΡΡΡΠΈΠΌ ΠΈΠ½ΠΆΠ΅Π½Π΅ΡΠ°ΠΌ ΠΈ Π°Π½Π°Π»ΠΈΡΠΈΠΊΠ°ΠΌ Π·Π° ΠΈΡ ΡΠ΅Π½Π½ΡΠΉ ΠΈ Π·Π½Π°ΡΠΈΡΠ΅Π»ΡΠ½ΡΠΉ Π²ΠΊΠ»Π°Π΄ Π² ΠΏΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΡΡ ΡΠΎΡΡΠ°Π²Π»ΡΡΡΡΡ ΡΡΠΎΠ³ΠΎ ΠΊΡΡΡΠ°: Ehsan M.ΠΠ΅ΡΠΌΠ°Π½ΠΈ, Π‘Π»ΠΎΠ±ΠΎΠ΄Π°Π½ ΠΠ°ΡΠΊΠΎΠ²ΠΈΡ, Π‘ΡΡΠ·Π°Π½ ΠΠΈ ΠΈ ΠΠ°Π΄Π»Π΅Π½ Π¨Π°Π½.
Π ΡΠΊΠΎΠ²ΠΎΠ΄ΡΡΠ² ΠΏΠΎ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ Π½Π° Python
ΠΠΎΠ±ΡΠΎ ΠΏΠΎΠΆΠ°Π»ΠΎΠ²Π°ΡΡ Π² ΡΡΠΊΠΎΠ²ΠΎΠ΄ΡΡΠ²ΠΎ ΠΏΠΎ Π°Π½Π°Π»ΠΈΠ·Ρ Π΄Π°Π½Π½ΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ Python ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ Pandas .
ΠΠ±Π»Π°ΡΡΡ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ Π΄ΠΎΠ²ΠΎΠ»ΡΠ½ΠΎ Π²Π΅Π»ΠΈΠΊΠ°, ΠΈ ΡΠΎ, ΡΡΠΎ Π²Ρ ΡΠΎΠ±ΠΈΡΠ°Π΅ΡΠ΅ΡΡ Ρ Π½Π΅ΠΉ Π΄Π΅Π»Π°ΡΡ, ΡΠΊΠΎΡΠ΅Π΅ Π²ΡΠ΅Π³ΠΎ, Π½ΠΈΠΊΠΎΠ³Π΄Π° Π½Π΅ Π±ΡΠ΄Π΅Ρ ΡΠΎΡΠ½ΠΎ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΠΎΠ²Π°ΡΡ Π½ΠΈ ΠΎΠ΄Π½ΠΎΠΌΡ ΡΡΠΊΠΎΠ²ΠΎΠ΄ΡΡΠ²Ρ. ΠΠΌΠ΅Ρ ΡΡΠΎ Π² Π²ΠΈΠ΄Ρ, Ρ Π΄ΡΠΌΠ°Ρ, ΡΡΠΎ Π»ΡΡΡΠΈΠΉ ΡΠΏΠΎΡΠΎΠ± ΠΏΠΎΠ΄ΠΎΠΉΡΠΈ ΠΊ ΠΈΠ·ΡΡΠ΅Π½ΠΈΡ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ Python — ΡΡΠΎ ΠΏΡΠΎΡΡΠΎ Π½Π° ΠΏΡΠΈΠΌΠ΅ΡΠ΅. ΠΠΎΠΉ ΠΏΠ»Π°Π½ Π·Π΄Π΅ΡΡ ΡΠΎΡΡΠΎΠΈΡ Π² ΡΠΎΠΌ, ΡΡΠΎΠ±Ρ Π½Π°ΠΉΡΠΈ Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ Π½Π°Π±ΠΎΡΡ Π΄Π°Π½Π½ΡΡ ΠΈ Π²ΡΠΏΠΎΠ»Π½ΠΈΡΡ Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ ΠΈΠ· ΠΎΠ±ΡΠΈΡ Π·Π°Π΄Π°Ρ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ , ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ ΠΏΠ°ΠΊΠ΅Ρ Pandas, ΡΡΠΎΠ±Ρ, Π½Π°Π΄Π΅ΡΡΡ, Π²Ρ Π΄ΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ ΠΏΠΎΠ·Π½Π°ΠΊΠΎΠΌΠΈΠ»ΠΈΡΡ Ρ ΠΏΠ°ΠΊΠ΅ΡΠΎΠΌ, ΡΡΠΎΠ±Ρ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ Π½ΠΈΠΌ ΡΠ°ΠΌΠΎΡΡΠΎΡΡΠ΅Π»ΡΠ½ΠΎ.
ΠΠ»Ρ Π½Π°ΡΠ°Π»Π° Π΄Π°Π²Π°ΠΉΡΠ΅ ΡΠ±Π΅Π΄ΠΈΠΌΡΡ, ΡΡΠΎ ΠΌΡ Π²ΡΠ΅ Π½Π° ΠΎΠ΄Π½ΠΎΠΉ ΡΡΡΠ°Π½ΠΈΡΠ΅.
Π― Π±ΡΠ΄Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Python 3.7 ΠΈ Pands 0.24.1
Π‘ΠΊΠΎΡΠ΅Π΅ Π²ΡΠ΅Π³ΠΎ, Π²Ρ ΡΠΌΠΎΠΆΠ΅ΡΠ΅ ΡΠ»Π΅Π΄ΠΈΡΡ Π·Π° ΡΠ°Π·Π½ΡΠΌΠΈ Π²Π΅ΡΡΠΈΡΠΌΠΈ Π²Π΅ΡΠ΅ΠΉ, ΠΏΡΠΎΡΡΠΎ Π·Π½Π°ΠΉΡΠ΅, ΡΡΠΎ ΠΌΠΎΠ³ΡΡ Π±ΡΡΡ Π½Π΅Π·Π½Π°ΡΠΈΡΠ΅Π»ΡΠ½ΡΠ΅ ΡΠ°Π·Π»ΠΈΡΠΈΡ, ΠΊΠΎΡΠΎΡΡΠ΅ Π²Π°ΠΌ Π½ΡΠΆΠ½ΠΎ Π±ΡΠ΄Π΅Ρ ΠΏΡΠΎΡΠ°Π±ΠΎΡΠ°ΡΡ. Π― Π»ΠΈΡΠ½ΠΎ ΠΎΠ±Π½Π°ΡΡΠΆΠΈΠ», ΡΡΠΎ Ρ ΠΏΠΎΠΌΠΎΡΡΡ Pandas Ρ ΠΌΠΎΠ³Ρ Ρ Π±ΠΎΠ»ΡΡΠΈΠΌ ΡΡΠΏΠ΅Ρ ΠΎΠΌ Π³ΡΠ³Π»ΠΈΡΡ ΡΠ²ΠΎΠΈ ΠΎΡΠΈΠ±ΠΊΠΈ.
ΠΡΠ°ΠΊ, ΠΏΠΎΡΠ»Π΅ ΡΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ Π²Ρ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΠ»ΠΈ Python ΠΈ Π²ΡΠΏΠΎΠ»Π½ΠΈΠ»ΠΈ ΡΡΡΠ°Π½ΠΎΠ²ΠΊΡ pandas Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΠΏΠ°ΠΊΠ΅ΡΠ° , Π²ΡΠ΅ Π³ΠΎΡΠΎΠ²ΠΎ!
ΠΡΠ΄Π΅Ρ Π΄ΠΎΠ²ΠΎΠ»ΡΠ½ΠΎ ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΠ°ΠΊΠ΅ΡΠΎΠ² ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΡ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΠΌ Π² Ρ ΠΎΠ΄Π΅ ΡΡΠΎΠΉ ΡΠ΅ΡΠΈΠΈ.ΠΡΠ»ΠΈ Π²Ρ ΠΏΡΠ΅Π΄ΠΏΠΎΡΠΈΡΠ°Π΅ΡΠ΅ ΡΠΎΡΡΠ΅Π΄ΠΎΡΠΎΡΠΈΡΡΡΡ Π½Π° ΠΊΠΎΠ΄Π΅, Π° Π½Π΅ Π½Π° ΠΏΠΎΠ»ΡΡΠ΅Π½ΠΈΠΈ ΠΏΠ°ΠΊΠ΅ΡΠΎΠ², Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΏΡΠΎΠ²Π΅ΡΠΈΡΡ ΠΏΡΠ΅Π΄Π²Π°ΡΠΈΡΠ΅Π»ΡΠ½ΠΎ ΡΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ ΠΈ ΠΎΠΏΡΠΈΠΌΠΈΠ·ΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ Π΄ΠΈΡΡΡΠΈΠ±ΡΡΠΈΠ² Python ΠΎΡ Activestate, Π² ΠΊΠΎΡΠΎΡΠΎΠΌ Π±ΡΠ΄Π΅Ρ Π²ΡΠ΅, ΡΡΠΎ Π²Π°ΠΌ Π½ΡΠΆΠ½ΠΎ, ΡΡΠΎΠ±Ρ ΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΡ Π²ΠΌΠ΅ΡΡΠ΅ Ρ ΡΡΠΎΠΉ ΡΠ΅ΡΠΈΠ΅ΠΉ. ΠΠΎΠ»ΡΡΠΈΡΠ΅ ActivePython.
ΠΠ°Π²Π°ΠΉΡΠ΅ ΠΏΡΡΠ³Π½Π΅ΠΌ!
ΠΠΉ, ΠΏΠΎΠ΄ΠΎΠΆΠ΄ΠΈ, Π½Π°Π²Π΅ΡΠ½ΠΎΠ΅, Π½Π°ΠΌ ΡΠΎΠΆΠ΅ Π½ΡΠΆΠ΅Π½ Π½Π°Π±ΠΎΡ Π΄Π°Π½Π½ΡΡ .
ΠΠ½ΡΠ΅ΡΠ½Π΅Ρ Π±ΠΈΡΠΊΠΎΠΌ Π½Π°Π±ΠΈΡ Π½Π°Π±ΠΎΡΠ°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ , ΡΠ°ΠΊ ΡΡΠΎ Π΅ΡΡΡ ΠΈΠ· ΡΠ΅Π³ΠΎ Π²ΡΠ±ΠΈΡΠ°ΡΡ. Π― Π»ΠΈΡΠ½ΠΎ ΡΠΎΠ±ΠΈΡΠ°ΡΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π½Π°Π±ΠΎΡΡ Π΄Π°Π½Π½ΡΡ ΠΈΠ· Kaggle .
ΠΡΠ»ΠΈ Π²Ρ Π½Π΅ Π·Π½Π°ΠΊΠΎΠΌΡ, Kaggle - ΡΡΠΎ ΡΠ°ΠΉΡ ΡΠΎΡΠ΅Π²Π½ΠΎΠ²Π°Π½ΠΈΠΉ ΠΏΠΎ Π°Π½Π°Π»ΠΈΠ·Ρ Π΄Π°Π½Π½ΡΡ .Π― Π΄ΡΠΌΠ°Ρ, ΡΡΠΎ Π΅ΡΠ»ΠΈ Π²Ρ Ρ ΠΎΡΠΈΡΠ΅ ΠΏΠΎΠΏΡΠ°ΠΊΡΠΈΠΊΠΎΠ²Π°ΡΡΡΡ Π² Π°Π½Π°Π»ΠΈΠ·Π΅ ΡΠ΅Π°Π»ΡΠ½ΡΡ Π΄Π°Π½Π½ΡΡ , Kaggle - Π»ΡΡΡΠ΅Π΅ ΠΌΠ΅ΡΡΠΎ Π΄Π»Ρ ΡΡΠΎΠ³ΠΎ, Π΄Π°ΠΆΠ΅ Π΅ΡΠ»ΠΈ Π²Ρ Π½Π΅ Ρ ΠΎΡΠΈΡΠ΅ ΡΡΠ°ΡΡΠ²ΠΎΠ²Π°ΡΡ Π² ΡΠΎΡΠ΅Π²Π½ΠΎΠ²Π°Π½ΠΈΡΡ .
ΠΠ½ΠΎΠ³ΠΈΠ΅, Π΅ΡΠ»ΠΈ Π½Π΅ Π±ΠΎΠ»ΡΡΠΈΠ½ΡΡΠ²ΠΎ, ΡΠΎΡΠ΅Π²Π½ΠΎΠ²Π°Π½ΠΈΠΉ Π½Π° Kaggle - ΡΡΠΎ Π°ΠΊΡΡΠ°Π»ΡΠ½ΡΡ ΠΏΡΠΎΠ±Π»Π΅ΠΌ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ. Π’Π°ΠΊΠΈΠ΅ ΠΆΠ΅ Π²Π΅ΡΠΈ, ΠΊΠ°ΠΊ ΠΌΠ΅Π½Ρ ΡΠ°ΡΡΠΎ ΠΏΡΠΎΡΡΡ ΡΠ΄Π΅Π»Π°ΡΡ Π½Π° ΠΊΠΎΠ½ΡΡΠ°ΠΊΡΠ½ΠΎΠΉ ΡΠ°Π±ΠΎΡΠ΅ ΠΈΠ»ΠΈ ΡΡΠΎ Π²Π°Ρ ΠΌΠΎΠ³ΡΡ ΠΏΠΎΠΏΡΠΎΡΠΈΡΡ ΡΠ΄Π΅Π»Π°ΡΡ, Π΅ΡΠ»ΠΈ Π²Ρ Π½Π°ΠΉΠ΄Π΅ΡΠ΅ ΡΠ°Π±ΠΎΡΡ Π°Π½Π°Π»ΠΈΡΠΈΠΊΠ° Π΄Π°Π½Π½ΡΡ . ΠΠ±ΡΡΠ½ΠΎ ΡΡΠΎ Β«Π½Π΅ΡΠ΅ΡΠ΅Π½Π½ΡΠ΅Β» ΠΏΡΠΎΠ±Π»Π΅ΠΌΡ, Π° Π½Π΅ Π±ΠΎΠ»Π΅Π΅ ΠΏΡΠΎΡΡΡΠ΅ ΡΠ΅ΡΠ΅Π½Π½ΡΠ΅ ΠΏΡΠΎΠ±Π»Π΅ΠΌΡ, Ρ ΠΊΠΎΡΠΎΡΡΠΌΠΈ Π²Ρ ΠΎΠ±ΡΡΠ½ΠΎ ΡΡΠ°Π»ΠΊΠΈΠ²Π°Π΅ΡΠ΅ΡΡ Π² ΡΡΠ΅Π±Π½ΡΡ ΠΏΠΎΡΠΎΠ±ΠΈΡΡ .
ΠΠ΅ Π΄ΡΠΌΠ°Ρ, ΡΡΠΎ ΠΌΡ Π³ΠΎΡΠΎΠ²Ρ ΠΊ ΡΠ΅ΠΌΡ-ΡΠΎ ΡΠ΅ΡΡΠ΅Π·Π½ΠΎΠΌΡ, ΠΏΠΎΡΡΠΎΠΌΡ Π΄Π°Π²Π°ΠΉΡΠ΅ Π΄Π»Ρ Π½Π°ΡΠ°Π»Π° Π½Π°ΠΉΠ΄Π΅ΠΌ Π±ΠΎΠ»Π΅Π΅ ΠΏΡΠΎΡΡΠΎΠΉ Π½Π°Π±ΠΎΡ Π΄Π°Π½Π½ΡΡ . Π§ΡΠΎΠ±Ρ Π½Π°ΠΉΡΠΈ Π½Π°Π±ΠΎΡΡ Π΄Π°Π½Π½ΡΡ , ΠΎΠ·Π½Π°ΠΊΠΎΠΌΡΡΠ΅ΡΡ Ρ Π½Π°Π±ΠΎΡΠΎΠΌ Π΄Π°Π½Π½ΡΡ Kaggle . Π’ΠΎΠ½Π½Ρ Π²ΠΊΡΡΠ½ΠΎΡΡΠ΅ΠΉ Π·Π΄Π΅ΡΡ.
ΠΠ»Ρ Π½Π°ΡΠ°Π»Π° Π΄Π°Π²Π°ΠΉΡΠ΅ ΠΏΠΎΡΠΌΠΎΡΡΠΈΠΌ Π½Π° Avocado Price . ΠΠ±ΡΠΎΠ»ΡΡΠ½ΠΎ ΠΎΠ±ΠΎΠΆΠ°Ρ Π°Π²ΠΎΠΊΠ°Π΄ΠΎ! ΠΡ Π·Π½Π°Π»ΠΈ, ΡΡΠΎ Π°Π²ΠΎΠΊΠ°Π΄ΠΎ - ΡΡΠΎ ΡΡΡΠΊΡ? ΠΠ°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΡΡΡΠΎΠ³ΠΎ ΠΊΠ»Π°ΡΡΠΈΡΠΈΡΠΈΡΡΠ΅ΡΡΡ ΠΊΠ°ΠΊ ... ΡΠ³ΠΎΠ΄Π°! ΠΡΠ΅Π΄ΡΡΠ°Π²ΡΡΠ΅ ΡΠ΅Π±Π΅, ΡΡΠΎ Π²Ρ ΠΏΠΎΠ»ΡΡΠ°Π΅ΡΠ΅ ΡΡΠΎ-ΡΠΎ ΡΠΎ Π²ΠΊΡΡΠΎΠΌ Β«ΡΠΌΠ΅ΡΠ°Π½Π½ΡΡ ΡΠ³ΠΎΠ΄Β», Π° ΡΠ°ΠΌ Π°Π²ΠΎΠΊΠ°Π΄ΠΎ. Π₯Π°!
Π Π»ΡΠ±ΠΎΠΌ ΡΠ»ΡΡΠ°Π΅ Π·Π°Π³ΡΡΠ·ΠΈΡΠ΅ ΡΡΠΎΡ Π½Π°Π±ΠΎΡ Π΄Π°Π½Π½ΡΡ .ΠΠ°ΠΌ Π½ΡΠΆΠ½ΠΎ Π±ΡΠ΄Π΅Ρ Π²ΠΎΠΉΡΠΈ / ΡΠΎΠ·Π΄Π°ΡΡ ΡΡΠ΅ΡΠ½ΡΡ Π·Π°ΠΏΠΈΡΡ, ΡΡΠΎΠ±Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Kaggle, Π½ΠΎ Π²Ρ Π΄ΠΎΠ»ΠΆΠ½Ρ ΡΡΠΎ ΡΠ΄Π΅Π»Π°ΡΡ. ΠΡΠ»ΠΈ ΠΏΠΎ ΠΊΠ°ΠΊΠΎΠΉ-Π»ΠΈΠ±ΠΎ ΠΏΡΠΈΡΠΈΠ½Π΅ Π²Ρ ΡΡΠΎΠ³ΠΎ Π½Π΅ Ρ ΠΎΡΠΈΡΠ΅ ΠΈΠ»ΠΈ Π½Π°Π±ΠΎΡ Π΄Π°Π½Π½ΡΡ ΠΎΡΡΡΡΡΡΠ²ΡΠ΅Ρ, Ρ ΡΠ°ΠΊΠΆΠ΅ ΡΠ°Π·ΠΌΠ΅ΡΡ Π΅Π³ΠΎ Π·Π΄Π΅ΡΡ: Π¦Π΅Π½Ρ Π½Π° Π°Π²ΠΎΠΊΠ°Π΄ΠΎ .
Π Π°ΡΠΏΠ°ΠΊΡΠΉΡΠ΅ ΡΠ°ΠΉΠ», ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ Π²ΡΠ΅, ΡΡΠΎ Π²Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΠ΅ Π΄Π»Ρ Π°ΡΡ ΠΈΠ²ΠΈΡΠΎΠ²Π°Π½ΠΈΡ / ΡΠ°ΡΠΏΠ°ΠΊΠΎΠ²ΠΊΠΈ, ΠΈ Ρ Π²Π°Ρ ΠΎΡΡΠ°Π½Π΅ΡΡΡ ΡΠ°ΠΉΠ» CSV.
Π€Π°ΠΉΠ»Ρ CSV
- ΡΡΠΎ ΠΎΡΠ΅Π½Ρ ΡΠ°ΡΠΏΡΠΎΡΡΡΠ°Π½Π΅Π½Π½ΡΠ΅ ΡΠΈΠΏΡ ΡΠ°ΠΉΠ»ΠΎΠ², ΠΊΠΎΡΠΎΡΡΠ΅ Π²Ρ Π½Π°ΠΉΠ΄Π΅ΡΠ΅ ΠΏΡΠΈ Π°Π½Π°Π»ΠΈΠ·Π΅ Π΄Π°Π½Π½ΡΡ . Π‘ΡΡΡΠΊΡΡΡΠ° CSV ΠΈΠΌΠ΅Π΅Ρ ΡΠ΅Π½Π΄Π΅Π½ΡΠΈΡ Π±ΡΡΡ ΠΎΡΠ³Π°Π½ΠΈΠ·ΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΏΠΎ ΡΡΠΎΠ»Π±ΡΠ°ΠΌ ΠΈ ΡΡΡΠΎΠΊΠ°ΠΌ, Π³Π΄Π΅ Π² ΡΠ°ΠΌΠΎΠΌ ΡΠ°ΠΉΠ»Π΅ Π΅ΡΡΡ Π·Π½Π°ΡΠ΅Π½ΠΈΡ, ΡΠ°Π·Π΄Π΅Π»Π΅Π½Π½ΡΠ΅ Π·Π°ΠΏΡΡΡΠΌΠΈ (ΡΠΉ, ΡΡΠΎ ΠΎΡΠΊΡΠ΄Π° ΠΈΠΌΡ CSV!?!), Π Π·Π°ΡΠ΅ΠΌ ΡΡΡΠΎΠΊΠΈ ΡΠ°Π·Π΄Π΅Π»ΡΡΡΡΡ Π½ΠΎΠ²ΡΠΌΠΈ ΡΡΡΠΎΠΊΠ°ΠΌΠΈ Π² Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ΅.ΠΡΠ°ΠΊ, Π΄Π°Π²Π°ΠΉΡΠ΅ ΠΏΡΠΎΡΠΈΡΠ°Π΅ΠΌ ΡΡΠΎΡ csv Ρ ΠΏΠΎΠΌΠΎΡΡΡ Pandas.
Π ΠΏΠΎΠΊΠ° Π΄Π°Π²Π°ΠΉΡΠ΅ ΡΠ±Π΅Π΄ΠΈΠΌΡΡ, ΡΡΠΎ Π½Π°Ρ ΡΠ°ΠΉΠ» Π½Π°Ρ
ΠΎΠ΄ΠΈΡΡΡ Π² ΡΠΎΠΌ ΠΆΠ΅ ΡΠ°Π±ΠΎΡΠ΅ΠΌ ΠΊΠ°ΡΠ°Π»ΠΎΠ³Π΅, ΡΡΠΎ ΠΈ Π½Π°Ρ ΡΠΊΡΠΈΠΏΡ Python, ΠΈΠ»ΠΈ Π² ΠΊΠ°ΡΠ°Π»ΠΎΠ³Π΅ ΡΠΈΠΏΠ° Β«Π½Π°Π±ΠΎΡΡ Π΄Π°Π½Π½ΡΡ
Β». Π― Π±ΡΠ΄Ρ Π΄Π΅Π»Π°ΡΡ ΠΏΠΎΡΠ»Π΅Π΄Π½Π΅Π΅, Π½ΠΎ Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ Π΄Π΅Π»Π°ΡΡ Π²ΡΠ΅, ΡΡΠΎ Ρ
ΠΎΡΠΈΡΠ΅. ΠΡΠ°ΠΊ, Π΄Π»Ρ Π½Π°ΡΠ°Π»Π° Ρ Π½Π°Ρ Π΅ΡΡΡ ΡΠ°ΠΉΠ» Ρ ΠΈΠΌΠ΅Π½Π΅ΠΌ avocado.csv
, ΠΈ ΠΌΡ Ρ
ΠΎΡΠΈΠΌ Π·Π°Π³ΡΡΠ·ΠΈΡΡ Π΅Π³ΠΎ Π² pandas. ΠΡΠΎ ΡΠ°ΠΉΠ» CSV, ΡΠ°ΠΊ ΡΡΠΎ ΠΎΠ½ ΡΠΆΠ΅ Π² ΡΠΎΡΠΌΠ°ΡΠ΅ ΡΡΠΎΠ»Π±ΡΠΎΠ² ΠΈ ΡΡΡΠΎΠΊ, ΠΌΡ ΠΏΡΠΎΡΡΠΎ Ρ
ΠΎΡΠΈΠΌ Π·Π°Π³ΡΡΠ·ΠΈΡΡ Π΅Π³ΠΎ Π² ΡΡΠ΅ΠΉΠΌ Π΄Π°Π½Π½ΡΡ
pandas .
ΠΠ»Ρ ΡΡΠΎΠ³ΠΎ Π²ΠΎΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΡΡ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠΌ read_csv
.ΠΠΎΡΠΌΠΎΡΡΠΈΠΌ, ΠΊΠ°ΠΊ ΡΡΠΎ ΡΠ°Π±ΠΎΡΠ°Π΅Ρ. Π― ΡΠΎΠ±ΠΈΡΠ°ΡΡΡ ΡΠ΄Π΅Π»Π°ΡΡ ΡΡΠΎ Π² Jupyter Notebook. ΠΡ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π»ΡΠ±ΠΎΠΉ ΡΠ΅Π΄Π°ΠΊΡΠΎΡ, ΠΊΠΎΡΠΎΡΡΠΉ Π²Π°ΠΌ Π½ΡΠ°Π²ΠΈΡΡΡ, Π½ΠΎ Π·Π°ΠΏΠΈΡΠ½ΡΠ΅ ΠΊΠ½ΠΈΠΆΠΊΠΈ Jupyer Π΄ΠΎΠ²ΠΎΠ»ΡΠ½ΠΎ ΠΏΠΎΠ»Π΅Π·Π½Ρ Π΄Π»Ρ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ
ΠΈ ΠΏΡΠΎΡΡΠΎ Π΄Π»Ρ ΠΎΠ±ΡΠ΅Π³ΠΎ ΠΏΠΎΠΈΡΠΊΠ° Π΄Π°Π½Π½ΡΡ
. Π§ΡΠΎΠ±Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΈΡ
, Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΏΡΠΎΡΡΠΎ Π½Π°Π±ΡΠ°ΡΡ:
pip install jupyterlab
ΠΠ°ΡΠ΅ΠΌ Π² ΡΠ΅ΡΠΌΠΈΠ½Π°Π»Π΅ / ΠΊΠΎΠΌΠ°Π½Π΄Π½ΠΎΠΉ ΡΡΡΠΎΠΊΠ΅ Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΡΠ΄Π΅Π»Π°ΡΡ:
Π»Π°Π±ΠΎΡΠ°ΡΠΎΡΠΈΡ jupyter
ΠΠ°ΡΠ΅ΠΌ Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ Π²ΡΠ±ΡΠ°ΡΡ ΡΠ°ΠΉΠ»> Π½ΠΎΠ²ΡΠΉ> Π±Π»ΠΎΠΊΠ½ΠΎΡ, Π²ΡΠ±ΡΠ°ΡΡ Python 3, ΠΈ Π²ΡΠ΅ Π³ΠΎΡΠΎΠ²ΠΎ! ΠΠ°ΡΠ½Π΅ΠΌ Ρ Π·Π°Π³ΡΡΠ·ΠΊΠΈ Π² ΡΠ°ΠΉΠ».
3 ΠΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ | R Π΄Π»Ρ Π½Π°ΡΠΊΠΈ ΠΎ Π΄Π°Π½Π½ΡΡ
ΠΠ²Π΅Π΄Π΅Π½ΠΈΠ΅
Β«ΠΡΠΎΡΡΠΎΠΉ Π³ΡΠ°ΡΠΈΠΊ ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²ΠΈΠ» Π°Π½Π°Π»ΠΈΡΠΈΠΊΠ°ΠΌ Π±ΠΎΠ»ΡΡΠ΅ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ.
ΡΠ΅ΠΌ Π»ΡΠ±ΠΎΠ΅ Π΄ΡΡΠ³ΠΎΠ΅ ΡΡΡΡΠΎΠΉΡΡΠ²ΠΎ Β». - ΠΠΆΠΎΠ½ Π’ΡΡΠΊΠΈ
ΠΡΠ° Π³Π»Π°Π²Π° Π½Π°ΡΡΠΈΡ Π²Π°Ρ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ Π΄Π°Π½Π½ΡΠ΅ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ggplot2. Π R Π΅ΡΡΡ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΠΈΡΡΠ΅ΠΌ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ², Π½ΠΎ ggplot2 - ΠΎΠ΄Π½Π° ΠΈΠ· ΡΠ°ΠΌΡΡ ΡΠ»Π΅Π³Π°Π½ΡΠ½ΡΡ ΠΈ ΡΠ½ΠΈΠ²Π΅ΡΡΠ°Π»ΡΠ½ΡΡ . ggplot2 ΡΠ΅Π°Π»ΠΈΠ·ΡΠ΅Ρ Π³ΡΠ°ΠΌΠΌΠ°ΡΠΈΠΊΡ Π³ΡΠ°ΡΠΈΠΊΠΈ , ΡΠΎΠ³Π»Π°ΡΠΎΠ²Π°Π½Π½ΡΡ ΡΠΈΡΡΠ΅ΠΌΡ Π΄Π»Ρ ΠΎΠΏΠΈΡΠ°Π½ΠΈΡ ΠΈ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ².Π‘ ggplot2 Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ Π΄Π΅Π»Π°ΡΡ Π±ΠΎΠ»ΡΡΠ΅ Π±ΡΡΡΡΠ΅Π΅, ΠΈΠ·ΡΡΠ°Ρ ΠΎΠ΄Π½Ρ ΡΠΈΡΡΠ΅ΠΌΡ ΠΈ ΠΏΡΠΈΠΌΠ΅Π½ΡΡ Π΅Π΅ Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ ΠΌΠ΅ΡΡΠ°Ρ .
ΠΡΠ»ΠΈ Π²Ρ Ρ ΠΎΡΠΈΡΠ΅ ΡΠ·Π½Π°ΡΡ Π±ΠΎΠ»ΡΡΠ΅ ΠΎ ΡΠ΅ΠΎΡΠ΅ΡΠΈΡΠ΅ΡΠΊΠΈΡ ΠΎΡΠ½ΠΎΠ²Π°Ρ ggplot2 ΠΏΠ΅ΡΠ΅Π΄ ΡΠ΅ΠΌ, ΠΊΠ°ΠΊ Π½Π°ΡΠ°ΡΡ, Ρ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡΡ ΠΏΡΠΎΡΠΈΡΠ°ΡΡ Β«ΠΠ½ΠΎΠ³ΠΎΡΠ»ΠΎΠΉΠ½Π°Ρ Π³ΡΠ°ΠΌΠΌΠ°ΡΠΈΠΊΠ° Π³ΡΠ°ΡΠΈΠΊΠΈΒ», http://vita.had.co.nz/papers/layered-grammar. pdf.
ΠΡΠ΅Π΄ΠΏΠΎΡΡΠ»ΠΊΠΈ
Π ΡΡΠΎΠΉ Π³Π»Π°Π²Π΅ ΠΎΡΠ½ΠΎΠ²Π½ΠΎΠ΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ ΡΠ΄Π΅Π»ΡΠ΅ΡΡΡ ggplot2, ΠΎΠ΄Π½ΠΎΠΌΡ ΠΈΠ· ΠΎΡΠ½ΠΎΠ²Π½ΡΡ ΡΠ»Π΅Π½ΠΎΠ² ΡΠΈΠ΄ΠΈΠ²Π΅ΡΡΠΈΠΈ. Π§ΡΠΎΠ±Ρ ΠΏΠΎΠ»ΡΡΠΈΡΡ Π΄ΠΎΡΡΡΠΏ ΠΊ Π½Π°Π±ΠΎΡΠ°ΠΌ Π΄Π°Π½Π½ΡΡ , ΡΡΡΠ°Π½ΠΈΡΠ°ΠΌ ΡΠΏΡΠ°Π²ΠΊΠΈ ΠΈ ΡΡΠ½ΠΊΡΠΈΡΠΌ, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΡ Π±ΡΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π² ΡΡΠΎΠΉ Π³Π»Π°Π²Π΅, Π·Π°Π³ΡΡΠ·ΠΈΡΠ΅ ΡΠΈΠ΄ΠΈΠ²Π΅ΡΡ, Π·Π°ΠΏΡΡΡΠΈΠ² ΡΡΠΎΡ ΠΊΠΎΠ΄:
Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° (tidyverse)
#> ββ ΠΡΠΈΡΠΎΠ΅Π΄ΠΈΠ½Π΅Π½ΠΈΠ΅ ΠΏΠ°ΠΊΠ΅ΡΠΎΠ² ββββββββββββββββββββββββββββββββββββββββ tidyverse 1.3.0 ββ
#> β ggplot2 3.3.2 β ΠΌΡΡΠ»ΡΠΊΠ°ΡΡ 0.3.4
#> β tibble 3.0.3 β dplyr 1.0.2
#> β ΡΠΈΠ΄ΡΡ 1.1.2 β ΡΡΡΠΈΠ½Π³Π΅Ρ 1.4.0
#> β readr 1.4.0 β forcats 0.5.0
#> ββ ΠΠΎΠ½ΡΠ»ΠΈΠΊΡΡ βββββββββββββββββββββββββββββββββββββββββββ tidyverse_conflicts () ββ
#> β dplyr :: filter () ΠΌΠ°ΡΠΊΠΈΡΡΠ΅Ρ stats :: filter ()
#> β dplyr :: lag () ΠΌΠ°ΡΠΊΠΈ stats :: lag ()
ΠΡΠ° ΠΎΠ΄Π½Π° ΡΡΡΠΎΠΊΠ° ΠΊΠΎΠ΄Π° Π·Π°Π³ΡΡΠΆΠ°Π΅Ρ ΠΎΡΠ½ΠΎΠ²Π½ΠΎΠΉ ΡΠΈΠ΄ΠΈΠ²Π΅ΡΡ; ΠΏΠ°ΠΊΠ΅ΡΡ, ΠΊΠΎΡΠΎΡΡΠ΅ Π²Ρ Π±ΡΠ΄Π΅ΡΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΏΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈ ΠΏΡΠΈ ΠΊΠ°ΠΆΠ΄ΠΎΠΌ Π°Π½Π°Π»ΠΈΠ·Π΅ Π΄Π°Π½Π½ΡΡ . ΠΠ½ ΡΠ°ΠΊΠΆΠ΅ ΡΠΎΠΎΠ±ΡΠ°Π΅Ρ Π²Π°ΠΌ, ΠΊΠ°ΠΊΠΈΠ΅ ΡΡΠ½ΠΊΡΠΈΠΈ ΠΈΠ· ΡΠΈΠ΄ΠΈΠ²Π΅ΡΡΠ° ΠΊΠΎΠ½ΡΠ»ΠΈΠΊΡΡΡΡ Ρ ΡΡΠ½ΠΊΡΠΈΡΠΌΠΈ Π² Π±Π°Π·ΠΎΠ²ΠΎΠΌ R (ΠΈΠ»ΠΈ ΠΈΠ· Π΄ΡΡΠ³ΠΈΡ ΠΏΠ°ΠΊΠ΅ΡΠΎΠ², ΠΊΠΎΡΠΎΡΡΠ΅ Π²Ρ ΠΌΠΎΠ³Π»ΠΈ Π·Π°Π³ΡΡΠ·ΠΈΡΡ).
ΠΡΠ»ΠΈ Π²Ρ Π·Π°ΠΏΡΡΡΠΈΡΠ΅ ΡΡΠΎΡ ΠΊΠΎΠ΄ ΠΈ ΠΏΠΎΠ»ΡΡΠΈΡΠ΅ ΡΠΎΠΎΠ±ΡΠ΅Π½ΠΈΠ΅ ΠΎΠ± ΠΎΡΠΈΠ±ΠΊΠ΅ Β«ΠΠ΅Ρ ΠΏΠ°ΠΊΠ΅ΡΠ° Ρ ΠΈΠΌΠ΅Π½Π΅ΠΌΒ« tidyverse »», Π²Π°ΠΌ Π½ΡΠΆΠ½ΠΎ ΡΠ½Π°ΡΠ°Π»Π° ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ Π΅Π³ΠΎ, Π° Π·Π°ΡΠ΅ΠΌ ΡΠ½ΠΎΠ²Π° Π·Π°ΠΏΡΡΡΠΈΡΡ library ()
.
ΠΠ°ΠΌ Π½ΡΠΆΠ½ΠΎ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ ΠΏΠ°ΠΊΠ΅Ρ ΡΠΎΠ»ΡΠΊΠΎ ΠΎΠ΄ΠΈΠ½ ΡΠ°Π·, Π½ΠΎ Π²Π°ΠΌ Π½ΡΠΆΠ½ΠΎ ΠΏΠ΅ΡΠ΅Π·Π°Π³ΡΡΠΆΠ°ΡΡ Π΅Π³ΠΎ ΠΊΠ°ΠΆΠ΄ΡΠΉ ΡΠ°Π·, ΠΊΠΎΠ³Π΄Π° Π²Ρ Π½Π°ΡΠΈΠ½Π°Π΅ΡΠ΅ Π½ΠΎΠ²ΡΠΉ ΡΠ΅Π°Π½Ρ.
ΠΡΠ»ΠΈ Π½Π°ΠΌ Π½ΡΠΆΠ½ΠΎ ΡΠΎΡΠ½ΠΎ ΡΠΊΠ°Π·Π°ΡΡ, ΠΎΡΠΊΡΠ΄Π° Π²Π·ΡΠ»Π°ΡΡ ΡΡΠ½ΠΊΡΠΈΡ (ΠΈΠ»ΠΈ Π½Π°Π±ΠΎΡ Π΄Π°Π½Π½ΡΡ
), ΠΌΡ Π²ΠΎΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΡΡ ΡΠΏΠ΅ΡΠΈΠ°Π»ΡΠ½ΠΎΠΉ ΡΠΎΡΠΌΠΎΠΉ package :: function ()
. ΠΠ°ΠΏΡΠΈΠΌΠ΅Ρ, ggplot2 :: ggplot ()
ΡΠ²Π½ΠΎ ΡΠΎΠΎΠ±ΡΠ°Π΅Ρ Π²Π°ΠΌ, ΡΡΠΎ ΠΌΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ ΡΡΠ½ΠΊΡΠΈΡ ggplot ()
ΠΈΠ· ΠΏΠ°ΠΊΠ΅ΡΠ° ggplot2.
ΠΠ΅ΡΠ²ΡΠ΅ ΡΠ°Π³ΠΈ
ΠΠ°Π²Π°ΠΉΡΠ΅ Π²ΠΎΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΡΡ Π½Π°ΡΠΈΠΌ ΠΏΠ΅ΡΠ²ΡΠΌ Π³ΡΠ°ΡΠΈΠΊΠΎΠΌ, ΡΡΠΎΠ±Ρ ΠΎΡΠ²Π΅ΡΠΈΡΡ Π½Π° Π²ΠΎΠΏΡΠΎΡ: Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»ΠΈ Ρ Π±ΠΎΠ»ΡΡΠΈΠΌΠΈ Π΄Π²ΠΈΠ³Π°ΡΠ΅Π»ΡΠΌΠΈ ΠΏΠΎΡΡΠ΅Π±Π»ΡΡΡ Π±ΠΎΠ»ΡΡΠ΅ ΡΠΎΠΏΠ»ΠΈΠ²Π°, ΡΠ΅ΠΌ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»ΠΈ Ρ ΠΌΠ°Π»Π΅Π½ΡΠΊΠΈΠΌΠΈ Π΄Π²ΠΈΠ³Π°ΡΠ΅Π»ΡΠΌΠΈ? ΠΠ΅ΡΠΎΡΡΠ½ΠΎ, Ρ Π²Π°Ρ ΡΠΆΠ΅ Π΅ΡΡΡ ΠΎΡΠ²Π΅Ρ, Π½ΠΎ ΠΏΠΎΡΡΠ°ΡΠ°ΠΉΡΠ΅ΡΡ Π΄Π°ΡΡ ΡΠΎΡΠ½ΡΠΉ ΠΎΡΠ²Π΅Ρ. ΠΠ°ΠΊ Π²ΡΠ³Π»ΡΠ΄ΠΈΡ Π²Π·Π°ΠΈΠΌΠΎΡΠ²ΡΠ·Ρ ΠΌΠ΅ΠΆΠ΄Ρ ΠΎΠ±ΡΠ΅ΠΌΠΎΠΌ Π΄Π²ΠΈΠ³Π°ΡΠ΅Π»Ρ ΠΈ ΡΠΎΠΏΠ»ΠΈΠ²Π½ΠΎΠΉ ΡΠΊΠΎΠ½ΠΎΠΌΠΈΡΠ½ΠΎΡΡΡΡ? ΠΡΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡΠ΅Π»ΡΠ½ΠΎ? ΠΡΡΠΈΡΠ°ΡΠ΅Π»ΡΠ½ΡΠΉ? ΠΠΈΠ½Π΅ΠΉΠ½ΡΠΉ? ΠΠ΅Π»ΠΈΠ½Π΅ΠΉΠ½ΡΠΉ?
Π€ΡΠ΅ΠΉΠΌ Π΄Π°Π½Π½ΡΡ
mpg
ΠΡ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΏΡΠΎΠ²Π΅ΡΠΈΡΡ ΡΠ²ΠΎΠΉ ΠΎΡΠ²Π΅Ρ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΡΡΠ΅ΠΉΠΌΠ° Π΄Π°Π½Π½ΡΡ
mpg
, Π½Π°ΠΉΠ΄Π΅Π½Π½ΠΎΠ³ΠΎ Π² ggplot2 (ΠΎΠ½ ΠΆΠ΅ ggplot2 :: mpg
).Π€ΡΠ΅ΠΉΠΌ Π΄Π°Π½Π½ΡΡ
- ΡΡΠΎ ΠΏΡΡΠΌΠΎΡΠ³ΠΎΠ»ΡΠ½ΡΠΉ Π½Π°Π±ΠΎΡ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ
(Π² ΡΡΠΎΠ»Π±ΡΠ°Ρ
) ΠΈ Π½Π°Π±Π»ΡΠ΄Π΅Π½ΠΈΠΉ (Π² ΡΡΡΠΎΠΊΠ°Ρ
). ΠΌΠΈΠ»Ρ Π½Π° Π³Π°Π»Π»ΠΎΠ½
ΡΠΎΠ΄Π΅ΡΠΆΠΈΡ Π½Π°Π±Π»ΡΠ΄Π΅Π½ΠΈΡ, ΡΠΎΠ±ΡΠ°Π½Π½ΡΠ΅ ΠΠ³Π΅Π½ΡΡΡΠ²ΠΎΠΌ ΠΏΠΎ ΠΎΡ
ΡΠ°Π½Π΅ ΠΎΠΊΡΡΠΆΠ°ΡΡΠ΅ΠΉ ΡΡΠ΅Π΄Ρ Π‘Π¨Π Π½Π° 38 ΠΌΠΎΠ΄Π΅Π»ΡΡ
Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»Π΅ΠΉ.
ΠΌΠΈΠ»Ρ Π½Π° Π³Π°Π»Π»ΠΎΠ½
#> # Π’Π°Π±Π»ΠΈΡΠ°: 234 x 11
#> ΠΌΠΎΠ΄Π΅Π»Ρ ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡΠ΅Π»Ρ displ Π³ΠΎΠ΄ cyl trans drv cty hwy fl class
#>
#> 1 audi a4 1.8 1999 4 Π°Π²ΡΠΎ (l5) f 18 29 p ΠΊΠΎΠΌΠΏΠ°β¦
#> 2 audi a4 1.8 1999 4 ΠΌΠ΅Ρ
Π°Π½ΠΈΠΊΠ° (m5) f 21 29 p compaβ¦
#> 3 audi a4 2 2008 4 ΠΌΠ΅Ρ
Π°Π½ΠΈΠΊΠ° (m6) f 20 31 p compaβ¦
#> 4 audi a4 2 2008 4 auto (av) f 21 30 p compaβ¦
#> 5 audi a4 2.8 1999 6 auto (l5) f 16 26 p compaβ¦
#> 6 audi a4 2.8 1999 6 ΠΌΠ΅Ρ
Π°Π½ΠΈΠΊΠ° (m5) f 18 26 p compaβ¦
#> #β¦ Π‘ Π΅ΡΠ΅ 228 ΡΡΡΠΎΠΊΠ°ΠΌΠΈ
Π‘ΡΠ΅Π΄ΠΈ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ
Π² ΠΌΠΈΠ»Ρ Π½Π° Π³Π°Π»Π»ΠΎΠ½
ΡΠ»Π΅Π΄ΡΡΡΠΈΠ΅:
displ
- ΠΎΠ±ΡΠ΅ΠΌ Π΄Π²ΠΈΠ³Π°ΡΠ΅Π»Ρ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»Ρ Π² Π»ΠΈΡΡΠ°Ρ .hwy
- ΡΠΎΠΏΠ»ΠΈΠ²Π½Π°Ρ ΡΠΊΠΎΠ½ΠΎΠΌΠΈΡΠ½ΠΎΡΡΡ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»Ρ Π½Π° ΡΠΎΡΡΠ΅, Π² ΠΌΠΈΠ»ΡΡ Π½Π° Π³Π°Π»Π»ΠΎΠ½ (ΠΌΠΈΠ»Ρ Π½Π° Π³Π°Π»Π»ΠΎΠ½).
ΠΠ²ΡΠΎΠΌΠΎΠ±ΠΈΠ»Ρ Ρ Π½ΠΈΠ·ΠΊΠΈΠΌ ΠΠΠ ΠΏΠΎΡΡΠ΅Π±Π»ΡΠ΅Ρ Π±ΠΎΠ»ΡΡΠ΅ ΡΠΎΠΏΠ»ΠΈΠ²Π°, ΡΠ΅ΠΌ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»Ρ Ρ Π²ΡΡΠΎΠΊΠΈΠΌ ΠΠΠ.
ΡΠΎΠΏΠ»ΠΈΠ²Π½Π°Ρ ΡΠΊΠΎΠ½ΠΎΠΌΠΈΡΠ½ΠΎΡΡΡ, ΠΊΠΎΠ³Π΄Π° ΠΎΠ½ΠΈ Π΅Π΄ΡΡ Π½Π° ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎΠ΅ ΡΠ°ΡΡΡΠΎΡΠ½ΠΈΠ΅.
Π§ΡΠΎΠ±Ρ ΡΠ·Π½Π°ΡΡ Π±ΠΎΠ»ΡΡΠ΅ ΠΎ ΠΌΠΈΠ»Ρ Π½Π° Π³Π°Π»Π»ΠΎΠ½
, ΠΎΡΠΊΡΠΎΠΉΡΠ΅ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡΡΡ ΡΡΡΠ°Π½ΠΈΡΡ ΡΠΏΡΠ°Π²ΠΊΠΈ, Π·Π°ΠΏΡΡΡΠΈΠ² ? Mpg
.
Π‘ΠΎΠ·Π΄Π°Π½ΠΈΠ΅ ggplot
Π§ΡΠΎΠ±Ρ ΠΏΠΎΡΡΡΠΎΠΈΡΡ ΠΌΠΈΠ»Ρ Π½Π° Π³Π°Π»Π»ΠΎΠ½ , Π·Π°ΠΏΡΡΡΠΈΡΠ΅ ΡΡΠΎΡ ΠΊΠΎΠ΄, ΡΡΠΎΠ±Ρ ΠΏΠΎΠΌΠ΅ΡΡΠΈΡΡ displ
Π½Π° ΠΎΡΡ x ΠΈ hwy
Π½Π° ΠΎΡΡ y:
ggplot (Π΄Π°Π½Π½ΡΠ΅ = ΠΌΠΈΠ»Ρ Π½Π° Π³Π°Π»Π»ΠΎΠ½) +
geom_point (ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ = aes (x = displ, y = hwy))
ΠΡΠ°ΡΠΈΠΊ ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°Π΅Ρ ΠΎΡΡΠΈΡΠ°ΡΠ΅Π»ΡΠ½ΡΡ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΡ ΠΌΠ΅ΠΆΠ΄Ρ ΠΎΠ±ΡΠ΅ΠΌΠΎΠΌ Π΄Π²ΠΈΠ³Π°ΡΠ΅Π»Ρ ( displ
) ΠΈ ΡΠΎΠΏΠ»ΠΈΠ²Π½ΠΎΠΉ ΡΠΊΠΎΠ½ΠΎΠΌΠΈΡΠ½ΠΎΡΡΡΡ ( hwy
).ΠΡΡΠ³ΠΈΠΌΠΈ ΡΠ»ΠΎΠ²Π°ΠΌΠΈ, Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»ΠΈ Ρ Π±ΠΎΠ»ΡΡΠΈΠΌΠΈ Π΄Π²ΠΈΠ³Π°ΡΠ΅Π»ΡΠΌΠΈ ΠΏΠΎΡΡΠ΅Π±Π»ΡΡΡ Π±ΠΎΠ»ΡΡΠ΅ ΡΠΎΠΏΠ»ΠΈΠ²Π°. ΠΠΎΠ΄ΡΠ²Π΅ΡΠΆΠ΄Π°Π΅Ρ Π»ΠΈ ΡΡΠΎ ΠΈΠ»ΠΈ ΠΎΠΏΡΠΎΠ²Π΅ΡΠ³Π°Π΅Ρ Π²Π°ΡΡ Π³ΠΈΠΏΠΎΡΠ΅Π·Ρ ΠΎ ΡΠΎΠΏΠ»ΠΈΠ²Π½ΠΎΠΉ ΡΠΊΠΎΠ½ΠΎΠΌΠΈΡΠ½ΠΎΡΡΠΈ ΠΈ ΠΎΠ±ΡΠ΅ΠΌΠ΅ Π΄Π²ΠΈΠ³Π°ΡΠ΅Π»Ρ?
Π‘ ΠΏΠΎΠΌΠΎΡΡΡ ggplot2 Π²Ρ Π½Π°ΡΠΈΠ½Π°Π΅ΡΠ΅ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ Π³ΡΠ°ΡΠΈΠΊΠ° Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΡΡΠ½ΠΊΡΠΈΠΈ ggplot ()
. ggplot ()
ΡΠΎΠ·Π΄Π°Π΅Ρ ΡΠΈΡΡΠ΅ΠΌΡ ΠΊΠΎΠΎΡΠ΄ΠΈΠ½Π°Ρ, Π² ΠΊΠΎΡΠΎΡΡΡ Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ Π΄ΠΎΠ±Π°Π²Π»ΡΡΡ ΡΠ»ΠΎΠΈ. ΠΠ΅ΡΠ²ΡΠΉ Π°ΡΠ³ΡΠΌΠ΅Π½Ρ ggplot ()
— ΡΡΠΎ Π½Π°Π±ΠΎΡ Π΄Π°Π½Π½ΡΡ
Π΄Π»Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ Π² Π³ΡΠ°ΡΠΈΠΊΠ΅. ΠΡΠ°ΠΊ, ggplot (data = mpg)
ΡΠΎΠ·Π΄Π°Π΅Ρ ΠΏΡΡΡΠΎΠΉ Π³ΡΠ°ΡΠΈΠΊ, Π½ΠΎ ΡΡΠΎ Π½Π΅ ΠΎΡΠ΅Π½Ρ ΠΈΠ½ΡΠ΅ΡΠ΅ΡΠ½ΠΎ, ΠΏΠΎΡΡΠΎΠΌΡ Ρ Π½Π΅ ΡΠΎΠ±ΠΈΡΠ°ΡΡΡ Π΅Π³ΠΎ Π·Π΄Π΅ΡΡ ΠΏΠΎΠΊΠ°Π·ΡΠ²Π°ΡΡ.
ΠΡ Π·Π°Π²Π΅ΡΡΠ°Π΅ΡΠ΅ ΡΠ²ΠΎΠΉ Π³ΡΠ°ΡΠΈΠΊ, Π΄ΠΎΠ±Π°Π²Π»ΡΡ ΠΎΠ΄ΠΈΠ½ ΠΈΠ»ΠΈ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΠ»ΠΎΠ΅Π² Π² ggplot ()
. Π€ΡΠ½ΠΊΡΠΈΡ geom_point ()
Π΄ΠΎΠ±Π°Π²Π»ΡΠ΅Ρ ΡΠ»ΠΎΠΉ ΡΠΎΡΠ΅ΠΊ ΠΊ Π²Π°ΡΠ΅ΠΌΡ Π³ΡΠ°ΡΠΈΠΊΡ, ΠΊΠΎΡΠΎΡΡΠΉ ΡΠΎΠ·Π΄Π°Π΅Ρ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ ΡΠ°ΡΡΠ΅ΡΠ½ΠΈΡ. ggplot2 ΠΏΠΎΡΡΠ°Π²Π»ΡΠ΅ΡΡΡ Ρ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎΠΌ ΡΡΠ½ΠΊΡΠΈΠΉ geom, ΠΊΠ°ΠΆΠ΄Π°Ρ ΠΈΠ· ΠΊΠΎΡΠΎΡΡΡ
Π΄ΠΎΠ±Π°Π²Π»ΡΠ΅Ρ ΠΊ Π³ΡΠ°ΡΠΈΠΊΡ ΡΠ°Π·Π½ΡΠ΅ ΡΠΈΠΏΡ ΡΠ»ΠΎΠ΅Π². Π ΡΡΠΎΠΉ Π³Π»Π°Π²Π΅ Π²Ρ ΡΠ·Π½Π°Π΅ΡΠ΅ ΠΎ Π½ΠΈΡ
ΡΠ΅Π»ΡΡ ΠΊΡΡΡ.
ΠΠ°ΠΆΠ΄Π°Ρ ΡΡΠ½ΠΊΡΠΈΡ geom Π² ggplot2 ΠΏΡΠΈΠ½ΠΈΠΌΠ°Π΅Ρ Π°ΡΠ³ΡΠΌΠ΅Π½Ρ mapping
. ΠΡΠΎ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΠ΅Ρ, ΠΊΠ°ΠΊ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΠ΅ Π² Π½Π°Π±ΠΎΡΠ΅ Π΄Π°Π½Π½ΡΡ
ΡΠΎΠΏΠΎΡΡΠ°Π²Π»ΡΡΡΡΡ Ρ Π²ΠΈΠ·ΡΠ°Π»ΡΠ½ΡΠΌΠΈ ΡΠ²ΠΎΠΉΡΡΠ²Π°ΠΌΠΈ.ΠΡΠ³ΡΠΌΠ΅Π½Ρ ΡΠΎΠΏΠΎΡΡΠ°Π²Π»Π΅Π½ΠΈΡ
Π²ΡΠ΅Π³Π΄Π° ΡΠ²ΡΠ·Π°Π½ Ρ aes ()
, Π° Π°ΡΠ³ΡΠΌΠ΅Π½ΡΡ x
ΠΈ y
aes ()
ΡΠΊΠ°Π·ΡΠ²Π°ΡΡ, ΠΊΠ°ΠΊΠΈΠ΅ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΠ΅ ΡΠΎΠΏΠΎΡΡΠ°Π²Π»ΡΡΡΡΡ Ρ ΠΎΡΡΠΌΠΈ x ΠΈ y. ggplot2 ΠΈΡΠ΅Ρ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ°Π΅ΠΌΡΠ΅ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΠ΅ Π² Π°ΡΠ³ΡΠΌΠ΅Π½ΡΠ΅ data
, Π² Π΄Π°Π½Π½ΠΎΠΌ ΡΠ»ΡΡΠ°Π΅ mpg
.
ΠΡΠ°ΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΡΠ°Π±Π»ΠΎΠ½
ΠΠ°Π²Π°ΠΉΡΠ΅ ΠΏΡΠ΅Π²ΡΠ°ΡΠΈΠΌ ΡΡΠΎΡ ΠΊΠΎΠ΄ Π² ΡΠ°Π±Π»ΠΎΠ½ ΠΌΠ½ΠΎΠ³ΠΎΠΊΡΠ°ΡΠ½ΠΎΠ³ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ Π΄Π»Ρ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ Π³ΡΠ°ΡΠΈΠΊΠΎΠ² Ρ ΠΏΠΎΠΌΠΎΡΡΡ ggplot2. Π§ΡΠΎΠ±Ρ ΠΏΠΎΡΡΡΠΎΠΈΡΡ Π³ΡΠ°ΡΠΈΠΊ, Π·Π°ΠΌΠ΅Π½ΠΈΡΠ΅ Π·Π°ΠΊΠ»ΡΡΠ΅Π½Π½ΡΠ΅ Π² ΡΠΊΠΎΠ±ΠΊΠΈ ΡΠ°Π·Π΄Π΅Π»Ρ Π² ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠΌ Π½ΠΈΠΆΠ΅ ΠΊΠΎΠ΄Π΅ Π½Π°Π±ΠΎΡΠΎΠΌ Π΄Π°Π½Π½ΡΡ , ΡΡΠ½ΠΊΡΠΈΠ΅ΠΉ geom ΠΈΠ»ΠΈ ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠ΅ΠΉ ΡΠΎΠΏΠΎΡΡΠ°Π²Π»Π΅Π½ΠΈΠΉ.
ggplot (data = ) +
(ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ = aes ())
ΠΡΡΠ°Π»ΡΠ½Π°Ρ ΡΠ°ΡΡΡ ΡΡΠΎΠΉ Π³Π»Π°Π²Ρ ΠΏΠΎΠΊΠ°ΠΆΠ΅Ρ Π²Π°ΠΌ, ΠΊΠ°ΠΊ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΡ ΠΈ ΡΠ°ΡΡΠΈΡΠΈΡΡ ΡΡΠΎΡ ΡΠ°Π±Π»ΠΎΠ½ Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ΡΠ°Π·Π»ΠΈΡΠ½ΡΡ
ΡΠΈΠΏΠΎΠ² Π³ΡΠ°ΡΠΈΠΊΠΎΠ². ΠΠ°ΡΠ½Π΅ΠΌ Ρ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½ΡΠ°
.
Π£ΠΏΡΠ°ΠΆΠ½Π΅Π½ΠΈΡ
Run
ggplot (data = mpg)
. Π§ΡΠΎ ΡΡ Π²ΠΈΠ΄ΠΈΡΡ?Π‘ΠΊΠΎΠ»ΡΠΊΠΎ ΡΡΡΠΎΠΊ Π² ΠΌΠΈΠ»ΡΡ Π½Π° Π³Π°Π»Π»ΠΎΠ½
? Π‘ΠΊΠΎΠ»ΡΠΊΠΎ ΡΡΠΎΠ»Π±ΡΠΎΠ²?
Π§ΡΠΎ ΠΎΠΏΠΈΡΡΠ²Π°Π΅Ρ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½Π°Ρ
drv
? ΠΡΠΎΡΡΠΈΡΠ΅ ΡΠΏΡΠ°Π²ΠΊΡ Π΄Π»Ρ?
ΠΌΠΈΠ»Ρ Π½Π° Π³Π°Π»Π»ΠΎΠ½, ΡΡΠΎΠ±Ρ Π½Π°ΠΉΡΠΈ
Π²Π½Π΅.ΠΠΎΡΡΡΠΎΠΉΡΠ΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ ΡΠ°ΡΡΠ΅ΡΠ½ΠΈΡ
hwy
ΠΈcyl
.Π§ΡΠΎ ΠΏΡΠΎΠΈΠ·ΠΎΠΉΠ΄Π΅Ρ, Π΅ΡΠ»ΠΈ Π²Ρ ΠΏΠΎΡΡΡΠΎΠΈΡΠ΅ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΡ ΡΠ°ΡΡΠ΅ΡΠ½ΠΈΡ
class
vsdrv
? ΠΠΎΡΠ΅ΠΌΡ
ΡΡΠΆΠ΅Ρ Π½Π΅ ΠΏΠΎΠ»Π΅Π·Π΅Π½?
ΠΡΡΠ΅ΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΠΊΠ°ΡΡΡ
Β«ΠΠ°ΠΈΠ±ΠΎΠ»ΡΡΠ°Ρ ΡΠ΅Π½Π½ΠΎΡΡΡ ΠΊΠ°ΡΡΠΈΠ½Ρ - ΡΡΠΎ ΠΊΠΎΠ³Π΄Π° ΠΎΠ½Π° Π·Π°ΡΡΠ°Π²Π»ΡΠ΅Ρ Π½Π°Ρ Π·Π°ΠΌΠ΅ΡΠ°ΡΡ ΡΠΎ, ΡΡΠΎ ΠΌΡ
Π½ΠΈΠΊΠΎΠ³Π΄Π° Π½Π΅ ΠΎΠΆΠΈΠ΄Π°Π» ΡΠ²ΠΈΠ΄Π΅ΡΡ. - ΠΠΆΠΎΠ½ Π’ΡΡΠΊΠΈ
ΠΠ° Π³ΡΠ°ΡΠΈΠΊΠ΅ Π½ΠΈΠΆΠ΅ ΠΎΠ΄Π½Π° Π³ΡΡΠΏΠΏΠ° ΡΠΎΡΠ΅ΠΊ (Π²ΡΠ΄Π΅Π»Π΅Π½Π° ΠΊΡΠ°ΡΠ½ΡΠΌ), ΠΊΠ°ΠΆΠ΅ΡΡΡ, Π²ΡΡ ΠΎΠ΄ΠΈΡ Π·Π° ΠΏΡΠ΅Π΄Π΅Π»Ρ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ ΡΡΠ΅Π½Π΄Π°.ΠΡΠΈ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»ΠΈ ΠΈΠΌΠ΅ΡΡ Π±ΠΎΠ»ΡΡΠΈΠΉ ΠΏΡΠΎΠ±Π΅Π³, ΡΠ΅ΠΌ ΠΌΠΎΠΆΠ½ΠΎ Π±ΡΠ»ΠΎ ΠΎΠΆΠΈΠ΄Π°ΡΡ. ΠΠ°ΠΊ Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΎΠ±ΡΡΡΠ½ΠΈΡΡ ΡΡΠΈ ΠΌΠ°ΡΠΈΠ½Ρ?
ΠΡΠ΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, ΡΡΠΎ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»ΠΈ - ΡΡΠΎ Π³ΠΈΠ±ΡΠΈΠ΄Ρ. ΠΠ΄ΠΈΠ½ ΠΈΠ· ΡΠΏΠΎΡΠΎΠ±ΠΎΠ² ΠΏΡΠΎΠ²Π΅ΡΠΈΡΡ ΡΡΡ Π³ΠΈΠΏΠΎΡΠ΅Π·Ρ - ΠΏΠΎΡΠΌΠΎΡΡΠ΅ΡΡ Π½Π° Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΠΊΠ»Π°ΡΡΠ°
Π΄Π»Ρ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»Ρ. ΠΠ΅ΡΠ΅ΠΌΠ΅Π½Π½Π°Ρ class
Π½Π°Π±ΠΎΡΠ° Π΄Π°Π½Π½ΡΡ
ΠΌΠΈΠ»Ρ Π½Π° Π³Π°Π»Π»ΠΎΠ½
ΠΊΠ»Π°ΡΡΠΈΡΠΈΡΠΈΡΡΠ΅Ρ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»ΠΈ ΠΏΠΎ ΡΠ°ΠΊΠΈΠΌ Π³ΡΡΠΏΠΏΠ°ΠΌ, ΠΊΠ°ΠΊ ΠΊΠΎΠΌΠΏΠ°ΠΊΡΠ½ΡΠ΅, ΡΡΠ΅Π΄Π½ΠΈΠ΅ ΠΈ Π²Π½Π΅Π΄ΠΎΡΠΎΠΆΠ½ΠΈΠΊΠΈ. ΠΡΠ»ΠΈ ΠΎΡΠ΄Π°Π»Π΅Π½Π½ΡΠ΅ ΡΠΎΡΠΊΠΈ ΡΠ²Π»ΡΡΡΡΡ Π³ΠΈΠ±ΡΠΈΠ΄Π°ΠΌΠΈ, ΠΈΡ
ΡΠ»Π΅Π΄ΡΠ΅Ρ ΠΎΡΠ½Π΅ΡΡΠΈ ΠΊ ΠΊΠ°ΡΠ΅Π³ΠΎΡΠΈΠΈ ΠΊΠΎΠΌΠΏΠ°ΠΊΡΠ½ΡΡ
Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»Π΅ΠΉ ΠΈΠ»ΠΈ, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, ΠΌΠ°Π»ΠΎΠ»ΠΈΡΡΠ°ΠΆΠ½ΡΡ
Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»Π΅ΠΉ (ΠΈΠΌΠ΅ΠΉΡΠ΅ Π² Π²ΠΈΠ΄Ρ, ΡΡΠΎ ΡΡΠΈ Π΄Π°Π½Π½ΡΠ΅ Π±ΡΠ»ΠΈ ΡΠΎΠ±ΡΠ°Π½Ρ Π΄ΠΎ ΡΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ Π³ΠΈΠ±ΡΠΈΠ΄Π½ΡΠ΅ Π³ΡΡΠ·ΠΎΠ²ΠΈΠΊΠΈ ΠΈ Π²Π½Π΅Π΄ΠΎΡΠΎΠΆΠ½ΠΈΠΊΠΈ ΡΡΠ°Π»ΠΈ ΠΏΠΎΠΏΡΠ»ΡΡΠ½ΡΠΌΠΈ).
ΠΡ ΠΌΠΎΠΆΠ΅ΡΠ΅ Π΄ΠΎΠ±Π°Π²ΠΈΡΡ ΡΡΠ΅ΡΡΡ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ class
, ΠΊ Π΄Π²ΡΡ
ΠΌΠ΅ΡΠ½ΠΎΠΉ Π΄ΠΈΠ°Π³ΡΠ°ΠΌΠΌΠ΅ ΡΠ°ΡΡΠ΅ΡΠ½ΠΈΡ, ΡΠΎΠΏΠΎΡΡΠ°Π²ΠΈΠ² Π΅Π΅ Ρ ΡΡΡΠ΅ΡΠΈΠΊΠΎΠΉ . ΠΡΡΠ΅ΡΠΈΠΊΠ° - ΡΡΠΎ Π²ΠΈΠ·ΡΠ°Π»ΡΠ½ΠΎΠ΅ ΡΠ²ΠΎΠΉΡΡΠ²ΠΎ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ² Π½Π° Π²Π°ΡΠ΅ΠΌ ΡΡΠ°ΡΡΠΊΠ΅. ΠΡΡΠ΅ΡΠΈΠΊΠ° Π²ΠΊΠ»ΡΡΠ°Π΅Ρ ΡΠ°ΠΊΠΈΠ΅ Π²Π΅ΡΠΈ, ΠΊΠ°ΠΊ ΡΠ°Π·ΠΌΠ΅Ρ, ΡΠΎΡΠΌΠ° ΠΈΠ»ΠΈ ΡΠ²Π΅Ρ Π²Π°ΡΠΈΡ
ΠΎΡΠΊΠΎΠ². ΠΡ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ°ΡΡ ΡΠΎΡΠΊΡ (ΠΊΠ°ΠΊ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ Π½ΠΈΠΆΠ΅) ΠΏΠΎ-ΡΠ°Π·Π½ΠΎΠΌΡ, ΠΈΠ·ΠΌΠ΅Π½ΡΡ Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π΅Π΅ ΡΡΡΠ΅ΡΠΈΡΠ΅ΡΠΊΠΈΡ
ΡΠ²ΠΎΠΉΡΡΠ². ΠΠΎΡΠΊΠΎΠ»ΡΠΊΡ ΠΌΡ ΡΠΆΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ ΡΠ»ΠΎΠ²ΠΎ Β«Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅Β» Π΄Π»Ρ ΠΎΠΏΠΈΡΠ°Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ
, Π΄Π°Π²Π°ΠΉΡΠ΅ Π²ΠΎΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΡΡ ΡΠ»ΠΎΠ²ΠΎΠΌ Β«ΡΡΠΎΠ²Π΅Π½ΡΒ» Π΄Π»Ρ ΠΎΠΏΠΈΡΠ°Π½ΠΈΡ ΡΡΡΠ΅ΡΠΈΡΠ΅ΡΠΊΠΈΡ
ΡΠ²ΠΎΠΉΡΡΠ².ΠΠ΄Π΅ΡΡ ΠΌΡ ΠΌΠ΅Π½ΡΠ΅ΠΌ ΡΡΠΎΠ²Π½ΠΈ ΡΠ°Π·ΠΌΠ΅ΡΠ°, ΡΠΎΡΠΌΡ ΠΈ ΡΠ²Π΅ΡΠ° ΡΠΎΡΠΊΠΈ, ΡΡΠΎΠ±Ρ ΡΠ΄Π΅Π»Π°ΡΡ ΡΠΎΡΠΊΡ ΠΌΠ°Π»Π΅Π½ΡΠΊΠΎΠΉ, ΡΡΠ΅ΡΠ³ΠΎΠ»ΡΠ½ΠΎΠΉ ΠΈΠ»ΠΈ ΡΠΈΠ½Π΅ΠΉ:
ΠΡ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΏΠ΅ΡΠ΅Π΄Π°ΡΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ ΠΎ ΡΠ²ΠΎΠΈΡ
Π΄Π°Π½Π½ΡΡ
, ΡΠΎΠΏΠΎΡΡΠ°Π²ΠΈΠ² ΡΡΡΠ΅ΡΠΈΠΊΡ Π³ΡΠ°ΡΠΈΠΊΠ° Ρ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΠΌΠΈ Π² Π½Π°Π±ΠΎΡΠ΅ Π΄Π°Π½Π½ΡΡ
. ΠΠ°ΠΏΡΠΈΠΌΠ΅Ρ, Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΡΠΎΠΏΠΎΡΡΠ°Π²ΠΈΡΡ ΡΠ²Π΅ΡΠ° Π²Π°ΡΠΈΡ
ΡΠΎΡΠ΅ΠΊ Ρ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ class
, ΡΡΠΎΠ±Ρ ΠΏΠΎΠΊΠ°Π·Π°ΡΡ ΠΊΠ»Π°ΡΡ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΌΠ°ΡΠΈΠ½Ρ.
ggplot (Π΄Π°Π½Π½ΡΠ΅ = ΠΌΠΈΠ»Ρ Π½Π° Π³Π°Π»Π»ΠΎΠ½) +
geom_point (ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ = aes (x = displ, y = hwy, color = class))
(ΠΡΠ»ΠΈ Π²Ρ ΠΏΡΠ΅Π΄ΠΏΠΎΡΠΈΡΠ°Π΅ΡΠ΅ Π±ΡΠΈΡΠ°Π½ΡΠΊΠΈΠΉ Π°Π½Π³Π»ΠΈΠΉΡΠΊΠΈΠΉ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ Hadley, Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ color
Π²ΠΌΠ΅ΡΡΠΎ color
.)
Π§ΡΠΎΠ±Ρ ΡΠΎΠΏΠΎΡΡΠ°Π²ΠΈΡΡ ΡΡΡΠ΅ΡΠΈΠΊΡ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ, ΡΠ²ΡΠΆΠΈΡΠ΅ ΠΈΠΌΡ ΡΡΡΠ΅ΡΠΈΠΊΠΈ Ρ ΠΈΠΌΠ΅Π½Π΅ΠΌ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ Π²Π½ΡΡΡΠΈ aes ()
. ggplot2 Π°Π²ΡΠΎΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΈ ΠΏΡΠΈΡΠ²ΠΎΠΈΡ ΡΠ½ΠΈΠΊΠ°Π»ΡΠ½ΡΠΉ ΡΡΠΎΠ²Π΅Π½Ρ ΡΡΡΠ΅ΡΠΈΠΊΠΈ (Π·Π΄Π΅ΡΡ ΡΠ½ΠΈΠΊΠ°Π»ΡΠ½ΡΠΉ ΡΠ²Π΅Ρ) ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡ ΡΠ½ΠΈΠΊΠ°Π»ΡΠ½ΠΎΠΌΡ Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ, ΠΏΡΠΎΡΠ΅ΡΡ, ΠΈΠ·Π²Π΅ΡΡΠ½ΡΠΉ ΠΊΠ°ΠΊ ΠΌΠ°ΡΡΡΠ°Π±ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ . ggplot2 ΡΠ°ΠΊΠΆΠ΅ Π΄ΠΎΠ±Π°Π²ΠΈΡ Π»Π΅Π³Π΅Π½Π΄Ρ, ΠΎΠ±ΡΡΡΠ½ΡΡΡΡΡ, ΠΊΠ°ΠΊΠΈΠ΅ ΡΡΠΎΠ²Π½ΠΈ ΠΊΠ°ΠΊΠΈΠΌ Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡ.
ΠΠΎ ΡΠ²Π΅ΡΠ°ΠΌ Π²ΠΈΠ΄Π½ΠΎ, ΡΡΠΎ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ ΠΈΠ· Π½Π΅ΠΎΠ±ΡΡΠ½ΡΡ Π²Π΅ΡΠ΅ΠΉ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΡΡ ΡΠΎΠ±ΠΎΠΉ Π΄Π²ΡΡ ΠΌΠ΅ΡΡΠ½ΡΠ΅ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»ΠΈ. ΠΡΠΈ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»ΠΈ Π½Π΅ ΠΏΠΎΡ ΠΎΠΆΠΈ Π½Π° Π³ΠΈΠ±ΡΠΈΠ΄Ρ, Π° Π½Π° ΡΠ°ΠΌΠΎΠΌ Π΄Π΅Π»Π΅ ΡΠ²Π»ΡΡΡΡΡ ΡΠΏΠΎΡΡΠΈΠ²Π½ΡΠΌΠΈ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»ΡΠΌΠΈ! Π‘ΠΏΠΎΡΡΠΈΠ²Π½ΡΠ΅ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»ΠΈ ΠΈΠΌΠ΅ΡΡ Π±ΠΎΠ»ΡΡΠΈΠ΅ Π΄Π²ΠΈΠ³Π°ΡΠ΅Π»ΠΈ, ΡΠ°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ Π²Π½Π΅Π΄ΠΎΡΠΎΠΆΠ½ΠΈΠΊΠΈ ΠΈ ΠΏΠΈΠΊΠ°ΠΏΡ, Π½ΠΎ ΠΌΠ°Π»Π΅Π½ΡΠΊΠΈΠ΅ ΠΊΡΠ·ΠΎΠ²Π°, ΡΠ°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»ΠΈ ΡΡΠ΅Π΄Π½Π΅Π³ΠΎ ΠΈ ΠΊΠΎΠΌΠΏΠ°ΠΊΡΠ½ΠΎΠ³ΠΎ ΡΠ°Π·ΠΌΠ΅ΡΠ°, ΡΡΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΡΠΎΠΊΡΠ°ΡΠΈΡΡ ΡΠ°ΡΡ ΠΎΠ΄ ΡΠΎΠΏΠ»ΠΈΠ²Π°.ΠΠ³Π»ΡΠ΄ΡΠ²Π°ΡΡΡ Π½Π°Π·Π°Π΄, ΡΡΠΈ Π°Π²ΡΠΎΠΌΠΎΠ±ΠΈΠ»ΠΈ Π²ΡΡΠ΄ Π»ΠΈ Π±ΡΠ»ΠΈ Π³ΠΈΠ±ΡΠΈΠ΄Π°ΠΌΠΈ, ΠΏΠΎΡΠΊΠΎΠ»ΡΠΊΡ Ρ Π½ΠΈΡ Π±ΡΠ»ΠΈ Π±ΠΎΠ»ΡΡΠΈΠ΅ Π΄Π²ΠΈΠ³Π°ΡΠ΅Π»ΠΈ.
Π ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠΌ Π²ΡΡΠ΅ ΠΏΡΠΈΠΌΠ΅ΡΠ΅ ΠΌΡ ΡΠΎΠΏΠΎΡΡΠ°Π²ΠΈΠ»ΠΈ class
Ρ ΡΡΡΠ΅ΡΠΈΠΊΠΎΠΉ ΡΠ²Π΅ΡΠ°, Π½ΠΎ ΠΌΡ ΠΌΠΎΠ³Π»ΠΈ Π±Ρ ΡΠΎΠΏΠΎΡΡΠ°Π²ΠΈΡΡ class
Ρ ΡΡΡΠ΅ΡΠΈΠΊΠΎΠΉ ΡΠ°Π·ΠΌΠ΅ΡΠ° ΡΠ°ΠΊΠΈΠΌ ΠΆΠ΅ ΠΎΠ±ΡΠ°Π·ΠΎΠΌ. Π ΡΡΠΎΠΌ ΡΠ»ΡΡΠ°Π΅ ΡΠΎΡΠ½ΡΠΉ ΡΠ°Π·ΠΌΠ΅Ρ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΡΠΎΡΠΊΠΈ ΠΏΠΎΠΊΠ°ΠΆΠ΅Ρ Π΅Π΅ ΠΊΠ»Π°ΡΡΠΎΠ²ΡΡ ΠΏΡΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ½ΠΎΡΡΡ. ΠΠ΄Π΅ΡΡ ΠΌΡ ΠΏΠΎΠ»ΡΡΠ°Π΅ΠΌ ΠΏΡΠ΅Π΄ΡΠΏΡΠ΅ΠΆΠ΄Π΅Π½ΠΈΠ΅ , ΠΏΠΎΡΠΎΠΌΡ ΡΡΠΎ ΡΠΎΠΏΠΎΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ Π½Π΅ΡΠΏΠΎΡΡΠ΄ΠΎΡΠ΅Π½Π½ΠΎΠΉ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ (, ΠΊΠ»Π°ΡΡ
) Ρ ΡΠΏΠΎΡΡΠ΄ΠΎΡΠ΅Π½Π½ΠΎΠΉ ΡΡΡΠ΅ΡΠΈΠΊΠΎΠΉ (, ΡΠ°Π·ΠΌΠ΅Ρ
) Π½Π΅ ΡΠ²Π»ΡΠ΅ΡΡΡ Ρ
ΠΎΡΠΎΡΠ΅ΠΉ ΠΈΠ΄Π΅Π΅ΠΉ.
ggplot (Π΄Π°Π½Π½ΡΠ΅ = ΠΌΠΈΠ»Ρ Π½Π° Π³Π°Π»Π»ΠΎΠ½) +
geom_point (ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ = aes (x = displ, y = hwy, size = class))
#> ΠΡΠ΅Π΄ΡΠΏΡΠ΅ΠΆΠ΄Π΅Π½ΠΈΠ΅: Π½Π΅ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡΠ΅ΡΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΡΠ°Π·ΠΌΠ΅Ρ Π΄ΠΈΡΠΊΡΠ΅ΡΠ½ΠΎΠΉ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ.
ΠΠ»ΠΈ ΠΌΡ ΠΌΠΎΠ³Π»ΠΈ Π±Ρ ΡΠΎΠΏΠΎΡΡΠ°Π²ΠΈΡΡ class
Ρ ΡΡΡΠ΅ΡΠΈΠΊΠΎΠΉ alpha , ΠΊΠΎΡΠΎΡΠ°Ρ ΠΊΠΎΠ½ΡΡΠΎΠ»ΠΈΡΡΠ΅Ρ ΠΏΡΠΎΠ·ΡΠ°ΡΠ½ΠΎΡΡΡ ΡΠΎΡΠ΅ΠΊ, ΠΈΠ»ΠΈ Ρ ΡΡΡΠ΅ΡΠΈΠΊΠΎΠΉ ΡΠΎΡΠΌΡ, ΠΊΠΎΡΠΎΡΠ°Ρ ΡΠΏΡΠ°Π²Π»ΡΠ΅Ρ ΡΠΎΡΠΌΠΎΠΉ ΡΠΎΡΠ΅ΠΊ.
# Left
ggplot (Π΄Π°Π½Π½ΡΠ΅ = ΠΌΠΈΠ»Ρ Π½Π° Π³Π°Π»Π»ΠΎΠ½) +
geom_point (ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ = aes (x = displ, y = hwy, alpha = class))
# ΠΡΠ°Π²ΠΈΠ»ΡΠ½ΠΎ
ggplot (Π΄Π°Π½Π½ΡΠ΅ = ΠΌΠΈΠ»Ρ Π½Π° Π³Π°Π»Π»ΠΎΠ½) +
geom_point (ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ = aes (x = displ, y = hwy, shape = class))
Π§ΡΠΎ ΡΠ»ΡΡΠΈΠ»ΠΎΡΡ Ρ Π²Π½Π΅Π΄ΠΎΡΠΎΠΆΠ½ΠΈΠΊΠ°ΠΌΠΈ? ggplot2 Π±ΡΠ΄Π΅Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΎΠ΄Π½ΠΎΠ²ΡΠ΅ΠΌΠ΅Π½Π½ΠΎ ΡΠΎΠ»ΡΠΊΠΎ ΡΠ΅ΡΡΡ ΡΠΈΠ³ΡΡ.ΠΠΎ ΡΠΌΠΎΠ»ΡΠ°Π½ΠΈΡ ΠΏΡΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠΈ ΡΡΡΠ΅ΡΠΈΠΊΠΈ ΡΠΎΡΠΌΡ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΡΠ΅ Π³ΡΡΠΏΠΏΡ Π½Π΅ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ°ΡΡΡΡ.
ΠΠ»Ρ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΡΡΡΠ΅ΡΠΈΠΊΠΈ Π²Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΠ΅ aes ()
, ΡΡΠΎΠ±Ρ ΡΠ²ΡΠ·Π°ΡΡ ΠΈΠΌΡ ΡΡΡΠ΅ΡΠΈΠΊΠΈ Ρ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ°Π΅ΠΌΠΎΠΉ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ. Π€ΡΠ½ΠΊΡΠΈΡ aes ()
ΡΠΎΠ±ΠΈΡΠ°Π΅Ρ Π²ΠΌΠ΅ΡΡΠ΅ Π²ΡΠ΅ ΡΡΡΠ΅ΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΡΠΎΠΏΠΎΡΡΠ°Π²Π»Π΅Π½ΠΈΡ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΡΠ΅ ΡΠ»ΠΎΠ΅ΠΌ, ΠΈ ΠΏΠ΅ΡΠ΅Π΄Π°Π΅Ρ ΠΈΡ
Π°ΡΠ³ΡΠΌΠ΅Π½ΡΡ ΡΠΎΠΏΠΎΡΡΠ°Π²Π»Π΅Π½ΠΈΡ ΡΠ»ΠΎΡ. Π‘ΠΈΠ½ΡΠ°ΠΊΡΠΈΡ ΠΏΠΎΠ΄ΡΠ΅ΡΠΊΠΈΠ²Π°Π΅Ρ ΠΏΠΎΠ»Π΅Π·Π½ΡΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ ΠΎ x
ΠΈ y
: ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΡ x ΠΈ y ΡΠΎΡΠΊΠΈ ΡΠ°ΠΌΠΈ ΠΏΠΎ ΡΠ΅Π±Π΅ ΡΠ²Π»ΡΡΡΡΡ ΡΡΡΠ΅ΡΠΈΠΊΠΎΠΉ, Π²ΠΈΠ·ΡΠ°Π»ΡΠ½ΡΠΌΠΈ ΡΠ²ΠΎΠΉΡΡΠ²Π°ΠΌΠΈ, ΠΊΠΎΡΠΎΡΡΠ΅ Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΡΠΎΠΏΠΎΡΡΠ°Π²ΠΈΡΡ Ρ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΠΌΠΈ Π΄Π»Ρ ΠΎΡΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ ΠΎ Π΄Π°Π½Π½ΡΡ
.
ΠΠΎΡΠ»Π΅ ΡΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ Π²Ρ Π½Π°Π½Π΅ΡΠ΅ΡΠ΅ Π½Π° ΠΊΠ°ΡΡΡ ΡΡΡΠ΅ΡΠΈΠΊΡ, ggplot2 ΠΏΠΎΠ·Π°Π±ΠΎΡΠΈΡΡΡ ΠΎΠ±ΠΎ Π²ΡΠ΅ΠΌ ΠΎΡΡΠ°Π»ΡΠ½ΠΎΠΌ. ΠΠ½ Π²ΡΠ±ΠΈΡΠ°Π΅Ρ ΡΠ°Π·ΡΠΌΠ½ΡΠΉ ΠΌΠ°ΡΡΡΠ°Π± Π΄Π»Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ Ρ ΡΡΡΠ΅ΡΠΈΠΊΠΎΠΉ ΠΈ ΡΡΡΠΎΠΈΡ Π»Π΅Π³Π΅Π½Π΄Ρ, ΠΎΠ±ΡΡΡΠ½ΡΡΡΡΡ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΠΈΠ΅ ΠΌΠ΅ΠΆΠ΄Ρ ΡΡΠΎΠ²Π½ΡΠΌΠΈ ΠΈ Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ. ΠΠ»Ρ ΡΡΡΠ΅ΡΠΈΠΊΠΈ x ΠΈ y ggplot2 Π½Π΅ ΡΠΎΠ·Π΄Π°Π΅Ρ Π»Π΅Π³Π΅Π½Π΄Ρ, Π½ΠΎ ΡΠΎΠ·Π΄Π°Π΅Ρ ΠΎΡΠ΅Π²ΡΡ Π»ΠΈΠ½ΠΈΡ Ρ Π΄Π΅Π»Π΅Π½ΠΈΡΠΌΠΈ ΠΈ ΠΌΠ΅ΡΠΊΠΎΠΉ. ΠΠΈΠ½ΠΈΡ ΠΎΡΠΈ Π΄Π΅ΠΉΡΡΠ²ΡΠ΅Ρ ΠΊΠ°ΠΊ Π»Π΅Π³Π΅Π½Π΄Π°; ΠΎΠ½ ΠΎΠ±ΡΡΡΠ½ΡΠ΅Ρ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΠΈΠ΅ ΠΌΠ΅ΠΆΠ΄Ρ ΠΌΠ΅ΡΡΠΎΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΡΠΌΠΈ ΠΈ ΡΠ΅Π½Π½ΠΎΡΡΡΠΌΠΈ.