تحضير البيانات والمكتبات المرتبطة بها

استخدم مكتبة الباندا ومكتبة Seaborn بشكل أساسي.

import pandas as pd
import numpy as np
import seaborn as sns
%matplotlib inline

توليد 4 مجموعات من البيانات وتحويلها إلى DataFrameنوع بيانات

xarray = np.linspace(0,10,100)#生成从0倒10,100个数
yarray = xarray**3+np.random.normal(0,100,100# y=x^3+正态扰动项
zarray = -100*xarray+np.random.normal(0,10,100# y=-100x+正态扰动项
warray = 200*xarray**0.5+np.random.normal(0,10,100)
x ذ ض ث
0 0 66.5297 -7.81256 14.5319
1 0.10101 -34.835 -18.8105 65.9947
2 0.20202 37.5717 -21.8944 96.7367
3 0.30303 140.38 -28.7846 101.061
4 0.40404 202.198 -47.9113 127.187

تحليل أحادي أو عديد المتغير

رسم بياني لتوزيع التردد

df.hist(bins=15, color='steelblue', edgecolor='black', linewidth=1.0,
           xlabelsize=8, ylabelsize=8, grid=False)

صورة

منحنى الكثافة الاحتمالية

sns.kdeplot(df['w'])

صورة

مربع مؤامرة

sns.boxplot(data=df)

صورة

شخصية كمان

طريقة أخرى فعالة لعرض البيانات الرقمية المجمعة باستخدام مخطط كثافة النواة (يصور كثافة احتمالية البيانات بقيم مختلفة)

sns.violinplot(data=df)

صورة

تحليل متعدد المتغيرات

خريطة الارتباط الحراري

sns.heatmap(round(df.corr(),2), annot=True, cmap="coolwarm",fmt='.2f',
                 linewidths=.05)

صورة

تختلف التدرجات اللونية في خريطة الحرارة وفقًا لقوة الارتباط ، ويمكنك بسهولة تحديد الخصائص المحتملة التي ترتبط ارتباطًا وثيقًا ببعضها البعض.

مؤامرة مبعثرة مقترنة

sns.pairplot(data=df,diag_kind='kde')

صورة

التوزيع الاحتمالي المشترك

sns.jointplot(x='x',y='y',data=df,kind='kde')

صورة