Veri Bilimi için Pandas Hile Sayfası Python

Pandalar Hile Sayfası

Pandalar Hile Sayfası Nedir?

Pandas kütüphanesinin birçok işlevi vardır ancak bunlardan bazıları bazı insanlar için kafa karıştırıcıdır. Burada, adı verilen yararlı bir kaynak sağladık. Python Pandalar Hile Sayfası. Pandaların temellerini basit ve öz bir şekilde açıklıyor.

İster yeni başlayan olun, ister Pandalar konusunda deneyimli olun, bu kısa bilgi sayfası yararlı bir referans kılavuzu olarak hizmet edebilir. Seriler ve DataFrame veri yapılarıyla çalışma, verileri seçme ve sıralama ve verilerinize işlevler uygulama dahil olmak üzere çeşitli konuları kapsar.

Özetle, bu Pandalar Python Cheat Sheet, kullanımı hakkında daha fazla bilgi edinmek isteyen herkes için iyi bir kaynaktır. Python Veri Bilimi için. Kullanışlı bir referans aracıdır. Kendinizi geliştirmenize yardımcı olabilir veri analizi becerileri ve Pandalarla daha verimli çalışın.

👉 Kopya Kağıdının PDF'sini buradan indirin

Pandalardaki önemli işlevlerin açıklanması:

Panda işlevleriyle çalışmaya başlamak için pandaları yükleyip içe aktarmanız gerekir. Bunu yapmak için iki komut vardır:

Adım 1) # Pandaları yükleyin

Pip pandaları yükle

Adım 2) # Pandaları İçe Aktarın

Pandaları pd olarak içe aktar

Artık Panda'nın işlevleriyle çalışmaya başlayabilirsiniz. Verileri işlemek, analiz etmek ve temizlemek için çalışacağız. İşte pandaların bazı önemli işlevleri.

Pandalar Veri Yapıları

Daha önce de belirttiğimiz gibi Pandaların Seriler ve DataFrames adında iki veri yapısı vardır. Her ikisi de dizi olarak etiketlenmiştir ve herhangi bir veri türünü tutabilir. Tek fark Series'in tek boyutlu bir dizi olması ve DataFrame'in iki boyutlu bir dizi olmasıdır.

1. Seri

Tek boyutlu etiketli bir dizidir. Her türlü veriyi tutabilir.

s = pd.Series([2, -4, 6, 3, None], index=['A', 'B', 'C', 'D', 'E'])

2. Veri Çerçevesi

İki boyutlu etiketli bir dizidir. Herhangi bir veri türünü ve farklı boyutlarda sütunları tutabilir.

data = {'RollNo' : [101, 102, 75, 99],
        'Name' : ['Mithlesh', 'Ram', 'Rudra', 'Mithlesh'],
        'Course' : ['Nodejs', None, 'Nodejs', 'JavaScript']
}
df = pd.DataFrame(data, columns=['RollNo', 'Name', 'Course'])
df.head()

Pandalar Hile Sayfası

Verileri İçe Aktarma

Pandalar, Not Defterinizdeki çeşitli dosya türlerini içe aktarma veya okuma yeteneğine sahiptir.

Aşağıda verilen bazı örnekler verilmiştir.

# Import a CSV file pd
pd.read_csv(filename)

# Import a TSV file
pd.read_table(filename)

# Import a Excel file pd
pd.read_excel(filename)

# Import a SQL table/database
pd.read_sql(query, connection_object)

# Import a JSON file
pd.read_json(json_string)

# Import a HTML file
pd.read_html(url)

# From clipboard to read_table()
pd.read_clipboard()

# From dict
pd.DataFrame(dict)

seçim

Öğeleri konumuna veya dizinine göre seçebilirsiniz. Bu teknikleri kullanarak satırları, sütunları ve farklı değerleri seçebilirsiniz.

1. Seri

# Accessing one element from Series
s['D']

# Accessing all elements between two given indices
s['A':'C']

# Accessing all elements from starting till given index
s[:'C']

# Accessing all elements from given index till end
s['B':]

2. Veri Çerçevesi

# Accessing one column df
df['Name']

# Accessing rows from after given row
df[1:]

# Accessing till before given row
df[:1]

# Accessing rows between two given rows
df[1:2]

Boolean İndekslemeye Göre Seçme ve Ayarlama

1. Pozisyona Göre

df.iloc[0, 1]

df.iat[0, 1]

2. Etikete Göre

df.loc[[0],  ['Name']]

3. Etikete/Konuma Göre

df.loc[2] # Both are same
df.iloc[2]

4. Boolean İndeksleme

# Series s where value is > 1
s[(s > 0)]

# Series s where value is <-2 or >1
s[(s < -2) | ~(s > 1)]

# Use filter to adjust DataFrame
df[df['RollNo']>100]

# Set index a of Series s to 6
s['D'] = 10
s.head()

Veri temizleme

Her Ticaretçi İçin Mükemmellik Python Veri temizleme hile sayfası amaçları doğrultusunda aşağıdaki işlemleri gerçekleştirebilirsiniz:

  • rename() yöntemini kullanarak sütunları yeniden adlandırın.
  • Belirli öğelere erişmek ve bunları değiştirmek için at[] veya iat[] yöntemini kullanarak değerleri güncelleyin.
  • copy() yöntemini kullanarak bir Serinin veya veri çerçevesinin bir kopyasını oluşturun.
  • isnull() yöntemini kullanarak NULL değerleri kontrol edin ve dropna() yöntemini kullanarak bunları bırakın.
  • Duplicated() yöntemini kullanarak yinelenen değerleri kontrol edin. drop_duplicates() yöntemini kullanarak bunları bırakın.
  • Fill () yöntemini kullanarak NULL değerlerini belirtilen değerle değiştirin.
  • Değiştir() yöntemini kullanarak değerleri değiştirin.
  • sort_values() yöntemini kullanarak değerleri sıralayın.
  • Rank() yöntemini kullanarak değerleri derecelendirin.
# Renaming columns
df.columns = ['a','b','c']
df.head()

# Mass renaming of columns
df = df.rename(columns={'RollNo': 'ID', 'Name': 'Student_Name'})

# Or use this edit in same DataFrame instead of in copy
df.rename(columns={'RollNo': 'ID', 'Name': 'Student_Name'}, inplace=True)
df.head()

# Counting duplicates in a column
df.duplicated(subset='Name')

# Removing entire row that has duplicate in given column
df.drop_duplicates(subset=['Name'])

# You can choose which one keep - by default is first
df.drop_duplicates(subset=['Name'], keep='last')

# Checks for Null Values
s.isnull()

# Checks for non-Null Values - reverse of isnull()
s.notnull()

# Checks for Null Values df
df.isnull()

# Checks for non-Null Values - reverse of isnull()
df.notnull()

# Drops all rows that contain null values
df.dropna()

# Drops all columns that contain null values
df.dropna(axis=1)

# Replaces all null values with 'Guru99'
df.fillna('Guru99')

# Replaces all null values with the mean
s.fillna(s.mean())

# Converts the datatype of the Series to float
s.astype(float)

# Replaces all values equal to 6 with 'Six'
s.replace(6,'Six')

# Replaces all 2 with 'Two' and 6 with 'Six'
s.replace([2,6],['Two','Six'])

# Drop from rows (axis=0)
s.drop(['B',  'D'])

# Drop from columns(axis=1)
df.drop('Name', axis=1)

# Sort by labels with axis
df.sort_index()

# Sort by values with axis
df.sort_values(by='RollNo')

# Ranking entries
df.rank()

# s1 is pointing to same Series as s
s1 = s

# s_copy of s, but not pointing same Series
s_copy = s.copy()

# df1 is pointing to same DataFrame as df
df1 = s

# df_copy of df, but not pointing same DataFrame
df_copy = df.copy()

Bilgi Alma

Bilgi almak için şu işlemi gerçekleştirebilirsiniz:

  • Satır ve sütun sayısını almak için şekil özelliğini kullanın.
  • Örnek olarak ilk veya son birkaç satırı elde etmek için head() veya tail() yöntemini kullanın.
  • Veri türü, sayım, ortalama, standart sapma, minimum ve maksimum değerler hakkında bilgi edinmek için info(), define() veya dtypes yöntemini kullanın.
  • Değerlere ilişkin belirli istatistiksel bilgiler elde etmek için count(), min(), max(), sum(), ortalama() ve median() yöntemlerini kullanın.
  • Bir satır elde etmek için loc[] yöntemini kullanın.
  • Bir DataFrame sütunundaki benzer değerleri gruplandırmak amacıyla GROUP BY işlevini uygulamak için groupby() yöntemini kullanın.

1. Temel bilgiler

# Counting all elements in Series
len(s)

# Counting all elements in DataFrame
len(df)

# Prints number of rows and columns in dataframe
df.shape

# Prints first 10 rows by default, if no value set
df.head(10)

# Prints last 10 rows by default, if no value set
df.tail(10)

# For counting non-Null values column-wise
df.count()

# For range of index df
df.index

# For name of attributes/columns
df.columns

# Index, Data Type and Memory information
df.info()

# Datatypes of each column
df.dtypes

# Summary statistics for numerical columns
df.describe()

2. Özet

# For adding all values column-wise
df.sum()

# For min column-wise
df.min()

# For max column-wise
df.max()

# For mean value in number column
df.mean()

# For median value in number column
df.median()

# Count non-Null values
s.count()

# Count non-Null values
df.count()

# Return Series of given column
df['Name'].tolist()

# Name of columns
df.columns.tolist()

# Creating subset
df[['Name', 'Course']]

# Return number of values in each group
df.groupby('Name').count()

İşlevleri Uygulama

# Define function
f = lambda x: x*5

# Apply this function on given Series - For each value
s.apply(f)

# Apply this function on given DataFrame - For each value
df.apply(f)

1. Dahili Veri Hizalama

# NA values for indices that don't overlap
s2 = pd.Series([8, -1, 4],  index=['A',  'C',  'D'])
s + s2

2. Aritmetik OperaDoldurma Yöntemleriyle İlgili İşlemler

# Fill values that don't overlap
s.add(s2, fill_value=0)

3. Filtrele, Sırala ve Gruplandır

Seri ve Veri Çerçevesine göre filtreleme, sıralama ve gruplama yapmak için aşağıdaki fonksiyonlar kullanılabilir.

# Filter rows where column is greater than 100
df[df['RollNo']>100]

# Filter rows where 70 < column < 101
df[(df['RollNo'] > 70) & (df['RollNo'] < 101)]

# Sorts values in ascending order
s.sort_values()

# Sorts values in descending order
s.sort_values(ascending=False)

# Sorts values by RollNo in ascending order
df.sort_values('RollNo')

# Sorts values by RollNo in descending order
df.sort_values('RollNo', ascending=False)

Verileri Dışa Aktarma

Pandalar, verileri çeşitli formatlarda dışa aktarma veya yazma yeteneğine sahiptir. Aşağıda verilen bazı örnekler verilmiştir.

# Export as a CSV file df
df.to_csv(filename)

# Export as a Excel file df
df.to_excel(filename)

# Export as a SQL table df
df.to_sql(table_name, connection_object)

# Export as a JSON file
df.to_json(filename)

# Export as a HTML table
df.to_html(filename)

# Write to the clipboard
df.to_clipboard()

Pandalar Hile Sayfası Sonuç:

Pandalar açık kaynak kütüphanedir Python veri kümeleriyle çalışmak için. Verileri analiz etme, temizleme, keşfetme ve değiştirme yeteneği. Pandalar Numpy'nin üzerine inşa edilmiştir. Matplotlib gibi diğer programlarla birlikte kullanılır ve Scikit-Öğren. Veri yapıları, veri seçimi, veri içe aktarma, Boolean indeksleme, değerleri düşürme, sıralama ve veri temizleme gibi konuları kapsar. Ayrıca makale için pandalar pdf hileleri hazırladık. Pandalar bir kütüphanedir Python ve veri bilimi bu kütüphaneyi pandaların veri çerçeveleri ve serileriyle çalışmak için kullanır. Bu kısa notta çeşitli panda komutlarını tartıştık.

Hile Sayfası Colab'ı

Pandalar için Colab Egzersiz dosyam – Pandalar Hile Sayfası – Python Veri Bilimi.ipynb için