Veri Bilimi için Pandas Hile Sayfası Python
Pandalar Hile Sayfası Nedir?
Pandas kütüphanesinin birçok işlevi vardır ancak bunlardan bazıları bazı insanlar için kafa karıştırıcıdır. Burada, adı verilen yararlı bir kaynak sağladık. Python Pandalar Hile Sayfası. Pandaların temellerini basit ve öz bir şekilde açıklıyor.
İster yeni başlayan olun, ister Pandalar konusunda deneyimli olun, bu kısa bilgi sayfası yararlı bir referans kılavuzu olarak hizmet edebilir. Seriler ve DataFrame veri yapılarıyla çalışma, verileri seçme ve sıralama ve verilerinize işlevler uygulama dahil olmak üzere çeşitli konuları kapsar.
Özetle, bu Pandalar Python Cheat Sheet, kullanımı hakkında daha fazla bilgi edinmek isteyen herkes için iyi bir kaynaktır. Python Veri Bilimi için. Kullanışlı bir referans aracıdır. Kendinizi geliştirmenize yardımcı olabilir veri analizi becerileri ve Pandalarla daha verimli çalışın.
👉 Kopya Kağıdının PDF'sini buradan indirin
Pandalardaki önemli işlevlerin açıklanması:
Panda işlevleriyle çalışmaya başlamak için pandaları yükleyip içe aktarmanız gerekir. Bunu yapmak için iki komut vardır:
Adım 1) # Pandaları yükleyin
Pip pandaları yükle
Adım 2) # Pandaları İçe Aktarın
Pandaları pd olarak içe aktar
Artık Panda'nın işlevleriyle çalışmaya başlayabilirsiniz. Verileri işlemek, analiz etmek ve temizlemek için çalışacağız. İşte pandaların bazı önemli işlevleri.
Pandalar Veri Yapıları
Daha önce de belirttiğimiz gibi Pandaların Seriler ve DataFrames adında iki veri yapısı vardır. Her ikisi de dizi olarak etiketlenmiştir ve herhangi bir veri türünü tutabilir. Tek fark Series'in tek boyutlu bir dizi olması ve DataFrame'in iki boyutlu bir dizi olmasıdır.
1. Seri
Tek boyutlu etiketli bir dizidir. Her türlü veriyi tutabilir.
s = pd.Series([2, -4, 6, 3, None], index=['A', 'B', 'C', 'D', 'E'])
2. Veri Çerçevesi
İki boyutlu etiketli bir dizidir. Herhangi bir veri türünü ve farklı boyutlarda sütunları tutabilir.
data = {'RollNo' : [101, 102, 75, 99], 'Name' : ['Mithlesh', 'Ram', 'Rudra', 'Mithlesh'], 'Course' : ['Nodejs', None, 'Nodejs', 'JavaScript'] } df = pd.DataFrame(data, columns=['RollNo', 'Name', 'Course']) df.head()
Verileri İçe Aktarma
Pandalar, Not Defterinizdeki çeşitli dosya türlerini içe aktarma veya okuma yeteneğine sahiptir.
Aşağıda verilen bazı örnekler verilmiştir.
# Import a CSV file pd pd.read_csv(filename) # Import a TSV file pd.read_table(filename) # Import a Excel file pd pd.read_excel(filename) # Import a SQL table/database pd.read_sql(query, connection_object) # Import a JSON file pd.read_json(json_string) # Import a HTML file pd.read_html(url) # From clipboard to read_table() pd.read_clipboard() # From dict pd.DataFrame(dict)
seçim
Öğeleri konumuna veya dizinine göre seçebilirsiniz. Bu teknikleri kullanarak satırları, sütunları ve farklı değerleri seçebilirsiniz.
1. Seri
# Accessing one element from Series s['D'] # Accessing all elements between two given indices s['A':'C'] # Accessing all elements from starting till given index s[:'C'] # Accessing all elements from given index till end s['B':]
2. Veri Çerçevesi
# Accessing one column df df['Name'] # Accessing rows from after given row df[1:] # Accessing till before given row df[:1] # Accessing rows between two given rows df[1:2]
Boolean İndekslemeye Göre Seçme ve Ayarlama
1. Pozisyona Göre
df.iloc[0, 1] df.iat[0, 1]
2. Etikete Göre
df.loc[[0], ['Name']]
3. Etikete/Konuma Göre
df.loc[2] # Both are same df.iloc[2]
4. Boolean İndeksleme
# Series s where value is > 1 s[(s > 0)] # Series s where value is <-2 or >1 s[(s < -2) | ~(s > 1)] # Use filter to adjust DataFrame df[df['RollNo']>100] # Set index a of Series s to 6 s['D'] = 10 s.head()
Veri temizleme
Her Ticaretçi İçin Mükemmellik Python Veri temizleme hile sayfası amaçları doğrultusunda aşağıdaki işlemleri gerçekleştirebilirsiniz:
- rename() yöntemini kullanarak sütunları yeniden adlandırın.
- Belirli öğelere erişmek ve bunları değiştirmek için at[] veya iat[] yöntemini kullanarak değerleri güncelleyin.
- copy() yöntemini kullanarak bir Serinin veya veri çerçevesinin bir kopyasını oluşturun.
- isnull() yöntemini kullanarak NULL değerleri kontrol edin ve dropna() yöntemini kullanarak bunları bırakın.
- Duplicated() yöntemini kullanarak yinelenen değerleri kontrol edin. drop_duplicates() yöntemini kullanarak bunları bırakın.
- Fill () yöntemini kullanarak NULL değerlerini belirtilen değerle değiştirin.
- Değiştir() yöntemini kullanarak değerleri değiştirin.
- sort_values() yöntemini kullanarak değerleri sıralayın.
- Rank() yöntemini kullanarak değerleri derecelendirin.
# Renaming columns df.columns = ['a','b','c'] df.head() # Mass renaming of columns df = df.rename(columns={'RollNo': 'ID', 'Name': 'Student_Name'}) # Or use this edit in same DataFrame instead of in copy df.rename(columns={'RollNo': 'ID', 'Name': 'Student_Name'}, inplace=True) df.head() # Counting duplicates in a column df.duplicated(subset='Name') # Removing entire row that has duplicate in given column df.drop_duplicates(subset=['Name']) # You can choose which one keep - by default is first df.drop_duplicates(subset=['Name'], keep='last') # Checks for Null Values s.isnull() # Checks for non-Null Values - reverse of isnull() s.notnull() # Checks for Null Values df df.isnull() # Checks for non-Null Values - reverse of isnull() df.notnull() # Drops all rows that contain null values df.dropna() # Drops all columns that contain null values df.dropna(axis=1) # Replaces all null values with 'Guru99' df.fillna('Guru99') # Replaces all null values with the mean s.fillna(s.mean()) # Converts the datatype of the Series to float s.astype(float) # Replaces all values equal to 6 with 'Six' s.replace(6,'Six') # Replaces all 2 with 'Two' and 6 with 'Six' s.replace([2,6],['Two','Six']) # Drop from rows (axis=0) s.drop(['B', 'D']) # Drop from columns(axis=1) df.drop('Name', axis=1) # Sort by labels with axis df.sort_index() # Sort by values with axis df.sort_values(by='RollNo') # Ranking entries df.rank() # s1 is pointing to same Series as s s1 = s # s_copy of s, but not pointing same Series s_copy = s.copy() # df1 is pointing to same DataFrame as df df1 = s # df_copy of df, but not pointing same DataFrame df_copy = df.copy()
Bilgi Alma
Bilgi almak için şu işlemi gerçekleştirebilirsiniz:
- Satır ve sütun sayısını almak için şekil özelliğini kullanın.
- Örnek olarak ilk veya son birkaç satırı elde etmek için head() veya tail() yöntemini kullanın.
- Veri türü, sayım, ortalama, standart sapma, minimum ve maksimum değerler hakkında bilgi edinmek için info(), define() veya dtypes yöntemini kullanın.
- Değerlere ilişkin belirli istatistiksel bilgiler elde etmek için count(), min(), max(), sum(), ortalama() ve median() yöntemlerini kullanın.
- Bir satır elde etmek için loc[] yöntemini kullanın.
- Bir DataFrame sütunundaki benzer değerleri gruplandırmak amacıyla GROUP BY işlevini uygulamak için groupby() yöntemini kullanın.
1. Temel bilgiler
# Counting all elements in Series len(s) # Counting all elements in DataFrame len(df) # Prints number of rows and columns in dataframe df.shape # Prints first 10 rows by default, if no value set df.head(10) # Prints last 10 rows by default, if no value set df.tail(10) # For counting non-Null values column-wise df.count() # For range of index df df.index # For name of attributes/columns df.columns # Index, Data Type and Memory information df.info() # Datatypes of each column df.dtypes # Summary statistics for numerical columns df.describe()
2. Özet
# For adding all values column-wise df.sum() # For min column-wise df.min() # For max column-wise df.max() # For mean value in number column df.mean() # For median value in number column df.median() # Count non-Null values s.count() # Count non-Null values df.count() # Return Series of given column df['Name'].tolist() # Name of columns df.columns.tolist() # Creating subset df[['Name', 'Course']] # Return number of values in each group df.groupby('Name').count()
İşlevleri Uygulama
# Define function f = lambda x: x*5 # Apply this function on given Series - For each value s.apply(f) # Apply this function on given DataFrame - For each value df.apply(f)
1. Dahili Veri Hizalama
# NA values for indices that don't overlap s2 = pd.Series([8, -1, 4], index=['A', 'C', 'D']) s + s2
2. Aritmetik OperaDoldurma Yöntemleriyle İlgili İşlemler
# Fill values that don't overlap s.add(s2, fill_value=0)
3. Filtrele, Sırala ve Gruplandır
Seri ve Veri Çerçevesine göre filtreleme, sıralama ve gruplama yapmak için aşağıdaki fonksiyonlar kullanılabilir.
# Filter rows where column is greater than 100 df[df['RollNo']>100] # Filter rows where 70 < column < 101 df[(df['RollNo'] > 70) & (df['RollNo'] < 101)] # Sorts values in ascending order s.sort_values() # Sorts values in descending order s.sort_values(ascending=False) # Sorts values by RollNo in ascending order df.sort_values('RollNo') # Sorts values by RollNo in descending order df.sort_values('RollNo', ascending=False)
Verileri Dışa Aktarma
Pandalar, verileri çeşitli formatlarda dışa aktarma veya yazma yeteneğine sahiptir. Aşağıda verilen bazı örnekler verilmiştir.
# Export as a CSV file df df.to_csv(filename) # Export as a Excel file df df.to_excel(filename) # Export as a SQL table df df.to_sql(table_name, connection_object) # Export as a JSON file df.to_json(filename) # Export as a HTML table df.to_html(filename) # Write to the clipboard df.to_clipboard()
Pandalar Hile Sayfası Sonuç:
Pandalar açık kaynak kütüphanedir Python veri kümeleriyle çalışmak için. Verileri analiz etme, temizleme, keşfetme ve değiştirme yeteneği. Pandalar Numpy'nin üzerine inşa edilmiştir. Matplotlib gibi diğer programlarla birlikte kullanılır ve Scikit-Öğren. Veri yapıları, veri seçimi, veri içe aktarma, Boolean indeksleme, değerleri düşürme, sıralama ve veri temizleme gibi konuları kapsar. Ayrıca makale için pandalar pdf hileleri hazırladık. Pandalar bir kütüphanedir Python ve veri bilimi bu kütüphaneyi pandaların veri çerçeveleri ve serileriyle çalışmak için kullanır. Bu kısa notta çeşitli panda komutlarını tartıştık.
Hile Sayfası Colab'ı
Pandalar için Colab Egzersiz dosyam – Pandalar Hile Sayfası – Python Veri Bilimi.ipynb için