CSV फ़ाइल को कैसे पढ़ें? Python (मॉड्यूल, पांडा उदाहरण)

CSV फ़ाइल क्या है?

A CSV फ़ाइल एक सरल प्रकार की सादा पाठ फ़ाइल है जो सारणीबद्ध डेटा को व्यवस्थित करने के लिए एक विशिष्ट संरचना का उपयोग करती है। CSV फ़ाइल का मानक प्रारूप पंक्तियों और स्तंभों के डेटा द्वारा परिभाषित किया जाता है जहाँ एक नई पंक्ति प्रत्येक पंक्ति को समाप्त करके अगली पंक्ति शुरू करती है, और प्रत्येक स्तंभ पंक्ति के भीतर अल्पविराम द्वारा अलग किया जाता है।

CSV डेटा आदान-प्रदान के लिए एक सामान्य प्रारूप है क्योंकि यह कॉम्पैक्ट, सरल और सामान्य है। कई ऑनलाइन सेवाएँ अपने उपयोगकर्ताओं को वेबसाइट से सारणीबद्ध डेटा को CSV फ़ाइल में निर्यात करने की अनुमति देती हैं। CSV की फ़ाइलें Excel में खुलेंगी, और लगभग सभी डेटाबेस में CSV फ़ाइलों से आयात करने की अनुमति देने वाला एक उपकरण होता है।

CSV नमूना फ़ाइल

तालिकाओं के रूप में डेटा को CSV (अल्पविराम से अलग किए गए मान) भी कहा जाता है - शाब्दिक रूप से "अल्पविराम से अलग किए गए मान।" यह सारणीबद्ध डेटा की प्रस्तुति के लिए अभिप्रेत एक टेक्स्ट प्रारूप है। फ़ाइल की प्रत्येक पंक्ति तालिका की एक पंक्ति है। अलग-अलग स्तंभों के मानों को एक विभाजक चिह्न - एक अल्पविराम (,), एक अर्धविराम (;) या किसी अन्य चिह्न द्वारा अलग किया जाता है। CSV को आसानी से पढ़ा और संसाधित किया जा सकता है Python.

निम्नलिखित तालिका पर विचार करें

तालिका डेटा

प्रोग्रामिंग भाषा द्वारा डिज़ाइन किया गया दिखाई दिया विस्तार
Python गिडो वैन रॉसम 1991 .py
Java जेम्स गोस्लिंग 1995 जावा
C++ बर्जने स्ट्राउटस्ट्रुप 1983 सीपीपी

आप इस तालिका को नीचे दिए अनुसार csv में प्रस्तुत कर सकते हैं।

सीएसवी डेटा

प्रोग्रामिंग भाषा, डिज़ाइन, दिखाई, एक्सटेंशन

Python, गुइडो वान रोसम, 1991, .py

Java, जेम्स गोसलिंग, 1995, .java

C++, बजेर्न स्ट्रॉस्ट्रुप,1983,.सीपीपी

जैसा कि आप देख सकते हैं कि प्रत्येक पंक्ति एक नई पंक्ति है, और प्रत्येक कॉलम को अल्पविराम से अलग किया गया है। यह एक उदाहरण है कि CSV फ़ाइल कैसी दिखती है।

CSV डेटा डाउनलोड करें

Python सीएसवी मॉड्यूल

Python CSV फ़ाइलों को संभालने के लिए CSV मॉड्यूल प्रदान करता है। डेटा पढ़ने/लिखने के लिए, आपको CSV की पंक्तियों के माध्यम से लूप करना होगा। निर्दिष्ट कॉलम से डेटा प्राप्त करने के लिए आपको स्प्लिट विधि का उपयोग करना होगा।

CSV मॉड्यूल फ़ंक्शन

CSV मॉड्यूल दस्तावेज़ में आप निम्नलिखित फ़ंक्शन पा सकते हैं:

  • csv.field_size_limit – अधिकतम फ़ील्ड आकार लौटाएँ
  • csv.get_dialect – नाम के साथ जुड़ी बोली प्राप्त करें
  • csv.list_dialects – सभी पंजीकृत बोलियाँ दिखाएँ
  • csv.reader – csv फ़ाइल से डेटा पढ़ें
  • csv.register_dialect – बोली को नाम से संबद्ध करें
  • csv.writer – डेटा को csv फ़ाइल में लिखें
  • csv.unregister_dialect - बोली रजिस्ट्री के नाम से जुड़ी बोली को हटाएँ
  • सीएसवी.QUOTE_ALL – हर चीज़ को उद्धृत करें, चाहे वह किसी भी प्रकार की हो।
  • सीएसवी.QUOTE_MINIMAL – विशेष वर्णों के साथ उद्धरण फ़ील्ड
  • csv.QUOTE_NONNUMERIC – उन सभी फ़ील्ड को उद्धृत करें जो संख्या मान नहीं हैं
  • सीएसवी.QUOTE_NONE – आउटपुट में कुछ भी उद्धृत न करें

इस ट्यूटोरियल में, हम केवल रीडर और राइटर फ़ंक्शन पर ध्यान केंद्रित करने जा रहे हैं जो आपको CSV फ़ाइल में डेटा को संपादित, संशोधित और हेरफेर करने की अनुमति देते हैं।

CSV फ़ाइल को कैसे पढ़ें? Python

नीचे CSV फ़ाइल को पढ़ने के चरण दिए गए हैं Python.

चरण 1) CSV फ़ाइलों से डेटा पढ़ने के लिए, आपको रीडर ऑब्जेक्ट उत्पन्न करने के लिए रीडर फ़ंक्शन का उपयोग करना होगा।

रीडर फ़ंक्शन को फ़ाइल की प्रत्येक पंक्ति लेने और सभी कॉलम की सूची बनाने के लिए विकसित किया गया है। फिर, आपको वह कॉलम चुनना होगा जिसके लिए आप वैरिएबल डेटा चाहते हैं।

यह जितना जटिल लगता है, उससे कहीं ज़्यादा जटिल है। आइए इस पर एक नज़र डालें Python CSV फ़ाइल को पढ़ने के लिए कोड, और हम पाएंगे कि csv फ़ाइल के साथ काम करना इतना कठिन नहीं है।

#import necessary modules
import csv
with open('X:\data.csv','rt')as f:
  data = csv.reader(f)
  for row in data:
        print(row)

चरण 2) जब आप उपरोक्त प्रोग्राम निष्पादित करेंगे, तो आउटपुट होगा:

['Programming language; Designed by; Appeared; Extension']
['Python; Guido van Rossum; 1991; .py']
['Java; James Gosling; 1995; .java']
['C++; Bjarne Stroustrup;1983;.cpp']

CSV फ़ाइल को डिक्शनरी में कैसे पढ़ें? Python

आप CSV फ़ाइलों को पढ़ने के लिए DictReader का भी उपयोग कर सकते हैं। परिणामों को एक शब्दकोश के रूप में व्याख्यायित किया जाता है जहाँ हेडर पंक्ति कुंजी है, और अन्य पंक्तियाँ मान हैं।

निम्नलिखित कोड पर विचार करें

#import necessary modules
import csv

reader = csv.DictReader(open("file2.csv"))
for raw in reader:
    print(raw)

इस कोड का परिणाम है:

OrderedDict([('Programming language', 'Python'), ('Designed by', 'Guido van Rossum'), (' Appeared', ' 1991'), (' Extension', ' .py')])
OrderedDict([('Programming language', 'Java'), ('Designed by', 'James Gosling'), (' Appeared', ' 1995'), (' Extension', ' .java')])
OrderedDict([('Programming language', 'C++'), ('Designed by', ' Bjarne Stroustrup'), (' Appeared', ' 1985'), (' Extension', ' .cpp')])

CSV फ़ाइल को शब्दकोश में पढ़ें

और CSV फ़ाइल से डेटा पढ़ने का यह तरीका पहले के तरीके से कहीं ज़्यादा आसान है। हालाँकि, यह डेटा पढ़ने का सबसे अच्छा तरीका नहीं है।

CSV फ़ाइल कैसे लिखें? Python

CSV फ़ाइल लिखने का तरीका यहां बताया गया है Python:

जब आपके पास डेटा का एक सेट होता है जिसे आप CSV फ़ाइल में स्टोर करना चाहते हैं तो आपको राइटर() फ़ंक्शन का उपयोग करना होगा। पंक्तियों (लाइनों) पर डेटा को पुनरावृत्त करने के लिए, आपको राइटरओ() फ़ंक्शन का उपयोग करना होगा।

निम्न उदाहरण पर विचार करें। हम डेटा को “writeData.csv” फ़ाइल में लिखते हैं, जहाँ सीमांकक एक एपोस्ट्रोफ़ है।

#import necessary modules
import csv

with open('X:\writeData.csv', mode='w') as file:
    writer = csv.writer(file, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)

    #way to write to csv file
    writer.writerow(['Programming language', 'Designed by', 'Appeared', 'Extension'])
    writer.writerow(['Python', 'Guido van Rossum', '1991', '.py'])
    writer.writerow(['Java', 'James Gosling', '1995', '.java'])
    writer.writerow(['C++', 'Bjarne Stroustrup', '1985', '.cpp'])

csv फ़ाइल में परिणाम है:

Programming language, Designed by, Appeared, Extension 
Python, Guido van Rossum, 1991, .py
Java, James Gosling, 1995, .java
C++, Bjarne Stroustrup,1983,.cpp

CSV फ़ाइल लिखें Python

पांडा का उपयोग करके CSV फ़ाइल पढ़ें

पांडा एक ओपनसोर्स लाइब्रेरी है जो आपको CSV को आयात करने की अनुमति देती है Python और डेटा में हेरफेर करते हैं। पांडा डेटा बनाने, हेरफेर करने और हटाने का एक आसान तरीका प्रदान करते हैं।

आपको pip install pandas कमांड के साथ pandas लाइब्रेरी स्थापित करनी होगी। Windows, आप इस कमांड को लिनक्स में टर्मिनल में कमांड प्रॉम्प्ट में निष्पादित करेंगे।

पांडा डेटाफ्रेम में CSV पढ़ना बहुत त्वरित और आसान है:

#import necessary modules
import pandas
result = pandas.read_csv('X:\data.csv')
print(result)

का परिणाम CSV पांडा पढ़ें उदाहरण:

Programming language, Designed by, Appeared, Extension 
0    Python, Guido van Rossum, 1991, .py
1    Java, James Gosling, 1995, .java
2    C++, Bjarne Stroustrup,1983,.cpp

बहुत उपयोगी लाइब्रेरी। कोड की सिर्फ़ तीन पंक्तियों में आपको पहले जैसा ही परिणाम मिलेगा। पांडा को पता है कि CSV की पहली पंक्ति में कॉलम नाम हैं, और यह उन्हें स्वचालित रूप से उपयोग करेगा।

पांडा का उपयोग करके CSV फ़ाइल लिखें

पांडा के साथ CSV फ़ाइल में लिखना पढ़ने जितना ही आसान है। यहाँ आप इसे समझ सकते हैं। सबसे पहले आपको निम्नलिखित के आधार पर डेटाफ़्रेम बनाना होगा Python CSV कोड में लिखें.

from pandas import DataFrame
C = {'Programming language': ['Python','Java', 'C++'],
        'Designed by': ['Guido van Rossum', 'James Gosling', 'Bjarne Stroustrup'],
        'Appeared': ['1991', '1995', '1985'],
        'Extension': ['.py', '.java', '.cpp'],
    }
df = DataFrame(C, columns= ['Programming language', 'Designed by', 'Appeared', 'Extension'])
export_csv = df.to_csv (r'X:\pandaresult.csv', index = None, header=True) # here you have to write path, where result file will be stored
print (df)

आउटपुट यह है

Programming language, Designed by, Appeared, Extension
0    Python, Guido van Rossum, 1991, .py
1    Java, James Gosling, 1995, .java
2    C++, Bjarne Stroustrup,1983,.cpp

और CSV फ़ाइल निर्दिष्ट स्थान पर बनाई जाती है।

पांडा का उपयोग करके CSV फ़ाइल लिखें

निष्कर्ष

तो, अब आप जानते हैं कि 'csv' विधि का उपयोग कैसे करें और CSV प्रारूप में डेटा को कैसे पढ़ें और लिखें। CSV फ़ाइलों का व्यापक रूप से सॉफ़्टवेयर अनुप्रयोगों में उपयोग किया जाता है क्योंकि उन्हें पढ़ना और प्रबंधित करना आसान है, और उनका छोटा आकार उन्हें प्रसंस्करण और संचरण के लिए अपेक्षाकृत तेज़ बनाता है।

csv मॉड्यूल विभिन्न फ़ंक्शन और क्लास प्रदान करता है जो आपको आसानी से पढ़ने और लिखने की अनुमति देता है। आप आधिकारिक वेबसाइट पर देख सकते हैं Python दस्तावेज़ देखें और कुछ और दिलचस्प सुझाव और मॉड्यूल पाएँ। CSV डेटा को सहेजने, देखने और भेजने का सबसे अच्छा तरीका है। वास्तव में, इसे सीखना उतना कठिन नहीं है जितना कि शुरुआत में लगता है। लेकिन थोड़े अभ्यास से आप इसमें महारत हासिल कर लेंगे।

CSV फ़ाइलें पढ़ने के लिए Pandas एक बढ़िया विकल्प है।

इसके अलावा, ANTLR, PLY और PlyPlus जैसी लाइब्रेरीज़ के साथ टेक्स्ट फ़ाइलों को पार्स करने के अन्य तरीके भी हैं। वे सभी भारी-भरकम पार्सिंग को संभाल सकते हैं, और यदि सरल स्ट्रिंग हेरफेर काम नहीं करता है, तो ऐसे रेगुलर एक्सप्रेशन हैं जिनका आप उपयोग कर सकते हैं।