CSV फ़ाइल को कैसे पढ़ें? Python (मॉड्यूल, पांडा उदाहरण)
CSV फ़ाइल क्या है?
A CSV फ़ाइल एक सरल प्रकार की सादा पाठ फ़ाइल है जो सारणीबद्ध डेटा को व्यवस्थित करने के लिए एक विशिष्ट संरचना का उपयोग करती है। CSV फ़ाइल का मानक प्रारूप पंक्तियों और स्तंभों के डेटा द्वारा परिभाषित किया जाता है जहाँ एक नई पंक्ति प्रत्येक पंक्ति को समाप्त करके अगली पंक्ति शुरू करती है, और प्रत्येक स्तंभ पंक्ति के भीतर अल्पविराम द्वारा अलग किया जाता है।
CSV डेटा आदान-प्रदान के लिए एक सामान्य प्रारूप है क्योंकि यह कॉम्पैक्ट, सरल और सामान्य है। कई ऑनलाइन सेवाएँ अपने उपयोगकर्ताओं को वेबसाइट से सारणीबद्ध डेटा को CSV फ़ाइल में निर्यात करने की अनुमति देती हैं। CSV की फ़ाइलें Excel में खुलेंगी, और लगभग सभी डेटाबेस में CSV फ़ाइलों से आयात करने की अनुमति देने वाला एक उपकरण होता है।
CSV नमूना फ़ाइल
तालिकाओं के रूप में डेटा को CSV (अल्पविराम से अलग किए गए मान) भी कहा जाता है - शाब्दिक रूप से "अल्पविराम से अलग किए गए मान।" यह सारणीबद्ध डेटा की प्रस्तुति के लिए अभिप्रेत एक टेक्स्ट प्रारूप है। फ़ाइल की प्रत्येक पंक्ति तालिका की एक पंक्ति है। अलग-अलग स्तंभों के मानों को एक विभाजक चिह्न - एक अल्पविराम (,), एक अर्धविराम (;) या किसी अन्य चिह्न द्वारा अलग किया जाता है। CSV को आसानी से पढ़ा और संसाधित किया जा सकता है Python.
निम्नलिखित तालिका पर विचार करें
तालिका डेटा
प्रोग्रामिंग भाषा | द्वारा डिज़ाइन किया गया | दिखाई दिया | विस्तार |
---|---|---|---|
Python | गिडो वैन रॉसम | 1991 | .py |
Java | जेम्स गोस्लिंग | 1995 | जावा |
C++ | बर्जने स्ट्राउटस्ट्रुप | 1983 | सीपीपी |
आप इस तालिका को नीचे दिए अनुसार csv में प्रस्तुत कर सकते हैं।
सीएसवी डेटा
प्रोग्रामिंग भाषा, डिज़ाइन, दिखाई, एक्सटेंशन
Python, गुइडो वान रोसम, 1991, .py
Java, जेम्स गोसलिंग, 1995, .java
C++, बजेर्न स्ट्रॉस्ट्रुप,1983,.सीपीपी
जैसा कि आप देख सकते हैं कि प्रत्येक पंक्ति एक नई पंक्ति है, और प्रत्येक कॉलम को अल्पविराम से अलग किया गया है। यह एक उदाहरण है कि CSV फ़ाइल कैसी दिखती है।
Python सीएसवी मॉड्यूल
Python CSV फ़ाइलों को संभालने के लिए CSV मॉड्यूल प्रदान करता है। डेटा पढ़ने/लिखने के लिए, आपको CSV की पंक्तियों के माध्यम से लूप करना होगा। निर्दिष्ट कॉलम से डेटा प्राप्त करने के लिए आपको स्प्लिट विधि का उपयोग करना होगा।
CSV मॉड्यूल फ़ंक्शन
CSV मॉड्यूल दस्तावेज़ में आप निम्नलिखित फ़ंक्शन पा सकते हैं:
- csv.field_size_limit – अधिकतम फ़ील्ड आकार लौटाएँ
- csv.get_dialect – नाम के साथ जुड़ी बोली प्राप्त करें
- csv.list_dialects – सभी पंजीकृत बोलियाँ दिखाएँ
- csv.reader – csv फ़ाइल से डेटा पढ़ें
- csv.register_dialect – बोली को नाम से संबद्ध करें
- csv.writer – डेटा को csv फ़ाइल में लिखें
- csv.unregister_dialect - बोली रजिस्ट्री के नाम से जुड़ी बोली को हटाएँ
- सीएसवी.QUOTE_ALL – हर चीज़ को उद्धृत करें, चाहे वह किसी भी प्रकार की हो।
- सीएसवी.QUOTE_MINIMAL – विशेष वर्णों के साथ उद्धरण फ़ील्ड
- csv.QUOTE_NONNUMERIC – उन सभी फ़ील्ड को उद्धृत करें जो संख्या मान नहीं हैं
- सीएसवी.QUOTE_NONE – आउटपुट में कुछ भी उद्धृत न करें
इस ट्यूटोरियल में, हम केवल रीडर और राइटर फ़ंक्शन पर ध्यान केंद्रित करने जा रहे हैं जो आपको CSV फ़ाइल में डेटा को संपादित, संशोधित और हेरफेर करने की अनुमति देते हैं।
CSV फ़ाइल को कैसे पढ़ें? Python
नीचे CSV फ़ाइल को पढ़ने के चरण दिए गए हैं Python.
चरण 1) CSV फ़ाइलों से डेटा पढ़ने के लिए, आपको रीडर ऑब्जेक्ट उत्पन्न करने के लिए रीडर फ़ंक्शन का उपयोग करना होगा।
रीडर फ़ंक्शन को फ़ाइल की प्रत्येक पंक्ति लेने और सभी कॉलम की सूची बनाने के लिए विकसित किया गया है। फिर, आपको वह कॉलम चुनना होगा जिसके लिए आप वैरिएबल डेटा चाहते हैं।
यह जितना जटिल लगता है, उससे कहीं ज़्यादा जटिल है। आइए इस पर एक नज़र डालें Python CSV फ़ाइल को पढ़ने के लिए कोड, और हम पाएंगे कि csv फ़ाइल के साथ काम करना इतना कठिन नहीं है।
#import necessary modules import csv with open('X:\data.csv','rt')as f: data = csv.reader(f) for row in data: print(row)
चरण 2) जब आप उपरोक्त प्रोग्राम निष्पादित करेंगे, तो आउटपुट होगा:
['Programming language; Designed by; Appeared; Extension'] ['Python; Guido van Rossum; 1991; .py'] ['Java; James Gosling; 1995; .java'] ['C++; Bjarne Stroustrup;1983;.cpp']
CSV फ़ाइल को डिक्शनरी में कैसे पढ़ें? Python
आप CSV फ़ाइलों को पढ़ने के लिए DictReader का भी उपयोग कर सकते हैं। परिणामों को एक शब्दकोश के रूप में व्याख्यायित किया जाता है जहाँ हेडर पंक्ति कुंजी है, और अन्य पंक्तियाँ मान हैं।
निम्नलिखित कोड पर विचार करें
#import necessary modules import csv reader = csv.DictReader(open("file2.csv")) for raw in reader: print(raw)
इस कोड का परिणाम है:
OrderedDict([('Programming language', 'Python'), ('Designed by', 'Guido van Rossum'), (' Appeared', ' 1991'), (' Extension', ' .py')]) OrderedDict([('Programming language', 'Java'), ('Designed by', 'James Gosling'), (' Appeared', ' 1995'), (' Extension', ' .java')]) OrderedDict([('Programming language', 'C++'), ('Designed by', ' Bjarne Stroustrup'), (' Appeared', ' 1985'), (' Extension', ' .cpp')])
और CSV फ़ाइल से डेटा पढ़ने का यह तरीका पहले के तरीके से कहीं ज़्यादा आसान है। हालाँकि, यह डेटा पढ़ने का सबसे अच्छा तरीका नहीं है।
CSV फ़ाइल कैसे लिखें? Python
CSV फ़ाइल लिखने का तरीका यहां बताया गया है Python:
जब आपके पास डेटा का एक सेट होता है जिसे आप CSV फ़ाइल में स्टोर करना चाहते हैं तो आपको राइटर() फ़ंक्शन का उपयोग करना होगा। पंक्तियों (लाइनों) पर डेटा को पुनरावृत्त करने के लिए, आपको राइटरओ() फ़ंक्शन का उपयोग करना होगा।
निम्न उदाहरण पर विचार करें। हम डेटा को “writeData.csv” फ़ाइल में लिखते हैं, जहाँ सीमांकक एक एपोस्ट्रोफ़ है।
#import necessary modules import csv with open('X:\writeData.csv', mode='w') as file: writer = csv.writer(file, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL) #way to write to csv file writer.writerow(['Programming language', 'Designed by', 'Appeared', 'Extension']) writer.writerow(['Python', 'Guido van Rossum', '1991', '.py']) writer.writerow(['Java', 'James Gosling', '1995', '.java']) writer.writerow(['C++', 'Bjarne Stroustrup', '1985', '.cpp'])
csv फ़ाइल में परिणाम है:
Programming language, Designed by, Appeared, Extension Python, Guido van Rossum, 1991, .py Java, James Gosling, 1995, .java C++, Bjarne Stroustrup,1983,.cpp
पांडा का उपयोग करके CSV फ़ाइल पढ़ें
पांडा एक ओपनसोर्स लाइब्रेरी है जो आपको CSV को आयात करने की अनुमति देती है Python और डेटा में हेरफेर करते हैं। पांडा डेटा बनाने, हेरफेर करने और हटाने का एक आसान तरीका प्रदान करते हैं।
आपको pip install pandas कमांड के साथ pandas लाइब्रेरी स्थापित करनी होगी। Windows, आप इस कमांड को लिनक्स में टर्मिनल में कमांड प्रॉम्प्ट में निष्पादित करेंगे।
पांडा डेटाफ्रेम में CSV पढ़ना बहुत त्वरित और आसान है:
#import necessary modules import pandas result = pandas.read_csv('X:\data.csv') print(result)
का परिणाम CSV पांडा पढ़ें उदाहरण:
Programming language, Designed by, Appeared, Extension 0 Python, Guido van Rossum, 1991, .py 1 Java, James Gosling, 1995, .java 2 C++, Bjarne Stroustrup,1983,.cpp
बहुत उपयोगी लाइब्रेरी। कोड की सिर्फ़ तीन पंक्तियों में आपको पहले जैसा ही परिणाम मिलेगा। पांडा को पता है कि CSV की पहली पंक्ति में कॉलम नाम हैं, और यह उन्हें स्वचालित रूप से उपयोग करेगा।
पांडा का उपयोग करके CSV फ़ाइल लिखें
पांडा के साथ CSV फ़ाइल में लिखना पढ़ने जितना ही आसान है। यहाँ आप इसे समझ सकते हैं। सबसे पहले आपको निम्नलिखित के आधार पर डेटाफ़्रेम बनाना होगा Python CSV कोड में लिखें.
from pandas import DataFrame C = {'Programming language': ['Python','Java', 'C++'], 'Designed by': ['Guido van Rossum', 'James Gosling', 'Bjarne Stroustrup'], 'Appeared': ['1991', '1995', '1985'], 'Extension': ['.py', '.java', '.cpp'], } df = DataFrame(C, columns= ['Programming language', 'Designed by', 'Appeared', 'Extension']) export_csv = df.to_csv (r'X:\pandaresult.csv', index = None, header=True) # here you have to write path, where result file will be stored print (df)
आउटपुट यह है
Programming language, Designed by, Appeared, Extension 0 Python, Guido van Rossum, 1991, .py 1 Java, James Gosling, 1995, .java 2 C++, Bjarne Stroustrup,1983,.cpp
और CSV फ़ाइल निर्दिष्ट स्थान पर बनाई जाती है।
निष्कर्ष
तो, अब आप जानते हैं कि 'csv' विधि का उपयोग कैसे करें और CSV प्रारूप में डेटा को कैसे पढ़ें और लिखें। CSV फ़ाइलों का व्यापक रूप से सॉफ़्टवेयर अनुप्रयोगों में उपयोग किया जाता है क्योंकि उन्हें पढ़ना और प्रबंधित करना आसान है, और उनका छोटा आकार उन्हें प्रसंस्करण और संचरण के लिए अपेक्षाकृत तेज़ बनाता है।
csv मॉड्यूल विभिन्न फ़ंक्शन और क्लास प्रदान करता है जो आपको आसानी से पढ़ने और लिखने की अनुमति देता है। आप आधिकारिक वेबसाइट पर देख सकते हैं Python दस्तावेज़ देखें और कुछ और दिलचस्प सुझाव और मॉड्यूल पाएँ। CSV डेटा को सहेजने, देखने और भेजने का सबसे अच्छा तरीका है। वास्तव में, इसे सीखना उतना कठिन नहीं है जितना कि शुरुआत में लगता है। लेकिन थोड़े अभ्यास से आप इसमें महारत हासिल कर लेंगे।
CSV फ़ाइलें पढ़ने के लिए Pandas एक बढ़िया विकल्प है।
इसके अलावा, ANTLR, PLY और PlyPlus जैसी लाइब्रेरीज़ के साथ टेक्स्ट फ़ाइलों को पार्स करने के अन्य तरीके भी हैं। वे सभी भारी-भरकम पार्सिंग को संभाल सकते हैं, और यदि सरल स्ट्रिंग हेरफेर काम नहीं करता है, तो ऐसे रेगुलर एक्सप्रेशन हैं जिनका आप उपयोग कर सकते हैं।