Az NLTK letöltése és telepítése Windows/Mac
NLTK telepítése Windows
Ebben a részben megtudjuk, hogyan kell beállítani az NLTK-t terminálon keresztül (a Windows parancssora).
Az alábbi utasítások azon a feltételezésen alapulnak, hogy nincs telepítve a python. Tehát az első lépés a python telepítése.
telepítése Python in Windows
Step 1) Ugrás a linkre https://www.python.org/downloads/, és válassza ki a Windows legújabb verzióját.
Megjegyzések: Ha nem szeretné letölteni a legújabb verziót, látogassa meg a letöltés lapot, és tekintse meg az összes kiadást.
Step 2) Kattintson a Letöltött fájlra
Step 3)Válassza a Telepítés testreszabása lehetőséget
Step 4) Kattintson a KÖVETKEZŐ gombra
Step 5) A következő képernyőn
- Válassza ki a speciális beállításokat
- Adjon meg egyéni telepítési helyet. Az én esetemben a C-meghajtón lévő mappát választottam a könnyebb működés érdekében
- Kattintson a Telepítés gombra
Step 6) A telepítés befejezése után kattintson a Bezárás gombra.
Step 7) Másolja ki a Scripts mappa elérési útját.
Step 8) A Windows parancssorban
- Navigáljon a pip mappa helyére
- Írja be a parancsot az NLTK telepítéséhez
pip3 install nltk
- A telepítésnek sikeresnek kell lennie
JEGYZET: Mert Python2 használja a commandpip2 install nltk parancsot
Step 9) In Windows Start menü, keressen és nyissa meg PythonHéj
Step 10) Az alábbi paranccsal ellenőrizheti, hogy a telepítés pontos-e
import nltk
Ha nem lát hibát, a telepítés befejeződött.
Az NLTK telepítése Mac/Linux rendszeren
Az NLTK Mac/Unix rendszerben történő telepítéséhez az nltk telepítéséhez a python csomagkezelő pip szükséges. Ha a pip nincs telepítve, kövesse az alábbi utasításokat a folyamat befejezéséhez
1. lépés) Frissítse a csomagindexet az alábbi parancs beírásával
sudo apt update
2. lépés) Pip telepítése a számára Python 3:
sudo apt install python3-pip
A pip-t az easy_install paranccsal is telepítheti.
sudo apt-get install python-setuptools python-dev build-essential
Most az easy_install telepítve van. Futtassa az alábbi parancsot a pip telepítéséhez
sudo easy_install pip
3. lépés)Az NLTK telepítéséhez használja a következő parancsot
sudo pip install -U nltk sudo pip3 install -U nltk
Az NLTK telepítése az Anacondán keresztül
1. lépés) Kérjük, telepítse az anacondát (amely különböző csomagok telepítésére is használható) a webhely meglátogatásával https://www.anaconda.com/products/individual és válassza ki, hogy a python melyik verzióját kell telepítenie az anacondához.
Megjegyzés: Tekintse meg ezt az oktatóanyagot a részletes lépésekért telepítse az anacondát
Step 2)Az Anaconda promptban
- Írja be a parancsot
conda install -c anaconda nltk
- RevNézze meg a csomag frissítését, a frissítést, a telepítési információkat, és írja be az igent
- Az NLTK letöltése és telepítése megtörtént
NLTK adatkészlet
Az NLTK modul számos adatkészlettel rendelkezik, amelyeket le kell töltenie a használathoz. Technikailag úgy hívják test. Néhány példa az stopszavak, Gutenberg, framenet_v15, nagy_nyelvtanokés így tovább.
Az NLTK összes csomagjának letöltése
Step 1)Futtassa a Python tolmács in Windows vagy Linux
Step 2)
- Írja be a parancsokat
import nltk nltk.download ()
- Megnyílik az NLTK letöltött ablaka. Az adatkészlet letöltéséhez kattintson a Letöltés gombra. Ez a folyamat az internetkapcsolattól függően időt vesz igénybe
JEGYZET: A letöltési helyet a Fájl> Letöltési könyvtár módosítása elemre kattintva módosíthatja
Step 3) A telepített adatok teszteléséhez használja a következő kódot
>>> from nltk.corpus import brown >>>brown.words()
["The", "Fulton", "County", "Grand", "Esküdtszék", "mondta", …]
Az NLP Script futtatása
Azt fogjuk megvitatni, hogy az NLP-szkript hogyan lesz végrehajtva a helyi számítógépünkön. A piacon számos természetes nyelvi feldolgozási könyvtár található. Tehát a könyvtár kiválasztása az Ön igényeitől függ. Itt van a lista NLP könyvtárak.
Az NLTK Script futtatása
1. lépés) Kedvenc kódszerkesztőjében másolja ki a kódot, és mentse a fájlt másként "NLTKsample.py "
from nltk.tokenize import RegexpTokenizer tokenizer = RegexpTokenizer(r'\w+') filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.') print(filterdText)
Kód magyarázata:
- Ebben a programban az volt a cél, hogy minden típusú írásjelet eltávolítsunk az adott szövegből. Importáltuk a „RegexpTokenizer”-t, amely egy modul NLTK. Eltávolítja az összes kifejezést, szimbólumot, karaktert, számot vagy bármit, amit csak akar.
- Éppen átadta a reguláris kifejezést a „RegexpTokenizer” modulnak.
- Továbbá tokenizáltuk a szót a „tokenize” modul segítségével. A kimenetet a „filterdText” változó tárolja.
- És kinyomtatta őket a „print().
2. lépés) A parancssorban
- Navigáljon arra a helyre, ahová a fájlt mentette
- Indítsa el a parancsot Python NLTKsample.py
Ez a kimenetet a következőképpen jeleníti meg:
['Hello', 'Guru99', 'You', 'van', 'build', 'a', 'nagyon', 'jó', 'webhely', 'és', 'én', 'szeretem', látogatás', 'saját', 'webhely']