نمونه پروژه آماده پردازش متون فارسی (پردازش زبان طبیعی بر روی داده های فارسی)

سلام دوستان یکی از وظایف و فرآیندهای مهم در حوزه های متن کاوی (text mining)، بازیابی اطلاعات (information retrieval) و پردازش زبان طبیعی (NLP)، استخراج کلیدواژه ها یا همان Automatic Keyword Extraction از دل اسناد متنی می باشد. در ادامه نمونه ای ا...

نمونه پروژه آماده پردازش متون فارسی (پردازش زبان طبیعی بر روی داده های فارسی)

جزئيات نمونه پروژه آماده پردازش متون فارسی (پردازش زبان طبیعی بر روی داده های فارسی)

پپروژه استخراج کلیدواژه از اسناد فارسی با رعایت تمامی متدهای NLP و پردازش متن امکانات پروژه: 1. امکان بارگزاری اسنادی فارسی به تعداد نامحدود در کرپس پروژه (پوشه Corpora) 2. انجام عملیات پیش پردازش متن، مانند حذف Stop Words، ریشه یابی (Stemming and Lemmatization)، نرمال سازی متون (Normalization)، تجمیع اسناد متنی (Integration) و Tokenization Word and Sent 3. استفاد از دو روش ( کتابخانه هضم و rake-nltk ) برای استخراج کلیدواژه ها 3. استفاد از کتابخانه های spaCy (معروفترین کتابخانه پردازش زبان طبیعی)، googletrans (کتابخانه ترجمه به منظور استفاده از متدهای انگلیسی در زبان فارسی) پیش نیازها برای اجرای پروژه: گام 1: نصب پایتون 3.7 یا نسخه بالاتر در مسیر درایو C گام 2: مقدار دهی متغیر path سیستم با مسیر نصب پایتون گام 3: restart کردن سیستم گام 4: نصب کتابخانه های ذیل به کمک CMD: - کتابخانه rake-nltk با دستور ذیل pip install rake-nltk - کتابخانه googletranse با دستور ذیل pip install googletrans - کتابخانه spaCy با دستور ذیل pip install -U spacy - کتابخانه مدل زبان با دستور ذیل python -m spacy download en_core_web_sm نحوه اجرا: پوشه پروژه را به پوشه پایتون 3.7 موجود در درایو C انتقال داده، سپس cmd را باز کرده و با استفاده از آن به پوشه پروژه رفته سپس با دستور ذیل پروژه را اجرا نمایید: python Keyword_Extraction.py پیروز و موفق باشید در صورت هر گونه سوال با شماره 09157202653 تماس حاصل نمایید
برچسب ها / برنامه نویسی پایتون / پایتون / پردازش متن

نظرات کاربران

هرگونه سوال یا نظری دارید،می توانید در این قسمت مطرح کنید.

مشخصات

تعداد بازديد
469
تعداد دانشجو
10
اندازه
31 مگابايت
هزینه ثبت نام
538 هزار تومان

برای دسترسی همیشگی به این آموزش و امکان دانلود ، در آن ثبت نام کنید.

مشاوره

در مورد مباحث دوره می توانید با مدرس صحبت کنید.


کاظم تقندیکی مدرس دوره " نمونه پروژه آماده پردازش متون فارسی (پردازش زبان طبیعی بر روی داده های فارسی) " هستم.
هر گونه سوال یا ابهام یا پیشنهادی در مورد این دوره داشتید، می تونید به روش های زیر با من تماس بگیرید:
شماره همراه
09157202653
پست الکترونیکی
taghandiky@gmail.com
نرم افزار تحت وب مديريت كتابخانه

نرم افزار تحت وب مديريت كتابخانه

با نصب نرم افزار تحت وب کتابخانه امکان راه اندازی چند کتابخانه با کتب، اعضا و مدیریت مستقل فراهم می شود ضمن اینکه همه کتابخانه ها تحت مدیریت عالی قرار دارند.